Traitement de la voix
Le système de traitement de la voix SPEECHGET développé par PERGET s’intègre à vos lignes téléphoniques et applications !
Dans l’animation ci-dessus, pour le besoin de la démonstration de la partie synthèse vocale (conversion de texte en audio/fichier son) et vous éviter d’activer le micro, après avoir saisi le nom d’une commune , le fichier audio dictant la commune est généré par la synthèse vocale , son spectre vocal est alors analysé sous forme de barres animées, puis passé à la reconnaissance vocale.
Le résultat de la reconnaissance est ensuite présenté : Nom de la commune française identifiée, code INSEE (unique) et le taux de confiance de reconnaissance (d’autres communes pouvant avoir un nom phonétiquement approchant).
Contrairement à Google Voice, Amazon Alexa , IBM Watson, Microsoft Azure, SPEECHGET n’est pas dans un Cloud public mais installé en France, sur un serveur privé vous étant dédié.
Ceci a aussi pour avantage de garantir une stabilité de l’interconnexion avec les API Cloud que ces acteurs changent fréquemment, de manière pas toujours concertée et pouvant nécessiter des développements de vôtre côté, de façon pro-active lorsque ceux-ci sont anticipés ou réactive quand c’est trop tard.
De plus, ces solutions étant dédiées à la retranscription de texte, elle ne proposent pas d’interaction avec un dictionnaire de mots-clés ou votre base de données (liste de noms propres ou contacts par exemple).
Egalement, ces solutions, contrairement à SPEECHGET, ne font pas toutes l’objet d’une optimisation pour une reconnaissance de sons aux formats télécom alaw ( prononcer « A-Law ») européen, ou µlaw (prononcer « Mu-Law ») pour quasiment le reste du monde. Ces deux formats télécoms, bien qu’étant de moindre qualité qu’un format stéréo, sont plus légers et suffisants pour l’oreille humaine tout en étant moins gourmands pour le transport de la communication.
Pour faire simple, pas sûr qu’avec ces acteurs Cloud, toutes les communes soient bien reconnues… Ambrutix, par exemple (si si ! : code postal 01500, code INSEE 01008) 🤔.
Ensuite, leur principe de facturation étant la tarification à l’utilisation (Pay Per Use), la budgétisation est souvent bien difficile.
Quand aux autres solutions, non Cloud (avec acquisition de licences), telle que Nuance, avec dictionnaire de mots-clés et grammaires intégrables et offrant une version spécialisée pour les Centres d’appels, le ticket d’entrée financier est bien supérieur à SPEECHGET, pas forcément accessible…
Enfin, avec SPEECHGET, 23 langues sont gérées, aussi bien en synthèse qu’en reconnaissance vocale.