Synthèse vocale : des avancées, mais on n’y est pas encore !


22/03/2022
Chapô

Dans quelle mesure la synthèse vocale peut-elle, en formation, se substituer à la voix humaine ? Face à certaines affirmations, il convient de rester prudent : la voix de synthèse manque encore de richesse et de nuance pour garantir l’interaction nécessaire à toute action d’apprentissage.

Icône innovation
Paragraphes

Elément majeur dans le cadre de la formation, la voix guide, réassure, interagit avec les apprenants. Elle peut notamment jouer, lorsqu’elle se trouve intégrée aux modules de e-learning, un rôle pédagogique en ce qu’elle garantirait une meilleure accessibilité aux formations. C’est pour cette raison que certaines entreprises ont déjà franchi le pas pour générer automatiquement des fichiers audios. D’autant que les progrès récents de l’IA rendent de plus en plus difficile la distinction entre une voix humaine et une voix de synthèse.

Dans un article paru récemment sur la plateforme e-learning letter, Roy Lindemann, cofondateur de la société Readspeaker, évoque le très fort potentiel des voix de synthèse actuelles. « Longtemps robotisées et peu engageantes, les voix de synthèse s’humanisent », explique-t-il, citant par exemple l’enseigne Conforama et le réalisme de la « voix de Roxane ». Est-on pour autant parvenu à l’étape ultime, qui permettrait à une voix de synthèse d’être totalement assimilée à une voix humaine ? Sans doute pas, ou du moins pas encore.

« Il faut toujours avoir à l’idée que les êtres humains repèrent très tôt les voix de synthèse des machines », décrypte Samuëlle Dilé. « Notre cerveau a la faculté dès l’âge de 6 ans de faire la différence entre le réel et le virtuel. La connexion humaine, reconnaissante d’un autre que moi avec lequel je peux interagir, m’identifier ou non,  et qui nourrit mon désir d’être en lien, de faire avec, de me comparer, d’apprendre ensemble vient donc très tôt dans le développement. » Et Samuëlle Dilé de tempérer : « N’oublions pas que la voix humaine est nuancée : elle est faite de tessiture et de chair. Ses variations subtiles permettent l’interaction, ô combien importantes dans le cas de l’action pédagogique. Car la pédagogie repose en majeure partie sur cette interaction, laquelle est essentielle ! » 

Autant d’éléments qui invitent à demeurer encore prudent quant aux effets supposément bénéfiques de l’IA (Intelligence Artificielle) de nature conversationnelle. « Oui la voix de synthèse est une aide mais ne soyons pas dupes : elle est encore loin de se substituer à l’humain. Dans le cadre d’une pédagogie qui s’appuie sur des interactions (les jeux de rôle par exemple), elle facilite aujourd’hui au mieux la compréhension des apports notionnels théoriques ou des savoirs procéduraux, techniques », conclut Samuëlle Dilé.
 

Pour en savoir plus :

https://www.e-learning-letter.com/info_article/m/2318/ia-et-synthèse-vocale-quel-potentiel-pour-l’e-learning.html


 

Pour poster un commentaire, veuillez vous identifier.

Connexion