OWNI http://owni.fr News, Augmented Tue, 17 Sep 2013 12:04:49 +0000 http://wordpress.org/?v=2.9.2 fr hourly 1 La reconnaissance vocale est morte : pet à son âme http://owni.fr/2010/11/10/la-reconnaissance-vocale-est-morte-pet-a-son-ame/ http://owni.fr/2010/11/10/la-reconnaissance-vocale-est-morte-pet-a-son-ame/#comments Wed, 10 Nov 2010 15:04:45 +0000 Dr Goulu http://owni.fr/?p=33275 D’après “2001 l’Odyssée de l’Espace”, nos ordinateurs devraient comprendre notre voix depuis 9 ans. Depuis 1997, on trouve des logiciels de reconnaissance vocale pour PC, et depuis peu nos téléphones disposent de cette fonction. Mais on ne l’utilise pas. Je ne connais personne qui dicte ses e-mails, et vous ?

Comme tous les geeks j’ai essayé de temps en temps, parfois passé une heure à lire des textes d’apprentissage de la voix la plus monocorde possible à la nouvelle version d’un soft, et puis abandonné devant ses piètres performances. Ça ne marche pas, ou pas assez bien.

Robert Portner analyse cet échec dans ”Rest in Peas: The Unrecognized Death of Speech Recognition“, titre subtilement traduit en français dans le présent article.

Le problème, c’est qu’après une phase de progrès rapides à la fin du siècle passé, le taux d’erreur de mots plafonne à 10% depuis 2001, soit environ le triple du taux d’erreur d’un être humain. Et encore, c’est pour l’anglais “standard”. Le taux d’erreur est bien plus élevé pour d’autres langues, et catastrophique pour une conversation entre supporters de foot à la sortie du match. (Voir l’évolution du taux d’erreur de mots du National Institute of Standards and Technology).

Pourtant dans les années 1990, des systèmes très fiables avaient été mis au point pour distinguer quelques mots bien choisis dans des cockpits d’avion ou des chiffres au téléphone, et on s’était légitimement attendus à ce que la Loi de Moore permette de traiter rapidement le langage naturel.

Et effectivement, aujourd’hui on sait bien reconnaitre des mots isolés. On sait à peu près éliminer les absurdités non conformes à la grammaire dans des phrases simples comme “le chat ment je la sous rit.” Mais pour distinguer entre “le chas mange la souris”, ”le chat mange là, sous l’riz” et  ”le chaman gela, sourit” et , il faut comprendre le sens de la phrase, voire le contexte dans lequel elle est prononcée…

Si l’ordinateur doit connaitre la différence entre un quadrupède carnivore et le trou d’une aiguille pour traiter une phrase triviale, on imagine que ce n’est pas demain qu’on dictera des contrats* ou des rapports à une machine.  De gros projets ont été lancés par des poids lourds de l’informatique pour tenter de modéliser la connaissance humaine.

Par exemple le projet MindNet de Microsoft a analysé des millions de pages de textes existants pour construire un graphe sémantique gigantesque, duquel il ressort effectivement que dans une phrase comportant “chat” et “souris”, le plus probable est que le chat chasse la souris. Un tel graphe peut certainement être utile en traduction automatique car on dispose d’un texte de départ, mais pour la reconnaissance vocale il faudrait étendre le graphe à la structure des phrases utilisées en conversation courante, qui peut être bien distincte du langage écrit. Et pour faire ça automatiquement, il faudrait la reconnaissance vocale…

Comme le note Portner, on pensait au début que la reconnaissance vocale était un premiers pas vers l’intelligence artificielle. Aujourd’hui de nombreux chercheurs estiment que l’intelligence artificielle est indispensable pour atteindre une reconnaissance vocale de qualité acceptable. Les gros projets de recherche ont été abandonnés les uns après les autres, bloqués devant le mur si bien décrit par les Perlisismes sur l’intelligence artificielle comme :

“Une année de travail sur l’intelligence artificielle est suffisante pour vous faire croire en Dieu”

Le nombre de recherches sur “reconnaissance vocale” ou “Dragon Naturally Speaking” sur Google baisse régulièrement depuis 2001. Comme aucune  idée fondamentalement nouvelle ne vient relancer la recherche, la reconnaissance vocale est morte, en toute discrétion.

Note : Ça me rappelle l’histoire de la secrétaire d’un célèbre ingénieur de la génération dictaphone qui avait commandé “310 mètres d’isolation entre 2 étages” au lieu de “3 centimètres” . Ça c’est avec les 2% d’erreurs de transcription humaines…

>> Article publié initialement sur le blog de Dr Goulu

>> Illustrations FlickR CC : TruShu et Loguy en CC pour OWNIsciences

]]>
http://owni.fr/2010/11/10/la-reconnaissance-vocale-est-morte-pet-a-son-ame/feed/ 6
Google ou la culture de l’erreur http://owni.fr/2010/08/08/google-ou-la-culture-de-lerreur/ http://owni.fr/2010/08/08/google-ou-la-culture-de-lerreur/#comments Sun, 08 Aug 2010 10:40:56 +0000 Benoit Raphaël http://owni.fr/?p=24156 Je ne reviendrai pas sur l’annonce de la fin de Google Wave. Lancé il y a un an et annoncé comme une révolution, ce service qui était présenté comme un “email killer” n’a jamais rencontré son public. Il suffit d’ailleurs d’essayer Google Wave une demi-heure pour comprendre pourquoi ça n’a pas marché. Fin de l’histoire.

“Nous célébrons nos erreurs”

Plus intéressant : les propos d’Eric Schmidt, le CEO de Google, hier lors de la Techonomy Conference, sur la philosophie du géant de l’entreprise :

“Nous essayons des choses… Souvenez-vous, nous célébrons nos erreurs. Nous sommes une entreprise où l’on a aucun problème avec le fait de tester quelque chose à fond, de ne pas obtenir de succès de ce travail et d’apprendre de cet échec.”

Peu de patrons sont capables de tenir un tel discours.

Le “plantage” fait partie de la culture Google. On essaye, on se trompe, on corrige, on partage. Inclure l’erreur dans la chaîne de valeurs de l’entreprise, c’est gonflé. Mais c’est ce qui explique l’incroyable force de Google.

Dans “What Would Google Do?” (traduit par Fabernovel en France), Jeff Jarvis rapporte cette anecdote:

“Sheryl Sandberg, directrice de la publicité (…) a commis une erreur sur laquelle elle ne s’est jamais étendue et qui a coûté des millions de dollars à Google. ‘C’était une mauvaise décision, prise trop rapidement, rien n’était sous contrôle, on a perdu du temps et de l’argent’. (…) Quand elle a présenté ses excuses à son patron, Larry Page lui a répondu: ‘Je suis heureux que tu aies fait cette erreur, parce que je veux développer une entreprise où on fait trop de choses trop vite et pas une entreprise où on ne prend aucun risque et où on ne fait rien. Si on n’a pas de temps en temps un gros plantage, c’est qu’on ne prend pas assez de risques’. Dans The Economist, Eric Schmidt a conseillé aux employés : ‘Faites vos erreurs vite – pour pouvoir faire un autre essai dans la foulée’”.

Facebook fait également des erreurs, poursuit Jarvis, mais il essaie, et corrige, puis essaie à nouveau…

Nous sommes dans un monde en révolution, où la nécessité de s’adapter en permanence génère naturellement le développement agile. Essayer vite, avec peu, se tromper, corriger, déployer, s’adapter…

Le 4 août, Eric Schmidt disait à Techonomic : “Tous les deux jours, nous produisons plus d’informations que nous l’avons fait depuis l’aube de l’humanité jusqu’en 2003.” Et de conclure: “Le monde dans lequel nous vivons n’est pas prêt pour la révolution technologique qui arrive prochainement.”

Google s’est planté sur Google Wave, mais pas sur Android, son système d’exploitation mobile, qui vient de passer N°1, devant RIM (BlackBerry) et Apple (iPhone).  1/3 de tous les smartphones vendus entre avril et juin étaient des téléphones Android. 200.000 se vendent chaque jour.

Essayer, essayer, essayer…

Article initialement publié sur La Social NewsRoom, le blog de Benoit Raphael : benoitraphael.com

]]>
http://owni.fr/2010/08/08/google-ou-la-culture-de-lerreur/feed/ 12