L’assistant vocal, la promesse d’un quotidien plus facile à vivre ? Les innovations technologiques se multiplient dans le domaine de la reconnaissance vocale. Les grands noms du secteur sont au coude à coude, face à des consommateurs qui en demandent toujours plus.
Les assistants vocaux dans nos appareils et nos foyers
Smartphones iOS ou Android avec Siri ou Google Assistant, PC Windows avec Cortana, objets et enceintes connectés, de nombreux appareils possèdent une commande vocale. De quoi faciliter la vie des utilisateurs, partisans du moindre effort ou juste un peu pressés ! Un engouement qui va perdurer si l’on en croit le bureau d’études Gartner qui prévoit que d’ici 2020, la majorité des appareils sera conçu pour fonctionner avec un minimum de touches, voire sans aucune touche.
Bientôt, et même déjà aujourd’hui, le seul fait d’exprimer une action permettra de la réaliser dans l’immédiat et même d’avoir accès à une multitude d’options et de possibilités. Des enceintes connectées à commande vocale existent actuellement sur le marché. Elles permettent de contrôler le volume ou le choix des musiques par la voix, sans avoir besoin d’appuyer sur un bouton ou de sortir son smartphone. C’est le cas de Whyd. En 2021, ce marché pourrait représenter 3,5 milliards d’euros, toujours selon le bureau d’études Gartner.
Encore plus en vogue, les assistants personnels sont les appareils connectés du quotidien les plus concernés par la commande vocale et ses innovations. Cet été, Google a dévoilé son propre assistant personnel baptisé Google Home. Comme Amazon Echo, concurrent direct, il permet de réaliser une grande palette de tâches du quotidien (faire une recherche sur Internet, programmer sa liste de courses, connaître la météo, accéder à son agenda…) au seul son de la voix. En prime, l’assistant personnel de Google fait appel aux puissants serveurs du moteur de recherche, sur le même fonctionnement que Google Assistant pour smartphone, et pourra ainsi répondre aux interrogations les plus poussées de son utilisateur.
Les innovations
Un taux d’erreur minimal
Si le futur est à notre portée, il faut reconnaître que les systèmes de reconnaissance vocale actuels sont encore perfectibles. Un groupe de recherche autour de l’énoncé oral et du dialogue de Microsoft l’a bien compris et a dévoilé récemment un programme informatique de reconnaissance vocale capable de reconnaître les mots d’un discours oral avec un taux d’erreur par mot de 5,1 %. Ce taux correspond aux fautes qui peuvent être commises lors d’une retranscription, comme une interversion de lettres ou une confusion de mots par exemple. 5,1 % ne vous dit rien ? C’est normal. Sachez juste que ce taux est inférieur au taux d’erreur humain.
Reconnaître une voix dans la foule
Les assistants vocaux sont présents dans nos maisons et dans notre quotidien mais pourraient bien aussi s’immiscer dans les lieux publics. La preuve avec une autre technologie actuellement à l’étude qui pourrait reconnaître et isoler une voix parmi d’autres. Avec elle, il ne serait plus dérangeant d’activer son assistant vocal en pleine rue ou entouré d’une dizaine de personnes. Actuellement développé par les laboratoires de recherche de Mitsubishi Electric, elle pourrait être installée dans des ascenseurs de la marque. Chacun prononcerait ainsi son étage sans taper sur aucun bouton et serait mené à bon port. Cette solution pourrait considérablement augmenter l’efficacité des assistants vocaux.
Quelles limites ?
Mais jusqu’où ira l‘utilisation de la reconnaissance vocale ? Pour l’heure, 53% des utilisateurs d’assistants vocaux considèrent que la reconnaissance vocale rendra l’être humain plus intelligent. 46% sont prêts à utiliser cette technologie uniquement s’ils obtiennent la garantie que leurs données personnelles seront protégées (étude Speak easy, sur un panel d’utilisateurs au Royaume-Uni).
En utilisant des assistants vocaux, qui enregistrent votre profil, vos requêtes et vos préférences, vos données sont forcément exposées. Récemment, les experts de l’Université de Zhejiang, en Chine, ont découvert que l’ensemble des assistants vocaux du marché peuvent être contrôlés à distance via des ultrasons. Leur découverte a été baptisée Dolphin attack. L’utilisation d’assistants vocaux nécessitent encore aujourd’hui de faire preuve de vigilance et de précautions d’usage, notamment pour la protection des données personnelles.