Nithya Thadani, PDG de Rain.

Concevoir pour la voix: instaurer la confiance dans l’intelligence ambiante

Lors d’une récente conférence virtuelle, Nithya Thadani a ouvert son discours avec une anecdote sur la relation de sa fille Sonia avec les assistants vocaux. «Nous avons acheté un haut-parleur Sonos et l’avons sorti de la boîte. [Sonia] est descendu et s’est approché de lui et a dit: «Oh hé, Alexa! Pas de réponse. Elle a ensuite essayé Google. Toujours pas de réponse. Et puis elle a commencé à le frapper et a dit: « Hé vous, qui êtes-vous? » »

Raconter une histoire sur l’interaction de sa jeune fille avec la technologie vocale répond à deux critères. Premièrement, cela confirme que la technologie vocale est facile à utiliser (vous n’avez pas besoin de savoir comment faire défiler, glisser ou texte pour l’utiliser) et, deuxièmement, elle renforce la relativité et la crédibilité de Thadani.

Si l’objectif était de susciter un soutien et d’éclairer le public sur la façon dont la technologie activée par la voix permet aux utilisateurs de contrôler leur environnement, le PDG de Pluie, une Une agence basée à New York, spécialisée dans la stratégie, la conception et le développement de la voix, a frappé la marque. Tenu 23-25 ​​juin, til à grande échelle événement virtuel Collision de la maison a attiré plus de 32 000 inscrits en ligne de 140 pays, avec des investisseurs technologiques, des conférenciers célèbres et des journalistes.

Nithya Thadani, PDG de Rain.Pluie« Nous avons tendance à penser à la voix comme ces haut-parleurs intelligents, mais ces haut-parleurs vont être une erreur d’arrondi lorsque vous parlez du comportement émergent de la voix – les gens qui parlent de choses », a déclaré Thadani, soulignant que deux fois plus d’adultes américains ont utilisé voix dans la voiture, quel que soit le battage médiatique accordé aux haut-parleurs intelligents et autres appareils.

Thadani n’était pas seule dans sa quête pour informer les participants sur le potentiel croissant de l’intelligence ambiante. Rejoignant le sommet virtuel depuis son domicile de San Francisco, le directeur de l’innovation d’Intuit, Bharath Kadaba, a déclaré que la construction d’une expérience ambiante intéressante reposait sur trois facteurs.

« Le premier est l’empathie, qui est une véritable compréhension de l’identité du client et de la situation dans laquelle il se trouve », a déclaré Kadaba. «Le deuxième est l’expertise, qui consiste à être en mesure de comprendre le défi particulier que le client a et d’avoir l’expertise pour le résoudre. Ce n’est pas une approche unique. Le troisième est l’éthique, qui sous-tend cette confiance – de la vie privée, la sécurité et l’explicabilité, et toutes ces choses qui construisent réellement cette relation à long terme. « 

Adoptez des plateformes d’experts pilotées par l’IA

La construction d’une technologie d’interface utilisateur conversationnelle ancrée dans ces facteurs est un élément fondamental d’un système viable, selon Kadaba, qui dirige Intuit. La technologie Groupe Futures. Largement expliqué, le processus implique de reconnaître la parole et de convertir l’intention du locuteur en un format lisible par machine, qui s’inscrit à la fois dans un moteur de raisonnement et combine la connaissance du domaine et les données du client pour trouver une réponse. Une fois la réponse trouvée, la réponse doit être reconvertie en parole, d’une manière qu’un être humain puisse comprendre.

Kabada a identifié cinq problèmes techniques que les chercheurs espèrent résoudre en créant une véritable interface interactive. La première consiste à comprendre l’impact du contexte, ce qui nécessite de comprendre l’intention et les préférences du client sur une période plus longue. La seconde est de pouvoir reconnaître la longue queue des questions possibles.

Le troisième est de détecter, comprendre et insuffler des émotions dans cette conversation. «L’injection d’émotions est un élément clé de l’instauration de la confiance», a déclaré Kadaba. Le quatrième est la construction d’un moteur de raisonnement, qui, a-t-il noté, est probablement la chose la plus difficile à faire car il combine les mots, la connaissance du domaine et les données approfondies pour développer cette expertise. Et le dernier problème consiste à tirer parti des nuances des conversations de va-et-vient.

La position de Kadaba est que mélanger l’apport humain et l’IA est le meilleur moyen de fournir des solutions ambiantes utilitaires. S’appuyant sur la théorie du scientifique PARC Mark Weiser sur l’informatique omniprésente, «les technologies les plus profondes sont celles qui disparaissent», a-t-il expliqué. « L’intelligence artificielle augmentée par une touche humaine se diffusera dans le tissu de la vie quotidienne jusqu’à ce qu’elle ne puisse pas être distinguée d’elle. »

Bharath Kadaba, directeur de l'innovation, Intuit.Bharath Kadaba, directeur de l’innovation, Intuit.Conception de la machine

Conception pour le comportement

Thadani soutient cette notion. «La voix va être le médicament de passerelle vers l’informatique ambiante», a-t-elle déclaré. En tant que moyen de communication, parler est naturel et sans friction, et «c’est pourquoi c’est le moyen de la thérapie, et c’est aussi le moyen de la prière».

Derrière sa référence à la pleine conscience se trouve la réussite de la façon dont Rain a intégré son interface utilisateur vocale à Headspace, une application de méditation qui fonctionne sur les plateformes Google, Alexa et Cortana. La startup est une idée originale d’Andy Puddicombe, un moine bouddhiste. Comme le site Web de Rain s’en vante, il a atteint le même nombre d’utilisateurs actifs en l’espace de deux mois qu’il a fallu pour amasser sur mobile en 40 mois.

De même, la technologie de Rain sous-tend la fonction «sur commande» qui permet aux clients de Starbucks de commander leur mouture régulière en utilisant le Plateforme Amazon Alexa ou chatbot My Starbucks Barista. Rain a examiné les comportements existants des clients Starbucks et a constaté que 73% des utilisateurs commandent la même chose à chaque visite. Les données ont fourni un ticket d’or à reconcevoir l’API produit du géant du café (un interface de programmation d’applications qui permet à deux applications de se parler).

Se concentrer sur les aspects comportementaux et émotionnels de l’utilisateur est la clé du succès de l’IA vocale, a expliqué Thadani. Le marché devrait «atteindre 93 milliards de dollars au cours des deux prochaines années» et elle prévoit que les assistants vocaux nous fourniront du contenu et des informations où que nous soyons et à tout moment.

« Que vous conceviez pour une voiture, ou pour un casque, ou pour un appareil vocal avec un écran, il est important de se rappeler que la voix n’est pas une interface », a déclaré Thadani. «C’est un comportement, des gens qui parlent à leur environnement. Ce sont des assistants ambiants. Et vous devez concevoir ce comportement sur tous ces différents points de contact. »

Construire l’intelligence émotionnelle

Thadani soutient que les algorithmes vocaux de Rain excellent dans la capacité à construire une intelligence émotionnelle (« Vous avez besoin à la fois d’égalisation et de QI »). Par exemple, Rain a travaillé avec Marriott’s Aloft Hotels pour savoir comment améliorer l’expérience client. Leur recherche a commencé par «écouter» ce que les clients demandaient le plus à la réception. « Nous appelons cette conversation minière », a déclaré Thadani. Le cas d’utilisation a montré que les demandes des clients pour des choses telles que des serviettes ou des mots de passe Wi-Fi pouvaient à la place être détournées vers des assistants vocaux, ce qui libérerait des ressources pour se concentrer sur l’expérience client.

Les grandes marques se penchent sur l’idée d’assistants vocaux personnalisés construits à partir d’une compréhension ciblée des émotions et du comportement des clients comme moyen de réaliser des gains de productivité en informatique vocale mutuellement bénéfiques. Erica de Bank of America et Alexa d’Amazon ont chacun leur propre personnalité extraite des conversations, des sentiments et des comportements des utilisateurs.

Prenons comme exemple Bank of America’s Erica, qui compte 10 millions d’utilisateurs et a pris en charge plus de 100 millions de demandes. « Elle fait des transferts de solde, elle fait des dépôts, elle accepte les demandes », a expliqué Thadani. Mais alors que la classe de technologie ambiante de 2020, y compris Erica, Alexa, Cortana et Julie«Ont été un énorme succès, ils sont toujours considérés comme« à l’ère de la demande, comme dans «J’ai posé une question et j’obtiens une réponse», a résumé Thadani.

Pourtant, être transactionnel en prenant des demandes n’était pas vraiment l’objectif, a noté Thadani. « Bank of America parie sur l’avenir, et dans le futur, Erica va prendre toutes ces données conversationnelles et ce sentiment, et se faire passer d’une assistante à une véritable conseillère financière », a-t-elle déclaré.

Supposons que les assistants vocaux agiront avec l’agence

L’intelligence ambiante va bien au-delà du référencement vocal et Erica de Bank of America démontre qu’elle est en bonne voie d’établir la confiance des clients que la solution proposée est optimale. «Le système intelligent doit être suffisamment intelligent pour le comprendre», a déclaré Kadaba.

Thadani a déclaré qu’il ne faudrait pas longtemps avant que les données conversationnelles, combinées aux données biométriques des appareils portables et de la connectivité, ainsi qu’à la vitesse de l’informatique 5G, passent à un modèle d’assistance proactive et ambiante dans tous les secteurs, des services financiers aux soins de santé et aux entreprises.

Alors que la pandémie COVID-19 se déroulait, la voix est devenue une technologie essentielle pour les travailleurs des soins de santé et des transports, a expliqué Thadani. «Lorsque vous songez à ajouter une couche d’assistance proactive, vous pourriez avoir un assistant pour aider à calculer le risque pour les patients ou à réorganiser la capacité de l’entrepôt», a-t-elle déclaré. «C’est là que tout cela va et c’est transformationnel. C’est l’avenir de la voix – une assistance proactive avec l’agence. »

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut