Dans les cuisines d’Alexa, la voix d’Amazon

Internet vous parle. Ou plutôt, « Alexa » vous parle. Alexa est un assistant vocal créé par Amazon, en vente depuis plus d’un an maintenant. Il permet à ses heureux propriétaires d’obtenir des infos disponibles en ligne en « discutant » avec leur assistant. Génial, non ? Mais qu’y a-t-il derrière son joli timbre de voix ? Est-il vraiment intelligent ? Pourquoi Amazon s’est-il lancé dans ce projet ? Quel est son coût écologique ? Réponses.

Pressé·e ? Voici la synthèse de l’article ! >> Alexa, l’assistant vocal d’Amazon, a une grande ambition : rendre Internet accessible à tous et toutes. Un assistant vocal a en effet un grand avantage : finis clavier, souris, écran. Mais derrière cette belle perspective, Alexa est non seulement beaucoup moins intelligente qu’elle n’en a l’air, mais elle a en plus un coût écologique très important. Pire : Alexa a surtout pour objectif de nous faire naviguer dans un Internet très rabougri : celui d’Amazon et ses services (musique, vidéo, e-commerce).

Précision : ce contenu est une synthèse d’une partie des articles publiés par l’excellent journal en ligne « Les jours » dont les éclairages sur Alexa sont passionnants. Le bureau de Ganesh ne peut que vous recommander de vous y abonner !

D’où vient Alexa ?

Alexa est, d’après Lesjours.fr, la troisième étape historique « de notre relation aux machines connectées.« 

Ainsi, « la première étape était l’interface textuelle, jusqu’au milieu des années 1990. Le très grand public en est resté largement exclu, c’était une affaire de scientifiques et de passionnés capables de taper douze lignes de code pour que leur clavier passe en majuscules.« 

La 2e étape a largement ouvert l’informatique au grand public : « la deuxième révolution a commencé avec l’invention du World Wide Web (avec notamment des pages dotées d’une adresse URL reliées entre elles par des liens hypertexte), d’une interface graphique et du couple clavier-souris : tout d’un coup, monsieur et madame Tout-le-Monde pouvaient faire beaucoup plus de choses facilement et intuitivement.« 

La voix est la 3e grande évolution du lien entre l’homme et la machine connectée

Vous avez compris en quoi consiste la 3e étape : plus besoin de souris, plus besoin de clavier, plus besoin d’écran ! La voix fait tout. Vous avez besoin de la météo ? Avant, vous allumiez votre ordinateur, vous lanciez un navigateur, tapiez une requête sur un moteur de recherche, attendiez que la page se charge et enfin – ouf ! – vous consultiez la météo.

La voix supprime toutes ces étapes. Dorénavant, demandez-le simplement à Alexa. À voix haute. Et Alexa vous donne immédiatement l’information. Plus de souris, plus de clavier, plus d’écran. Un rêve d’accessibilité.

Génial, non ? Oui… mais.

Pourquoi Amazon a-t-il investi le numérique vocal ?

C’est assez simple : pour vendre davantage.

C’est qu’avant de vendre des enceintes connectées, Amazon est surtout un site de e-commerce très populaire. Et Alexa, dans l’esprit d’Amazon, est un canal supplémentaire pour inciter les utilisateurs à acheter davantage sur son site de e-commerce.

Une publicité pour Alexa sur Amazon.fr.
Alexa, l’assistant vocal d’Amazon, permet de recruter des clients pour sa marketplace.

Chaque nouveau propriétaire d’Alexa est donc un nouveau client Amazon, de fait. Malgré tout, cette stratégie n’est pas vraiment couronnée de succès pour l’instant : aux États-Unis, « seuls 2 % des utilisateurs auraient acheté quelque chose via l’assistant d’Amazon [en 2018]. L’entreprise a démenti ce chiffre, mais les sondages d’usage vont dans le même sens : aujourd’hui, on n’utilise pas, ou très peu, un assistant vocal pour acheter.« 

Ce « smart speaker » est-il vraiment intelligent ?

Alors, non. Vraiment pas.

Comme l’écrit Lesjours.fr : « Amazon vend son abonnement Prime. Indispensable pour activer Alexa, il est la porte d’entrée pour son catalogue infini de produits, livrables sur simple demande. »

Mais Alexa se perd facilement. Lesjours.fr donne un exemple très éclairant de son « intelligence » très limitée. Imaginons que vous souhaitiez commander du café. Vous demandez à Alexa de le faire, via Amazon donc (oui, oui, vous pouvez aussi acheter des produits alimentaires sur Amazon). Et là, Alexa panique : « Est-ce qu’on parle de café en grains ou moulu ? En dosettes ? Mais quelles dosettes ? Du robusta ou je ne sais quoi ? Quelle force ? Pour quelle machine ? Et puis quelle marque ? »

Bref, Alexa se noie dans les nombreuses possibilités et vous, vous repassez au bon vieil écran-clavier-souris (ou à votre smartphone).

Une photo d'Alexa posée sur une table.
Alexa, un « smart speaker » pas si intelligent.

Ainsi, seules les demandes récurrentes (vous achetez toujours le même café et vous avez préalablement défini précisément votre commande avec Alexa) peuvent être satisfaites. Ou des demandes pratiques concernant la météo, le prochain bus ou la prochaine séance de cinéma. Mais « pas grand-chose de plus, tant cette pseudo-intelligence artificielle ne parvient pas – encore – à engager une discussion qui mènerait rapidement au bon produit, notamment parce que l’énumération de listes par la voix est fastidieuse et inefficace.« 

Quel est le coût écologique ?

Il est double.

Pour le disséquer, Lesjours.fr s’est entretenu avec un chercheur spécialisé, Vladan Joler.

Celui rappelle d’abord une évidence… souvent oubliée : il faut les construire, ces assistants vocaux ! Et comme toutes les machines informatiques, « il y a des matières premières qui sont extraites, notamment des métaux rares qui ne représentent que 0,2 % des masses de terre qui doivent être déplacées pour les trouver. » Un travail gigantesque fait avec des machines lourdes, très consommatrices de pétrole, donc émettrices de beaucoup de CO².

Des excavateurs en train de déblayer un terrain.
Pour construire des Alexa par milliers, il faut déterrer des « terres rares » avec des machines très polluantes…

Ensuite, chaque utilisation de l’assistant vocal a un coût écologique. Selon Vladan Joler, chaque requête « va déclencher des milliers de milliers de processus différents. Une fois qu’on a déclenché une action, cette action va elle-même en déclencher de nouvelles, comme, par exemple, l’analyse des données générées par votre comportement. » Une suite d’actions qui consomme à chaque fois de l’énergie, donc pollue.


Vous avez des questions ? Des remarques ? N’hésitez pas à nous en faire part sur notre page LinkedIn ou en nous envoyant un message, ici. Vous pouvez aussi recevoir tous nos conseils pratiques et notre article premium dans votre boîte mail une fois par mois.