On espérait cet appareil depuis deux ans, le voici enfin dans nos mains ! Son nom ? Home Assistant Voice Preview Edition. Comme son nom l’indique, il s’agit d’un assistant vocal, ou plus précisément d’un périphérique permettant d’utiliser Assist sous Home Assistant comme on le fait avec nos enceintes Alexa ou Google Assistant. J’ai eu la chance de le recevoir quelques semaines avant sa sortie afin de pouvoir vous en parler plus en détail dès aujourd’hui. Voici mon avis sur ce petit appareil qui risque bien de marquer le début d’une nouvelle ère pour nos assistants vocaux. Oui, rien que ça !
Home Assistant Voice Preview Edition : une nouvelle ère pour nos assistants vocaux ?
Présenté dans un petit carton au format très compact, Home Assistant Voice Preview Edition n’est pas une version de test à destination des médias et des influenceurs, mais un aperçu public de ce que devrait être un jour la première enceinte connectée avec Assist, l’assistant vocal du système domotique Home Assistant. Qu’on se le dise, ce n’est pas un produit encore parfaitement abouti, mais Nabu Casa l’assume et s’en explique.
Pour être honnête, ce ne fut pas tout à fait le même effet Waouh! que lors de la réception de mon premier Amazon Echo en bêta, mais je n’ai cependant pas boudé mon plaisir en découvrant l’objet. Alors même que j’ignorais encore les tenants et aboutissants du projet dévoilé hier soir lors du live Voice : Chapter 8, j’ai tout de suite compris que j’avais entre les mains quelque chose qui pourrait bien marquer le début d’une nouvelle ère pour nos assistants vocaux. Une sensation que j’avais aussi connue avec Alexa : celle de participer aux prémices d’une technologie capable de transformer nos maisons connectées. Bis repetita ? Oui, à en croire Paulus Schoutsen, fondateur de Home Assistant, « l’ère des assistants vocaux ouverts et privés commence maintenant ». Et ce qui est formidable, c’est que nous pouvons tous y participer !
A l’ouverture, je découvre donc le tout premier Home Assistant Voice Preview Edition. L’appareil prend la forme d’un parallélépipède à base carrée de 84 mm de côté et 21 mm d’épaisseur pour seulement 96 grammes. Sa coque semi-transparente en polycarbonate moulé par injection est de belle facture. On a vu plus sexy, mais ses finitions sont irréprochables et j’aime bien son anneau LED qui n’est pas sans rappeler celui des appareils d’Amazon. Au centre, un bouton et une molette rotative. Le premier est multifonction, la seconde permet de régler le volume de l’appareil. C’est simple et intuitif.
Sur les côtés, un interrupteur de microphone permet de physiquement couper l’alimentation de ce dernier, vingt-quatre petits trous témoignent de la présence d’un haut-parleur, une sortie mini-Jack 3.5 mm permet de relier une enceinte et un port USB-C (5V DC, 2A) est chargé de l’alimentation de l’appareil… Qui est livré sans adaptateur et sans câble USB-C. Dommage, mais pas rédhibitoire non plus.
En retournant l’appareil, on s’aperçoit que quatre petits patins cachent autant de vis qui permettent d’ouvrir le périphérique à l’aide d’un simple tournevis cruciforme afin d’en observer les entrailles. C’est un produit open source, il n’y a rien à cacher ! On note aussi la présence d’un port Grove qui permet à un capteur d’utiliser l’alimentation et la connexion Wi-Fi de l’appareil. Les makers apprécieront !
A l’intérieur, on découvre le circuit imprimé. Maintenu lui-aussi par quatre vis, il est composé d’un SoC ESP32-S3 avec 16 MB de stockage flash et 8 MB de PSRAM octal, d’une puce XMOS XU316 pour le traitement audio, d’un DAC TI AIC3202 – 48 kHz qui permet de diffuser de l’audio sans perte via la sortie 3.5 mm évoquée plus haut, et d’un petit haut-parleur Simpusun MH4-HR pas vraiment fait pour écouter de la musique. Une puce Wi-Fi 2.4 GHz et Bluetooth 5.0 LE complète le tout. Vous retrouverez l’ensemble des spécifications techniques ci-dessous.
Fiche technique
- Marque : Nabu Casa
- Produit : Home Assistant Voice Preview Edition
- Modèle : NC-VK-9727
- Matériaux : polycarbonates banc et semi-transparent
- SoC : ESP32-S3 SoC with 16 MB of FLASH storage, 8 MB octal PSRAM
- Audio :
- Audio processing XMOS XU316
- sortie stéréo mni-Jack 3.5 mm (⅛”)
- DAC : TI AIC3202 – 48 kHz
- Radio :
- 2.4 GHz Wi-Fi
- Bluetooth 5.0 Low Energy
- Pré-requis : Home Assistant installé et configuré sur un autre appareil
- Température d’utilisation : O°C to 30°C (32°F to 86°F)
- Humidité : à conserver dans un endroit propre et sec sans condensation
- Alimentation : USB-C, 5V DC / 2A
- Dimensions : 84 x 84 x 84 x 21 mm
- Poids : 96 grammes
Installation de Home Assistant Voice Preview Edition
Pour installer Home Assistant Voice Preview Edition, le plus simple est d’utiliser l’application Companion pour Android ou iOS, mais vous pouvez également réaliser cette installation via un navigateur web si votre serveur domotique dispose du Bluetooth, ou encore si vous posséder un appareil ESPHome configuré comme proxy Bluetooth et connecté à Home Assistant. Nous allons donc utiliser un iPhone.
Via mobile, il vous suffit de suivre les étapes ci-dessous :
- Branchez Home Assistant Voice Preview Edition à une source d’alimentation à l’aide du câble USB-C. Une animation lumineuse blanche devrait apparaître très rapidement ;
- Ouvrez l’application Home Assistant Companion pour iOS ou Android ;
- Accédez à Paramètres > Appareils et services ;
- Un écran « Search devices » devrait automatiquement apparaître, appuyez sur le bouton Continuer ;
- Dans « Découvertes », sélectionnez l’appareil nommé « home-assistan-12345a » et cliquez sur « Ajouter », puis « Soumettre » ;
- Entrez les identifiants de votre réseau Wi-Fi (SSID et mot de passe) ;
- Lorsque cela est demandé, appuyez sur le bouton central de l’appareil pour autoriser la connexion.
- Sous « Découvertes », choisissez « Home Assistant Voice 12345a » ;
- Patientez quelques minutes pendant la mise à jour ;
- Suivez les instructions à l’écran pour configurer l’assistant vocal.
Okay Nabu : configurer la voix, le mot de réveil et la couleur des LED
Le mot de réveil par défaut est « Okay Nabu », car c’est le plus fiable et efficace à l’heure actuelle, mais vous pouvez le remplacer par « Hey Jarvis » ou encore « Hey Mycroft ». C’est tout pour l’instant. Ceux qui rêvaient de pouvoir utiliser leur propre wake word devront attendre, mais ça n’est pas vraiment une surprise car les mots de réveil personnalisés sont rarement efficaces. En effet, il faut une masse assez considérable d’échantillons pour entraîner ces algorithmes, c’est d’ailleurs la raison pour laquelle Amazon avait organisé une bêta avant la sortie d’Alexa en France, alors n’hésitez pas à aider à l’amélioration de microWakeWord en participant au programme Wake Word Collective. La communauté vous en sera reconnaissante.
Pour ce qui est de la synthèse vocale, vous pouvez choisir entre 14 voix féminines ou masculines, mais vous les connaissez probablement déjà pour avoir essayé Assist sur votre instance Home Assistant. Personnellement, j’ai choisi la voix masculine Claude pour éviter de vexer Alexa… 😂
Il est également possible de personnaliser la couleur de l’anneau lumineux. Pour ce faire, tournez la molette tout en appuyant sur le bouton central ou accédez à ses réglages depuis l’interface de Home Assistant en cliquant sur l’icône située devant « LED Ring ».
Enfin, on retrouve un contrôle pour le volume, des interrupteurs pour couper le microphone, activer ou désactiver le son de réveil, et l’indispensable journal des événements de l’appareil.
Un assistant vocal local ?
Vous rêviez d’un assistant vocal local ? Bonne nouvelle, Home Assistant Voice Preview Edition peut s’exécuter en local, ou presque… En fait, c’est Assist qui le peut, mais attention, ce n’est pas encore pour tout le monde et ce n’est pas non plus comme ça qu’il est le plus efficace. Pour l’instant.
En effet, si vous espériez un appareil capable de faire de la reconnaissance vocale (STT) ou de la synthèse vocale (TTS) sur son propre hardware, ce n’est pas celui que vous attendiez, vous aurez besoin en plus d’une machine suffisamment puissante. Nabu Casa recommande un système fonctionnant avec au minimum un processeur Intel N100 et un processeur graphique disposant de suffisamment de VRAM. C’est un peu flou, non ? Oui, mais de toute façon, ce n’est pas le seul obstacle et vous serez probablement déçu d’apprendre que le français n’est encore disponible en local.
Bref, pour l’instant, vous devrez donc en passer par le cloud de Nabu Casa, et utiliser Assist dans le cloud vous coûtera donc 7,50€/mois (ou 75€/an). Un abonnement qui vous apporte cependant d’autres services et qui permet de soutenir le développement de Home Assistant, et donc d’espérer un jour un assistant vocal local en français, mais certains préféreront évidemment éviter de passer à la caisse…
Si tel est votre cas, il vous reste toujours la possibilité de l’utiliser en local en installant Piper et Whisper, mais vous risquez vite de regretter Alexa ou Google Assistant, surtout si vous préférez parler en français. Pour ce qui est de l’IA, vous pouvez aussi héberger des LLM en local comme Ollama, mais il vous faudra alors une infrastructure encore plus solide avec un processeur graphique disposant de suffisamment de VRAM.
Si on additionne le coût de l’infrastructure, sa consommation d’énergie, le temps passé à la maintenir et la sécuriser (ce dernier point est trop souvent négligé), l’abonnement proposé par Nabu Casa n’est finalement pas si cher… Et le raisonnement est encore plus vrai pour Alexa, Google Assistant ou Siri qui sont (encore) gratuits. Bref, si vous utilisez déjà un assistant vocal grand public, alors la migration n’est pas forcément très intéressante, d’autant que les capacités actuelles d’Assist sont très en deçà de ce à quoi vous êtes habitué. En tout cas, à l’heure où j’écris ces lignes, car tout ceci est appelé à évoluer dans les années à venir…
Notre avis sur Home Assistant Voice
En conclusion, Home Assistant Voice est un périphérique prometteur. Compact et discret, l’appareil ne jure pas trop dans nos intérieurs contemporains. Ce n’est pas un canon de beauté, mais ses finitions sont irréprochables et sa coque moulée par injection est déjà bien plus esthétique que la plupart des boîtiers DIY que vous pourriez faire avec votre imprimante 3D. Si toutefois vous souhaitez en imprimer une pour la personnaliser, sachez que les fichiers 3D sont disponibles ici.
D’un point de vue hardware, l’appareil est simple mais bien conçu. Certes, son électronique embarquée se limite en gros à un ESP32-S3 avec deux microphones et un haut-parleur, dont certains ne manqueront pas de souligner qu’il est possible de le fabriquer soi-même pour bien moins cher, mais il devrait ravir tous ceux qui n’ont pas la possibilité d’en réaliser un ou qui n’ont tout simplement pas le temps de s’embêter avec ça, et qui souhaitent tout de même utiliser Assist pour piloter leur domotique Home Assistant à la voix. Pour tous ceux-là, il suffit de brancher ce périphérique et de suivre les instructions. En quelques minutes l’affaire est réglée et vous pouvez passer des commandes vocales à Assist. C’est quand-même bien ! J’ai aussi apprécié son bouton de volume et son anneau de LED qui n’est pas sans nous rappeler les appareils Alexa.
Attention, cependant, Home Assistant Voice n’est pas encore au niveau d’un Amazon Echo ou Google Nest. S’il me fait un peu penser au tout premier Echo Dot de 2016, ce sont surtout les limites d’Assist qui me rappellent les débuts d’Alexa. En effet, la détection du mot de réveil est encore assez aléatoire. Malgré l’ajout d’une puce de traitement audio, le micrologiciel XMOS est encore à des années lumière de ce que nous proposent les géants du secteur. Heureusement, me direz-vous, car comme le dit avec humour Mike Hansen, responsable de l’ingénierie vocale chez Nabu Casa, le budget alloué à son équipe correspond probablement à ce que l’équipe vocale d’Amazon dépense en pizzas. Ne vous étonnez donc pas qu’Assist ne soit pas encore au niveau, et gardez à l’esprit que si vous trouvez Alexa ou Google Assistant sourd, vous n’avez pas fini de hausser le ton, voire carrément de baisser la musique ou de couper le son de la télévision pour passer une commande.
Des commandes vocales que vous devrez aussi répéter de façon très méthodique, Assist n’étant pas encore capable de comprendre les nombreuses nuances du langage naturel. Autrement dit, si vous changez un peu votre requête, il y a de grandes chances pour qu’il ne la comprenne pas. Les premiers assistants vocaux ont énormément progressé sur ce point, Assist a des années de retard à rattraper, mais nul doute qu’il y parviendra avec le temps. En attendant, il est suffisant pour passer quelques commandes simples, comme allumer la lumière ou éteindre des prises connectées, régler des minuteurs ou gérer des listes d’achats. Par contre, il ne saura ni répondre à des questions de culture générale, ni amuser la galerie avec des blagues pourries… A moins de lui adjoindre un LLM.