Fabrication industrielle
Internet des objets industriel | Matériaux industriels | Entretien et réparation d'équipement | Programmation industrielle |
home  MfgRobots >> Fabrication industrielle >  >> Industrial Internet of Things >> Technologie de l'Internet des objets

La démocratisation de l'interface vocale

Les livres d'histoire pourraient bien considérer la commande vocale comme l'avancée la plus importante réalisée dans l'interface homme-machine. Plus besoin de taper, plus de pointer, on dit juste ce qu'on veut. Les premiers progrès dans ce domaine ont ralenti jusqu'à l'avènement des haut-parleurs intelligents, lorsque nous avons commencé à réaliser ce qui pourrait être possible. Maintenant, la course est lancée avec des améliorations en matière de reconnaissance, de fonctionnalités et d'applications dans les téléphones, les casques, les écouteurs et la maison intelligente. Les solutions les plus connues aujourd'hui reposent sur des plateformes et des services contrôlés par un petit nombre de fournisseurs, mais cela est en train de changer. L'activation vocale peut être intégrée n'importe où, avec une personnalisation, une immunité au bruit améliorée, une puissance réduite, une portée plus longue tout en étant tout aussi efficace que les grandes plates-formes de reconnaissance vocale.


(Source :CEVA/Shutterstock)

Le marché audio grand public, où cette capacité joue un rôle important, a une histoire intéressante. FutureSource montre que de 2008 à 2012, le volume en dollars a diminué, les expériences audio se consolidant principalement sur les smartphones. De 2012 à 2014, le marché est resté essentiellement stable. Puis de 2015 à 2018, il a de nouveau augmenté à un TCAC de 15 %, principalement grâce à l'activation vocale. À l'avenir, Yole Développement prévoit un TCAC d'au moins 30 % d'ici 2023, principalement basé sur la reconnaissance vocale . L'essentiel de cette croissance continuera de se situer dans les smartphones, suivis des casques et appareils auditifs, des assistants personnels et des fonctionnalités de la maison intelligente (téléviseurs, appareils électroménagers, etc.). Le même rapport conclut que nous entrons maintenant dans une deuxième phase de l'audio intelligent, où le contrôle vocal deviendra beaucoup plus répandu, à mesure que les consommateurs se sentiront plus à l'aise avec cette méthode de contrôle.

Partout où ils sont déployés, l'objectif est de renforcer la différenciation. Dans un smartphone ou tout autre appareil fonctionnant sur batterie, un avantage évident est de prendre en charge l'écoute permanente; pas besoin d'appuyer sur un bouton avant de donner une commande. Cela nécessite une détection de mot de déclenchement à très faible consommation, ce qui, comme nous le savons, signifie un matériel avec un logiciel étroitement adapté afin de minimiser la puissance de veille. Naturellement, vous souhaitez personnaliser des mots ou des phrases déclencheurs pour votre marque, et dans plusieurs langues, afin d'obtenir une forte pénétration dans votre région et peut-être aussi sur le marché international. Vous pouvez toujours transmettre les commandes suivantes à l'un des principaux fournisseurs de reconnaissance vocale pour décompresser la demande. Ou peut-être pas. Si votre appareil n'a besoin que d'une assistance pour un vocabulaire limité, vous n'aurez peut-être pas besoin de l'aide d'un tiers, si votre moteur de reconnaissance vocale peut être étendu à cet objectif.

Un autre besoin critique est la reconnaissance et peut-être l'authentification, dans un environnement bruyant. La reconnaissance vocale présente des défis différents de ceux de la reconnaissance d'objets. Dans un salon ou une voiture par exemple, il peut y avoir plusieurs sources sonores :des personnes qui parlent, la télévision et des sources indépendantes de musique/radio, le bruit intérieur et extérieur et les échos de tous ces éléments provenant des surfaces d'une pièce ou de l'intérieur d'une voiture. Isoler la source d'une commande, annuler les échos et réduire le bruit de fond nécessite une technologie sophistiquée dépendant de plusieurs microphones, de la formation de faisceau et de l'annulation d'écho, ainsi que de la suppression du bruit.

Tels sont les besoins et naturellement, les solutions disponibles telles que celles de CEVA sont prêtes à répondre à ces besoins. Des solutions telles que le produit de reconnaissance de phrases CEVA WhisPro™ récemment introduit utilisent un logiciel basé sur un réseau neuronal fonctionnant sur les plates-formes CEVA DSP. WhisPro prend déjà en charge « Alexa » et « OK Google » en tant que déclencheurs vocaux et il peut être personnalisé lors de la formation pour prendre en charge tous les déclencheurs demandés par le client. Il prend en charge plusieurs langues et peut gérer plusieurs déclencheurs vocaux. La formation est effectuée avec plusieurs bruits de fond, de sorte que la reconnaissance a une immunité au bruit intégrée, offrant une reconnaissance> 95 % et une fausse acceptation de moins de 1 par heure, sans avoir besoin de vérification dans le cloud.

En ajoutant une solution spécialisée de prise de voix, CEVA ClearVox™, les développeurs peuvent obtenir une prise en charge de plusieurs microphones et une formation de faisceau pour une meilleure prise de voix en champ lointain, ainsi qu'une annulation d'écho et une réduction supplémentaire du bruit. L'association de WhisPro avec ClearVox offre une reconnaissance de déclenchement compétitive à une meilleure distance (jusqu'à 7 mètres), en particulier dans les environnements bruyants.


Youval Nachum est le directeur principal du marketing produit de CEVA pour la gamme de produits audio et vocaux. Youval apporte plus de 20 ans d'expérience multidisciplinaire, couvrant les domaines du marketing, de l'architecture système, des ASIC et des logiciels dans des entreprises technologiques de premier plan. Il est passionné par l'anticipation des tendances à long terme et la conduite de programmes techniques jusqu'à leur réussite. Très compétent dans la combinaison des exigences du marché, des définitions de produits, des normes de l'industrie et des innovations de conception dans des produits révolutionnaires. Youval détient un B.Sc. et M.Sc. en génie électrique du Technion - Israel Institute of Technology.


Technologie de l'Internet des objets

  1. L'interface de ligne de commande
  2. Interface C#
  3. InterfaceJava
  4. Que dois-je faire avec les données ? !
  5. Interface vs classe abstraite en Java :quelle est la différence ?
  6. Exprimez-vous :la technologie vocale améliore les inspections de produits
  7. C# - Interfaces
  8. Comment la technologie de reconnaissance vocale peut-elle améliorer les processus de fabrication ?
  9. La réalité augmentée devient l'interface utilisateur de l'IoT