Authentification des cibles de la solution biométrique vocale
Les progrès de l'intelligence artificielle permettent désormais une précision suffisante de la biométrie vocale pour qu'elle puisse être utilisée non seulement pour l'identification et la personnalisation, mais aussi pour des applications telles que l'authentification des paiements. Une nouvelle solution de Synaptics et ID R&D offre une biométrie vocale basée sur l'IA et des algorithmes anti-usurpation d'identité qui peuvent s'exécuter sur un SoC Synaptics dans l'appareil de périphérie. Plus précisément, le logiciel a été optimisé pour l'unité de traitement neuronal (NPU) de la série VS600 de Synaptics pour les appareils domestiques intelligents tels que les décodeurs (STB), les haut-parleurs intelligents et les systèmes de sécurité.
Synaptics vend ses SoC compatibles avec l'IA dans des produits pour la maison intelligente qui doivent traiter le streaming vidéo, le streaming audio et l'imagerie. Un cas d'utilisation typique pourrait être un STB incorporant des caméras pour la vidéoconférence, par exemple.
La biométrie vocale est désormais suffisamment précise pour permettre l'authentification des paiements dans les appareils domestiques intelligents
« Ce qui est commun à toutes les applications de décodeur et qui devient de plus en plus courant au fil du temps, c'est la possibilité d'utiliser la voix comme interface », a déclaré Vineet Ganju, vice-président du marketing chez Synaptics à EE Times . « Les télécommandes peuvent être activées par la voix afin que vous puissiez y parler pour naviguer dans votre compte Netflix et rechercher des films… la voix en tant qu'interface devient presque la norme dans ces applications. »
Lorsqu'un STB exécute Netflix, la première chose que les utilisateurs doivent faire est de sélectionner le profil à utiliser. Avec la biométrie vocale, le STB saurait immédiatement qui regardait, coupant une étape du processus.
"Par exemple, avec le contenu à la carte, vous pouvez non seulement effectuer une recherche vocale et trouver certains films qui ne font peut-être pas partie de votre abonnement, mais vous êtes également prêt à payer 5 $ pour les regarder", a déclaré Ganju. « Ensuite, [les opérateurs] veulent pouvoir s'authentifier immédiatement et vous faire acheter ce film sur place. Ils voient cela comme une énorme réduction des frictions, aidant les utilisateurs non seulement à trouver du contenu qui leur est personnalisé, mais aussi à pouvoir payer pour ce contenu et pouvoir le regarder. »
Inscription sur l'appareil
L'IA de biométrie vocale d'ID R&D extrait plus de 400 caractéristiques de la voix, y compris des combinaisons de paramètres liés à la fréquence/hauteur et d'autres éléments tels que la prononciation et les accents.
"Ce n'est pas limité à la manière dont certaines des générations précédentes de biométrie vocale étaient", a déclaré John Amein, vice-président senior des ventes chez ID R&D à EE Times , ajoutant que ce n'est que depuis environ un an que la biométrie vocale de l'IA a atteint la précision requise pour des applications telles que l'authentification des paiements.
L'algorithme apprend à reconnaître la voix de l'utilisateur grâce à un processus appelé « enrôlement » au cours duquel l'utilisateur répète une phrase trois fois. N'importe quelle expression peut être utilisée, et cela fonctionne dans n'importe quelle langue prête à l'emploi. L'inscription est traitée sur l'appareil périphérique.
L'algorithme d'IA d'ID R&D peut identifier les utilisateurs inscrits avec un taux de fausse acceptation inférieur à 1 sur 10 000, qu'Amein compare aux chances qu'une personne devine votre code PIN. Le taux de faux rejets - le taux auquel la voix de l'utilisateur inscrit est rejetée par erreur - est proche de 5%. Et le taux d'acceptation d'usurpation (SAR), pour les attaques d'usurpation d'identité telles que les enregistrements de la voix de l'utilisateur joués sur le système, est supérieur à 7 %, ce qui est la limite standard pour le déverrouillage biométrique des appareils Android.
« Entre la correspondance biométrique étant à un taux de fausse acceptation d'un sur 10 000 et l'anti-usurpation d'identité étant meilleur que le taux de 7 % requis par la norme Android, nous atteignons vraiment les deux choses qui sont nécessaires pour que la biométrie vocale soit acceptée. comme suffisamment sécurisé pour une autorisation de paiement », a déclaré Amein.
Anti-usurpation
La technologie anti-usurpation d'identité d'ID R&D repose également sur l'IA.
"La voix parlée a une bande passante qui va jusqu'à 3500 Hz, et nous échantillonnons à un taux beaucoup plus élevé que cela", a déclaré Amein. « Donc, nous entendons des fréquences plus élevées que la voix parlée. Nous écoutons dans ces gammes supérieures pour différentes caractéristiques. »
La voix humaine créée en parlant à travers notre conduit vocal tubulaire produit des fréquences caractéristiques qui sont très différentes des sons produits par la vibration d'une surface plane comme dans un haut-parleur. C'est l'un des éléments que l'IA anti-usurpation utilise pour distinguer une voix en direct d'un enregistrement.
"Nous pouvons également détecter les voix synthétisées, telles que les applications de synthèse vocale", a déclaré Amein. « Beaucoup d’entre eux ne sont pas si géniaux, mais ils deviennent de plus en plus réalistes. Et dans ce scénario, il y a toujours des anomalies dans le signal - il est trop parfait dans certains cas, ou il y aura juste des transitions ou des différences de phase que l'oreille ne peut pas entendre, mais l'[IA] peut. "
Unité de traitement neuronal
Les SoC de la série VS600 de Synaptics comportent une unité de traitement neuronal (NPU); le NPU du VS680 offre 6,75 TOPS tandis que le VS640 nouvellement annoncé offre 1 TOPS et vise "des coûts, des performances et des points de puissance plus courants", a déclaré Vineet Ganju de Synaptics. Le NPU de chaque partie a "plus qu'assez" de calcul pour exécuter simultanément les algorithmes de biométrie vocale et l'anti-usurpation d'identité d'ID R&D, a-t-il déclaré. La NPU a pu accélérer l'inférence biométrique vocale d'un facteur 10 par rapport à l'utilisation du processeur de la puce, dont l'utilisation a été réduite d'un facteur 3.
Synaptics fournit un ensemble d'outils pour permettre à des entreprises comme ID R&D d'optimiser leurs technologies pour le NPU, et bien que ID R&D soit le premier partenaire de Synaptics à cet égard, la société travaillera avec plus de partenaires à l'avenir pour des applications en dehors de la biométrie vocale.
« Sur la base de nos discussions avec les sociétés de reconnaissance vocale, nous pouvons en fait créer un moteur de reconnaissance vocale de vocabulaire anglais complet sur l'appareil, bien dans les limites de la capacité 1 TOPS de la NPU », a déclaré Ganju. « Donc, vous pouvez avoir un produit entièrement hors ligne en ce qui concerne la reconnaissance vocale… par exemple, pour les produits où les utilisateurs ne le connectent pas immédiatement à leur WiFi, la reconnaissance vocale intégrée peut les aider à obtenir une bonne expérience prête à l'emploi avant même c'est connecté."
La première version logicielle de ID R&D sera disponible sur les kits de développement VS600 de Synaptics plus tard ce mois-ci.
>> Cet article a été initialement publié le notre site partenaire, EE Times.
Technologie de l'Internet des objets
- Un capteur IIoT vers une solution de passerelle cloud
- Équations différentielles
- Solution Minterm vs Maxterm
- Mesure du pH
- Q&R avec un architecte de solution Industrie 4.0
- Siemens et Bentley lancent une solution pour accélérer la numérisation des usines
- La solution Azima DLI cible les programmes de surveillance de l'état des machines
- Voix du client sur la machine CNC
- Intégration IHM-PLC