Un casque d'IA permet aux utilisateurs de se concentrer sur une seule voix dans les environnements bruyants

28 mai 2024

  • Des chercheurs ont mis au point des écouteurs qui permettent de distinguer les voix individuelles dans la foule
  • L'équipe de l'Université de Washington l'appelle Target Speech Hearing (TSH).
  • Elle est particulièrement prometteuse pour les personnes souffrant de troubles auditifs.
Audition de l'Ai

Des chercheurs de l'université de Washington ont mis au point un système d'intelligence artificielle qui permet aux casques antibruit d'isoler et d'amplifier une seule voix dans un environnement bruyant et encombré. 

Cette technologie, appelée Target Speech Hearing (TSH), permet aux utilisateurs de sélectionner une personne spécifique à écouter en la regardant simplement pendant quelques secondes.

Le système TSH répond à un problème commun aux casques antibruit : s'ils réduisent efficacement le bruit ambiant, ils le font sans discernement, ce qui empêche les utilisateurs d'entendre les sons spécifiques sur lesquels ils voudraient se concentrer. 

Comme l'explique Shyam Gollakota, professeur à l'université de Washington et chercheur principal du projet, expliqueL'écoute de personnes spécifiques est un aspect fondamental de notre façon de communiquer et d'interagir avec d'autres êtres humains. Mais il peut être très difficile, même si vous n'avez pas de problème de perte auditive, de vous concentrer sur des personnes spécifiques dans des situations bruyantes."

Comment cela fonctionne-t-il ?

Les étude combine intelligemment des écouteurs anti-bruit et l'intelligence artificielle pour distinguer les voix individuelles dans les environnements bruyants et bondés. 

  1. Pendant la phase d'"enrôlement", l'utilisateur regarde le locuteur cible pendant quelques secondes, ce qui permet aux microphones binauraux du casque de capturer un échantillon audio contenant les caractéristiques vocales du locuteur, même en présence d'autres locuteurs et de bruits.
  2. Le signal binaural capturé est traité par un réseau neuronal qui apprend les caractéristiques du locuteur cible, en séparant sa voix des locuteurs interférents à l'aide d'informations directionnelles.
  3. Les caractéristiques apprises du locuteur cible, représentées sous la forme d'un vecteur d'intégration, sont ensuite introduites dans un autre réseau neuronal conçu pour extraire la parole cible d'une cacophonie de locuteurs.
  4. Une fois que les caractéristiques du locuteur cible ont été apprises au cours de la phase d'inscription, l'utilisateur peut regarder dans n'importe quelle direction, bouger la tête ou marcher tout en continuant à entendre le locuteur cible.
  5. Le système TSH traite en permanence les données audio entrantes, en utilisant l'intégration du locuteur apprise pour isoler et amplifier la voix du locuteur cible tout en supprimant les autres voix et le bruit de fond.

Le prototype actuel ne peut enrôler efficacement qu'un locuteur ciblé dont la voix est la plus forte dans une direction donnée, mais l'équipe travaille à la mise au point d'un système d'enregistrement de la voix. améliorer le système pour qu'il puisse gérer des scénarios plus complexes avec des sources audio diverses et variées.

Samuele Cornell, chercheur au Language Technologies Institute de l'université Carnegie Mellon, salue la recherche pour ses applications claires dans le monde réel : "Je pense que c'est un pas dans la bonne direction. C'est une bouffée d'air frais".

Bien que le système TSH soit actuellement une preuve de concept, les chercheurs sont en pourparlers pour intégrer la technologie dans des marques populaires d'oreillettes anti-bruit et pour la rendre disponible pour les appareils auditifs. 

Avec l'amélioration de l'analyse audio et vocale, qui a fait un bond en avant avec GPT-4oLes personnes souffrant de déficiences visuelles et auditives pourront ainsi mieux se connecter au monde sensoriel qui les entoure.

Rejoindre l'avenir


SOUSCRIRE AUJOURD'HUI

Clair, concis, complet. Maîtrisez les développements de l'IA avec DailyAI

Sam Jeans

Sam est un rédacteur scientifique et technologique qui a travaillé dans diverses start-ups spécialisées dans l'IA. Lorsqu'il n'écrit pas, on peut le trouver en train de lire des revues médicales ou de fouiller dans des boîtes de disques vinyles.

×

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI

Inscrivez-vous à notre newsletter hebdomadaire et recevez un accès exclusif au dernier eBook de DailyAI : 'Mastering AI Tools : Your 2024 Guide to Enhanced Productivity" (Maîtriser les outils de l'IA : votre guide 2024 pour une meilleure productivité).

*En vous abonnant à notre lettre d'information, vous acceptez nos conditions d'utilisation. Politique de confidentialité et notre Conditions générales d'utilisation