Un casque d'IA permet aux utilisateurs de se concentrer sur une seule voix dans des environnements bruyants

Des chercheurs de l'université de Washington ont mis au point un système d'intelligence artificielle qui permet aux casques antibruit d'isoler et d'amplifier une seule voix dans un environnement bruyant et encombré.

Cette technologie, appelée Target Speech Hearing (TSH), permet aux utilisateurs de sélectionner une personne spécifique à écouter en la regardant simplement pendant quelques secondes.

Le système TSH répond à un problème commun aux casques antibruit : s'ils réduisent efficacement le bruit ambiant, ils le font sans discernement, ce qui empêche les utilisateurs d'entendre les sons spécifiques sur lesquels ils voudraient se concentrer.

Comme l'explique Shyam Gollakota, professeur à l'université de Washington et chercheur principal du projet, expliqueL'écoute de personnes spécifiques est un aspect fondamental de notre façon de communiquer et d'interagir avec d'autres êtres humains. Mais il peut être très difficile, même si vous n'avez pas de problème de perte auditive, de vous concentrer sur des personnes spécifiques dans des situations bruyantes."

Comment cela fonctionne-t-il ?

Les étude combine intelligemment des écouteurs anti-bruit et l'intelligence artificielle pour distinguer les voix individuelles dans les environnements bruyants et bondés.

Pendant la phase d'"enrôlement", l'utilisateur regarde le locuteur cible pendant quelques secondes, ce qui permet aux microphones binauraux du casque de capturer un échantillon audio contenant les caractéristiques vocales du locuteur, même en présence d'autres locuteurs et de bruits.
Le signal binaural capturé est traité par un réseau neuronal qui apprend les caractéristiques du locuteur cible, en séparant sa voix des locuteurs interférents à l'aide d'informations directionnelles.
Les caractéristiques apprises du locuteur cible, représentées sous la forme d'un vecteur d'intégration, sont ensuite introduites dans un autre réseau neuronal conçu pour extraire la parole cible d'une cacophonie de locuteurs.
Une fois que les caractéristiques du locuteur cible ont été apprises au cours de la phase d'inscription, l'utilisateur peut regarder dans n'importe quelle direction, bouger la tête ou marcher tout en continuant à entendre le locuteur cible.
Le système TSH traite en permanence les données audio entrantes, en utilisant l'intégration du locuteur apprise pour isoler et amplifier la voix du locuteur cible tout en supprimant les autres voix et le bruit de fond.

Le prototype actuel ne peut enrôler efficacement qu'un locuteur ciblé dont la voix est la plus forte dans une direction donnée, mais l'équipe travaille à la mise au point d'un système d'enregistrement de la voix. améliorer le système pour qu'il puisse gérer des scénarios plus complexes avec des sources audio diverses et variées.

Samuele Cornell, chercheur au Language Technologies Institute de l'université Carnegie Mellon, salue la recherche pour ses applications claires dans le monde réel : "Je pense que c'est un pas dans la bonne direction. C'est une bouffée d'air frais".

Bien que le système TSH soit actuellement une preuve de concept, les chercheurs sont en pourparlers pour intégrer la technologie dans des marques populaires d'oreillettes anti-bruit et pour la rendre disponible pour les appareils auditifs.

Avec l'amélioration de l'analyse audio et vocale, qui a fait un bond en avant avec GPT-4oLes personnes souffrant de déficiences visuelles et auditives pourront ainsi mieux se connecter au monde sensoriel qui les entoure.

Un casque d'IA permet aux utilisateurs de se concentrer sur une seule voix dans les environnements bruyants

Comment cela fonctionne-t-il ?

Rejoindre l'avenir

Sam Jeans

ARTICLES ASSOCIÉS

ChatGPT Is Making People Think They’re Gods and Their Families Are Terrified

China Unveils World’s First AI Hospital: 14 Virtual Doctors Ready to Treat Thousands Daily

Katy Perry Didn’t Attend the Met Gala, But AI Made Her the Star of the Night

Therapists Too Expensive? Why Thousands of Women Are Spilling Their Deepest Secrets to ChatGPT

Un casque d'IA permet aux utilisateurs de se concentrer sur une seule voix dans les environnements bruyants

Comment cela fonctionne-t-il ?

Rejoindre l'avenir

Sam Jeans

ARTICLES ASSOCIÉS

ChatGPT Is Making People Think They’re Gods and Their Families Are Terrified

China Unveils World’s First AI Hospital: 14 Virtual Doctors Ready to Treat Thousands Daily

Katy Perry Didn’t Attend the Met Gala, But AI Made Her the Star of the Night

Therapists Too Expensive? Why Thousands of Women Are Spilling Their Deepest Secrets to ChatGPT

PDF GRATUIT EXCLUSIFGardez une longueur d'avance avec DailyAI

PDF GRATUIT EXCLUSIF
Gardez une longueur d'avance avec DailyAI