Les questions scientifiques dans le centre-ville

Imaginez un sc�nario:

Dans un apr�s-midi ensoleill� ordinaire, vous marchez seul dans la rue, en face de deux personnes, ils discutent, nouvellement ouvert, � proximit� d'un d�panneur. Tout � coup, derri�re lui vint un �clat de chiens rapides aboiements � �corce Wang �, vous regardez rapidement revenir � la fa�on dont il �tait. A cette �poque, la rue, j'entendu la sir�ne de la voiture de police, � les enfants Wuwa, les enfants, les enfants Wuwa Hooroar. �

Apr�s un certain temps, vous passez devant Dieu, ils d�couvrent que le chien ne semble pas arr�ter les appels, mais la discussion est toujours pi�tonne du son est toujours l'oreille, la police siffler lentement crescendos plus loin.

Vous ne pouvez pas se rendre compte que, en fait, vous venez de rencontrer et facilement remplir un demi-si�cle de probl�mes de calcul scientifique casse-t�te - probl�me de cocktail.

1. sc�ne auditive figure dans une rue, des images de l'IEEE Spectrum

probl�me Cocktail Party (cocktail probl�me du parti), est un scientifique cognitiviste britannique Edward ColinCherry a propos� en 1953 dans l'�tude des m�canismes attentionnels. Il fait r�f�rence au genre de l'oreille humaine dans la capacit� complexe des environnements d'�coute � choisir.

Dans le cas de multiples voix est apparu, les gens peuvent se concentrer sur un stimulus sonore particulier, tout en ignorant d'autres bruits de fond. En d'autres termes, les humains peuvent se concentrer dans une conversation personnelle, tout en ignorant d'autres conversations ou le bruit de fond.

Rappelons que nous supposons que ce sc�nario, quand une sir�ne de voiture de police apparaissent, nous pouvons rapidement attirer l'attention � cette voix au-dessus, tout en ignorant les interf�rences d'autres sons, comme voix des pi�tons et des aboiements de chiens. Bien s�r, vous �tes libre de tester le comportement auditif dans l'environnement de multiples sources sonores, les faits vous diront, vous pouvez toujours entendre parfaitement naturel et une partie de ce que vous voulez entendre, mais pas toujours en m�me temps de se concentrer sur plus la source sonore.

Photos du r�seau

En fait, face � la capacit� d'attention auditive pour s�lectionner l'environnement complexe du syst�me auditif humain a montr� un talent incroyable. Bien que le m�canisme de l'effet cocktail du complexe, mais pour nous les humains, parmi de multiples sources sonores converties attention est une chose tr�s facile, que nous ne pouvons m�me pas sentir la pr�sence de ce processus. Cependant, pour nos ordinateurs ou une vari�t� d'appareils intelligents, comment s�lectionner le son que vous voulez entendre dans un environnement complexe, c'est un tr�s gros probl�me.

Pour r�soudre ce probl�me, les scientifiques ont men� des recherches et des analyses. Au cours des 60 derni�res ann�es, les scientifiques ont fait beaucoup de probl�mes pour l'approche de cocktail. Il peut �tre form� essentiellement de trois genres diff�rents: un proc�d� bas� sur le traitement du signal, les m�thodes bas�es sur des r�gles et des m�thodes bas�es sur la d�composition. Cependant, ces m�thodes sont encore limit�es dans leur hypoth�se respective Id�alement, les donn�es ou plus �tat stable. Pour le syst�me de calcul, s�lectionnez la prochaine audience du r�el environnement plus complexe est encore difficile d'obtenir les r�sultats souhait�s.

Heureusement, avec l'accumulation de donn�es et le d�veloppement de la technologie, les m�thodes, la profondeur des r�seaux de neurones ont commenc� � montrer leurs talents dans le domaine de la r�solution du probl�me de cocktail.

les questions de CocktailConf�rence sont destin�s � s�parer le signal utile du signal perturb� vocal, ce processus peut �tre un terrain tr�s naturel pour atteindre un probl�me d'apprentissage supervis�. Comme la profondeur de la fonction d'identification par r�seau de neurones est un proc�d� d'apprentissage de la surveillance du courant le plus puissant, il peut �tre utilis� en tant que signal d'apprentissage � partir des donn�es brutes bruyants pour isoler la cible (par exemple, le masque ou la voix sur le spectre d'amplitude d'int�r�t) dans.

R�cemment, l'Institut Acad�mie chinoise des sciences du mod�le auditif d'automatisation et de l'�quipe de l'informatique cognitive dans ce domaine ont fait de nouveaux progr�s. Les chercheurs proposent un mod�le de s�lection de l'attention auditive, nous allons nous concentrer sur le probl�me de cocktail � attention � et la cl� point de d�part.

Photos du r�seau

Les chercheurs font de ce mod�le ont �t� r�alis�es � �coute active � et � passive � stimulation deux t�ches. Lors de l'ex�cution de la t�che, l'empreinte vocale comporte plusieurs mod�les de haut-parleur dans l'enregistrement, le mixage de ces sons sont superpos�s sur le m�me canal de fr�quence. Ensuite, laissez la machine continuer � apprendre et � extraire ces caract�ristiques, accumul� une richesse de connaissances et d'exp�rience, laissez la machine pour identifier et extraire leur propre � int�r�t � � partir des informations de son.

l'attention auditive de s�lection. La structure de cellule de m�moire de la figure dur�e (b) pour stocker des caract�ristiques d'empreinte vocale du locuteur; (A) dans le mod�le de cadre g�n�ral FIG.

Dans des exp�riences comparatives pr�sent�es dans le discours anglais deux ensembles de donn�es indiquent que la s�lection du mod�le d'attention auditive meilleure robustesse en sc�ne auditive multi-haut-parleur contenant du bruit.

Cette �tude offre un nouvel avenir - une nouvelle voie sur une vari�t� de questions li�es � la voix de traitement dans un environnement complexe.

Imaginez que dans un avenir proche, dans un m�tro bruyant, nous rendons compte que sur la destination que vous pouvez rapidement et avec pr�cision compl�ter l'achat sur la machine de billet, dans le son de la t�l�vision forte, nous sommes encore loin de commande facile de robots intelligents �tre actionn� par la voix, dans la foule bruyante, nous sommes toujours sans accroc en utilisant l'assistant vocal du t�l�phone ...... tout le fonctionnement de la machine merveilleuse exub�rant � voix �, nous ne probablement plus des obstacles.

Les d�tails du travail, voir � lire l'original. �

Route de la soie

Apprenez � conna�tre la Chine

Les questions scientifiques dans le centre-ville