Laissez la machine apprendre � � lire dans les pens�es � besoins informatiques affectifs de la fa�on de r�soudre le sc�nario dans le monde r�el?

Vous faites un visage, ou dire un mot, la machine peut identifier avec pr�cision votre humeur.

Oui, quand vous �tes d�sireux d'obtenir � t�l�pathie � comp�tences, la machine a �t� en mesure d'atteindre le parfait. � l'heure actuelle, la technologie ouverte de l'aile int�rieure, l'entreprise Au-del� Verbal Isra�l et les Etats-Unis et Affectiva Emotient font ces solutions informatiques affectives. Le sc�nario d'application est tr�s large: l'humeur pilote de surveillance, centre d'appels d'�valuation �motionnelle, suivi de l'intelligence �motionnelle �tudiants et m�me le mat�riel peuvent utiliser ces algorithmes, et la pr�cision peut atteindre 90%.

En termes simples, la machine est bas�e sur la personne de la fr�quence cardiaque, la respiration, la voix, et m�me les expressions du visage et d'autres caract�ristiques, alors les gens seront en mesure d'interpr�ter l'�tat �motionnel gr�ce � un algorithme de mod�le sp�cifique, d'un point de vue technique, l'exploration de donn�es, l'apprentissage machine et sont donc des �motions base de calcul.

Ainsi, le module complet qui d�termine les besoins �motionnels? Et le principe de mise en uvre sp�cifique est ce qui est il? Cette question a frapp� dur classe ouverte, Lei Feng r�seau invit� � l'aile ouverte Weiqing Chen, fondateur de la science et de la technologie en tant que part des questions de technologie de l'informatique affective et des sc�narios.

Invit� Pr�sentation

Weiqing Chen, la technologie open aile fondateur de EmoKit, EmoKit a actuellement la responsabilit� g�n�rale de la planification strat�gique de l'entreprise, la gestion des op�rations, le renforcement de l'�quipe, l'�quipe deux scientifiques cl�s ont �t� rapatri�s post-doctorants.

EmoKit, � savoir les moteurs de l'informatique affective sir�ne, y compris l'identification �motionnelle, l'optimisation, l'expression, l'intelligence artificielle est l'une des infrastructures de base. Depuis 2015, la cr�ation de six mois pour obtenir 6 millions d'investissement, compte aujourd'hui plus de 20 millions d'utilisateurs, pr�s de 20 millions de yuans cette ann�e pour obtenir l'ordre. Emokit a remport� le Massachusetts Institute of Technology organis� par le "MIT-CHEF Global Entrepreneurship Competition," la premi�re r�gion chinoise, la Finlande "Slush monde 2014 Global Entrepreneurship Competition" au premier rang, le minist�re de l'Industrie et de l'Association nationale pour le plan d'affaires Concours 2015 National Mobile Internet " grand Prix "l'Universit� de Tsinghua, H + Lab" heureux championnat technologie de d�fi mondial �.

La consolidation suivante de la classe actuelle ouverte, Lei Feng r�seau ne voulait pas changer l'�diteur:

des modules de calcul et de la valeur Affective

Sur ce que nous faisons maintenant, nous mettons l'informatique affective est divis� en trois modules: la premi�re partie est la reconnaissance de l'�motion, et un sens du taux de changement pour d�terminer l'humeur de l'utilisateur par la voix, le rythme cardiaque, les expressions du visage et de l'�criture pression process.

reconnaissance Emotion

Type �motionnel d'un total de 24 esp�ces, 12 sortes de divers positif et n�gatif. Dans le processus de d�veloppement affectif de l'informatique, l'algorithme a �galement enregistr� six mises � niveau. Nous escaladons l'�valuation de la premi�re g�n�ration, deuxi�me g�n�ration a rejoint le rythme cardiaque et la respiration, augmentation de troisi�me g�n�ration pour l'�tude longitudinale individuelle et la formation, la quatri�me g�n�ration des �motions que nous avons fait un raffinement (augmentation du 5 original dans l'ambiance � 24 sortes), la cinqui�me g�n�ration � se joindre � l'expression de la reconnaissance des �motions et des notes, la sixi�me g�n�ration de faire deux t�ches principales: une fois qu'un utilisateur est de d�terminer l'�tat d'esprit d'identifier plus fond�e sur l'intention de l'utilisateur sur un fond d'�v�nement unique, le second travail est la voix, les expressions du visage et le comportement visuel du texte pour un montage multi-modal.

Module d'optimisation �motionnelle

la reconnaissance de l'�motion est la premi�re �tape, le prochain probl�me � r�soudre est d'ajuster l'humeur de l'utilisateur. Comme on le voit sur le graphique, puis d�terminer l'humeur de l'utilisateur � travers la voix, les expressions faciales et les notes de la fr�quence cardiaque ces informations, il peut aussi faciliter l'humeur de l'utilisateur en recommandant le contenu.

Par exemple, l'aile technologique a ouvert en 2011 une demande sera recommand� � la ligne de la po�sie, calligraphie, musique, etc., et plus tard dans une analyse plus approfondie du contenu de la musique, la musique de notre terrain d'analyse, le rythme, la m�lodie et l'intensit� sonore de l'utilisateur, 3 chanson minute recueillera 6000 points de donn�es pour lire des morceaux selon l'�tiquette d'humeur � ces messages. Maintenant marqu� une belle quantit� de musique plus de 1,6 million, en plus, comme des images, le contenu vid�o peut �tre fait en faisant correspondre �motionnel, de l'utilisateur et, finalement, pour faciliter l'humeur.

L'expression �motionnelle

L'expression �motionnelle est l'utilisation de la technologie de synth�se �motionnelle qui permet � une voix, les expressions du visage ou des mouvements du corps simulent l'�motion humaine, laisser la machine avec l'expression de sortir de l'�motion, de sorte que vous pouvez am�liorer l'exp�rience de l'interaction homme-machine.

Par exemple, si le robot ne voit que la salle plat et les invit�s, ce sont les services de base, mais d'augmenter la valeur ajout�e du robot, le robot a besoin d'espace pour lire l'humeur des clients, les clients se sentant vers le bas, salle sera un robot plus apaisante type de dialogue �motionnel.

la technologie informatique Affective pour atteindre la route

� l'heure actuelle aile technologique ouverte et l'Institut de psychologie, D�partement de psychologie, Institut de l'Universit� de Tsinghua, la technologie linguistique et Carnegie Mellon University.

Ceci est en fait deux �coles: les repr�sentants des deux corps devant le mod�le expert se fonde sur la recherche th�orique, Universit� Carnegie Mellon, est bas�e sur la profondeur du mod�le de r�seau de neurones de l'apprentissage.

La technologie actuellement ouvert dans les ailes � faire est en partie bas� sur la profondeur de l'apprentissage, mais aussi en partie bas�e sur des mod�les experts. Nous croyons que ces deux types de goulots d'�tranglement ont progressivement �merg�, n�cessit� d'int�grer les uns aux autres.

Pourquoi apprendre � reconna�tre les expressions faciales � voir avec la profondeur?

Maintenant, faire beaucoup de goulot d'�tranglement d'apprentissage profond est des donn�es annot�es, mais l'�tiquette regardera relativement facile, que les �motions d'un visage humain, en g�n�ral, une seconde peut identifier le visage d'une personne, s'il y a des centaines de milliers �motic�nes Zhang, le temps et les d�penses n�cessaires pour utiliser le crowdsourcing moyen ne sera pas grande.

Cependant, il n'y a pas tr�s pratique pour faire des annotations de donn�es, telles que la voix.

discours de trois minutes, nous devons faire apr�s avoir �cout� trois minutes � l'humeur de marque, marqu�s en augmenter pratiquement la charge de travail sur une centaine de fois, et l'expression relative, l'expression �motionnelle de la parole est plus cach�e, donc il est difficile d'utiliser l'apprentissage en profondeur la fa�on de parvenir � la reconnaissance de la parole �motionnelle.

Il y a aussi une marque de gens ordinaires difficiles, comme la fr�quence cardiaque. M�me si vous �tes un m�decin professionnel pour une carte de lecture de la fr�quence cardiaque ne peut pas d�terminer la cause de l'objet de test de fr�quence cardiaque (heureux, anxi�t�, col�re).

Alors maintenant, le visage est bas� sur la profondeur de l'apprentissage, la voix et le rythme cardiaque � partir de mod�les experts.

Mais nous venons d'�voquer, ces deux types de d�veloppement dans une certaine mesure, quand il y aura un goulot d'�tranglement. goulots d'�tranglement d'expression par exemple face par deux fois: 1 expression du visage ordinaire taille des particules est g�n�ralement marqu�e 6-8 sortes d'�motions, difficile d'identifier les plus fines (24 types ou encore plus d'une centaine de sortes), 2 voire termin�s. le type �motionnel de standard, mais vous ne pouvez pas confirmer l'authenticit� de l'�motion.

Dans le mod�le expert, il existe des mod�les plus matures pour d�terminer l'authenticit� des �motions, de sorte que nous pouvons apprendre sur la base de la profondeur, puis mod�le expert � briser superpos� ce goulot d'�tranglement.

La fr�quence cardiaque et des goulets d'�tranglement voix sur le mod�le expert, et maintenant la solution est de construire un mod�le de formation pour renforcer l'utilisateur individuel (un test utilisateur plus de mod�les mettra en vedette plus d'autocollants correspondent aux utilisateurs de test), en plus, nous pouvons �galement �tablir un algorithme d'apprentissage semi-supervis� pour obtenir une r�troaction en temps r�el.

Ainsi, il y a deux voies techniques sur la surface, mais en fait les deux sont fusionn�s les uns aux autres.

Compr�hension diff�rente de l'informatique affective

Diff�rentes industries pour la compr�hension de l'informatique affective ne sont pas les m�mes. Rosalind Picard de l'enseignant du MIT MediaLab, elle est aussi le fondateur des disciplines de l'informatique affective.

Il y a tellement de mots dans la pr�face de son livre � l'informatique affective �: Si vous voulez que l'ordinateur pour atteindre vraiment intelligent et nous adapter �, produit naturellement l'interaction homme-ordinateur avec nous, il doit avoir la capacit� d'exprimer la reconnaissance des �motions et , vous avez besoin d'avoir des �motions.

directeur scientifique de l'informatique Google Cloud Li Feifei informatique affective est si compr�hensible: maintenant que nous devons juger l'�motion de la logique de la m�thode AI. Logique au nom du QI, et au nom �motionnel de l'�galiseur. En venant de l'�motion � l'�motion, l'intelligence artificielle est la direction future de l'avant.

Nous croyons que l'on peut comprendre � partir de trois angles de calcul affectif:

Tout d'abord, l'informatique affective peut aider l'IA � reconna�tre l'humeur de l'utilisateur;

En second lieu, l'informatique affective peut aider l'IA simulent les �motions humaines, afin d'am�liorer l'interaction �motionnelle humaine;

Troisi�mement, l'informatique affective permet IA de g�n�rer l'auto-discipline (empathie).

sc�narios

aile actuellement la technologie en boucle ouverte et a lanc� une lettre de coop�ration, anneau croit avoir l'outil de communication IM, qui contient des informations qui voix, les expressions du visage et du texte, nous avons ouvert ses liaisons SDK, peut d�terminer l'humeur de l'utilisateur par la voix et d'autres informations .

De plus, nous avons maintenant et la coop�ration IFLYTEK, principalement par le biais de licences crois�es de l'autre, par la version liaison du SDK, HKUST reconnaissance vocale de vol, la technologie ouverte de l'aile pour juger de l'humeur, en ce moment encore des applications visuelles, iFLYTEK identifier l'identit� de la personne, la technologie ouverte de l'aile pour identifier leurs �motions.

En outre, les �l�ments suivants sont possibles sc�narios de calcul affectifs d'atterrissage:

1. La reconnaissance multimodale � base d'AI et des techniques de biofeedback mat�riel de d�pistage du stress intelligent

2. Identification multimodale bas�e sur l'IA des techniques d'interrogatoire de la police et l'analyse en temps r�el de la PNL de l'�quipement d'alerte pr�coce

3. Le syst�me est bas� sur la fatigue du conducteur de courage et de surveillance �motionnelle reconnaissance multimodale AI et le contr�le du v�hicule

4. La base AI-reconnaissance multimodale intelligente et la liaison de contr�le des �motions syst�me intelligent de la maison sans contr�le

5. Analyse du visage signe robotique financi�re d'�valuation des risques de cr�dit reconnaissance multimodale bas�e-AI et de motivation

6. Surveillance et centre d'appels syst�me d'analyse de la satisfaction empreinte vocale bas�es sur la voix et des techniques PNL si�ges humeur

7. tendance d�veloppement logiciel de pr�vision bas� sur le caract�re des jeunes enfants �motion grande technologie d'analyse temporelle des donn�es r�cursive

8. Analyse r�cursive du syst�me immunitaire reconna�t les dommages alarmants technologie logicielle bas�e sur le calendrier grand de donn�es d'�motion

Bien s�r, les soci�t�s de capital-risque, de faire tous les sc�narios ci-dessus arrivent sur le march�, Lei Feng r�seau a appris, la technologie ouverte de l'aile a fait des efforts pour l'�ducation Commercialiser, des finances et d'autres domaines.

Q & merveilleux

Q: voix, image comment ces diff�rents modules coordonnent le travail � l'int�rieur du syst�me?

R: En fait, est un algorithme multi-modale, il existe deux fa�ons de r�aliser: les donn�es elles-m�mes sont des donn�es multimodaux, puis faire le marquage, l'�tiquetage fait de jouer, vous pouvez le faire par le biais d'une �tude approfondie de la formation, d'autre part, multimodal fait par la collecte de donn�es, puis le m�me capteur, par exemple, peuvent �tre collect�es par le biais d'un microphone � la voix de l'utilisateur, empreinte vocale, une analyse plus approfondie du texte, ne multimodal.

Q: pr�cision des donn�es d'�motion ont beaucoup d'influence, comment les donn�es sont collect�es?

R: Au cours de notre informatique affective � l'Universit� Carnegie Mellon et l'�change d'experts, nous obtenons une vue � travers une information unique pour d�terminer le sentiment, le taux d'exactitude a ses limites, en outre, le plus t�t sera le mieux � faire multimodaux , plus le meilleur mode ajustement.

Nous signal de r�ponse �motionnelle est divis� en deux cat�gories, l'un est un signal faible, comme la parole, l'expression, il y a une cat�gorie de signaux profonde, compl�tement influenc�e par sympathique et parasympathique, la conscience subjective est difficile � contr�ler.

acquisition de signal faible profondeur plus facile, mais le poids est pas �lev�, le signal profond poids �lev�, mais la collection plus difficile. analyse multi-modale des deux signaux peuvent �tre int�gr�s pour am�liorer la pr�cision du jugement �motionnel.

Q: Quelle pr�cision actuelle? Les mod�les multi-modales ont le do papier pertinent?

A: voix et la fr�quence cardiaque sont bas�es sur le mod�le expert, la pr�cision sera plus faible, � environ 85%, environ 90% du visage (mais seulement 7 dans l'expression �motionnelle).

Q: Il existe des normes de l'industrie reconnaissance des �motions pour d�terminer l'exactitude de celui-ci? Il n'y a pas de norme, puis, � partir de laquelle les dimensions pour am�liorer le taux de reconnaissance?

A: Standard Type d'�motion maintenant d�termin� sont plus fr�quentes si la profondeur du mod�le d'apprentissage atteint, encore un autre ensemble de donn�es d'annotation afin de fonctionner sur le mod�le, afin de d�terminer l'exactitude; En outre, les �valuations d'utilisateur peut �tre d�termin� en fonction de , les r�sultats des �valuations tests syst�me � l'utilisateur, ce qui permet aux utilisateurs de donner la validation finale.

Comment optimiser? Peut-�tre auto-formation par le biais de l'auto-correction d'apprentissage semi-supervis�.

Q: Y at-il des donn�es de modalit� utilisant des ondes c�r�brales elle?

R: Ceci est une �tude � l'�tranger ont pas beaucoup, nous pensons maintenant capteur EEG n'est pas standard consommateur final, la collecte EEG � un capteur sp�cial, actuellement seulement utilis� dans l'industrie sp�cial, ne algorithmes g�n�riques pas ouverts.

Ouvrez la vid�o de classe

PS: Wings Ouvrir la technologie embauche: l'apprentissage de la machine, la vision de la machine, l'informatique affective, multi-modale, la PNL et d'autres postes connexes, qui sont int�ress�s sont invit�s � reprendre vote: way@emokit.com

Route de la soie

Apprenez � conna�tre la Chine

Laissez la machine apprendre � � lire dans les pens�es � besoins informatiques affectifs de la fa�on de r�soudre le sc�nario dans le monde r�el? | Difficile de cr�er la classe ouverte