Apprentissage et Applications Session | AIS pr�-s�cher toute la part parlera

AIS (ACL, IJCAI, SIGIR) 2018

Session 5: Apprentissage et applications

1 Shenda Universit� Zhong de la science et de la technologie de la Chine

Une approche conjointe d'apprentissage � l'�valuation de l'entrevue d'emploi intelligente

Regardez d'abord notre motivation, le recrutement dans les entrevues comme une partie importante. Il a re�u de plus en plus d'attention. Cependant, le processus d'entrevue traditionnelle, il y a quelques inconv�nients in�vitables. Par exemple, interview la d�cision de l'enqu�teur d�pend principalement de jugement personnel, sera in�vitablement l'intervieweur pr�f�rences personnelles, l'exp�rience et le talent d'influence, une certaine quantit� de biais, en particulier pour certains des premiers praticiens, l'intervieweur n'a pas d'exp�rience. Pour certains intervieweur chevronn�, leur exp�rience ne peut gu�re �tre h�rit�e interviewer primaire d'apprendre. D'autre part, bien que maintenant certaines entreprises ont accumul� de grandes quantit�s d'entretien d'embauche de donn�es, mais l'entretien renforcer l'effet du point de vue des travaux d'exploration de donn�es est tr�s faible. En particulier, d'explorer l'exp�rience d'un excellent enqu�teur.

� cette fin, nous visons de ce travail est d'�tudier dans une interview enregistr�e par un grand nombre d'excellents intervieweur de participer � l'entrevue pour explorer la relation inh�rente entre plusieurs types de texte. Ils sont � description de poste, CV et entretien entre avis � excellent enqu�teur pour trouver le principal objectif de l'entrevue, pour aider davantage l'entrevue et ainsi de suite. la subjectivit� d'am�lioration, unilat�ralit� d'une questions d'entrevue traditionnelles.

Mais dans le processus, nous avons trouv� un certain nombre de ph�nom�nes ou de recrutement d�fis que nous avons besoin d'un traitement sp�cial. Tout d'abord, l'intervieweur souvent bas� sur le curriculum vitae du candidat � concevoir l'entrevue, ce qui conduit souvent � l'existence d'une forte corr�lation entre les commentaires de curriculum vitae et l'entrevue. En second lieu, entre les curriculum vitae et les descriptions d'emploi ont aussi une forte corr�lation, mais la diff�rence est que la description g�n�rale de l'emploi est relativement simple, et de reprendre plus pr�cis et beaucoup d'exp�riences diff�rentes de la m�me personne peut demander un emploi, de sorte que, diversit� de reprendre la description de l'emploi pour �tre petite. Enfin, nous avons �galement not� avec une grande distinction entre la technologie de classe et interview interview compl�te, biais�e en faveur d'une mission technique, mettant l'accent sur l'�tude des sciences humaines. Nous devons �tre trait�s diff�remment.

Afin de r�soudre trois d�fis ci-dessus. Nous avons pr�sent� notre mod�le mod�le d'apprentissage mixte Interview d'�valuation (JLMIA). Notre mod�le est bas� sur le mod�le de th�me de LDA pour d�velopper la promotion. Le droit est le montre la figure de probabilit� correspondante, nous croyons que l'entrevue est un m�lange de toutes sortes de textes de plusieurs th�mes, et de l'image pour le moment la corr�lation entre l'�valuation et le curriculum vitae, il a partag� le th�me entre nous deux la distribution thetaA venir, supposons aussi que la description du poste de distribution de sujet thetaA thetaJ g�n�r� pour caract�riser la relation entre le CV et l'emploi, afin de caract�riser les diff�rents deversity entre les descriptions d'emploi et les curriculum vitae, nous supposons que trois types de documents sujets respectifs sont diff�rents. Ensuite, afin de faire la distinction entre la technologie et l'entrevue compl�te, nous utilisons un ensemble diff�rent de sujets pour des interviews de diff�rents types de textes. Enfin, afin de r�soudre notre mod�le, nous avons con�u l'algorithme EM. Si vous �tes int�ress� plus en d�tail le mod�le pour nous, vous pouvez lire notre article.

Ensuite, nous avons con�u deux entrevue d'application auxiliaire, on est des gens apr�s correspondance, �tant donn� une paire de descriptions d'emploi et curriculum vitae, nous voulons mesurer le degr� de correspondance entre les deux. Tout d'abord, il est possible de d�duire que deux mod�le du texte relatif � chacun de la distribution, caract�ris� par un vecteur respectif, de sorte que l'on peut utiliser diff�rentes m�thodes pour mesurer le degr� de concordance, par exemple, la similarit� du cosinus entre les vecteurs, la distance KL comme la mise en correspondance ou l'�pissage du vecteur comme fonctionnalit�, ajoutez une �tiquette ou non admis, m�thodes supervis�es utilis�es pour former un classificateur pour pr�dire la probabilit� d'admission. Nous avons test� sur un effet r�el dans nos donn�es d'entrevue, de base il LDA sac de mots, notre mod�le devrait �tre de base nettement mieux sur un certain nombre de mesures, nous pouvons dire que nous avons trouv� un mod�le entre le CV et la description de l'emploi pertinence.

Une autre application est question d'entrevue recommand�, supposons que nous avons un ensemble de questions d'entrevue, �tant donn� une requ�te que nous voulons recommander un sous-ensemble de questions li�es � X, un sous-ensemble de X d'une part que cette question soit associ�e � la requ�te, d'autre part, r�gler probl�me couvrant de la connaissance, autant que possible, qu'il doit y avoir des diff�rences entre les uns des autres. Nous d�duisons cette question comme th�me de l'entrevue la caract�risation des examens. Compte tenu des probl�mes Relevance et la fonction d'optimisation de la conception de la diversit�, F. Probl�me Set F Temps maximum d'acquisition comme la solution optimale. Nous mettons �galement l'accent sur le test de notre approche dans les questions d'entrevue r�elle.

Nous vous proposons trois �valuation, la pertinence, la diversit�, personne qualit�, la pertinence est recommand� de dire combien il y a des questions dix li�es � la question, la diversit� est de dire que ces probl�mes sont li�s � combien sont impliqu�s dans diff�rentes connaissances, est la derni�re qualit� de personne questions impliquant entrevue compl�te. Trois indicateurs d'�valuation, notre mod�le recommand� questions Pertinence et diversit� sont �lev�s, ce qui indique que le probl�me est pas li� � la requ�te recommand�e et une couverture plus large des points de connaissances. En second lieu recommand� pour une question d'entrevue compl�te portant sur les questions de qualit� que personne entretien technique est plus �lev�, ce qui est conforme � la r�alit�. L'algorithme de correspondance � base de caract�res BM25 r�sultats relativement m�diocres, il peut �tre difficile d'explorer en raison de son r�sultat de la requ�te de connaissances potentiel. Plus pr�cis�ment, nous montrons un exemple dans le document, plus l'interpr�tation visuelle de nos r�sultats. Si vous �tes int�ress�, vous pouvez lire notre article.

C'est ce que nous travaillons espoir intelligent interviewer dans l'am�lioration de la qualit� de l'�valuation de l'entrevue influencer la vie des gens qui se d�marquent dans un recrutement appropri�. Merci.

2 Maoyu Zhao, l'Universit� de Beijing des Postes et T�l�communications

Show and Tell Plus: sujet orient�e image multi-Sentence Sous-titrage

Nous regardons l'image t�che Captioning, pour d�crire l'image du texte g�n�r�, la classification d'images avec elle dans des endroits diff�rents peuvent �tre d�crits dans une image avec une phrase, il est largement utilis� dans de nombreux domaines tels que l'enseignement des jeunes enfants, navigation aveugles, guides automatiques. Ceci est une bonne application, tourn�e maintenant le syst�me de guidage, nous avons commenc� soudainement parler � un endroit, je ne sais pas ce que disent, avec des lunettes VR, un align�, il vous expliquera le contenu pour vous.

Le multim�dia interactif, ainsi que nous pouvons g�n�rer automatiquement un certain nombre de rapports pour l'image de l'imagerie m�dicale, il a une application tr�s large. Notre motivation est g�n�ralement g�n�r�e image description d�crit une seule phrase comme une image.

Notre premi�re pens�e est que le mod�le LDA, la premi�re de ces phrases vont dans le mod�le de LDA, vous pouvez obtenir des param�tres, y compris la phrase de sujet, et les mots-cl�s sujet de la phrase peut �tre marqu� sur la partie sup�rieure de l'image. Nous pouvons �galement visualiser notre th�me. Le premier sujet, d�crivant certains �l�ments de la cuisine, le deuxi�me th�me, de la couleur, et le troisi�me, appel� le quatri�me, lu quelque chose dans le journal.

Notre contribution est de proposer un mod�le orient� objet, avec une description plus compl�te des phrases d'image. Nous vous proposons la porte de l'unit� de fusion, le th�me � l'int�rieur, et la phrase r�sultant th�me coh�rent. Nous sommes �galement des phrases fixes num�riques et les paragraphes fix�s et avons fait beaucoup d'exp�riences pour prouver que notre mod�le sur le th�me de la description de la coh�rence et de coh�rence est valide.

La premi�re est la description formelle du mod�le, traditionnellement, une description de l'image cible est une image pour maximiser la probabilit� d'une phrase donn�e. Notre mod�le, afin de saisir les diff�rentes emphases, incorpor� des variables th�matiques. Dans le cas d'une image donn�e, une phrase et l'image de distribution conjointe peuvent �tre d�velopp�s en deux projets, dont le premier est le mod�le de langage orient� objet, notre correspond mod�le � une sortie, tandis que le second terme est un sujet de classificateur, ce mod�le correspond � la deuxi�me sortie.

Notre prix comprend deux, l'un est le co�t de la formation d'un mod�le de langage, le second est le co�t de la formation d'un classificateur.

Notre entr�e se compose de deux, tout d'abord, ont �t� form�s LDA, il y a une LCM premi�re fois que nous allons entrer dans une image, dans l'instant nous allons phrase d'entr�e.

Le premier module est l'unit� de LSTM, il obtiendra deux ladite premi�re repr�sentation d'image, est d�livr� en sortie h0, et la repr�sentation de contexte ht, t 0 est plus grand que le temps de sortie.

Nous avons aussi la porte de l'unit� de fusion, obtenir trois repr�sentation, un contexte indique, il y a une repr�sentation de l'image, il y a un th�me, l'int�gration est tr�s simple, en multipliant d'abord des th�mes et des images, puis puis �piss� dans le contexte indiqu� le mod�le de distribution de probabilit� � la langue de sortie.

Notre mod�le n'est pas une description du paragraphe de la conception, mais dans les donn�es de paragraphe peut obtenir de meilleures performances.

Compte tenu d'un th�me, la carte r�seau g�n�re une partie importante de la description, et notre mod�le produit des images avec des d�tails pertinents au sujet, ce qui est notre avantage du mod�le.

Nous d�crivons la m�me sc�ne, comme la construction quand on d�crira un c�t� diff�rent, ce qui est des r�sultats qualitatifs.

3 Il Universit� benz�ne de l'Acad�mie chinoise des sciences

TDNN: A deux �tapes de Deep Neural Network pour la notation de Essai automatis� rapide ind�pendant

Essai automatique Marquer un point, se r�f�rant � l'apprentissage de la machine, l'�criture automatique pour jouer une minute, en esp�rant que r�duire le co�t de la notation manuelle, les �tats-Unis ont commenc� � introduire des points AES GRE, etc. � l'int�rieur de la machine en 2005.

Existante m�thode de notation essai, largement divis� en deux cat�gories, un mod�le de sujet, pour chaque essai de poser les points de donn�es, mod�le de formation, puis pr�voir. En second lieu, l'objet d'un essai de scores s�par�s, les notes ont un examen simul�, essai �crit, mais aucune donn�e de formation, seules les donn�es historiques du pass�, il est un mod�le bas� sur des donn�es historiques pass�es pour faire rapidement un point.

La plupart des m�thodes conventionnelles sont pertinentes pour le mod�le de sujet, les r�sultats sont tr�s bons, et les r�sultats montrent m�me la coh�rence entre eux et la personne qui est encore plus �lev�. Mais les sujets de l'essai ind�pendant relativement parlant classement, pas si simple.

Pour r�soudre ce probl�me, nous proposons un algorithme bas� sur une pouss�e droite l'apprentissage de transfert en deux �tapes sur le travail.

La premi�re phase, les sujets de la sc�ne ind�pendante, nous avons form� un mod�le simple de notation, qui fait l'objet d'un mod�le distinct, il fait l'objet de l'utilisation des caract�ristiques individuelles. Avec cette question comme le mod�le pour pr�dire le score cible. Les �valuations ne volent pas, mais en g�n�ral avec ce score peut savoir quel est le meilleur essai, ce qui est le pire.

La deuxi�me phase de la formation du mod�le de r�seau de neurones est utilis� pour pr�dire le score cible pour l'anthologie d'essais. La profondeur du r�seau de neurones comporte trois parties d'entr�e, une premi�re partie, un r�seau s�mantique, qui est form� enrobage que l'entr�e, la seconde partie est marqu�e entr�e POS, la troisi�me partie est marqu�e par une syntaxe d'entr�e. Nous esp�rons utiliser trois entr�es diff�rentes, respectivement, pour saisir l'information s�mantique d'une �criture, la grammaire, la composition de la phrase. Un tissu ainsi que le paragraphe, l'organisation syntaxique, et leurs relations pour capturer un score d'�criture, apr�s trois couches de composition g�n�ratrice de LSTM ont indiqu� qu'ils sont �piss�s ensemble, avant l'entr�e du r�seau de distribution, afin d'obtenir le score final.

Le mod�le propos�, ces trois diff�rentes entr�es du mod�le, le meilleur essai de comparaison des performances de base sur toutes les routes, � l'exception des septi�me questions de r�daction des voies, plusieurs autres essai a am�lior� dans une certaine mesure. Huit essai, en moyenne, est au-dessus de base, les caract�ristiques suivantes sont diff�rentes m�thodes d'entr�e. Nous avons constat� que la m�thode propos�e, en moyenne, peut �tre un certain degr� d'am�lioration sur les trois indicateurs, la meilleure combinaison de fonctionnalit�s est Embedding la syntaxe d'entr�e ainsi que marque.

De plus, marquant la fin de ses informations exactitude, m�me si elle a marqu� la fin de la partition est pas exacte, la fin �tant sup�rieure � la n�gative Exemple de queue, tandis que les cas de n�gatifs de la queue des exemples positifs est inf�rieur � la queue, il y a plus de 80% de garantie de pr�cision la fiabilit� de la formation.

Pour r�sumer, cet article propose un transfert en deux �tapes d'apprentissage mod�le de r�seau de neurones bas� sur, dans l'espoir de r�soudre l'objet d'une t�che de notation autre essai, les r�sultats montrent l'efficacit� de la m�thode, il y a une conclusion, syntaxiques, se sont av�r�s un scoring essai utile fonction.

Quatre semaines de sec Rong Universit� de Beijing des Postes

Attentif apprentissage Repr�sentation diff�renti�e pour la classification de la peine

Maintenant, beaucoup de phrases dans le mod�le de classification, l'aspect le plus important est la phrase prend connaissance � ce stade repr�sente le mod�le d'apprentissage par la profondeur, nous utilisons le mod�le du m�canisme d'attention, cette attention pour am�liorer le m�canisme de l'ensemble de la phrase la science et la technologie ainsi que la coh�rence de la performance du mod�le de classification d'une grande aide.

En r�sum�, les travaux connexes qui, o� l'attention de l'individu parmi les vecteurs de direction utilis�s sont souvent vecteur moyen d'une phrase ou initialisation. Ce mod�le unique volume ci-dessus peuvent �laborer des m�canismes de multi-hop, ce m�canisme est un changement majeur dans le single-hop d'origine est pr�occup� par la phrase une fois, ce multi-hop sera mis � jour dans la phrase ci-dessus concernent le poids, attendons avec impatience une fois la finale nous pouvons faire attention � la partie plus importante de la phrase.

Sur la base de la performance du mod�le unique hop sur quelques-unes des phrases plus complexes, des phrases ou une performance est pas particuli�rement bonne. la performance g�n�rale est sup�rieure � un mod�le unique-hop, en g�n�ral, il utilise une pleine part en valeur, qui est un m�canisme d'attention multi-hop, il utilise un poids uniforme. De plus, nous avons constat� que c'est une fa�on de superviser toujours la classification de l'information et l'�tiquetage, ne fournit pas d'informations sur d'autres sous surveillance dans le milieu � la fin.

Voici une question que nous avons constat� que ce mod�le de multi-hop, le plus souvent dans la premi�re attention est tr�s important. Par exemple, pour la premi�re fois l'attention au mauvais endroit, au fond plus loin en arri�re et plus loin sur le mauvais chemin. Nous esp�rons que la fa�on dont peuvent �tre transf�r�s au bon endroit pour la premi�re fois la mauvaise attention.

Une motivation de notre mod�le est de trouver un moyen de mettre cette erreur lorsque l'attention d�plac� vers la droite au-dessus du seul bond, pr�vision donn�e. Notre motivation est le temps de donner un signal d'inqui�tude, de tels signaux envoyer un message, expriment est bonne ou mauvaise performance devant l'attention, si les erreurs de classification, nous devrions dit comment ajuster le dos du houblon.

Sur les m�thodes de formation, si nous disons directement au ensemble de deux pertes, en fait, pas de diff�rence. Nous avons ajout� un facteur de r�gulation de la perte de GR ci-dessus, en cas d'erreur, le probl�me n'est pas une zone particuli�rement bien quand capable de transf�rer son attention.

Ce que nous r�gulateur utilise une fonction de distribution, ce qui signifie que C1 dans la pr�diction de l'�tiquette droite valeur de probabilit�, si cette valeur est relativement faible, et que la prononciation sera relativement importante. Perte de se concentrer sur l'optimisation de L2 ci-dessus. Un tel signal d'affichage, la performance comment, ce signal est transmis � C2.

Enfin, la perte discriminateur, et cette perte d'information de son suivi de la classification des pertes C1 et C2, en utilisant une fonction.

Nous avons trouv� dans le laboratoire, si C1 apprend un impact particuli�rement important sur le C2, si C1 est toujours donn� une distribution de probabilit� tr�s forte ou tr�s r�partition moyenne de probabilit�, aura une incidence sur l'apprentissage C2. Nous sortie pr�visions de C1 � faire une multiplication, il a maintenu un mot que certaines �tiquettes correctes, il n'y a pas des valeurs particuli�rement faibles sur d'autres �tiquettes. Enfin, nous mettons trois optimisation ensemble unifi�.

Au niveau du mod�le, nous vous proposons un mod�le principalement diff�renci�. Dans le niveau de r�solution de probl�mes, nous vous proposons un transfert de signal d'affichage d'une telle attention, le biais de l'attention peut r�soudre efficacement le probl�me. De plus, nous avons fait un visuel, voir le mod�le peut �tre extrait des caract�ristiques plus expressives, l'am�lioration de la d�composition de la performance, je vous remercie.

Harbin Institute of Technology Liu Yijia 5

Connaissances pour la pr�vision distillant structur� � base de recherche

pr�diction de la structure du langage naturel est le langage naturel mapp�e dans une structure qui pourrait �tre un arbre ou un graphique comparant l'analyse syntaxique typique, ceux-ci sont traduits Prediction Structure. Le probl�me de la pr�diction de la structure peut �tre mod�lis� comme un probl�me de recherche, pouvoir structurer le processus de recherche sur l'utilisation d'un processus de recherche pour arriver � une nouvelle action de l'Etat, par fonctionnement continu, pour atteindre le statut final d'un tel processus de recherche.

La pr�diction des structures n�cessite souvent une fonction de notation bas�e sur la recherche, dans un �tat, un score d'action est combien, aussi longtemps que l'�lection au plus haut score de l'action a continu� de descendre l�-dessus.

L'apprentissage d'une fonction de notation est en construisant une strat�gie politique de r�f�rence qui nous dit dans un �tat connu pour apr�s la structure, l'action appropri�e devrait �tre ce qui est, par cette politique de r�f�rence continue � fonctionner dans les donn�es de formation, a gagn� le droit �tat et de l'action correcte. Apr�s l'�tat pour obtenir cette action juste et bon, la formation d'un discriminateur, vous pouvez obtenir la fonction de pointage.

Mais le processus de formation il y a deux grandes questions, � savoir le processus de formation, les donn�es de formation divergence d'existence. En second lieu, la formation est incompatible test, le processus de test peut entrer dans un �tat d'erreur.

Des solutions au premier probl�me consiste � utiliser une approche int�gr�e de l'apprentissage.

La deuxi�me question pour la solution la plus typique est d'explorer les m�canismes mis en place dans le processus de formation.

Compte tenu des deux points ci-dessus, nous avons d�cid� d'utiliser les moyens de connaissances distill�es ces deux probl�mes sont r�solus � usage unique.

Nous formons les mod�les M avec des m�thodes d'�limination, avec une production moyenne de la derni�re sortie du mod�le. Vous pouvez directement � partir de la sortie du mod�le, la connaissance distill�e sur elle. Parce que le mod�le a explor� l'espace, nous recevons beaucoup de l'�tat de recherche, les connaissances sur l'�tat des objectifs d'apprentissage distill�s � apprendre, � explorer le m�canisme qui est introduit dans le processus de rectification des connaissances � une �cole d'Etat � certains du mod�le d'information.

Nous algorithme �crit dans un cadre unifi�, la politique de l'�cole de r�f�rence, mais aussi de l'�chantillonnage �cole de politique, deux parties des donn�es obtenues est compl�tement orthogonales, Talia peut �tre fusionn� ensemble pour am�liorer encore les performances de notre mod�le.

En termes de nos exp�riences dans deux ensembles de donn�es standard, avec une petite exp�rience des donn�es, les r�sultats de l'inspection est d'am�liorer de 1,3 point, le r�sultat de petits levage NMT de donn�es 2,6 points. Les donn�es montrent que le mod�le actuel est meilleur que les performances d'autres performances de pr�diction de la structure bas�e sur la recherche.

Notre mod�le peut mieux apprendre dans l'�tat des erreurs, peut apprendre de la distillation de la perte de connaissance, plus stable que NLL traditionnelle.

Le point culminant de notre travail est pas n�cessaire de changer un mod�le et ne pas ajouter de donn�es, dans le cas de la connaissance artificielle, permettra d'am�liorer la pr�cision de l'analyse syntaxique de 1,3 point, et sur un petit mod�le de taux de pr�cision de la traduction automatique a augment� de 2,6 points.

6 Luobing Feng de l'Universit� de P�kin

Mariant expressions r�guli�res avec des r�seaux de neurones: une �tude de cas pour la compr�hension Langue parl�e

Notre travail consiste � l'expression correcte gr�ce � l'utilisation des connaissances en aide � la formation du r�seau de neurones, et donc la quantit� de donn�es en tr�s peu de temps, mais aussi la formation � un meilleur mod�le.

Lorsque nous classe r�seau de neurones apprentissage automatique de l'utilisation r�elle, ont souvent besoin d'�tre combin�s � des sc�narios d'application sp�cifiques. Et une fois sp�cifique � une rupture de la sc�ne, nous pouvons utiliser les donn�es sont souvent tr�s limit�es. syst�me de dialogue bas� sur des t�ches est un exemple typique. O� se trouve la difficult� dans la fa�on d'obtenir un syst�me fiable de la langue parl�e � comprendre le cas dans le domaine des petites donn�es.

Spoken compr�hension du langage est divis� en deux sous-t�ches. L'un est destin� � identifier, � savoir identifier l'utilisateur de ladite intention correspondant d'instruction (la classification de phrase), le deuxi�me fente r�solu, � savoir qu'elle est destin�e � trouver la fente associ�e (s�quence marqu�) dans les instructions de l'utilisateur.

Dans le secteur industriel, l'absence de donn�es, nous �crit habituellement manuellement une s�rie de r�gles d'expressions r�guli�res pour construire un syst�me de r�gles. Bien que cette m�thode ne n�cessite pas de donn�es de formation, mais sa capacit� de g�n�ralisation est tr�s pauvre. Et en cons�quence, en raison du mod�le de r�seau de neurones fonctionne dans un espace vectoriel, il a g�n�ralement une bonne g�n�ralisation de la parit�. Pour construire un syst�me plus fiable dans les circonstances donc, si nous pouvons �tre une expression r�guli�re et les r�seaux de neurones, ce qui en tr�s peu de donn�es?

Nous regardons quelles parties de l'expression r�guli�re est utile pour les r�seaux de neurones.

Tout d'abord, l'expression de sortie r�guli�re est certainement utile. Pour les t�ches de classification destin�es � identifier une telle phrase, l'expression r�guli�re est g�n�ralement �tiquette au niveau de la phrase sortie, et pour la d�termination de l'emplacement de cette t�ches de marquage de s�quence, l'expression r�guli�re est g�n�ralement sortie �tiquette au niveau des mots. Ainsi, d'une part, nous appelons l'expression r�guli�re peut �tre d�livr�e � un membre de quantification, et comme une entr�e auxiliaire du r�seau de neurones et, d'autre part, on peut �galement former une masse lin�aire similaire, �tiquette d'expression r�guli�re nerf de sortie sortie du r�seau d'une mani�re qui peut �tre appris obligatoire.

En second lieu, nous avons constat� que l'expression r�guli�re elle-m�me nous a d�j� dit que la moindre id�e de classification mot est bas�e oui. Par cons�quent, le correspondant, nous esp�rons �galement que le r�seau de neurones lors de la classification est �galement pr�occup� par le mot d'indice. L'accent mis sur des mots sp�cifiques dans une phrase est pr�cis�ment ce que l'attention du module de r�seau de neurones faire. Ainsi, une autre utilisation des expressions r�guli�res est que nous pouvons utiliser des expressions r�guli�res indices de mots pour guider des modules de formation attention.

En m�me temps, nous avons �galement constat� que, dans la pratique, nous allons utiliser les deux expressions r�guli�res positives, elle consid�re en accord avec son mod�le d'�chantillons doit �tre marqu� comme une classe, �galement utiliser des expressions r�guli�res pour n�gatif, il consid�re conforme � son mod�le de les �chantillons ne doivent pas �tre marqu�s en tant que classe. Ainsi, nous avons propos� une attention positive correspondante et une attention n�gative. Parmi eux, l'attention n�gative dans l'�chantillon que les mots nous disent que les �chantillons ne sont pas dans cette cat�gorie, contrairement � l'attention de l'attention positive. Nous serons une attention positive pour le score k-classe et soustrayez attention n�gative pour marquer la premi�re classe k, k-classe obtenir le score final.

Nos exp�riences sont r�alis�es sur des ensembles de donn�es d'information de vol ATIS. Tout d'abord, nous avons proc�d� � l'�tude de petits �chantillons des exp�riences. Dans ce cadre, nous avons par la m�thode d'�chantillonnage al�atoire, de telle sorte que chaque classe ne comprend que 5, 10 ou 20 �chantillons de formation.

Dans la t�che de reconnaissance intention, nos trois m�thodes par rapport � la base de deux voies mod�les LSMC ont consid�rablement am�lior�. Parmi eux, l'utilisation d'une attention r�guli�re de la surveillance des expressions des fa�ons d'am�liorer le plus, serait en mesure d'augmenter de 8% --15% de la pr�cision. Dans la t�che d'analyse de l'emplacement, nous avons constat� que la sortie de fonction d'expression r�guli�re comme m�thode d'entr�e qui fonctionne le mieux, serait en mesure d'augmenter de 5% macro F1. En m�me temps, notre approche est beaucoup plus que la simple mise en correspondance d'expression r�guli�re. Lorsque vous utilisez ATIS montant de l'ensemble de la formation, nous combinons la m�thode des expressions r�guli�res peut encore apporter des am�liorations significatives � la fente destin�e � identifier et r�soudre F1 macro-�conomique.

Enfin, nous avons analys� la diff�rence entre les expressions simples et complexes corriger les expressions correctes. Nous avons constat� que des expressions r�guli�res complexes en g�n�ral que de simples expressions r�guli�res ont de meilleurs r�sultats. Cependant, en utilisant une expression r�guli�re tr�s simple a �t� en mesure d'atteindre tr�s nettement am�lior�e. Donc, quand nous pratiquons, vous pouvez commencer par une expression simple, a commenc� � corriger, puis dans le cas du co�t de permettre, puis augmenter progressivement la complexit� de l'expression correcte.

7 Ni Yao Beijing Institute of Technology

Cagan: Conform�ment accusatoire une formation bonifi�es GAN

G�n�ration contre les applications de r�seau de g�n�ration, ainsi que dans de nombreux domaines de l'image. En termes simples, le r�seau g�n�re une confrontation est de rendre l'image r�sultante et essayer de distinguer la v�ritable image, dans la mesure du possible, de sorte que le g�n�rateur g�n�re l'image semble tr�s r�el.

En fait, ce r�seau de confrontation a deux probl�mes. Tout d'abord, il faut une fonction d'optimisation de l'espace, mais appara�t comme un r�seau de neurones dans le processus r�el, l'espace des param�tres optimis�s � l'int�rieur limit�. Un autre, disparaissant gradient. Lorsque la discrimination est trop forte lorsque le g�n�rateur est d'apprendre presque tout, cela conduira � l'accident de mode d'instabilit� et de la formation.

Les m�thodes existantes pour surmonter la confrontation d'apprentissage dans un espace de param�tres limit�, ainsi que sur la question de la disparition du gradient est divis� en deux cat�gories, on est commu�e ne le gradient de la fonction est utilis�e pour surmonter les disparait probl�me, la seconde est de le r�soudre dans une optimisation de l'espace des param�tres limit� un g�n�rateur correspondant � une pluralit� de classificateurs, cette formation peut �tre mieux.

Dans la solution, on ajoute l'abandon dans le discriminateur � l'int�rieur du r�seau. Ainsi, chaque sortie correspondant � un r�seau d'�chantillonnage pour un traitement particulier de l'�chantillon, il est possible de construire un certain nombre de classificateurs.

Il a l'avantage que, d'une part, il est proche de param�tre d'optimisation de l'espace infini, le deuxi�me param�tre � explosion � �viter, d'une troisi�me, pour �viter de trop ajust�, de sorte que le processus de jeu ne peut �chapper � ce dilemme, � savoir g�n�rateur quasi il combine les donn�es de formation.

En dehors de la construction de plusieurs classificateurs, construit �galement un processus coh�rent de formation de combat. Il est surtout vrai dans la mesure du possible la performance du m�me �chantillon, la coh�rence de mesure � la diff�rence entre les deux r�seaux diff�rents pour identifier la sortie d'�chantillons r�els repr�sentent autant que possible compatible avec l'objectif de mieux ajust� aux donn�es r�elles. Il des donn�es incoh�rentes g�n�r�s, autant que possible, est notre point de d�part pour une photo avec beaucoup de fonctionnalit�s faux, il a beaucoup de caract�ristiques fausses, mais un r�seau d'apprendre des caract�ristiques diff�rentes, les diff�rents r�seaux de telles diff�rences aussi grandes que possible.

Lorsque le g�n�rateur de formation, nous allons faire des �chantillons g�n�r�s aller vers le discriminateur pensent la m�me direction.

la formation et la formation parfois g�n�rateur de discriminateur au cours d'un discriminateur de formation peuvent �tre multiples it�rations, une it�ration g�n�rateur, cela se traduira par la coh�rence sera une certaine compensation, afin de le rendre g�n�rer la coh�rence des donn�es et des donn�es r�elles la coh�rence est maintenue dans une certaine plage, nous utilisons une fonction pour l'�quilibrer.

Nos exp�riences compatibles avec le processus de formation de combat a ajout� deux � l'int�rieur de la ligne de base, mis sur la t�che de g�n�ration d'image. Notre performance a augment� sur 10 points ICRA de cr�ation 9.17, sur la STL-10 �tait 10,02, la derni�re g�n�ration de l'image � la recherche r�aliste. En m�me temps, notre mod�le de processus de formation est �galement plus stable. Dans l'image sur la t�che de classification semi-supervis�e, nous avons obtenu un r�sultat concurrentiel, nous g�n�rons image plus diversifi�e, peut att�nuer le probl�me du mode r�seau contre l'effondrement.

Conclu, nous utilisons fa�on de construire un abandon discriminateur nombre presque infinie, nous vous proposons la m�me formation de combat, notre exp�rience a obtenu des r�sultats avanc�s, nous avons augment� la stabilit� du mode de formation et pour faciliter l'accident.

8 Si l'institut Hao calcul�

La r�duction de la variance du gradient Bandit algorithme utilisant variable antith�tique M�thode

Ceci est un travail � �tre optimis� pour la m�thode du gradient de la politique sur un probl�me de rati�re. m�thode de gradient de politique en utilisant la m�thode de Monte Carlo pour estimer la variance quand il y a un grand gradient En introduisant une double m�thode des variables � r�duire.

Tout d'abord, le contexte. Dobby d�crit une telle question: nous devons jouer un r�le plus des machines � sous bras, bonus de chaque bras obtenu soumis � diff�rentes distributions de l'inconnu et les attentes ne sont pas les m�mes, dans un certain nombre de jeux, peut savoir quel bras baisse attente de r�compense est plus grande. m�thode de gradient de politique est une m�thode importante pour r�soudre ce probl�me. Pour chaque bras fix� une valeur initiale de 0 pour la pr�f�rence, la pr�f�rence obtenir une distribution de probabilit� apr�s SoftMax, qui est, nous jouons le jeu de strat�gie que nous sommes la probabilit� de s�lection de chaque bras. Dans cette distribution de probabilit�, nous pouvons citer le rendement attendu d'une expression, avec sa pr�f�rence pour le bras aux d�riv�es partielles, les pr�f�rences optimales gr�ce � une m�thode it�rative de mont�e de gradient, pour obtenir une bonne strat�gie de jeu, la pr�f�rence finale est le plus gros gains EM bras.

Mais dans le processus de r�solution, nous ne savons pas chaque bras de pr�visions de b�n�fices, donc je ne peux pas obtenir un gradient pr�cis. Donc, en utilisant la m�thode du gradient de la politique m�thode de Monte Carlo � son estimation non biais�e, mais on estime qu'il ya un grand �cart. Et cet �cart de toute �vidence sur la r�solution efficacit� ou si elle est le r�sultat de notre m�thode de gradient croissant ont caus� un grand impact, donc nous esp�rons r�duire la variance.

Pour la m�thode de Monte Carlo, en fait, il a �t� des strat�gies plus de r�duction de la variance matures, telles que la m�thode variable de commande, m�thode � double variable. Similaire au contr�le des variables d�riv�es de la base des strat�gies d'apprentissage sont am�lior�es m�thode de d�grad� utilis�, nous lancerons notre Dobby approche m�thode get m�me variable.

Voici une liste premi�re estimation directe de la m�thode du gradient, l'expression, au contraire on peut le voir apr�s la m�thode de r�glage des param�tres variable double gauche sera constante, � savoir, � droite de l'expression de notre m�thode peut �tre obtenue. Notre approche est d'ajouter trois parties et, d'autre part, trois parties sont en relation inverse, la plus grande difficult� est inversement li�e � la mise en place d'une fonction complexe qui doit construire une voix monotone.

Comment structurer? A titre d'exemple, il y a quatre bras de rati�re, chaque bras du gradient du robinet obtenu sous forme d'une ligne, pouvant constituer une telle structure de matrice afin de faciliter une fonction monotone, on utilise pour r�soudre le proc�d� de remont�e de coordonn�es, il est suppos� que nous sommes s�lectionnez le second bras, nous maintenant seulement besoin de se concentrer sur la deuxi�me ligne de la matrice, si vous pouvez trier les valeurs de cette colonne peut faire une r�elle valeur de gradient est �gal au c�t� droit de l'int�gration de fonction d�finie par le 0-1, et depuis cette fonction est monotone, il peut �tre facilement introduit dans la m�thode � double variable. Toutefois, les pr�visions de b�n�fices dans chaque bras de l'�quation on ne sait pas, comment nous voulons faire le tri? Dans ce num�ro, nous croyons que la valeur de pr�f�rence pour chaque bras que nous utilisons dans la formation apr�s un certain nombre de relations dans les attentes de la taille et de la r�mun�ration sont compatibles, donc nous pr�f�rons l'utilisation directe de la taille de sorte � obtenir une fonction approximative sur la droite, qui l'ensemble du processus est notre approche.

Ceci est mon exp�rience, qui a �t� r�alis�e sur 20 dans chaque bras et de bras pour ob�ir � Dobby de distribution Bernoulli, la figure dans les spectacles du milieu de la probabilit� finalement trouv� le bras optimal, en tirant sur les bonnes expositions le montant estim� variance de cas.

En g�n�ral, ils sont. Enfin, inclure des estimations non biais�es, il y a une certaine r�duction de la variance �prouv�e, il y a une d�claration d�taill�e dans laquelle le papier, nous sommes regard peut int�resser �.

9 Yue Feng Institut de l'informatique

De Greedy S�lection � la prise de d�cision Exploratoire: Classement Diverse avec les r�seaux politiques Valeur

Notre travail consiste � r�soudre les probl�mes de choix gourmands optima locaux caus�s dans le classement diversifi� dans.

Lorsque l'information est exprim�e dans notre requ�te de requ�te contient un large �ventail de r�sultats de recherche les utilisateurs veulent voir est la possibilit� d'inclure un large �ventail d'informations. Alors Diverse objectif de classement de cette t�che est de r�sultat de la recherche peut contenir autant de sous-th�mes.

La m�thode actuelle, Classement Diverse Ce processus est mod�lis� comme une s�quence de processus de s�lection de documents pour �valuer se compose principalement de deux aspects, on est les aspects de similitude, on est la diversit� Enfin, les deux facteurs une approche globale, � s�lectionnez le document. Ce processus, il sera consid�r� comme une seule �tape qui documente la position actuelle s�lectionn�e � chaque �tape le meilleur moment, n'a pas tenu compte du processus de commande de documents de suivi est un cadre de choix gourmand.

solution optimale locale ce choix constituera le cadre de ce probl�me. La solution la plus simple consiste � rechercher un document de commande ult�rieurs peuvent traiter trier, mais � cause de notre probl�me est un processus de s�lection des sous-s�quences, il est une question difficile non polynomiale, si tous la recherche tr�s r�aliste, donc nous esp�rons utiliser certains aussi peu que possible dans la recherche pour r�soudre ce probl�me. Voici la m�thode que nous utilisons SCTM, vous pouvez rechercher � travers un certain nombre de strat�gies pour guider l'arbre de recherche, essayez de rechercher avec moins de fr�quence pour obtenir une solution relativement mieux. Notre strat�gie de recherche principalement par notre analyse de r�seau valeur politique. A l'int�rieur, notre politique est principalement de contr�ler la largeur de la recherche, notre valeur est avant tout une recherche de contr�le de la profondeur.

Le processus est de mod�liser le processus sp�cifique Classement diversifi� est mod�lis� comme un processus MDP, l'�tat entre le processus MDP est d�j� r�gl� le probl�me et les documents. Notre action est apr�s l'�lection de chaque document. Dans un �tat o� le transfert est que, apr�s avoir s�lectionn� un document, nous avons mis ce document sur la liste a �t� tri�e. Nous modules Il y a quatre modules principaux, un module encodage d'�tat, ainsi que des modules de strat�gie, module de valeur, et enfin SCTM module de recherche.

Tout d'abord � vous dire sur le module encodage, nous utilisons LSTM le mod�le, nous renseignerai l'�tat initial LSTM de nos documents sont entr�s de mani�re s�quentielle au module de LSTM, il retournera � notre �tat ultime, nous ENCODER �tat final vecteur tel que l'�tat actuel du MDP. Ensuite, en fonction de l'�tat actuel, module de strat�gie qui document peut �tre donn� le meilleur, le module de valeur est principalement l'�valuation de l'�tat actuel des revenus subs�quents, qui est bas� sur l'�tat actuel, la liste est tri�e si l'ach�vement ult�rieur de la d�claration finale est Que, faire une estimation. Enfin, le module de recherche SCTM, qui est principalement bas�e des strat�gies d'orientation des politiques et la recherche de valeur, effectuer une recherche, un peu en mesure d'effectuer un emplacement ult�rieur de l'exploration, vous pouvez obtenir une meilleure strat�gie de recherche.

Enfin nous validons notre mod�le sur des ensembles de donn�es TREC, m�thode comparative, y compris la m�thode d'apprentissage en profondeur et les m�thodes traditionnelles, et enfin les r�sultats exp�rimentaux sont significativement am�lior�s. Nous sommes �galement sur le r�le de la recherche SCTM sont explor�es au cours du processus de formation et d'essai, la politique SCTM nos r�sultats de recherche que la recherche n'a pas sensiblement am�lior�.

Route de la soie

Apprenez � conna�tre la Chine

Apprentissage et Applications Session | AIS pr�-s�cher toute la part parlera