Syntaxiques et analyse s�mantique pour comprendre sp�ciale | AIS pr�-s�cher toute la part parlera

AIS (ACL, IJCAI, SIGIR) 2018

Session 10: syntaxiques et s�mantiques

1. rivi�re bateau Universit� Soochow

Supervis� Treebank Conversion: Les donn�es et approches

(Le pr�-talk remplacera bateau AIS papier par la rivi�re Li professeur Zhenghua rapport oral)

Notre m�tier principal est de convertir l'arbre biblioth�que. Pour nous parler de ce qui est la d�pendance parsing. L'objectif est de d�pendance l'analyse d'une phrase, puis le mettre au-dessus de l'information structur�e marqu�. Il arc comme une unit�, il est de faire correspondre la relation entre les deux mots est l'unit� de base. Colocalisation est les relations grammaticales entre eux, et parfois il peut y avoir des informations s�mantiques.

Dans la d�pendance de ces derni�res ann�es analyse syntaxique d�velopp� rapidement en 2016, lorsque Google a propos� un mod�le pour am�liorer les trois points, 2017 Stanford a �galement propos� un mod�le que Google a �lev� quatre points. Quels sont les d�fis de l'analyse de d�pendance pouvez-vous faire? Je comprends, tout d'abord est de savoir comment faire face � un petit texte de r�seau non standard. De plus, le mod�le n'a pas encore mis une certaine connaissance s�mantique, la connaissance du monde humain � l'int�rieur, c'est un champ entier probl�me de l'apprentissage machine va �tre pris en consid�ration. Mais comment utiliser treebank existant mieux certaines des donn�es de formation.

Ensuite, nous devons r�pondre � deux questions, un probl�me est de savoir comment mettre des sp�cifications diff�rentes treebank converties en une biblioth�que avec un arbre standard. Par exemple, cette phrase est des normes HIT, et notre propre d�finition d'un cahier des charges. Que ces deux sp�cifications est la d�finition de l'arc � charge, ou la d�finition de la d�pendance, qui n'est pas la m�me chose. Comment mettre les autres de convertir des arbres dans leur propre arbre? On appelle cela la transformation de la biblioth�que de l'arbre de probl�me. Nous pouvons comprendre le probl�me de la traduction automatique, il doit �tre converti en une phrase � une autre peine. La question est vraiment la fa�on dont nous mettons un arbre dans un autre arbre, ce probl�me est plus compliqu�. La deuxi�me question, si ces diff�rentes sp�cifications de conversion de donn�es normalis�es l'avenir, ne sont pas vraiment mieux que la m�thode actuelle utilis�e peut am�liorer le mod�le de sp�cification de l'aide de la syntaxe sur la cible? Ces deux questions que nous devons travailler une r�ponse pr�liminaire est OUI.

Pour toute question Treebank transform� quels d�fis? Le d�fi le plus important est que nous ne disposons pas de telles donn�es. Pour une phrase, j'ai marqu� les deux arbres, un arbre est une sp�cification source, et l'autre extr�mit� d'un arbre est la sp�cification cible. Nous appelons cette bi-arbre des donn�es align�es. En l'absence de ces donn�es, pr�d�cesseurs qu'ils utilisaient d'autres moyens de le faire, et nous utilisons la fa�on super sage.

La premi�re chose est de marquer une donn�e, il y a deux arbres produisent une phrase de donn�es. Pas une phrase utilis�e pour marquer deux arbres, sur les donn�es HIT, nous avons marqu� le 10000, a d�j� un arbre HIT. Sur cette base, nous, avec notre nouvelle norme, puis marquer � nouveau, presque marqu� les dix mille. Le sujet du processus, il y a un choix de points de rep�re, la peine moyenne a marqu� 30% du mot.

Nous avons une plate-forme d'�tiquette, pr�s de 15 �tudiants engag�s, ces donn�es avaient pass� pr�s de 500 heures / personne, le taux global de pr�cision �tait de 78,6%, l'arc de la coh�rence entre les personnes 71,5%, la coh�rence 43,7 phrases %. Ces donn�es sont strictement double marquage, deux personnes sinon, il y aura des experts pour examiner et ainsi de suite, nous allons avoir des donn�es de marquage de la qualit� pour contr�ler le processus pour faire en sorte que ses donn�es.

arbre de t�ches biblioth�que est d'abord converti en une phrase, puis � la borne de source d'un arbre, l'arbre et l'arbre source de g�n�ration de fin de destination. Notre principal d�fi de la t�che elle-m�me, ou le plus de difficult� r�side important dans la fa�on de pouvoir utiliser pleinement l'arborescence de source d'information pour diriger la production du c�t� cible de l'arbre au-dessus du b�timent.

Nous vous proposons deux m�thodes, on appelle plongement mod�le, on est treeLSTM. Pour un pointage � l'arc, la notation, pensez � l'arbre comment utiliser la source pour guider l'arc lorsque la fonction de notation de score.

Les r�sultats exp�rimentaux montrent que les deux points. Tout d'abord, le r�sultat de la conversion, qui est tr�s proche des deux m�thodes, les r�sultats sont similaires, sont tr�s efficaces et simples. De plus, nous avons transform� treebank utilis� apr�s, la performance est �galement Parsing augmentation relativement importante. Ceci est la premi�re fois que notre contribution, les donn�es, les m�thodes, et il a propos� cette t�che. Notre avenir sera converti en d'autres treebank nos directives, continuent � marquer d'autres biblioth�ques d'arbres, dans l'espoir d'une analyse de la d�pendance chinoise fait de tr�s bons r�sultats.

2. Non-Chen Yu de l'Universit� de P�kin

Pr�cis SHRG-Based s�mantique Parsing

Notre travail se fait montrer la structure d'une repr�sentation s�mantique. Quelle est la position de la structure repr�sentation s�mantique de celui-ci? Et comparer la AMR SDG, SDG est une configuration relativement simple de la figure, la mod�lisation est une relation binaire entre le mot et le mot. Le AMR SDG plus complexe que l'id�e est d'unifier les diff�rentes mani�res d'expression, AMR peut �tre tr�s diff�rentes formes de peine, tant que la m�me s�mantique, peut �tre unifi�e en un montre un sch�ma de la structure. Par exemple, un mot � la voix active et voix passive, ladite surface est une grande diff�rence, mais la vue de la structure dans l'espoir qu'ils repr�sentent une repr�sentation s�mantique dans un graphe s�mantique unifi�e.

Donn�es impliqu�es dans notre document, mais aussi une vue de la structure repr�sentation s�mantique, il est plus comme avec AMR, diagramme � l'int�rieur du nud et phrase, le mot n'est pas un � un. Elle est marqu�e lorsque le premier r�sultat de la syntaxe obtenue par le candidat, puis manuellement d�sambigu�ser, il est beaucoup plus �lev�e que le degr� d'�tiquettes correspondant � l'avant de la RAM.

La grammaire non contextuelle phrase est d�crit comme une forme r�cursive, hyperar�te variante grammaire est la grammaire sans contexte est repr�sent� sur la figure ci-dessus. Il est le concept de base et la grammaire sans contexte est le m�me, il y a un premier symbole de d�marrage S, chaque �tape du c�t� remplac� par un sous la figure. Apr�s une s�rie d'alternatives, il est possible d'obtenir une carte plus compl�te des symboles S est �tendu.

Super-c�t� grammaire de remplacement synchrone est de construire une relation entre mappage synchrone de la syntaxe et de la s�mantique de phrase. Chaque r�gle a une des r�gles s�mantiques synchronis�es CFG, donc apr�s l'obtention de r�gles syntaxiques, nous pouvons trouver les r�gles de syntaxe des r�gles s�mantiques de synchronisation correspondant au bord et sur variante, pour obtenir la figure s�mantique sp�cifique. Cependant, dans le corpus est pas de processus de g�n�ration de carte s�mantique, le processus doit �tre g�n�r� par l'extraction de mani�re graphique s�mantique. Syntaxe processus d'extraction et le processus de d�ploiement est invers�e, figure constamment trouver un fragment de la figure r�sultant, il r�duit � un bord. Enfin, la carte enti�re est compress�e en un symbole de d�marrage S, nous pouvons obtenir le processus de g�n�ration du diagramme, et plus peut-on tirer que la syntaxe de la figure.

Notre d�termination est l'utilisation du r�seau de neurones. Il comporte deux �tapes principales, la premi�re �tape est l'analyse, l'analyse s�mantique de la deuxi�me �tape. Mots, la Parsing premi�re d'une cha�ne, pour obtenir son arbre de syntaxe. La seconde est la repr�sentation s�mantique, chaque noeud de l'arbre syntaxique qui a ses r�gles de CFG pour trouver des r�gles SHRG CFG correspondant aux r�gles.

Comme nous l'avons fait l'analyse syntaxique est principalement bas�e LSTM-Minus. Apr�s avoir soustrait les deux vecteurs de sortie, sera un vecteur, le vecteur peut �tre entre une sous-cha�ne d'une cha�ne.

analyseur s�mantique est �galement une vari�t� de mod�les, est le mod�le le plus simple de comptage. Nous avons choisi les donn�es de formation apparaissent � l'int�rieur la plupart des r�gles s�mantiques. Deux mod�les d'homonymie est un vecteur � base de r�gles, nous dirigerons sous-vecteur et le vecteur correspondant � la cha�ne correspondante mis en place, dans lequel un lien de r�seau pour obtenir une partition compl�te, le choix de la r�gle avec le score le plus �lev�.

Le troisi�me est bas� sur un mod�le global. J'ai choisi le meilleur score des sous-graphes K dans chaque nud, apr�s les op�rations de faisceau-recherche, vous pouvez obtenir un graphe s�mantique consid�rer l'information mondiale. Ce sont nos r�sultats. Nous pouvons voir notre mod�le est beaucoup mieux que l'effet du mod�le de comparaison. Nous avons trois mod�les, m�me le mod�le le plus � base de contre-simple, vous pouvez obtenir de meilleurs r�sultats.

3. Non-Chen Yu de l'Universit� de P�kin

Pr� et In-analyse syntaxique des mod�les pour Neural vide Cat�gorie de d�tection

Si nous avons fait, le sens de ces noeud vide repr�sente alors l'analyse syntaxique trouvera treebank en plus de la peine, la peine a �t� ins�r�e entre le nombre noeud vide, est l'objet de l'information omise et similaires. Notre travail est de nud vide D�tecte que je donne la peine d'une surface, cette phrase, il y aura une omission du sujet, comment la composition de ceux-ci omis balis�e, la t�che est de d�tecter une cat�gorie vide.

Proc�d� de d�tection ECP est divis� en trois: pre-parsing, dans l'analyse et de post-analyse. pr�-analyse syntaxique est d�tect�e dans les zones vides de l'analyse syntaxique et ind�pendante de la situation. dans l'analyse est l'analyse syntaxique et de d�tection ECP deux ensemble. pour obtenir apr�s l'analyse syntaxique est le r�sultat de l'analyse syntaxique, puis analys� pour ECP.

Quand vider le champ de l'analyse, quel genre de fonctionnalit�s que nous voulons? La premi�re caract�ristique est les premi�res s�quences de caract�ristiques, � c�t� des zones vides de ce qui pourrait �tre le mot. Il y a quelques-unes des d�pendances les plus �loign�es, il peut y avoir quelques mots et cat�gorie vide �loign�s, mais ils peuvent aussi aider � d�tecter la cat�gorie vide.

Nous pr�sentons le premier mod�le est un �tiquetage de s�quence bas� sur un mod�le, parce que nous avons la phrase originale, peut �tre fix� � une cat�gorie vide � c�t� de la phrase. Nous vous proposons trois mod�les: le premier consiste � ins�rer un peu d'espace entre les mots et les phrases, attach� � l'espace vide au-dessus cat�gorie. La deuxi�me cat�gorie est attach� � l'autre mot vide ci-dessus, pre2 repr�sent� au plus, il existe deux zones vides cons�cutives. Le troisi�me mod�le est que s'il y a une des zones vides en continu, on peut le mettre sur le dessus du mot attach� � l'avant ou � l'arri�re du mot.

Le premier mod�le est ins�r� entre le mot et le mot beaucoup d'espace, sera ins�r� dans l'espace entre tous les deux mots, nous mettons l'�tiquette dans l'espace vide au-dessus des cat�gories. Les mod�les suivants ne sont pas ins�r�s dans l'espace, nous avons mis des �tiquettes sur des zones vides d'un mot avant ou apr�s un mot l�-dessus.

Le deuxi�me mod�le est l'analyse syntaxique d�pendante et faire ensemble. Tout d'abord, nous trouvons la plus grande fraction du processus d'arbre de syntaxe. Notre mod�le de premier ordre est calqu� sur le bord, le bord peut �tre un bord entre les c�t�s, ainsi que de v�ritables noeuds et le noeud vide entre le noeud et il sera r�el nud r�el, nous sommes enti�rement connect� avec une couche construite sur les le mode.

Il y a le mod�le de second ordre. Ses �l�ments de base ne sont pas partie, mais les deux c�t�s compos�s, par exemple, IJ et IK ces deux c�t�s, il peut �tre exprim� en IJK de ce c�t�, on peut �galement se connecter � travers toute une couche de les modeler. Mod�le d'ordre, nous proposons un ensemble de l'algorithme de programmation dynamique pour d�tecter un joint de nud vide et l'analyse syntaxique en 2017.

Les r�sultats de notre mod�le est de comparer le mod�le d'�tiquetage de s�quence LSTM-CRF, ainsi que les r�sultats d'un mod�le d'�tiquetage de s�quence lin�aire, on peut voir le mod�le LSTM-CRF a consid�rablement am�lior� le mod�le de s�rie.

Le second est le r�sultat de notre mod�le en analyse syntaxique. Parce que notre mod�le en analyse syntaxique est la d�tection de noeud vide et l'analyse syntaxique r�alis�e ensemble, afin que nous puissions voir le nud vide d�tecte cette fa�on, non seulement vider l'effet de d�tection de noeud a �t� soulev�, et les r�sultats devra mettre � jour l'analyse syntaxique, est la d�tection de noeud vide et l'analyse syntaxique peut am�liorer l'autre.

4. Bo ISCAS

S�quence � l'action: End-to-End s�mantique graphique pour la g�n�ration s�mantique Parsing

Tout d'abord, nous expliquons bri�vement la t�che d'analyse s�mantique. l'analyse s�mantique phrase en langage naturel est analys�e dans un ordinateur ex�cutable ou d'identifier une repr�sentation s�mantique, comme une s�mantique d'expression logique de la phrase. Ceci est une peine d'analyse s�mantique de phrase en langage naturel �qui Obama est n� dans la ville �, elle correspond � une expression logique que l'explication est un c�t� X, sa cat�gorie est la ville, il y eut entre elle et l'entit� Obama s�mantique de la relation. Et puis nous obtenons une phrase de repr�sentation s�mantique, nous sommes dans la base de connaissances du support, vous pouvez obtenir une r�ponse pr�cise � cette phrase, on peut obtenir une phrase de r�ponse pr�cise, Obama est n� dans la ville de Honolulu. L'analyse s�mantique est largement utilis�, peut �tre appliqu�e automatiquement quizz et plus.

A ce stade, des probl�mes de r�solution s�mantiques rencontr�s, nous pensons que l'analyse s�mantique traditionnelle trop d�pendante des dictionnaires et la grammaire. Par exemple, beaucoup de travail se sont engag�s pr�c�demment r�alis� dictionnaire comment apprendre, comment d�velopper le dictionnaire, doivent �galement d�finir une combinaison de beaucoup de grammaire. Et il y a deux types de ces deux m�thodes d'analyse s�mantique, ils r�solvent les probl�mes rencontr�s par la m�thode d'analyse s�mantique traditionnelle: l'une est bas�e sur la construction de graphe s�mantique, ce type de m�thode est repr�sent�e par graphe s�mantique, l'avantage de cette approche n'est plus n�cessaire grammaire combin�e, le processus d'atterrissage s�mantique de la conversion d'une partie de cette relation de correspondance, plus besoin d'un dictionnaire.

En outre une �tape de comparaison s�quence d'incendie � la s�quence du proc�d�, directement � l'expression logique phrase s�mantique s�rialis�, converti en une s�quence de processus d'analyse s�mantique - � - s�quence de proc�d�, qui peut r�soudre le probl�me de l'analyseur s�mantique. Cette m�thode ne n�cessite pas aussi la grammaire, les d�finitions et les caract�ristiques du dictionnaire, le processus de formation est � la fin.

Nous combinons ces deux m�thodes propos�es s�quence � l'action, tout d'abord, nous utilisons des graphiques s�mantiques pour repr�senter la s�mantique de la phrase, sans l'utilisation d'expressions logiques. De plus, nous construisons processus figure s�mantique consid�r� comme une s�quence d'actions, nous voulons analyser la phrase, la phrase pour obtenir graphe s�mantique. graphe s�mantique est construit �tape par �tape termin�e, on le met dans le processus de construction comme une s�quence d'action, de sorte que vous pouvez mettre toute analyse s�mantique d'une phrase consid�r�e comme une s�quence d'actions � traiter la s�rie, vous pouvez utiliser le mod�le RNN pour mod�le. L'avantage de cette m�thode est qu'elle repr�sente l'utilisation de la capacit� du graphe s�mantique s�mantique ainsi que le mod�le de s�quence � la s�quence capacit� s�quence pr�dite.

De tels proc�d�s et s�mantique construit sur la base d'une comparaison de la figure avant, n'a pas besoin de construire un tel r�sultat d'analyse syntaxique � l'aide d'un graphique s�mantique ou un mod�le sp�cifique, le proc�d� de g�n�ration d'une extr�mit� directement � la fin de la Fig. Alors que l'approche comparative par s�quence � la s�quence, on construit le fonctionnement encodage en utilisant des graphiques s�mantiques, construction syntaxique plus la mod�lisation de l'information, nous avons examin� un certain nombre de liens entre l'op�ration de g�n�ration. Dans le processus de d�codage qui peut facilement ajouter des contraintes syntaxiques et s�mantiques pour filtrer une mauvaise op�ration.

Un cadre de notre d�marche vous donner un exemple. Lorsque vous entrez dans une phrase, nous utilisons le mod�le RNN pour g�n�rer une s�quence d'actions. Cette s�quence d'actions peut �tre utilis�e pour construire le graphe s�mantique. Dans le processus de g�n�ration de la s�quence d'actions peut ajouter des contraintes au fonctionnement limite peut g�n�rer filtre en temps opportun � un mauvais fonctionnement. Le cadre tout, d'abord besoin de d�finir un ensemble d'actions, le jeu d'action est le processus de mod�lisation s�mantique de la figure. Cet ensemble d'actions, il est relativement commun, il y a un certain nombre d'un des noeuds de graphe s�mantique, le nombre d'ar�tes form�es dans, a une certaine universalit�. Et sp�cifique pour chaque jeu de donn�es, de son c�t�, son entit�, ses informations est diff�rent, il peut correspondre � un fonctionnement l�g�rement diff�rent, mais dans des cat�gories g�n�rales bas�es bords ajouter, ajouter un nud, ajouter des nuds cat�gories, etc. et ainsi de suite.

Le mod�le de s�quence � l'action et le plus largement utilis� � ce stade du mod�le de l'encodeur que nous utilisons ne fait aucune diff�rence, la seule diff�rence est nous avons ajout� un contr�leur pour ajouter des contraintes syntaxiques et s�mantiques.

Nous ajoutons des contraintes syntaxiques et s�mantiques dans le codeur. contrainte syntaxique consiste � veiller � ce que le fait de g�n�rer une s�quence de construire vue effective correspondant � des contraintes s�mantiques garantissent la figure s�quence s�mantique de mouvement g�n�r� construit, sans se d�partir de la base de connaissances de contrainte. Par exemple, deux noeuds sont reli�s � chaque bord, qui doivent �tre conformes aux contraintes de connaissances. Il y a une autre contrainte est que chaque nud doit �tre de cat�gorie ne sont pas contradictoires.

Nous avons effectu� des exp�riences sur trois ensembles de donn�es, � savoir la National Aeronautics �tats-Unis et g�ographique GeoQuery ensembles de donn�es ATIS et ensembles de donn�es ont un jour � trois ci-dessus obtenu des r�sultats relativement bons. Nous avons obtenu les meilleurs r�sultats dans l'ensemble de COURS DE LA NUIT donn�es et ensembles de donn�es ATIS dans GeoQuery ci-dessus et d'obtenir de bons r�sultats.

5. Tu Ke-wei Universit� de Shanghai des sciences et de la technologie

M�lange gaussienne Latent vecteur Grammars

(Le premier auteur est Zhao Yanpeng, AIS pr�-parler sera la sc�ne de Zhang Liwen au lieu d'un rapport oral)

Grammaire composant analyseur (circonscription Parsing) est destin� � donner � la structure de la repr�sentation de langage, � savoir, pour obtenir l'arbre de syntaxe de langage correspondant. Comme on le voit � droite, il m'a trouv� cette d�claration, nous voulons trouver sa structure syntaxique. PDGF (probabilistes Contexte libre Grammars) est une approche tr�s classique, mais cette m�thode, en supposant que la probabilit� de r�gles de grammaire et il n'a rien � voir dans le contexte de la situation, il y a une limitation tr�s grandes.

Pour rem�dier � cette limitation, nos pr�d�cesseurs ont fait beaucoup Solution: annotation syntaxique qui marque l'information syntaxique � son nud parent, fr�re ou sur de la cat�gorie syntaxique dans l'arbre de syntaxe, vocabulaire marqu�, la cat�gorie syntaxique qui est dans l'arbre de syntaxe marquer les composants de phrase correspondant lemme.

Puis vint la m�thode d'apprentissage automatique des cat�gories syntaxiques grains fins, � savoir les variables cach�es grammaire (Latent Grammars variables, LVG). grammaires syntaxiques variables cach�es pour chaque cat�gorie (non terminaux) variables cach�es associ�es � un discret, les valeurs discr�tes de variables cach�es repr�sentent la sous-classe de syntaxe particuli�re (sous-type). Mais ce mod�le pour chaque cat�gorie syntaxique original, seul un nombre fini de la mod�lisation syntaxique de ses sous-cat�gories.

R�sumant les travaux ci-dessus, nous continuons � affiner trouv� cat�gorie syntaxique, nous pouvons �tre plus pr�cis des r�sultats d'analyse de grammaire.

Par cons�quent, nous vous proposons la grammaire Vector Implicite (Latent Vector Grammars, LVeG), le but d'un nombre infini de mod�lisation de chaque sous-type de non-terminaux. Le LVeG non terminal d'associer un espace continu, chaque point de l'espace peut �tre consid�r� comme un sous-type. Par exemple, P (0.3, 2.1) g�n�re le sous-type a, et P (0.5, 1.4) est g�n�r�e me.

LVG faire quelque chose avec la comparaison pr�c�dente: dans LVG, chacune des parties multiples non terminales sont devenues limit�es, on suppose que seuls les sous-types M NP, P seuls les sous-types M, r�gle: NP- > P, qui est une r�gle de sous-type que M�, parce que nous serons divis�s en un nombre infini de copies de chaque non-terminal, de sorte que nous NP- > P aura un nombre infini de r�gles de sous-type. En outre, LVG ayant un param�tre qui indique que les r�gles de grammaire de la probabilit�, dans la LVeG, r�gle de grammaire ayant un param�tre de pond�ration des r�gles de grammaire repr�sent�e densit�.

En fait, LVG LVeG peut �tre consid�r�e comme un cas particulier. Par valeur de variable discr�te LVG est convertie en vecteurs One-chaud, LVG elle peut �tre projet�e sur l'espace continu. grammaire combinaison vecteur (compositionnelle Vector Grammars, CVG) est �galement donn�e aux sous-cat�gories syntaxiques dit vectorisation continue, nous pouvons prouver que le mod�le est un cas particulier de LVeG.

Depuis LVeG peut �tre consid�r�e comme une extension de LVG, LVG que certains probl�mes, LVeG rencontrera. Si nous directement LV (e) G do complexit� temporelle est exponentielle Parsing, et finalement obtenu est l'arbre de sous-type, mais est finalement souhait� arbre d'analyse syntaxique avec CRK non raffin�. Il est n�cessaire de prendre une m�thode d'approximation.

Ici, nous prenons une analyse syntaxique max-r�gle, cette m�thode de calcul de la grammarrule devrait compter chaque � chaque emplacement pour chaque phrase, ou la probabilit� post�rieure, puis a couru CYK post�rieure r�utilisation de l'algorithme de probabilit�, pour obtenir le r�sultat final. Apr�s avoir calcul� la LVG de probabilit� post�rieure � cette �tape est possible dans l'espace continu est incalculables, afin de r�soudre ce probl�me, nous proposons un LVeGs M�lange gaussiennes (GM-LVeGs). GM-LVeGs grammmar r�gle de la fonction de poids est d�fini comme une distribution de m�lange gaussien (GaussianMixture), puisque la distribution gaussienne de m�lange pour l'addition, la multiplication, des solutions d'int�gration sont tous ferm�s, donc nous cherchons obtenu pointage � l'int�rieur, le score � l'ext�rieur et la posteriorprobability solution analytique ..

fonction objective GM-LVeG est une probabilit� conditionnelle de journal classique, nous avons utilis� l'algorithme d'optimisation Adam, et lorsque la distribution gaussienne est gaussienne quand un angle, on peut tirer la solution analytique du calcul du gradient. Dans l'exp�rience POS-taggng, nous dans les ensembles et UD huit langues donn�es WSJ pour faire le test, et LVG ont �t� compar�s. Nous pouvons obtenir les r�sultats relativement bons.

Dans la circonscription exp�rience Parsing, nous LVG avec CVG et d'autres m�thodes ont �t� compar�s ensemble de donn�es wsj. Peut �tre trouv�, quelle que soit la dur�e de la peine 40 ou moins, ou toute la phrase, nous pouvons obtenir de meilleurs r�sultats.

En r�sum�, nous vous proposons un nouveau cadre, Latent Verctor grammaire, chacun �tant associ� � un non-terminal � un espace continu, et nous avons prouv� avant LVG, CVG ces algorithmes peut �tre consid�r� comme un cas particulier LVeG, nous �galement propos� GaussianMixture LVeGs. Dans lequel la fonction de pond�ration de chaque r�gle de grammaire est d�finie pour les m�langes gaussiens. Et l'apprentissage propos� et le raisonnement algorithme polynomial peut avoir obtenu de bons r�sultats dans le marquage POS et l'analyse de la circonscription.

6. Jin Hui Ming et de l'Universit� Hao Zhu Qinghua et l'Universit� de Beijing de l'a�ronautique et de l'astronautique

L'int�gration de caract�res chinois de mots pour Lexical S�M�ME Pr�vision

Jin Hui Ming: S�M�ME traduction officielle est appel�e Yoshimoto, consid�rer quelques-uns des caract�res chinois signifiant pr�visions yuans.

Donner � chacun parler de la connaissance derri�re la premi�re Yoshimoto faire est de d�finir une unit� s�mantique minimale. �tiquetage Yoshimoto n'est pas naturelle, mais marqu�e par des linguistes qui constituent une base de donn�es. Tel est le concept HowNet HowNet Dong Zhendong et M. Dong Qiang utilis� propos�rent, HowNet est base de donn�es bien connue. HowNet qui a presque 2000 Yoshimoto, ces Yoshimoto a marqu� avec 100.000 mots et expressions, chaque mot et expression a plusieurs sens, peut �tre ambigu�, ce qui signifie chacun compos� de plusieurs composants Yoshimoto.

Il y a structure arborescente de l'organisation entre Yoshimoto, alors il y a de multiples relations entre Yoshimoto. Par exemple, le concept � pomme �, qui a deux significations, l'un est un ordinateur, l'autre est un fruit. Tout d'abord, il est la d�finition d'un ordinateur, vous pouvez transporter style. Ensuite, il est une marque particuli�re, vous pouvez transporter l'ordinateur, qui est � pomme �. Une autre est la d�finition d'un fruit, nous pouvons voir l'importance de certains est d'utiliser Yoshimoto de sp�cifique pour expliquer le sens du mot.

Notre t�che est de Yoshimoto recommand�. Est d�sign� par l'apprentissage du vocabulaire de nouveaux mots pour recommander Yoshimoto, vous ne savez pas comment il Yoshimoto cette norme, ce mod�le vous lui dire comment la norme Yoshimoto. Xie Ruobing travaux ant�rieurs, etc. Deux m�thodes, et le filtrage collaboratif d�composition de matrice � base. Ces deux m�thodes est tr�s efficace, mais leur probl�me est que seules les informations externes, des informations de contexte qui a appris de texte � grande �chelle.

Notre mod�le est le premier mod�le fait usage d'une information privil�gi�e, la premi�re est similaire � la technique de filtrage collaboratif. Tout d'abord, la position des mots apparaissent dans le mot est divis� en avant, pendant et apr�s. Parce que le mot dans un endroit diff�rent, peut repr�senter des significations diff�rentes. Yoshimoto puis faire une recommandation bas�e sur la similitude de la forme de texte.

De plus, lorsque ces matrice d�composition se d�compose deux matrices, recherche la plus repr�sentative d'un mot, en raison de l'ambigu�t� du mot est plus fort que les mots, de sorte que chaque mot pour en savoir plus Embedding, la d�composition de choisir un mot parmi les plus repr�sentatifs d'un mot le plus repr�sentatif Embedding, comme le mot et Yoshimoto �taient Embedding comparer le temps.

Zhu Hao: Nous avons �tabli un mod�le pour d�duire la signification des caract�res chinois compos� de yuans des caract�res chinois, qui est bas� sur une hypoth�se fondamentale qui a un lien tr�s fort entre les personnages et les mots qu'il pose. caract�res chinois en utilisant seulement un mod�le, son effet, bien que non seulement le mod�le de contexte, mais il n'y a pas particuli�rement grande diff�rence. Plus important encore, nous ferons un deux mod�les d'int�gration tr�s simple, puis trouv� pour renforcer l'effet est tr�s important. Description deux mod�les sont tr�s compl�mentaires. Nous supposons qu'il est en fait corpus relativement rares, semble mots relativement basse fr�quence ci-dessus effet sera meilleur.

Nos exp�riences ont �galement prouv� ce point, lorsque notre fr�quence de mot est tr�s bas, plus bas m�me que apparu 50 fois dans le corpus, nous constatons que l'effet entre l'efficacit� de notre mod�le de mots � haute fr�quence avec presque la m�me, que faible 0,03. Avant d'utiliser le mod�le de contexte, leur effet est r�duit de 50%. Comme nous joignons mod�le, la capacit� d'int�grer le mod�le est plus robuste.

Nous pouvons aussi analyser de plus pr�s, quels types de mots dans ce qui pr�c�de, nos r�sultats font particuli�rement bien. Par exemple horloger, dans le corpus, bien que l'horloger appara�t plus fr�quemment qu'un plus haut, mais pas encore en utilisant le mod�le de contexte associ� � temps pr�dit Yoshimoto, et notre mod�le peut �tre. Le deuxi�me exemple est Oscar n'a pas de lien entre translitt�ration un du mot, avec des caract�res chinois signifiant, notre mod�le sera fait relativement pauvre.

Nous avons propos� un mod�le pour pr�dire Yoshimoto bas�e sur les caract�res chinois, alors il y aura beaucoup de travail peut �tre prolong�. Notre mod�le est v�rifi� une forte association entre le mot et ses caract�res compos�s, il fournit la base pour une utilisation ult�rieure caract�re niveau mod�le de traitement du langage naturel.

7. Luofu Li Universit� de P�kin

L'int�gration de gloses dans Word Neural Sense Homonymie

Mot SenseDisambiguation (WSD, WSD) est une t�che de la PNL plus traditionnelle. Nous examinons d'abord un exemple de ce jeu de mot multi-sens, dans un contexte diff�rent, peut repr�senter un sens diff�rent (sens). Par exemple, la premi�re phrase, nous avons jou� au football l'apr�s-midi, ce qui signifie ex�cuter. Dans d'autres phrase, il peut �galement indiquer un instrument de musique et de jouer un r�le. Sens Pour ces derniers, il est dans le dictionnaire qui correspond � la phrase explicative d'un texte, g�n�ralement appel� brillant. Par exemple, le premier brillant d'une pi�ce de sens est: � participer � des jeux ou le sport �. Pour approche purement fond�e sur la connaissance des sans supervision traditionnelle compter uniquement sur le contexte de contexte polys�mies et son calculate brillant une similitude, s�lectionnez brillant sens o� la plus grande similitude est le mot correspondant au contexte actuel de la signification correcte .

Pour fa�on classique supervis�, il est souvent compter que sur la surface sup�rieure du contexte que le sens marqu�, d'un ou plusieurs classificateurs form�s. (Parce que chaque mot a un sens diff�rent, il est g�n�ralement plus d'un mot pour chaque formation un classificateur, mais l'approche � base de neurones est habituellement une formation uniforme pour tous classificateur mot). Le travail principal de notre inspiration principale de cet article est: si elle est �tiquet�e, des donn�es ou des connaissances lexicales, tous les WSD tr�s utile. Nous avons donc pens�, pourrait utiliser un mod�le, ces deux donn�es de mod�lisation en compte, est la principale motivation de notre papier.

Comment mod�liser ces deux types de connaissances? En fait, il peut �tre converti en un probl�me de compr�hension de lecture. Par exemple, la lecture probl�me de compr�hension, il y a une question correspond � un certain de document, il y a une r�ponse. Pour notre t�che en termes de d�sambigu�sation document Word, gloses est que tous les sens de l'ambigu�t� des mots. Par exemple, il y a N jeu de mot qui signifie dans le dictionnaire, le document correspondant est la phrase brillant explication de sens N. Cette question dans le contexte dont le contexte actuel, jouent un mot qui � la fin est le sens (le sens). Choisissez la bonne r�ponse est le num�ro de phrase brillant correspondant sens correspondant. Lorsque le � Join connaissances supervis� probl�me de d�sambigu�sation mot, � le probl�me dans la lecture de probl�me de compr�hension / QA, vous pouvez utiliser une partie du cadre de l'assurance qualit� pour r�soudre ce probl�me. Gr�ce � la recherche et des exp�riences, nous avons constat� que le r�seau de m�moire est tr�s appropri� pour r�soudre ce probl�me.

Voici un regard sur les principaux mod�les d'architecture, principalement contient quatre modules. module de contexte de l'information principalement sur le contexte de la phrase est mod�lis�, il mod�lis� comme un vecteur. sens du module brillant de chaque phrase est principalement model� brillant expliqu�, la brillance de chaque exprim� comme vecteur. Dans le module m�moire en permanence pour calculer la similitude de chaque contexte avec brillant, et enfin le dernier passage d'une attention du module m�moire retir�, avec le score que le contexte de brillance de similarit� finale gr�ce � plusieurs tours (passe). Enfin R�ponse module ce score de similarit� et une note de contexte � l'ajout de MLP, puis prendre SoftMax, obtenir un sens diff�rent des distributions de probabilit�, et tout le mod�le est form� en maximisant la entropie crois�e.

Au cours de l'exp�rience, nous avons constat� que certains brillant parce que la phrase de quelques mots, � son tour, affecte la g�n�ration de vecteur brillant inexact. Nous avons donc am�lior� le mod�le avec un mot brillant du bit sup�rieur et inf�rieur de sens pour d�velopper l'information. Am�lioration de phrase est un mod�le sur la base du module Gloss expans�, avec le BiLSTM de fusion de la brillance du vecteur de mot sup�rieur et inf�rieur.

Notre meilleur mod�le par rapport � utiliser pleinement que des donn�es d'annotation BiLSTM, a augment� de 2,2 points de pourcentage. Ajout de la brillance des connaissances pour am�liorer les performances est tr�s �vident, alors que notre mod�le sur tous les ensembles de donn�es SemEval ont atteint les meilleurs r�sultats. Influence d'un Multi-pass ci-dessous, vous pouvez voir un m�canisme pour rejoindre multi-hop, vous pouvez �largir la valeur de l'attention entre le sens sens bien et le mal.

Enfin, parler de l'avenir de certains des travaux. Nous avons utilis� uniquement les informations texte brillant, il y a encore une foule d'informations structurelles ne sont pas utilis�es dans WordNet. Il y a un lustre que nous mettons chaque mod�le directement dans un vecteur d'utilisation, plus � � grains fins � dans la Glose si une corr�lation plus significative avec la mod�lisation du contexte, mais aussi digne de notre r�flexion profonde et d'exp�rimentation.

8. Zhaolou juin Universit� Fudan

R�seaux de Neurones et partiellement Incorporating Unlabeled marqu� de donn�es pour Word Chinese Cross-domain Segmentation

Tout d'abord, parlez-nous de la mission du mot chinois, puis pr�senter notre mod�le, et enfin parler de quelques-uns des r�sultats de l'exp�rience.

choses mot chinois, une entr�e de texte est l'espoir lorsque la sortie est de la mettre en chaque mot. Cette t�che sera g�n�ralement mod�lis� comme une des t�ches d'�tiquetage de s�quence, chaque jeu de mot quatre �tiquettes indiquant si le mot est le d�but, au milieu ou � la fin, ou le mot lui-m�me est un mot. Nous utilisons principalement deux corpus, le premier est non marqu� dada, la seconde est des donn�es partiellement marqu�es.

Par exemple, ici, � les Etats-Unis | Pr�sident � si deux mots, si vous �tes au milieu du mot � couper, par exemple, � US General �, vous sont tr�s faciles � pr�dire le mot suivant, et pr�dire le mot suivant est � r�unification � probabilit� est 0,71. Si au milieu de deux mots s�par�s, par exemple, �tant donn� � aux Etats-Unis � pour pr�dire le mot suivant, tr�s difficile de pr�dire le mot suivant est � total � (probabilit� 0,05). Cette probabilit� est donn�e par le mod�le de langage, de sorte que vous pouvez trouver des informations entre la co-occurrence de mots par mod�le de langage, mot pour cette information est plus utile. Et mod�le de langage peut �tre utilis� pour former le dada Unlabeled. Afin de mod�liser les caract�ristiques de la langue afin de mieux int�grer dans le mot � l'int�rieur, notre architecture en utilisant un m�canisme de porte est mis en uvre avec le GRU, les trois caract�ristiques font une fusion, et enfin faire un mot.

La seconde est l'utilisation des donn�es partiellement marqu�es, par exemple, � le pr�sident am�ricain � la Maison Blanche, � si � Pr�sident � est un lien hypertexte, nous pensons que c'est un mot, produit les donn�es suivantes partiellement marqu�es.

Ensuite, regardez nos exp�riences, le domaine est ancien corpus Quotidien du Peuple (journalisme), il existe quatre zones cibles, les finances, la m�decine, la litt�rature et les champs informatiques. Un autre groupe est un roman (immortelle) en tant que champ cible, CTB5 que le champ d'origine.

Nos exp�riences de mod�les dans lesquels ces cinq, un seul ne fonctionne pas en 2017 que par le pass�, les quatre autres exp�riences ont obtenu les meilleurs r�sultats. Apr�s un endroit assez �trange d'�tre, nous trouvons dans le domaine de la litt�rature que vous avez ajout� un inscriptibles partiellement, mais pire que cela, sans effet partiellement marqu�.

Analysons ajouter mod�le de langage avec plus de partiellement marqu� � la fin ce qui est la m�me chose. "Xiao Zhou", "Tian Linger" sont des noms. Nous avons constat� que ces deux noms sont divis�s mal BilSTM, ainsi que le mod�le de langage, il y avait un nom ( � Tian Linger �) � droite. Notre analyse a r�v�l� que � Tian Linger � est le protagoniste du livre, elle est apparue plus souvent, le nombre de � petites semaines � appara�t relativement faible. Pour les donn�es non marqu� est, le plus de fois si ce mot appara�t, il est facile � l'information de capture par mot de donn�es non marqu�es. Si le nombre est relativement faible, vous venez de mettre partiellement marqu� Ceci est une fa�on meilleure.

Cette exp�rience est d'analyser l'influence de la taille de la quantit� de donn�es sur les r�sultats exp�rimentaux, plus vous utilisez sans �tiquette, mieux. partiellement marqu� n'est pas le m�me, il peut �tre la premi�re hausse apr�s la chute. il partiellement inscriptibles sont tr�s, tr�s bruyant, ce qui provoque plus que vous utilisez, le dos diminue lentement, c'est notre analyse, je vous remercie!

Route de la soie

Apprenez � conna�tre la Chine

Syntaxiques et analyse s�mantique pour comprendre sp�ciale | AIS pr�-s�cher toute la part parlera