ACL 2018 | logiciel CAS: bloc pour la proposition de r�seau de d�tection d'�v�nements chinois

L'extraordinaire! Une autre vague a frapp� le sommet s�chera papier!

9-10 Juin 2018, des repr�sentants du monde universitaire et l'�v�nement de r�seautage haut de l'industrie - par le Comit� de la jeunesse Information Processing Society chinois et Baidu ont organis� conjointement [ � documents AIS2018 (ACL, IJCAI, SIGIR) seront pr�-parler � ] grande tenue � Beijing. Dans les deux jours, de � l'analyse des sentiments � � syst�me de recommandation � � machine Q & A �, � syst�me de dialogue � et d'autres documents de conf�rence au niveau sup�rieur des rapports diff�rents sujets ensemble, le h�ros Xiang Xi, Huashan Mountain.

Il est le monarque de base est entendu que cette parlera aux cercles pr�-universitaires de niveau populaire tout � fait au-del� de l'imagination des organisateurs, l'inscription est ouvert seulement quelques jours sur une capacit� globale compl�te, et que les organisateurs avaient conditions fix�es pour les participants de d�pistage.

Juin les activit�s des m�dias comme base la lecture de ce pr� conf�rences suivront l'ensemble de l'Assembl�e g�n�rale, que nous enregistrons tout l'�v�nement dans l'avant-garde de vue, les r�alisations les plus pr�cieux et les documents invit�s parlerons de pr�-rapport publi� conjointement par les lecteurs et amis conf�rences s�rie de textes pr�-s�rie, le haut vous montrera les r�sultats du dernier document.

lecteurs de base lire les papiers groupe d'�change de la chirurgie, s'il vous pla�t ajouter de petites s�ries Micro Signal: zhizhizhuji . En attendant vous.

ACL 2018

Bloquer la proposition de r�seau de d�tection d'�v�nements chinois

P�pite Proposition pour les r�seaux chinois de d�tection d'�v�nements

Logiciel Acad�mie des Sciences de Chine

Institut de logiciel, Acad�mie des Sciences de Chine

mod�le abstrait bas� sur la d�tection d'�v�nements de r�seau de neurones g�n�ralement consid�r� comme une des t�ches de classification au niveau des mots, elle est souvent affect�e par le d�calage entre les mots et le mot de d�clenchement, pas de tels probl�mes dans mot langage naturel (d�limiteurs Chinois, par exemple) sont plus prononc�s. Dans cet article, nous vous proposons un projet de r�seau de bloc de m�thode (de NPN), qui est un mod�le direct de pr�voir un bloc complet sur chaque mot de d�clenchement limite de mot de mot ind�pendamment des fronti�res, �vitant ainsi le mot - entre les morceaux de d�clenchement la non-concordance. Plus pr�cis�ment, la t�che de d�tection d'�v�nements consid�r� comme un NPN niveau de classification des probl�mes de texte. mod�le d'apprentissage d'abord pour obtenir un mot avec le mot repr�sentation hybride qui peut capturer des mots de d�clenchement d'information structurelle et l'information s�mantique. Ensuite, sur la base dudit bloc propos� de pr�voir la g�chette directe d'un r�seau de bloc complet et mot cat�gorie en utilisant une combinaison de la structure s�mantique des mots de d�clenchement de l'�v�nement chinois. Des exp�riences sur des jeux de donn�es ACE2005 et TAC KBP 2017 montrent, nettement mieux que NPN la meilleure fa�on actuelle.

1 introduction

l'extraction de l'�v�nement est une t�che importante dans l'extraction de l'information. La d�tection d'�v�nements, destin� � identifier les types de sp�cifiques des �v�nements d�clencheurs, l'�v�nement est une �tape critique dans l'extraction. Par exemple, la phrase � Henry a �t� bless�, puis est d�c�d� peu � parmi les besoins de reconna�tre le � bless� � du syst�me de d�tection d'�v�nements a d�clench� un �v�nement � bless� � et � d�c�d� � d�clenche une � mort �.

mot Mismatch et la carte de mot de d�clenchement

La plupart des mod�les de r�seau de neurones existants pour classer probl�me de d�tection d'�v�nements pour un niveau de transformation de texte. Cependant, ces mod�les g�n�ralement affect�s par le d�calage entre les mots de d�clenchement et le mot. Plus pr�cis�ment, un mot de d�clenchement d'�v�nement peut �tre soit une partie du mot, il peut y avoir plusieurs mots. La figure 1 montre la situation �tait un mot de d�clenchement fait partie du mot, et une pluralit� de mots. Le tableau 1 montre la relation entre la proportion des diff�rents mots de d�clenchement de correspondance et mot sur les ensembles de donn�es ACE2005 et KBP. Nous pouvons voir que dans les donn�es de KBP, il y a pr�s de 25 pour cent entre le mot de d�clenchement et le mot ne correspond pas. Dans le ACE2005, cette proportion atteint pr�s de 15%. De cela, nous pouvons voir qui a d�clench� le d�calage entre les mots et les mots affectent de mani�re significative la performance du d�clencheur � base de mots mod�le existant de d�tection de mots.

Le tableau 1 correspondant � la proportion entre le d�clencheur et les mots

Sur cette base, nous proposons une m�thode pour le r�seau propos� de bloc (de NPN) de. Il est une combinaison de mod�lisation structurale par des mots de d�clenchement de niveau mot pour identifier le mot de d�clenchement, le processus de reconnaissance ne d�pend pas d'une limite de mot. La figure 2 montre l'architecture globale de. NPN Compte tenu d'une phrase, un mot de d�tection NPN en tant qu'unit� de base, et de pr�voir l'ensemble du bloc de texte complet d�clench� par composition de mod�lisation structurale interne directement sur le mot de d�clenchement de chaque mot. Pendant ce temps, en m�langeant avec la repr�sentation de mot d'apprentissage des mots, peuvent apprendre la structure NPN plus pr�cise et l'information s�mantique, ce qui peut �tre accompli plus efficacement tri�s bloc de d�clenchement de mot.

2 blocs propos�s d'architecture r�seau

Par rapport aux m�thodes pr�c�dentes, principalement par les NPN deux avantages suivants:

1) en pr�disant un bloc entier plein de mots de d�clenchement directement sur chaque mot, NPN peuvent �tre tr�s efficaces pour r�soudre le probl�me avec le mot d�clencheur mot bloque d�pareill�es. Parce que le mot NPN utiliser en tant que tests unitaires de base, et n'a donc pas d�clenchement mots correspondants et mot ne pas affecter les performances de NPN. De plus, en mod�lisation de la structure interne d'une combinaison de mots de d�clenchement, par rapport au niveau NPN mot traditionnel pour le mod�le au niveau des mots a un meilleur taux d'erreur de classification des d�fauts.

2) en mod�lisant simultan�ment au niveau des mots d'information s�mantique et le niveau des mots, nous pouvons efficacement hybride de capture montrant la structure interne des caract�res et une combinaison d'information s�mantique plus pr�cise, ce qui les meilleurs r�sultats de d�tection et de classification d�clencher mots.

Nous avons effectu� des exp�riences sur ensemble de donn�es de d�tection d'�v�nements chinois ACE2005 et TAC KBP2017. Les r�sultats exp�rimentaux montrent que par rapport au meilleur mod�le existant, peut r�soudre efficacement NPN le d�calage entre les mots et d�clencheur de mot, ce qui am�liorera consid�rablement les effets du mod�le de d�tection des incidents.

2 apprend mixtes

Compte tenu d'une phrase, chaque mot pour NPN l'apprentissage d'une repr�sentation vectorielle. Apr�s la repr�sentation est envoy�e � un module de d�tection d'�v�nements en aval. Nous avons observ� que le niveau de niveau de mot et mot d'information pour d�tecter tr�s important pour les �v�nements chinois: l'information au niveau des mots pour expliquer la structure interne d'une combinaison de mots de d�clenchement et les informations de niveau mot contient la s�mantique plus pr�cise. Par cons�quent, nous vous proposons un m�lange de mot niveau d'apprentissage et d'information de niveau mot � la repr�sentation quantifi�e.

Tout d'abord, nous utilisons deux mod�les de base pour �tudier le niveau de mot et le mot niveau de repr�sentation, respectivement, puis utiliser trois fa�ons diff�rentes pour obtenir la repr�sentation mixte finale. Notre mod�le de base est similaire mod�le DMCNN propos� par Chen et al., Montr� � la figure 3.

Figure 3 mod�les de base

La figure 4 DPT

Apr�s utilisation, la s�quence mod�le et un niveau de s�quence de mots au niveau des mots, respectivement, on peut obtenir une repr�sentation caract�ristique du niveau du mot et au niveau du mot repr�sentation d'entit�, puis on utiliser trois strat�gies diff�rentes comme le montre la figure 4, en les m�langeant ensemble.:

1) m�lange de ligature:-�-dire directement reli� au mot repr�sent� par le niveau de texte indique le niveau.

2) un m�lange universel: Porte-�-dire d'utiliser une fonction de l'importance relative de la mod�lisation du niveau du mot et au niveau mot, r�sultant en un courant de repr�sentation quantitative de deux modules d'aval.

3) m�langer les t�ches li�es: la porte mod�lis�e � l'aide de deux niveaux d'importance du mot et les caract�ristiques au niveau des mots des deux modules sont en aval, respectivement, en obtenant ainsi deux vecteurs repr�sentent des t�ches li�es � deux diff�rents pour chaque module aval.

3 blocs de r�seau propos�

Apr�s avoir obtenu une repr�sentation mixte, bloquer le r�seau propos� est divis� en deux �tapes pour terminer la d�tection d'�v�nements. La premi�re consiste � g�n�rer un mot complet dans chaque g�n�rateur de bloc d�clench� par le mot potentiel bloc de mot de d�clenchement, puis une classification des �v�nements est utilis� pour d�terminer les cat�gories de sp�cifiques du bloc de mots de d�clenchement.

3.1 d�clencheur g�n�rateur de bloc de texte

Des morceaux de d�clenchement chinois ont g�n�ralement une combinaison de la structure interne au niveau des mots, comme � bless� � il y a une structure � verbe + adverbe + nom � et � shot � � poignarder � est en ligne avec le � mod�le Outils + verbe � . Ainsi, si le mod�le peut capturer la structure s�mantique de cette combinaison, on peut pr�voir des blocs de mots de d�clenchement complet (par exemple dans le Chunk � tuer � l'ensemble de pr�diction de mots � shot �) directement sur chaque mot. De r�cents travaux connexes ont montr� que la convolution r�seau de neurones peut tr�s bien saisir l'information s�mantique de cette r�gion. Par cons�quent, nous utilisons un r�seau de neurones en tant que g�n�rateur de bloc de mot de d�clenchement. Au niveau de chaque mot, il ne peut pas d�terminer si le mot appartient � une phrase de d�clenchement, peut �galement noter que la position des morceaux de mots de d�clenchement, ce qui d�clenche le bloc de mot de toute pr�dit.

mot d�clencheur figure g�n�rateur de bloc 5

La figure 5 montre notre g�n�rateur de bloc de mot de d�clenchement. Auparavant, il a appris repr�sente le m�lange en couches enti�rement connect�es de diff�rents blocs de mots de d�clenchement de score calcul� contient le mot en cours. D�finition du mot de d�clenchement de chaque bloc est la longueur du mot courant de d�clenchement et la position des morceaux de mot dans le bloc de d�clenchement. �tant donn� que 98,5% de la longueur du bloc de donn�es est les mots de d�clenchement sont trois caract�res ou moins, donc il est le mot pour chaque mot, un total de six blocs peut contenir mot de d�clenchement. NIL, plus la marque (qui est, le mot ne fais partie d'aucun bloc de mot de d�clenchement), un total de sept cat�gories de blocs de mots de d�clenchement possibles. Apr�s avoir calcul� obtenir ce score, nous devons normaliser la notation � travers une couche Softmax, ce qui entra�ne la probabilit� de classification pour chaque type de bloc de mot de d�clenchement.

3.2 classificateur Cat�gorie de l'�v�nement

Une fois qu'un bloc de mots de classe particuli�re est d�tect�e, le mot en cours indique que le m�lange est amen� � un autre classificateur pour d�terminer la g�chette du bloc de mots de d�clenchement. Comme les pr�c�dents travaux, nous classons directement aux �v�nements de petits sous-cat�gories, ignorant ainsi la topologie entre l'�v�nement et l'�v�nement.

Avec g�n�rateur de bloc de mot d�clencheur comme notre classification des �v�nements est �galement une couche enti�rement connect�e est calcul�e en marquant chaque cat�gorie, puis utilisez la couche Softmax de notation est normalis�e pour finalement obtenir la probabilit� de chaque cat�gorie d'�v�nement .

exp�rience 4

4.1 installation exp�rimentale

Nous sur ACE2005 avec TAC KBP 2017 ensembles de donn�es de d�tection d'�v�nements chinois ont effectu� des exp�riences. Nous nos m�thodes ont �t� compar�es avec les groupes suivants syst�me de base:

1) le mod�le de r�seau de neurones au niveau du mot, comprenant en C-BiLSTM, FBRNN, et le mot de niveau mod�le DMCNN.

2) Niveau de mot de mod�le de r�seau neuronal contient et ainsi de suite DMCNN, HNN, FBRNN. Afin d'all�ger le bloc d�calage de mot d�clencheur mot, nous utilisons le remplacement errata moyen d'am�liorer au-dessus du syst�me de base.

3) La caract�ristique courant am�liorant mod�le optimal, comprenant CLUZH (KBP2017 syst�me de titre), et Rich-C.

4.2 R�sultats exp�rimentaux

Tableau 2 R�sultats

Le tableau 2 pr�sente les r�sultats de nos exp�riences. Nous pouvons voir:

1) et sur deux donn�es, nettement mieux que NPN tous les mod�les de base.

2) d�clench� par la mod�lisation de la structure interne d'une combinaison de mots, nous d�clencher le g�n�rateur de bloc de texte peut r�soudre efficacement le probl�me de la non-concordance entre le mot et le bloc de mot de d�clenchement.

3) pour �tudier la combinaison de moyens de mots que pour la d�tection d'�v�nements est tr�s efficace.

4.3 avec le mod�le traditionnel de comparaison au niveau des mots

Nous allons �galement notre mod�le a �t� compar� au niveau du mot traditionnel mod�le IOB sur la base des r�sultats exp�rimentaux comme le montre le tableau 3.

Tableau 3 Comparaison avec le mod�le au niveau des mots

Nous pouvons voir, �tre nettement mieux NPN que le mod�le traditionnel de marquage niveau IOB � base de mots. Cela est d� au mod�le traditionnel de IOB, la marque verbale correcte, un d�clencheur de bloc la n�cessit� pour tous les mots qui sont donn�s les bons marqueurs, qui, dans bien des cas, il est tr�s difficile (par exemple, � bless� � et � le �). Dans chaque bloc entre NPN mot de d�clenchement Un seul mot peut donner les pr�dictions correctes, m�me si tout le reste du mot est divis� en NIL n'affectera le r�sultat final. Cela rend mod�le a une meilleure NPN la tol�rance aux pannes.

5 r�sum�

Dans cet article, nous vous proposons un projet de r�seau de bloc de m�thode (de NPN), qui est un mod�le direct de pr�voir un bloc complet sur chaque mot de d�clenchement limite de mot de mot ind�pendamment des fronti�res, �vitant ainsi le mot - entre les morceaux de d�clenchement la non-concordance. Plus pr�cis�ment, la t�che de d�tection d'�v�nements consid�r� comme un NPN niveau de classification des probl�mes de texte. mod�le d'apprentissage d'abord pour obtenir un mot avec le mot repr�sentation hybride qui peut capturer des mots de d�clenchement d'information structurelle et l'information s�mantique. Ensuite, sur la base dudit bloc propos� de pr�voir la g�chette directe d'un r�seau de bloc complet et mot cat�gorie en utilisant une combinaison de la structure s�mantique des mots de d�clenchement de l'�v�nement chinois. Des exp�riences sur des jeux de donn�es ACE2005 et TAC KBP 2017 montrent, nettement mieux que NPN la meilleure fa�on actuelle.

En raison de l'unit� de d�tection de d�calage et le mot est tr�s r�pandu dans l'extraction de l'information qui, � l'avenir, nous esp�rons appliquer � plus NPN probl�mes entre l'extraction d'informations, telles que la reconnaissance des entit�s nomm�es.

Route de la soie

Apprenez � conna�tre la Chine

ACL 2018 | logiciel CAS: bloc pour la proposition de r�seau de d�tection d'�v�nements chinois