ACL 2018 | logiciel CAS: bloc pour la proposition de réseau de détection d'événements chinois

L'extraordinaire! Une autre vague a frappé le sommet séchera papier!

9-10 Juin 2018, des représentants du monde universitaire et l'événement de réseautage haut de l'industrie - par le Comité de la jeunesse Information Processing Society chinois et Baidu ont organisé conjointement [ « documents AIS2018 (ACL, IJCAI, SIGIR) seront pré-parler » ] grande tenue à Beijing. Dans les deux jours, de « l'analyse des sentiments » « système de recommandation » « machine Q & A », « système de dialogue » et d'autres documents de conférence au niveau supérieur des rapports différents sujets ensemble, le héros Xiang Xi, Huashan Mountain.

Il est le monarque de base est entendu que cette parlera aux cercles pré-universitaires de niveau populaire tout à fait au-delà de l'imagination des organisateurs, l'inscription est ouvert seulement quelques jours sur une capacité globale complète, et que les organisateurs avaient conditions fixées pour les participants de dépistage.

Juin les activités des médias comme base la lecture de ce pré conférences suivront l'ensemble de l'Assemblée générale, que nous enregistrons tout l'événement dans l'avant-garde de vue, les réalisations les plus précieux et les documents invités parlerons de pré-rapport publié conjointement par les lecteurs et amis conférences série de textes pré-série, le haut vous montrera les résultats du dernier document.

lecteurs de base lire les papiers groupe d'échange de la chirurgie, s'il vous plaît ajouter de petites séries Micro Signal: zhizhizhuji . En attendant vous.

ACL 2018

Bloquer la proposition de réseau de détection d'événements chinois

Pépite Proposition pour les réseaux chinois de détection d'événements

Logiciel Académie des Sciences de Chine

Institut de logiciel, Académie des Sciences de Chine

modèle abstrait basé sur la détection d'événements de réseau de neurones généralement considéré comme une des tâches de classification au niveau des mots, elle est souvent affectée par le décalage entre les mots et le mot de déclenchement, pas de tels problèmes dans mot langage naturel (délimiteurs Chinois, par exemple) sont plus prononcés. Dans cet article, nous vous proposons un projet de réseau de bloc de méthode (de NPN), qui est un modèle direct de prévoir un bloc complet sur chaque mot de déclenchement limite de mot de mot indépendamment des frontières, évitant ainsi le mot - entre les morceaux de déclenchement la non-concordance. Plus précisément, la tâche de détection d'événements considéré comme un NPN niveau de classification des problèmes de texte. modèle d'apprentissage d'abord pour obtenir un mot avec le mot représentation hybride qui peut capturer des mots de déclenchement d'information structurelle et l'information sémantique. Ensuite, sur la base dudit bloc proposé de prévoir la gâchette directe d'un réseau de bloc complet et mot catégorie en utilisant une combinaison de la structure sémantique des mots de déclenchement de l'événement chinois. Des expériences sur des jeux de données ACE2005 et TAC KBP 2017 montrent, nettement mieux que NPN la meilleure façon actuelle.

1 introduction

l'extraction de l'événement est une tâche importante dans l'extraction de l'information. La détection d'événements, destiné à identifier les types de spécifiques des événements déclencheurs, l'événement est une étape critique dans l'extraction. Par exemple, la phrase « Henry a été blessé, puis est décédé peu » parmi les besoins de reconnaître le « blessé » du système de détection d'événements a déclenché un événement « blessé » et « décédé » déclenche une « mort ».

mot Mismatch et la carte de mot de déclenchement

La plupart des modèles de réseau de neurones existants pour classer problème de détection d'événements pour un niveau de transformation de texte. Cependant, ces modèles généralement affectés par le décalage entre les mots de déclenchement et le mot. Plus précisément, un mot de déclenchement d'événement peut être soit une partie du mot, il peut y avoir plusieurs mots. La figure 1 montre la situation était un mot de déclenchement fait partie du mot, et une pluralité de mots. Le tableau 1 montre la relation entre la proportion des différents mots de déclenchement de correspondance et mot sur les ensembles de données ACE2005 et KBP. Nous pouvons voir que dans les données de KBP, il y a près de 25 pour cent entre le mot de déclenchement et le mot ne correspond pas. Dans le ACE2005, cette proportion atteint près de 15%. De cela, nous pouvons voir qui a déclenché le décalage entre les mots et les mots affectent de manière significative la performance du déclencheur à base de mots modèle existant de détection de mots.

Le tableau 1 correspondant à la proportion entre le déclencheur et les mots

Sur cette base, nous proposons une méthode pour le réseau proposé de bloc (de NPN) de. Il est une combinaison de modélisation structurale par des mots de déclenchement de niveau mot pour identifier le mot de déclenchement, le processus de reconnaissance ne dépend pas d'une limite de mot. La figure 2 montre l'architecture globale de. NPN Compte tenu d'une phrase, un mot de détection NPN en tant qu'unité de base, et de prévoir l'ensemble du bloc de texte complet déclenché par composition de modélisation structurale interne directement sur le mot de déclenchement de chaque mot. Pendant ce temps, en mélangeant avec la représentation de mot d'apprentissage des mots, peuvent apprendre la structure NPN plus précise et l'information sémantique, ce qui peut être accompli plus efficacement triés bloc de déclenchement de mot.

2 blocs proposés d'architecture réseau

Par rapport aux méthodes précédentes, principalement par les NPN deux avantages suivants:

1) en prédisant un bloc entier plein de mots de déclenchement directement sur chaque mot, NPN peuvent être très efficaces pour résoudre le problème avec le mot déclencheur mot bloque dépareillées. Parce que le mot NPN utiliser en tant que tests unitaires de base, et n'a donc pas déclenchement mots correspondants et mot ne pas affecter les performances de NPN. De plus, en modélisation de la structure interne d'une combinaison de mots de déclenchement, par rapport au niveau NPN mot traditionnel pour le modèle au niveau des mots a un meilleur taux d'erreur de classification des défauts.

2) en modélisant simultanément au niveau des mots d'information sémantique et le niveau des mots, nous pouvons efficacement hybride de capture montrant la structure interne des caractères et une combinaison d'information sémantique plus précise, ce qui les meilleurs résultats de détection et de classification déclencher mots.

Nous avons effectué des expériences sur ensemble de données de détection d'événements chinois ACE2005 et TAC KBP2017. Les résultats expérimentaux montrent que par rapport au meilleur modèle existant, peut résoudre efficacement NPN le décalage entre les mots et déclencheur de mot, ce qui améliorera considérablement les effets du modèle de détection des incidents.

2 apprend mixtes

Compte tenu d'une phrase, chaque mot pour NPN l'apprentissage d'une représentation vectorielle. Après la représentation est envoyée à un module de détection d'événements en aval. Nous avons observé que le niveau de niveau de mot et mot d'information pour détecter très important pour les événements chinois: l'information au niveau des mots pour expliquer la structure interne d'une combinaison de mots de déclenchement et les informations de niveau mot contient la sémantique plus précise. Par conséquent, nous vous proposons un mélange de mot niveau d'apprentissage et d'information de niveau mot à la représentation quantifiée.

Tout d'abord, nous utilisons deux modèles de base pour étudier le niveau de mot et le mot niveau de représentation, respectivement, puis utiliser trois façons différentes pour obtenir la représentation mixte finale. Notre modèle de base est similaire modèle DMCNN proposé par Chen et al., Montré à la figure 3.

Figure 3 modèles de base

La figure 4 DPT

Après utilisation, la séquence modèle et un niveau de séquence de mots au niveau des mots, respectivement, on peut obtenir une représentation caractéristique du niveau du mot et au niveau du mot représentation d'entité, puis on utiliser trois stratégies différentes comme le montre la figure 4, en les mélangeant ensemble.:

1) mélange de ligature:-à-dire directement relié au mot représenté par le niveau de texte indique le niveau.

2) un mélange universel: Porte-à-dire d'utiliser une fonction de l'importance relative de la modélisation du niveau du mot et au niveau mot, résultant en un courant de représentation quantitative de deux modules d'aval.

3) mélanger les tâches liées: la porte modélisée à l'aide de deux niveaux d'importance du mot et les caractéristiques au niveau des mots des deux modules sont en aval, respectivement, en obtenant ainsi deux vecteurs représentent des tâches liées à deux différents pour chaque module aval.

3 blocs de réseau proposé

Après avoir obtenu une représentation mixte, bloquer le réseau proposé est divisé en deux étapes pour terminer la détection d'événements. La première consiste à générer un mot complet dans chaque générateur de bloc déclenché par le mot potentiel bloc de mot de déclenchement, puis une classification des événements est utilisé pour déterminer les catégories de spécifiques du bloc de mots de déclenchement.

3.1 déclencheur générateur de bloc de texte

Des morceaux de déclenchement chinois ont généralement une combinaison de la structure interne au niveau des mots, comme « blessé » il y a une structure « verbe + adverbe + nom » et « shot » « poignarder » est en ligne avec le « modèle Outils + verbe » . Ainsi, si le modèle peut capturer la structure sémantique de cette combinaison, on peut prévoir des blocs de mots de déclenchement complet (par exemple dans le Chunk « tuer » l'ensemble de prédiction de mots « shot ») directement sur chaque mot. De récents travaux connexes ont montré que la convolution réseau de neurones peut très bien saisir l'information sémantique de cette région. Par conséquent, nous utilisons un réseau de neurones en tant que générateur de bloc de mot de déclenchement. Au niveau de chaque mot, il ne peut pas déterminer si le mot appartient à une phrase de déclenchement, peut également noter que la position des morceaux de mots de déclenchement, ce qui déclenche le bloc de mot de toute prédit.

mot déclencheur figure générateur de bloc 5

La figure 5 montre notre générateur de bloc de mot de déclenchement. Auparavant, il a appris représente le mélange en couches entièrement connectées de différents blocs de mots de déclenchement de score calculé contient le mot en cours. Définition du mot de déclenchement de chaque bloc est la longueur du mot courant de déclenchement et la position des morceaux de mot dans le bloc de déclenchement. Étant donné que 98,5% de la longueur du bloc de données est les mots de déclenchement sont trois caractères ou moins, donc il est le mot pour chaque mot, un total de six blocs peut contenir mot de déclenchement. NIL, plus la marque (qui est, le mot ne fais partie d'aucun bloc de mot de déclenchement), un total de sept catégories de blocs de mots de déclenchement possibles. Après avoir calculé obtenir ce score, nous devons normaliser la notation à travers une couche Softmax, ce qui entraîne la probabilité de classification pour chaque type de bloc de mot de déclenchement.

3.2 classificateur Catégorie de l'événement

Une fois qu'un bloc de mots de classe particulière est détectée, le mot en cours indique que le mélange est amené à un autre classificateur pour déterminer la gâchette du bloc de mots de déclenchement. Comme les précédents travaux, nous classons directement aux événements de petits sous-catégories, ignorant ainsi la topologie entre l'événement et l'événement.

Avec générateur de bloc de mot déclencheur comme notre classification des événements est également une couche entièrement connectée est calculée en marquant chaque catégorie, puis utilisez la couche Softmax de notation est normalisée pour finalement obtenir la probabilité de chaque catégorie d'événement .

expérience 4

4.1 installation expérimentale

Nous sur ACE2005 avec TAC KBP 2017 ensembles de données de détection d'événements chinois ont effectué des expériences. Nous nos méthodes ont été comparées avec les groupes suivants système de base:

1) le modèle de réseau de neurones au niveau du mot, comprenant en C-BiLSTM, FBRNN, et le mot de niveau modèle DMCNN.

2) Niveau de mot de modèle de réseau neuronal contient et ainsi de suite DMCNN, HNN, FBRNN. Afin d'alléger le bloc décalage de mot déclencheur mot, nous utilisons le remplacement errata moyen d'améliorer au-dessus du système de base.

3) La caractéristique courant améliorant modèle optimal, comprenant CLUZH (KBP2017 système de titre), et Rich-C.

4.2 Résultats expérimentaux

Tableau 2 Résultats

Le tableau 2 présente les résultats de nos expériences. Nous pouvons voir:

1) et sur deux données, nettement mieux que NPN tous les modèles de base.

2) déclenché par la modélisation de la structure interne d'une combinaison de mots, nous déclencher le générateur de bloc de texte peut résoudre efficacement le problème de la non-concordance entre le mot et le bloc de mot de déclenchement.

3) pour étudier la combinaison de moyens de mots que pour la détection d'événements est très efficace.

4.3 avec le modèle traditionnel de comparaison au niveau des mots

Nous allons également notre modèle a été comparé au niveau du mot traditionnel modèle IOB sur la base des résultats expérimentaux comme le montre le tableau 3.

Tableau 3 Comparaison avec le modèle au niveau des mots

Nous pouvons voir, être nettement mieux NPN que le modèle traditionnel de marquage niveau IOB à base de mots. Cela est dû au modèle traditionnel de IOB, la marque verbale correcte, un déclencheur de bloc la nécessité pour tous les mots qui sont donnés les bons marqueurs, qui, dans bien des cas, il est très difficile (par exemple, « blessé » et « le »). Dans chaque bloc entre NPN mot de déclenchement Un seul mot peut donner les prédictions correctes, même si tout le reste du mot est divisé en NIL n'affectera le résultat final. Cela rend modèle a une meilleure NPN la tolérance aux pannes.

5 résumé

Dans cet article, nous vous proposons un projet de réseau de bloc de méthode (de NPN), qui est un modèle direct de prévoir un bloc complet sur chaque mot de déclenchement limite de mot de mot indépendamment des frontières, évitant ainsi le mot - entre les morceaux de déclenchement la non-concordance. Plus précisément, la tâche de détection d'événements considéré comme un NPN niveau de classification des problèmes de texte. modèle d'apprentissage d'abord pour obtenir un mot avec le mot représentation hybride qui peut capturer des mots de déclenchement d'information structurelle et l'information sémantique. Ensuite, sur la base dudit bloc proposé de prévoir la gâchette directe d'un réseau de bloc complet et mot catégorie en utilisant une combinaison de la structure sémantique des mots de déclenchement de l'événement chinois. Des expériences sur des jeux de données ACE2005 et TAC KBP 2017 montrent, nettement mieux que NPN la meilleure façon actuelle.

En raison de l'unité de détection de décalage et le mot est très répandu dans l'extraction de l'information qui, à l'avenir, nous espérons appliquer à plus NPN problèmes entre l'extraction d'informations, telles que la reconnaissance des entités nommées.

Huawei nova 4 Forme exposition totale: 6,4 pouces valeur de couleur écran perforé grâce ultraélevé
Précédent
Tsinghua la science et de génie commencent juste près de sept cent élèves du secondaire se sentent le « charme d'ingénierie »
Prochain
Sony « la technologie noire »: la batterie du téléphone est mort? Vous pouvez téléphoner d'un ami « voler » le pouvoir ......
2019 montant entrée au collège Pékin d'examen à 500 points ou plus peuvent demander l'école
| Académie chinoise des sciences: un TDNN en deux étapes un essai automatique indépendant orienté objet réseau profondeur de notation
KPL super hôte, puis rafraîchir la perception, ce qui déclenche LOL et la gloire des joueurs roi secouant la guerre des mots
ACL2018 | CAS Institut de l'informatique: En fonction de la séquence des scènes de dialogue personnalisé au modèle de séquence
Turbo et volley hybride? La nouvelle Sonata ou débuts moderne de Shanghai Auto Show
ACL 2018 | Académie chinoise d'ingénierie de la lettre: l'utilisation de contraintes simples pour améliorer la représentation des connaissances carte d'apprentissage
NHK morceau enregistré ZTE Japon, ZTE Viens!
Déterminer la nouvelle Lexus LC sera libéré / équipé du nouveau système d'alimentation de cette année
Aujourd'hui, le son de base | essai d'entrée au collège première « guerre homme-machine », AI le gagner
DATA 7 millimètres de libération mince UE700 Pro disque U: vitesse de lecture jusqu'à 360MB / s
À la suite de DDR4 pourpre, tour-fait solide!