Cartes d'extraction de l'information et de la connaissance session

AIS (ACL, IJCAI, SIGIR) 2018

S�ance 8: Extraction d'information et des connaissances Graphique

1. Meijia Jie Universit� de Beijing de l'a�ronautique et de l'astronautique

Sur les bases Lien Predictionin Connaissances: Max-K Crit�re et protocoles de pr�vision

Regardez d'abord la base de connaissances, base de connaissances est une connaissance tr�s structur�e, il est une collection de faits, nous mettons habituellement organis� en chambre triple, < H, R, T > Dans lequel la premi�re entit� est H, R est la relation, T est la fin de l'entit�. Par exemple, un exemple typique ". < P�kin est la capitale, la Chine > . � Nous avons g�n�ralement d�j� une base de connaissances, il est loin d'�tre termin�, il y a beaucoup d'informations sont manquantes. Ici, nous avons deux KB, le premier est d�j� d�tenue par G ,, nous supposons que le second est termin� connaissance G *. Liens cible pr�dite est bas�e a une certaine G, pour r�cup�rer la diff�rence entre le jeu G * et G.

t�che de pr�diction de liaison, g�n�ralement li�e au score Fonction, triple est une mesure de la probabilit� d'un fait. avec < P�kin est la capitale? > Par exemple, la Chine a atteint 10 points, un point a frapp� les Etats-Unis, aux Philippines a atteint 0,1 point. Cette possibilit� est pas n�cessairement la caract�risation probabiliste. Lorsque nous avons la fonction de notation, compte tenu de H et R comment pr�dire le T? Le fait est que nous avons besoin de chacun marqu� possible T, la possibilit� de rendements plus �lev�s. La diff�rence entre les diff�rents mod�les, se refl�te dans la conception de la fonction Score. Score fonction implique souvent Embedding KB, les entit�s et les relations doivent �tre mis en correspondance avec un certain nombre d'espace vectoriel.

Compte tenu Score Fonction, comment la pr�vision de lien? KB noyant mod�le existant, en utilisant le crit�re Top-k, a k entit�s s�lectionn� probabilit� la plus �lev�e de la queue. Tout d'abord s�lectionner un k, par exemple, les trois premiers, les 10 premiers, pour chaque t�che de pr�diction de lien, toutes sortes d'entit�s de la queue, en fonction de leur score, sont revenus le plus haut score k entit�s de la queue.

Ce crit�re a ses limites. On peut consid�rer deux exemples, par exemple, supposons que K est �gal � 3. Tout d'abord, le premier exemple, P�kin est la capitale qui nous voulons pr�dire les trois, mais dans ce cas, vous trouverez ce un probl�me aussi longtemps que la r�ponse est assez, on n'a pas besoin de trois, de sorte que le probl�me est caus� par taux de pr�cision sera faible.

La deuxi�me t�che, P�kin qui est n�, la r�ponse � cette question est qu'il ya beaucoup, beaucoup. Vous ne pr�voir trois, le taux de rappel est tr�s faible. Top-K est difficile � r�aliser toutes les t�ches avec pr�cision, rappeler une tr�s bonne performance.

Pourquoi notre max-K est raisonnable? Tout d'abord, top-k sont largement utilis�s dans KB domaine Embedding, si je peux prouver un tr�s bon mod�le, il appara�t dans le Max-K suivant, et pas pire qu'un haut k suivant la performance, dans ce cas, Max- K est une utilisation raisonnable.

Ici, le mod�le implique un � proph�te �, il conna�t toutes les bonnes r�ponses pour chaque probl�me de pr�diction de lien. Nous consid�rons comment choisir la r�ponse. On peut dire que le mod�le de rappel Proph�te, l'exactitude et la valeur F1 � la valeur max-K est au moins �gal au top-k crit�re de crit�res.

Avec les directives Max-K, apprendre un mod�le, il y a une fonction de pointage, je voudrais utiliser les lignes directrices Max-K pour effectuer des t�ches r�elles. Le premier est le plus banal Top-k, puisque la plupart du K a demand� de revenir, je vais revenir � la premi�re de K. Le deuxi�me protocole est l'�chantillonnage, la r�ponse correcte � partir d'une distribution d'�chantillonnage de r�ponses K, le retour de ces diff�rentes r�ponses. Le troisi�me est le protocole Greedy, chaque fois que r�pondre � des questions devaient faire l'�chantillonnage, en r�alit� ralentissement. La r�ponse peut �tre donn�e imm�diatement par le protocole Greedy.

Cela implique une question d'�valuation nous sur quatre mod�les et quatre ensembles de donn�es ont fait une exp�rience tr�s riche prouv� que le crit�re Max-K mieux que les lignes directrices Top-K.

Nous faisons un mod�le de travail est sp�cifiquement con�u pour le rendre bien performer dans les lignes directrices Max-K.

�2. Logiciel Lin Hongyu CAS

P�pite Proposition pour les r�seaux chinois de d�tection d'�v�nements

Mon premier emploi �tait pour le do de d�tection d'�v�nements chinois. l'extraction de l'�v�nement est une des t�ches de base tr�s importantes. objectifs de d�tection d'�v�nements pour identifier certaines cat�gories sp�cifiques d'�v�nements d�clenchent mot du texte. Par exemple, un journaliste � Bagdad a ouvert le feu sur un char d'entre eux est mort, nous avons identifi� de la peine de mort qui est d�clench�e par le mot Fired. La d�tection d'�v�nements est une �tape d'extraction d'�v�nement tr�s important. Existant mod�le de r�seau de neurones bas� sur la d�tection d'�v�nements, la d�tection d'�v�nements est g�n�ralement traduit en t�ches de classification au niveau des mots. Tout d'abord, nous avons besoin est mort et mis le feu sur la fili�re sont class�s en deux cat�gories et d'attaque. Dans la langue anglaise ci-dessus ces mots ont une fronti�re naturelle, et ses r�sultats sont tr�s bons.

Pour les Chinois, ce type de mod�le au niveau des mots souffrira du probl�me de la non-concordance entre d�clenchement Word. Plus pr�cis�ment, un mot de d�clenchement soit peut faire partie d'un mot, il peut y avoir plus d'un mot. Pr�s de 25% du mot de d�clenchement, pas un mot sur les donn�es ERE. Les donn�es sur l'ACE2005 �galement 15% des donn�es ne sont pas un mot. Le probl�me ne peut pas r�soudre en trouvant un crit�re de segmentation optimale.

Cet article propose un nouveau cadre de marquage au niveau des mots. l'apprentissage mixte de chaque mot de la premi�re s�quence de mots et de phrases qui indiquent, pour enrichir ses informations s�mantiques. Apr�s cela, nous utilisons un sch�ma pour pr�dire directement � travers les blocs de mots de d�clenchement complets sur chaque mot, non seulement dans l'�tiquette de mot de d�clenchement du bloc de pr�diction de mot BIO. Nous avons pr�dit l'expression de d�clenchement, sur le syst�me de classification, d�cider de la cat�gorie sp�cifique.

Nous utilisons une combinaison de la structure s�mantique des mots de d�clenchement de l'�v�nement chinois. La caract�ristique la plus importante, il existe un mot central, comme � bless� �, est le mot central bless� centre. Il peut d�tecter les � bless�s � par bloc complet mots � blessure �. Notre mod�le de tol�rance d'erreur plus �lev�e.

Tout d'abord, nous utilisons un mod�le de base de CNN, et a utilis� le niveau des mots et de la formation au niveau des mots, le niveau de parole de chaque repr�sentation de mot et le niveau mot de chaque mot repr�sente. Utilis� trois approche hybride, la premi�re consiste � relier les deux vecteurs, et le second est d'utiliser la porte importance relative du vecteur au niveau des mots et le niveau de mot de vecteur de d�termination. Le troisi�me est l'utilisation d'une grille pour chaque module, chaque mod�le repr�sente mixte, respectivement. Elle exige que nous sur chaque mot, pr�disons directement un bloc de d�clenchement de mot complet.

Nous avons fait un test sur ACE2005 et KVP2017. En comparant plusieurs niveaux bas�s sur le mot, le niveau de r�f�rence du mot, au moins nous avons d'am�liorer la valeur des points de pourcentage F 1.5, notre base est tr�s forte. En m�me temps, nos mod�les traditionnels au niveau des mots ont �t� compar�s, le mod�le se trouve dans notre avantage est tr�s �vident.

Pour r�sumer, nous vous proposons Nugget cadre de r�seaux Proposition utilis� dans la d�tection d'�v�nements chinois, il peut effectivement r�soudre le probl�me de l'inad�quation mot-d�clencheur.

Notre travail futur, non seulement peut �tre utilis� dans le probl�me de la d�tection d'�v�nements, peut �tre appliqu�e � d'autres langues, plus de t�ches, y compris NER cette question est tr�s claire.

3. Lin logiciels Hongyu CAS

Adaptive Scalingfor Sparse D�tection en extraction d'information

t�che de d�tection dans l'extraction de l'information parmi les omnipr�sentes, cette t�che de d�tection d'�v�nements comme nous venons, reconnaissance d'entit�s nomm�es, il semble que le cas est d�tect� dans l'entit� document, l'extraction de relation est la relation entre les entit�s dans la d�tection de documents situation.

Existant r�seau de neurones, habituellement les t�ches de classification des t�ches de d�tection de transition. K a des cat�gories positives, ce qui repr�sente la n�cessit� de d�tecter une cat�gories cibles et n�gatives, repr�sente la connaissance ind�pendante ou arri�re-plan. Mais nous avons constat� que l'aide d'une simple classification du mod�le utilis� dans la mission conduira � une baisse des r�sultats.

Cet article est de proposer un moyen de mesurer l'importance de l'�chantillon, une mesure de l'importance de la voie de la cat�gorie positive et n�gative cat�gorie dans l'�chantillon de formation, bas� sur le cadre de l'utilit� marginale. Dans le m�me temps propos� algorithme de mise � l'�chelle adaptative, il peut �tre utilis� directement dans le cadre de la formation de l'algorithme de r�seau de neurones pour r�soudre le probl�me de l'in�galit� de classe entre le probl�me de d�tection.

Tout d'abord, parlez-nous de cadre de l'utilit� marginale, nous avons emprunt� la notion d'effet marginal sur l'�conomie, elle repr�sente une augmentation de plus que la consommation par unit� d'un produit apporte des effets. Dans notre t�che d'apprentissage de la machine qui est notre �valuation de ses effets sur la nature. Nous pouvons l'effet marginal de la d�riv�e partielle de l'int�r�t n�gatif des �chantillons calcul�s par celle-ci pour le nombre correct d'�chantillons et la pr�diction correcte.

Nous vous proposons l'approche de mise � l'�chelle adaptative, l'importance de ce qui pr�c�de calcul�e en utilisant l'effet marginal des cat�gories positives et n�gatives cat�gories bas�es sur l'�chantillon pond�r� � l'importance du processus de formation de cat�gorie CKS et par cat�gorie n�gative. Dans chaque it�ration le gradient de laquelle une demande pour mettre � jour le mod�le est passe ensuite dans la direction du gradient apr�s pond�ration. Nous pouvons prouver que notre approche est bas�e sur une analyse empirique et les r�sultats des m�thodes pr�c�dentes sont tr�s coh�rentes. Y compris quelques exp�riences avant de le faire, notre approche a prouv� qu'ils sont li�s tr�s coh�rente.

Nos r�sultats, vous pouvez voir les premiers probl�mes d'in�galit� de classe, il est tr�s important pour la t�che de d�tection. Par rapport � d'autres syst�mes, toutes les questions abord�es pour le syst�me sont en mesure d'obtenir de meilleures performances.

Nous offrons un cadre tr�s solide pour mesurer l'importance de l'�chantillon. Par cons�quent, l'approche adaptative de mise � l'�chelle de toute la ligne de base, quelle que soit la moyenne ou la variance, notre algorithme est non seulement mieux, mais aussi plus stable.

De plus, nous faisons �galement l'analyse de la stabilit� d'une 10 exp�rience. Nous avons tir� terrain bo�te exp�rimentale 10, les r�sultats sont tr�s robustes algorithme.

Pour r�sumer notre rapport. Nous vous proposons une mesure bas�e sur l'importance de la cat�gorie de l'utilit� marginale, Adaptive mise � l'�chelle des algorithmes propos�, l'optimisation des r�seaux de neurones directement sous forme de plug-ins. Notre algorithme peut tr�s facilement port� sur les diff�rentes m�thodes.

Nous esp�rons explorer plus en profondeur sur le probl�me du d�s�quilibre des donn�es � la fin quel est le probl�me. Les donn�es La distribution est pas le plus important, nous voulons explorer est de savoir si ce probl�me est pas tout � fait l'�cart entre la fonction de perte et de mesures d'�valuation d�clench�e. En second lieu, notre m�thode peut �tre appliqu�e sur plus de t�ches et plus m�triques d'�valuation.

4. Wang Baoxin IFLYTEK

Disconnected r�currentes Neural Networks pour Cat�gorisation Text

A propos de la t�che de classification texte, les m�thodes sont maintenant couramment utilis�s sont bas�s sur la RNN de base CNN ou d'un mod�le. A propos de RNN et le mod�le CNN, il y a des caract�ristiques de chacun. Par exemple mod�le RNN pour l'ensemble de la phrase peut �tre cod�e directement, peut bien prendre des informations de d�pendance � longue distance, mais l'information RNN peut n�gliger quelques phrases cl�s. Pour le mod�le CNN est tout le contraire, le mod�le CNN peut mieux plac� pour extraire les m�mes caract�ristiques, mais plus difficile � l'information de capture sur de longues distances d�pendantes.

Dans l'exemple de classification par sujet, en baisse de deux phrases id�ographique fondamentalement les m�mes, pour d�terminer leur classement sont des phrases cl�s en gras, les myst�res math�matiques. Il est une position diff�rente en deux phrases, pour la taille de la fen�tre d'un CNN unidimensionnelle 4, peu importe o� la repr�sentation de phrase correspondant doit �tre le m�me. Pour RNN pas la m�me, la sortie de chaque cach� tout le temps et toutes les entr�es pr�c�dentes sont li�es. Lors du changement de sa position, car en face de l'entr�e a chang�, de sorte que la sortie cach�e sera une grande diff�rence, qui est class� lors de la mod�lisation derri�re le texte, pour apporter plus de pression.

Pour cette classification de sentiment des exemples suivants, RNN mieux en mesure de traiter ces d�pendances � longue distance, le traitement CNN est pas tr�s bon. Comment deux mod�les caract�ristiques RNN et CNN ensemble, donc nous avons fait Disconnected r�currentes Neural Networks, principalement le mod�le invariance de position est introduit dans le mod�le � l'int�rieur RNN. Le cycle traditionnel des r�seaux de neurones, cach�s et devant chaque instant de toutes les contributions pertinentes, nous l'avons fait ici �quivaut � une limite, de sorte que chaque fois que l'Etat est seulement les mots pertinents et K. Donc, pour tous les m�mes phrases K-mot, peu importe comment d�placer l'emplacement, o� la repr�sentation correspondante est la m�me. Telle est la position que nous sommes pr�sent�s � DRNN mod�le invariance.

D�pendance � l'�gard longue distance. mod�le DRNN peut �tre ajust�e tr�s grande fen�tre, lorsque la fen�tre est tourn� � droite quand il peut capturer une information de d�pendance plus longue distance, mais sans ajouter les param�tres correspondants. DRNN ce mod�le peut �tre consid�r� comme un mod�le sp�cial CNN. mod�le CNN g�n�ralement ouvrir une fen�tre avec une taille de fen�tre, fen�tre Si vous augmentez, vous pouvez �galement capturer des informations de d�pendance � longue distance. Mais avec la fen�tre augmente, les param�tres augmentent �galement, il est facile de surajustement. mod�les DRNN n'ont pas ce probl�me, essentiellement fen�tre a �t� augment�, mais les param�tres ne seront pas augment�s. Nous DRNN est le bon mod�le pour mod�liser la structure du classement ensemble du texte.

Nous avons effectu� des exp�riences sur plusieurs ensemble de donn�es de classification de texte � grande �chelle, les r�sultats exp�rimentaux ont montr� que, dans la base pr�c�dente, ou il y avait une nette am�lioration.

Dans la pratique, nous avons trouv� mod�le DRNN entre longue distance et la d�pendance � l'invariance de position ont un compromis. En particulier, lorsque la longueur de la fen�tre, et un mod�le DIAGONALE R�CURRENTE NEURONES RNN mod�les plus �troitement, relativement forte d�pendance � longue distance, mais invariance de position perdue. Relativement petite fen�tre de temps, et le mod�le CNN est plus proche d'une perte de la capacit� � compter sur longue distance. Donc, r�gler la fen�tre optimale est plus important, nous avons fait quelques exp�riences et avons constat� que les meilleures cat�gories de fen�tres et de t�ches DRNN mod�le sont li�s, mais la taille de l'ensemble des donn�es de formation ne sont pas pertinents. Par cons�quent, dans la fen�tre de s�lection, il peut �galement �tre consid�r� pour trouver la meilleure fen�tre sur un petit ensemble de donn�es, puis exp�rimenter.

DRNN peut bien saisir les informations en fonction de la longue distance et de l'information peut extraire des phrases cl�s tout au long de l'exp�rience est �galement tr�s bon, donc, je vous remercie!

5. Cengxiang Rong CASIA

Faits Relational par extraction d'un bout en bout Mod�le Neural avec m�canisme de copie

Nous avons l'habitude exprim� en termes du fait que la relation triple. Un triplet comprenant trois �l�ments: une relation entre la t�te et la queue des entit�s physiques. Une phrase ne peut pas comprendre le fait qu'une relation peut �galement contenir plusieurs fait relationnelle. Lorsque la relation comprenant une pluralit� de faits, il peut y avoir un cas o� une relation de chevauchement entre triples. Par donn�es d'observation, le chevauchement est divis�e en trois cat�gories. Tout d'abord, le type ordinaire, il n'y a pas de chevauchement de. D'autre part, toute l'entit� chevauche. En troisi�me lieu, une seule entit� qui se chevauchent. La plupart des travaux existants suscite des inqui�tudes dans le type ordinaire de la situation, nous voulons faire est de concevoir un mod�le, alors que pour les trois cat�gories de peines d'extraction de relation sont effectu�es.

Voici quelques-unes de nos mod�les. Notre mod�le est ajout� au codeur un mod�le de d�codeur, le m�canisme du codeur est de copier la phrase originale repr�sent�e comme un vecteur s�mantique. Reads vecteur s�mantique d�codeur de d�codage commence, lorsque le d�codage d'un triple, une premi�re relation de pr�diction, la premi�re copie des entit�s de la phrase d'origine, la fin de la derni�re copie de la phrase originale de l'entit�. Quand une copie de la seconde entit�, il y a une contrainte, un triple l�gitime, deux entit�s ne seraient pas les m�mes, donc quand une copie de la seconde entit�, il est de culbute entit� n'est pas la m�me chose. d�codage sp�cifique, quand ils ont utilis� deux strat�gies: La premi�re consiste � utiliser un d�codeur pour d�coder tous les triplets, le second est appel� multi-d�codeur, respectivement, chaque triplet un d�codeur pour d�coder.

Nos exp�riences sont les suivantes. S�lectionnez d'abord l'exp�rience de r�f�rence est ACL2017, nous avons mis ce mod�le est appel� mod�le NovelTagging, sa principale m�thode consiste � utiliser la m�thode de marquage pour extraire des phrases triplets. Certaines donn�es deux ensembles, un ensemble de donn�es est le New York Times, une faible surveillance et la collecte de donn�es, son �tiquette est automatiquement sur le sujet, les donn�es elles-m�mes est mis en pr�sence de bruit. La deuxi�me s�rie de choix est ensembles de donn�es WebNLG de donn�es, afin de renforcer la t�che de g�n�ration de langage naturel, nous le prenons � son tour utiliser la t�che d'extraction de relation, il est un ensemble de donn�es supervis�.

Ceci est le r�sultat global de nos exp�riences. Nous rapportons deux ensembles de donn�es, respectivement, des trois valeurs PRF mod�le de donn�es trouv� notre mod�le multi-d�codeur, vous pouvez obtenir la meilleure valeur F1. mod�le de d�codeur unique peut �tre mieux que certains de notre mod�le exp�rimental standard. De nouvelles exp�riences de marquage avec notre mod�le de base, il est possible d'obtenir la meilleure pr�cision dans les deux ensembles de donn�es, mais son taux de rappel est relativement faible. Multi-d�codeur et le mod�le de d�codeur d'une seule entit� � travers le chevauchement forment une seule entit� et sont superpos�s sur le mod�le exp�rimental est meilleure que la r�f�rence. R�f�rence dans le type de mod�les exp�rimentaux ne se chevauchent pas mieux que notre mod�le. Une phrase ne contient qu'un seul fait triplet, lorsque l'exp�rience de r�f�rence peut �tre obtenu de tr�s bons r�sultats. De plus en plus le nombre de la peine de triplets inclus le temps, notre mod�le est beaucoup mieux que le mod�le exp�rimental standard.

Enfin, nous avons compar� la diff�rence entre unique et le mod�le de d�codeur multi-d�codeur. On peut voir qu'un seul d�codeur et un mod�le multi-d�codeur en relation avec les performances d'extraction est � peu pr�s le m�me, mais le mod�le de d�codeur dans un environnement multi-entit� g�n�re de meilleures performances dans le seul mod�le de d�codeur.

6. Wang Shaolei Harbin Institute of Technology

Extraction conjointe des entit�s et des relations bas�es sur un sch�ma graphique Novel

Notre travail consiste � l'adresse d'une m�thode d'extraction d'entit�s et de relations commune montrant la structure de la t�che. D�finition d'une t�che donn�e mot extrait en m�me temps et la relation correspondante entre les entit�s. La m�thode traditionnelle consiste � faire comme une s�rie, la premi�re entit� identifi�e, la relation identifi�e. La m�thode est lacunes �videntes de la s�rie, cela conduira � la propagation d'erreur, et ne peuvent pas faire bon usage des liens entre les entit�s et les relations. Il existe une forte corr�lation entre les entit�s et les relations, il existe une forte corr�lation entre la relation. Il y a aussi quelques m�thodes, essayez de faire une approche commune, mod�lis�e comme une t�che commune, tout en g�n�rant des entit�s et des relations. Nous concevons des mod�les Examin�s sous deux aspects, on est ainsi bon usage de la corr�lation entre les entit�s et les relations, il existe une certaine corr�lation entre relation et contiennent la relation.

mani�re plus classique consiste � remplir une m�thode de forme, � un mot, cette table est pleine, et le processus de remplissage, il y a quelques astuces pour r�soudre les d�fis vient de dire.

Il y a une autre fa�on, ces deux sous-t�che comme une t�che � accomplir, pour atteindre l'objectif de l'�tude conjointe de la mani�re de partage des param�tres. L'inconv�nient est qu'il est que par le partage des param�tres mani�re tacite d'exprimer le contact. G�rer la t�che transform� en une t�che en concevant une partie du syst�me d'�tiquetage, la Joint Task transform� en probl�me d'�tiquetage de s�quence, cette m�thode pr�sente un inconv�nient majeur, si une entit� en m�me temps et les deux autres entit�s ont une relation, il ne peut pas appliquer . Un autre probl�me est que l'utilisation de la relation de d�pendance entre, ou implicitement exprim� en comparant le syst�me de Tag, le contact ne peut �tre explicitement construit.

Inspir� par certains de ce qui pr�c�de, nous pensons mettre ce probl�me en un probl�me de g�n�ration de graphique. Nous d�finissons un diagramme de structure, la d�finition du sch�ma, propos� en fonction de la voie de transfert � g�n�rer directement Il figure. En 2014, il a �t� sugg�r� qu'une approche bas�e sur les t�ches conjointe pour faire le transfert. Nos m�thodes et son approche sur l'approche de mod�lisation ne sont pas les m�mes. Nous voulons mod�liser et convertir directement � la m�thode d'analyse similaire pour g�n�rer directement une carte.

Nous l'avons mis dans un tableau comme le probl�me. Est bas� sur un diagramme est bas� sur un transfert. Nous avons con�u une s�rie de mesures de transfert, il y a deux types, l'un est consacr� � la relation entre l'arc g�n�r�, et l'autre est de cr�er un arc solide.

Afin d'assurer le caract�re raisonnable de la figure g�n�r�e, a ajout� certaines limites, ce qui est une s�quence de transfert. Est configuration plus sp�cifique, une s�rie d'op�rations, il est possible de g�n�rer une bonne vue peut regarder ce processus de changement.

Il y a une combinaison de fonction, la corr�lation entre la relation de mod�lisation est le raisonnement, changer une nouvelle r�cursif, la m�thode de r�seau de neurones.

Vue d'ensemble se trouvent dans le num�ro public chinois concern� de notre laboratoire:

https://mp.weixin.qq.com/s/6viSk0Ts_7eTfYrWYi_HDQ

7. Li Zhongyang Harbin Institute of Technology

La construction narrative de l'�v�nement �volutionnaire graphique pour le script de pr�vision de l'�v�nement

Notre travail consiste � la construction d'une des cartes affair narratives pour aider � pr�dire les �v�nements de t�che de script. Tout d'abord, parlez-nous de ce qui est des �v�nements script�s pr�dit. Nous avons une cha�ne d'�v�nements, triple ou quadruple chaque �v�nement est une structure, nous donne apr�s un contexte d'�v�nements, de pr�dire ce que oui le dernier �v�nement. La cha�ne d'�v�nements tir�s sont bas�s sur des travaux ant�rieurs, par exemple, pour donner un paragraphe, la premi�re r�solution d'anaphores chose, obtenir entit� de noms. D'apr�s le texte de l'ordre avec une entit� apparent�e au verbe extrait, d�cim� dans l'ordre d�crit dans le texte, vous obtenez une cha�ne d'�v�nements.

La m�thode pr�c�dente sur la t�che de pr�diction des �v�nements script�s peut �tre divis� en deux cat�gories, l'une est la m�thode bas�e sur des �v�nements, tels que ceux bas�s sur l'information mutuelle, bigramme et la m�thode bas�e sur les �v�nements du r�seau de neurones, l'autre est la cha�ne d'approche bas�e sur les �v�nements tels que bilin�aire, mod�le de langage de LSTM et d'autres m�thodes, telles m�thodes prenant en compte la s�quence d'informations d'�v�nements. Ces pr�d�cesseurs m�thodes, en raison de la raret� des �v�nements est plus grave, entra�ner une certaine d�viation dans les pr�visions, pas en mesure de tirer pleinement parti des riches connexions denses d'information entre les �v�nements. Peut obtenir beaucoup de la cha�ne d'�v�nements par extraction de texte sur une grande �chelle, la plupart des candidats ne sont pas derri�re l'�tiquette, seul le contexte, de sorte que ce document construit l'affaire narrative bas�e sur des cartes � grande �chelle ne pas la cha�ne d'�tiquettes d'�v�nements t�che sc�naris�e de pr�diction des �v�nements id�es.

Notre approche est divis�e en deux �tapes, la premi�re �tape consiste � construire un atlas Affair narratives, la deuxi�me �tape est l'apprentissage repr�sentation du r�seau et l'inf�rence sur la carte. Plus pr�cis�ment, la premi�re �tape dans la cha�ne d'extraction d'�v�nements, personnes en face de la m�thode est la m�me, l'utilisation d'une repr�sentation raisonnable de l'�v�nement. Si l'utilisation directe de tripl�s ou quadrupl�s serait trop clairsem�e, ce chiffre serait infini. Nous avons adopt� une repr�sentation plus abstraite de la relation entre les entit�s associ�es � la d�pendance s�mantique verbale avec un infinitif. Il est plus abstraite, la g�n�ralisation est beaucoup d'�v�nements sp�cifiques, l'�chelle de la carte sera r�duite en cons�quence. Enfin, on peut calculer la transition de probabilit� entre les �v�nements par formule simple. Pr�d�cesseurs fait beaucoup de m�thode d'apprentissage du r�seau, ladite �chelle de carte parce que nous construisons tr�s grandes, les m�thodes pr�c�dentes ne peuvent �tre naturellement appliqu�s � notre t�che. Nous vous proposons une m�thode de repr�sentation du r�seau d'apprentissage supervis�, appel� Scaled Graph Neural Network (SGNN), afin de r�soudre les probl�mes de l'affaire � grande �chelle carte d�duisent.

exp�riences � l'�chelle des donn�es en utilisant le papier est relativement grande, on extrait du corpus New York Times d'un million d'articles en anglais qui donnent la cha�ne d'�v�nements d'environ 6 millions. affaire narrative Atlas constitu� d'environ 100000 noeuds dernier �v�nement, ainsi que plus de 600 millions bord dirig�. Il y a des balises ensemble de formation 140.000, le d�veloppement et les tests sont 10000. Comparaison des m�thodes devant des gens, notre mod�le bient�t atteindre un taux �lev� et stable de pr�cision, et a obtenu les meilleurs r�sultats.

8. canal CAS navire Ding oc�an, travailleur

L'am�lioration des connaissances plongement du graphe Utilisation de contraintes simples

La connaissance est une carte � grande �chelle des faits ensemble de triplets, chaque triple contient la t�te et la queue entit� entit� de relation. Apprend l'id�e de base est d'apprendre � quantifier la relation entre l'entit� et dit que d'une part de simplifier le fonctionnement de la carte, tout en permettant de maintenir sch�ma de structure interne, offre la possibilit� de raisonnement pr�cise la cartographie � grande �chelle des connaissances. Une partie du mod�le de base au d�but, m�me si son efficacit� est relativement �lev�, mais la pr�cision de l'inf�rence est tr�s limit�e. Dans certains des derniers travaux, il existe deux m�thodes principales pour am�liorer encore les performances de l'apprentissage de raisonnement de repr�sentation. La premi�re m�thode est le mod�le de base, l'utilisation des donn�es externes, telles que du texte ou des r�gles logiques. La deuxi�me m�thode consiste � concevoir un mod�le plus complexe qui contient le mod�le en utilisant des r�seaux de neurones de profondeur. Cependant, la premi�re m�thode repose sur des donn�es sp�cifiques, manque de polyvalence. La deuxi�me m�thode permettra de r�duire le calcul de l'efficacit�.

Notre id�e principale est d'ajouter quelques contraintes simples sur la cartographie vectorielle des connaissances, � la fois pour maintenir un rendement relativement �lev�, tout raisonnement am�liorer les performances.

Nous vous proposons deux contraintes, le premier est pour l'entit� d'ajouter une contrainte non-n�gatives, il est que nous avons besoin d'une non-entit� dans un espace vectoriel dans le n�gatif. Pour la contrainte non-n�gativit�, une compr�hension intuitive de tous les encodages s�mantique n�gative n'est pas n�cessaire. Nous consid�rons que la deuxi�me contrainte est le vecteur de relation contient environ contraintes, parce que l'implication est pas n�cessairement dans tous les cas est strictement uniforme, donc ici, nous aurons un degr� de confiance.

Nous utilisons le mod�le de base CompIEx, les entit�s et les relations repr�sent�es comme vecteur complexe, comprenant une partie r�elle et une partie imaginaire. Chaque dimension des parties r�elles et imaginaires de la contrainte de non-n�gativit� exige que chaque entit� est sup�rieur � 0 et inf�rieur � 1. Il contient la contrainte approximative comporte deux parties, la premi�re partie est n�cessaire pour r�pondre � la partie r�elle et imaginaire contient la relation mod�le de l'ordre. La deuxi�me partie est introduite dans les variables d'�cart � la variable d'approximation du mod�le.

Vous avez d�j� une repr�sentation dans l'entit� et les entit�s et les relations pour apr�s des vecteurs de contrainte, puis d�finir la fonction d'optimisation, nous pouvons enfin r�soudre sous les contraintes du vecteur. Enfin, nous faisons une analyse de la complexit� de la complexit� de la contrainte non-n�gativit� d�pend du nombre d'entit�s dans un lot, il contient environ la complexit� d�pend du nombre de contraintes inh�rentes, ce qui est beaucoup plus petit qu'un lot de tuples nombre, et est donc contraint la complexit� du mod�le et le mod�le original du m�me ordre, est un algorithme tr�s efficace.

La premi�re exp�rience que nous faisons est la pr�diction de lien, WN18, ensembles de donn�es � grande �chelle FB15K sur la t�che fr�quemment utilis�e, il y a un DB100K est bas� sur un vaste ensemble de donn�es construit sur DBPedia. Il existe trois m�thodes principales de comparaison, sont une repr�sentation plus classique d'une partie du mod�le de base de l'apprentissage, les derniers r�sultats utilisent mieux des r�gles logiques de certains des mod�les plus complexes et certains mod�les r�cemment publi�s, qui contient �galement un r�seau de neurones en fonction de la profondeur mod�le. Notre m�thode avec des contraintes sur les trois ensembles de donn�es principaux indicateurs sont mieux que la m�thode comparative.

L� encore, j'ai appris cette m�thode d'int�gration de l'analyse interpr�tabilit�. La premi�re partie est le vecteur d'entit� d'analyse visuelle, le vecteur peut �tre pour l'entit� explicative, l'entit� qui est de dire que nous esp�rons chaque vecteur de dimension sont capables de coder la s�mantique sp�cifique. Le deuxi�me vecteur d'entit� d'analyse visuelle est la puret� s�mantique. Nous esp�rons que plus la valeur d'une des entit�s de dimension appartiennent � la m�me cat�gorie que possible. Nous mesurons l'entropie puret� s�mantique. Pour l'analyse visuelle, nous consid�rons la relation entre le vecteur contient trois types, �quivalents, inverse, contient en g�n�ral, ces trois types de relations n�cessite l'int�gration contient les parties r�elles et imaginaires d'un certain ordre de se rencontrer. Vecteur avec leurs cartes de chaleur pour le visualiser, nous pouvons voir notre vecteur de relation ne r�unissez pas ces conditions.

Route de la soie

Apprenez � conna�tre la Chine

Cartes d'extraction de l'information et de la connaissance session | AIS pr�-s�cher toute la part parlera