R�sum� | Universit� Tsinghua, Han Xu: mod�le d'extraction de la relation nerf

AI Technology Review par: extraction de relations est une t�che importante de traitement du langage naturel, la connaissance est l'un des moyens de base de l'exploitation mini�re du texte. �tude de recherche en profondeur en relation avec extraction au cours des derni�res ann�es a fait l'inqui�tude g�n�ralis�e, qui repose sur une longue distance de surveillance, le mod�le de r�seau de neurones avec le m�canisme de l'attention que la principale solution au probl�me. Dans cette classe ouverte, les haut-parleurs trieront le contexte de neurones de d�veloppement du mod�le en relation avec l'extraction et les derniers progr�s dans les domaines li�s � l'action.

Partager Pr�sident:

Han Xu, Tsinghua University D�partement du directeur de th�se Informatique Liu Zhiyuan professeur agr�g�, les principales directions de recherche pour le traitement du langage naturel, l'acquisition de connaissances et ainsi de suite. Les travaux de recherche ont �t� publi�s dans AAAI, COLING, EMNLP et ainsi de suite.

Ouvrez l'adresse de lecture de classe:

Partager Sujet: Mod�le d'extraction de la relation nerf

grandes lignes de l'action:

Contexte du d�veloppement �tude approfondie sur l'extraction de relation.
Sur la base de la relation entre les m�canismes neuronaux de mod�le d'analyse d'extraction d'attention.
Introduire les derniers progr�s dans des domaines connexes.

Lei Feng r�seau AI Yanxishe au contenu des actions se r�sument comme suit:

Aujourd'hui, la principale extraction de relations haut-parleur d�veloppement r�cent dans le domaine du mod�le neuronal, tout d'abord nous donner quelques connaissances de base de la science.

t�che d'extraction de relations appartient au sous-domaine de l'extraction de l'information, la fonction principale est de permettre � la machine retir�e de l'entit� donn�e de phrase, et de clarifier la relation correspondante, principalement utilis� pour �largir la carte des connaissances, le texte libre non structur� dans des donn�es structur�es.

Parmi le r�le traditionnel, nous classerons comme un filtre d'extraction de relation, aux relations d�finies arbitrairement, entit� bonne �tiquetage puis entrez le texte, le texte est d�termin� quel type de d�finitions de relations. Dans une certaine mesure, on peut dire que c'est un probl�me de classification supervis�e.

En 2013, le mod�le de r�seau de neurones est appliqu� pour extraire le champ de la relation, qui est, la phrase comme une caract�ristique dans le r�seau de neurones, a appris � faire les fonctions de classification par le r�seau de neurones.

Un probl�me avec ces mod�les qui n�cessitent de grandes quantit�s de donn�es et la main-d'uvre de haute qualit�, des co�ts plus �lev�s, et les difficult�s sont donc confront�s � la promotion.

Pour r�soudre ce probl�me, le concept de surveillance � distance est n�e, il introduit une hypoth�se: S'il y a deux entit�s dans les relations ext�rieures de la carte du savoir, l'entit� qui contient la phrase est la correspondance entre la carte. Cette m�thode heuristique, la machine peut �tiqueter automatiquement un grand nombre de donn�es, puis utilis�es pour former classificateurs faire l'extraction de relation.

Les avantages de la surveillance � distance est que cependant, aucune op�ration manuelle, et peuvent des donn�es Pervasive � grande �chelle, sont confront�s au probl�me du bruit.

Comment r�soudre le probl�me du bruit?

La premi�re m�thode consiste � introduire l'apprentissage des multiples exemple, toutes les phrases contenant la m�me entit� dans un ensemble (sac), le sac d'extraction de caract�ristiques de la phrase si n�cessaire, puis pr�dire les relations entre les entit�s.

Un travail 2015 de la surveillance � distance et multi-instance d'apprentissage ensemble, depuis lors, le mod�le d'extraction de relation domaines cl�s essentiellement par la surveillance � distance + + multi-instance d'apprentissage des r�seaux de neurones.

Attention, Mod�le de m�canisme

Ce travail est dans notre laboratoire pour personnes �g�es men�e en 2016, principalement pour des probl�mes de bruit qui existent dans l'apprentissage multi-instance en introduisant l'attention des m�canismes des peines de paquet (sac) dans un poids donn� am�liorer efficacement la pr�vision.

En savoir plus sur le principe de fonctionnement du mod�le de m�canisme d'attention, s'il vous pla�t regarder en arri�re la vid�o 00:16:53, http: //www.mooc.ai/open/course/548 = Leiphone]

A partir des r�sultats exp�rimentaux point de vue, ajoutant m�canisme d'attention peut en effet am�liorer efficacement l'effet du mod�le. (Ligne noire afin d'augmenter le mod�le de m�canisme d'attention)

A partir de 2016, le mod�le de relation pour extraire les principaux domaines de la supervision de la t�l�commande d'origine + + apprentissage multi-instance de base de neurones mod�le de r�seau, puis ajouter un m�canisme d'attention.

Mod�le d'extension

Tout d'abord, l'entit� d'information est introduite pour construire des m�canismes d�crits attentionnels

Ce travail sera d�crit texte entit� vecteurs terme phrase correspondant obtenu apr�s traitement de deux fonctions, deux caract�ristiques puis soustraites pour obtenir une relation potentielle, et enfin le vecteur potentiel en tant que relation m�canismes d'attention.

En second lieu, la mise en place d'un m�canisme de note douce

Afin de r�soudre le probl�me de mislabeled, qui a mis en place une relation de travail � chaque niveau de confiance, le processus de formation une fois relation pr�visible avec l'�tiquetage d'origine est incompatible, et le niveau de confiance est plus �lev� que l'on trouve d'origine, il sera par d�faut � la pr�sence de l'�tiquette d'origine probl�mes et pr�voir des relations avec de nouvelles alternatives.

En troisi�me lieu, l'introduction de la formation de combat

En d�lib�r�ment de faire du bruit � la peine, pratiquement am�lior� le mod�le d'immunit� au bruit.

Quatri�mement, la relation entre la pluralit� d'entit�s extraites

extraction de relations r�alis�e pour une grande partie de texte en plusieurs entit�s. Ceci est l'industrie d'une �ventuelle mise au point de la recherche future, parce que nous sommes des �tres humains et des m�canismes cognitifs de tous les jours plus �troits.

Cinqui�mement, l'int�gration du mod�le de repr�sentation des connaissances

Le mod�le du spectre et mod�le relationnel sur un morceau d'extraction de connaissances faire une formation commune, et en tant que l'attention du m�canisme de la r�duction du bruit. Dans ce processus, le texte peut aussi aider � am�liorer et � la carte de correction.

Sixi�me, l'int�gration de l'information et de la structure des connaissances carte

En introduisant la relation hi�rarchique (relation primaire et secondaire) connaissance de mappage, pour construire un m�canisme attention caract�ris� de gros grains � grains fins.

Sept, pour extraire les relations inter-langue

L'id�e de base de ce travail est d'utiliser le m�canisme d'attention entre les diff�rentes langues, le texte � l'autre pour faire des compromis dans la langue informatique. Les avantages de l'extraction de la relation inter-linguistique qui peuvent utiliser efficacement les compl�mentarit�s entre les langues, telles que les relations chinoises dans les donn�es moins caract�ristiques, les donn�es peuvent �tre utilis�es pour compl�ter les Anglais.

Huit extraction de relations inter-linguistique (version mise � jour)

En mettant en place un espace s�mantique interlangage s�par� et espace unifi�, et l'introduction de la formation de combat, l'optimisation de l'effet cross-extraction finale des relations linguistiques.

Neuf, sc�nario de recherche est bas� sur l'apprentissage quelques-shot

Afin de r�soudre les probl�mes de surveillance � distance et les donn�es � longue queue, qui travaillent en construisant un petit ensemble de donn�es d'�chantillons �tiquet�s manuellement, de sorte que la machine peut apprendre le raisonnement par un �chantillon de moins. Mais le travail est actuellement utilis� dans plus de domaines de l'image, le champ du langage naturel ont plus d'espace pour le d�veloppement.

Enfin, je recommande des ressources pertinentes.

Les trois premiers sont quelques-uns du mod�le de notre groupe a termin� sa th�se pour obtenir les deux derniers est le nombre de travaux au coup par coup de code source ouvert.

Je partage l'arr�t d'aujourd'hui ici, je vous remercie!

Ce sont les clients actuels partagent tous. Plus ouvert go vid�o de classe � Lei Feng r�seau AI Yanxishe communautaire (https://club.leiphone.com/) � regarder. Mise au point sur le num�ro public micro-canal: AI Yanxishe (okweiwu), vous pouvez obtenir le dernier avis de temps en classe ouverte en direct.

Route de la soie

Apprenez � conna�tre la Chine

R�sum� | Universit� Tsinghua, Han Xu: mod�le d'extraction de la relation nerf