frontière connaissance de la cartographie à suivre et voir cela suffit, Philip S. Yu équipe d'examen faisant autorité publié six questions en suspens à traiter

Lei produits de technologie de réseau Feng sur la presse AI: La fin de 2019, lauréat du prix Turing Bengio a souligné, nous sommes dans une période de 1 à un système d'intelligence cognitive de l'apprentissage en profondeur en tant que représentant de la transition de la perception de la profondeur du système d'apprentissage intelligente représenté 2.

Dans ce processus, la technologie de cartographie des connaissances joue un rôle clé. Ces dernières années, diagramme en plein essor du réseau a également confirmé cette tendance.

Cet article est une donnée scientifique faisant autorité Philip S. équipe Yu pour examiner les dernières connaissances dans le domaine de la carte expose l'histoire du développement dans ce domaine de la base théorique, application pratique, la direction de la recherche future et d'autres aspects d'une image globale et ambitieuse.

L'introduction de la connaissance humaine est une direction de recherche importante de l'intelligence artificielle. La représentation des connaissances et de raisonnement inspiré par l'approche de la résolution des problèmes humains, destinés à caractériser les systèmes intelligents de connaissances pour obtenir la capacité de résoudre des problèmes complexes. Récemment, comme une carte de connaissance structurée des connaissances humaines, et a été une grande préoccupation des milieux universitaires et les gens de l'industrie.

La cartographie des connaissances est une caractérisation structurale des faits, qui se compose d'entités, les relations, et la sémantique composition décrite. Entité peut être présent dans les objets du monde réel, peuvent être des concepts abstraits, les relations d'association entre ces entités, la description sémantique des entités et leurs relations comprenant les types et les attributs bien définis. Aujourd'hui, la propriété a été diagramme largement utilisé, où les nuds et les relations ont des propriétés.

Le terme « carte des connaissances » et « base de connaissances » est presque synonyme, seule une très faible différence. Lorsque l'on considère le point de vue de la structure de la carte des connaissances, il peut être considéré comme un graphique. Quand il s'agit d'un problème de sémantique formelle, il peut être interprété comme un dépôt des faits et le raisonnement. connaissances et connaissances spécifiques sous la forme d'une carte représentée sur la figure.

La connaissance peut être représenté par les triplets Framework (RDF) Description des ressources sous la forme du fait, comme (entités de tête, les relations, l'entité finale) ou (sujet, prédicat, objet), par exemple (Einstein, ... les lauréats, le prix Nobel). La connaissance peut également être caractérisé comme un graphe orienté, les noeuds représentent des entités qui représentent des relations bords.

Par souci de simplicité et de se conformer à la communauté de recherche sur les tendances de développement, nous sommes utilisés de façon interchangeable ici et carte des connaissances de base de la connaissance de ces deux termes.

Figure 1: base de connaissances schématique et carte connaissances

Ces dernières années, la carte des connaissances fondées sur la recherche principale préoccupation est que en cartographiant les à vecteur de faible dimension, les entités et les relations d'obtenir leurs informations sémantiques afin de parvenir à l'apprentissage de la représentation des connaissances (KRL) ou la connaissance de la cartographie intégrée (KGE). Les tâches spécifiques comprennent l'achèvement de l'acquisition de connaissances sur la carte des connaissances (KGC), la classification des triplets, la reconnaissance de l'entité, et l'extraction de relation.

Merci à modèle basé sur la connaissance des informations hétérogènes, la richesse intégrée de la représentation des connaissances et de l'ontologie sémantique et la connaissance des langues. Ainsi, alors que la compréhension du bon sens et le raisonnement des compétences pour progresser, de nombreuses applications telles que des systèmes réels et recommander répondeur, aussi vers la prospérité. Satori Microsoft et Google Knowledge Graph et d'autres produits dans le monde réel, a démontré de fournir des services plus efficaces de puissantes fonctionnalités.

Tout d'abord, un bref historique des connaissances

Dans le domaine de la logique et l'intelligence artificielle, représentation des connaissances a connu une longue histoire de développement. La représentation des connaissances par idée de dessin peut être tracé Richens arrière proposé en 1956. « Web sémantique » (sémantique Net), et la connaissance de la logique symbolique remonte au solveur de problème général 1959.

Dans un premier temps, la base de connaissances est utilisée pour le système de raisonnement fondé sur la connaissance de la résolution de problèmes. MYCIN est utilisé pour le diagnostic médical, l'un des plus fameux système expert fondé sur des règles, il a une base de connaissances qui contient environ 600 règles.

Après cela, la caractérisation des connaissances humaines dans le cadre de la langue communautaire, la caractérisation et la caractérisation des aspects mixtes de la règle basée ont fait des progrès dans la recherche. Vers la fin de cette période, le programme Cyc conçu pour intégrer la connaissance humaine, a commencé.

Resource Description Framework (RDF) et Web Ontology Language (OWL) ont été libérés, il est devenu un critère important pour le Web sémantique. Ensuite, il a également publié, comme WordNet, DBpedia, tels YAGO ouvert et base de connaissances Freebase ou corps.

Stokman Vries et a proposé l'idée d'organiser des connaissances sous forme de graphiques dans le sens moderne en 1988. Cependant, le concept est devenu carte des connaissances populaires attendre jusqu'en 2012, Google introduit sa connaissance de la cartographie dans le moteur de recherche, cette fois ils ont proposé cadre pour l'intégration des connaissances connue sous le nom « Vault Knowledge » afin de construire une connaissance de la cartographie à grande échelle. La connaissance du diagramme de l'histoire, s'il vous plaît voir cet article à l'annexe A.

Deuxièmement, les définitions et les symboles pertinents

Les chercheurs beaucoup de travail, carte de connaissance donnée est définie par la description d'une caractérisation sémantique commune ou caractéristiques essentielles. Cependant, la carte du savoir est toujours pas largement acceptée définition officielle. Paulheim définit quatre mapping standard de la connaissance. Ehrlinger et Wo Ss analyser certaines définitions existantes et la définition proposée de 1 ci-dessous, qui met l'accent sur la carte du savoir moteur d'inférence. Wang et al 2 proposé dans la définition d'un multi-définir le schéma de relation.

Inspiré par ces travaux antérieurs, nous avons une carte de connaissances est défini comme G = {E, R, F}, E, R, F sont une collection d'entités, les relations et les faits. Fait peut être représenté par un triplet (h, r, t) F.

1 défini (Ehrlinger et Wo Ss): Les cartes de connaissances peuvent obtenir de l'information et l'intégrer dans un corps en utilisant une inférence est de générer de nouvelles connaissances.

La définition 2 (Wang et al.): La cartographie des connaissances est un multi-graphe composé d'entités et les relations, l'entité est considérée comme un noeud et la relation est considérée comme une variété de différents types d'arêtes.

Tableau 1: Symboles et définitions relatives aux cartes de connaissances

En troisième lieu, la classification des études de cartographie des connaissances

1, l'apprentissage de représentation de connaissances (KRL)

l'apprentissage de la représentation des connaissances sont les questions clés de recherche dans le domaine de la cartographie des connaissances, des tâches, et il obtient pour base de connaissances de nombreuses applications en aval. Nous KRL est divisé en quatre niveaux: Caractérisation de l'espace, la fonction de pointage, et le modèle de codage de l'information auxiliaire. Cet article donne également un modèle de KRL de workflow de développement clair. Les détails sont les suivants:

1) Caractérisation de l'espace

Figure 3: une représentation différente des connaissances dans une vue schématique d'un espace

Répartition de faible dimension des entités d'apprentissage intégrés et des relations est la question clé de l'apprentissage de caractériser. travail existant principalement en utilisant le point à valeurs réelles dans le vecteur de l'espace, la matrice, l'espace de tenseurs (Fig. 3a), mais aussi l'utilisation d'un vecteur spatial complexe (Fig. 3b), l'espace gaussien (Fig. 3c montré) et d'autres types (représenté sur la figure 3d.), l'espace, etc. collecteur.

2) fonction de score

Figure 4: schéma et fonction de score basé sur la distance sur la base de la correspondance de la similitude, et l'exemple DistMult Transe respectivement.

fonction de notation est utilisée pour mesurer le caractère raisonnable des faits, il est également connu en fonction de l'énergie dans le cadre de l'apprentissage basé sur l'énergie. L'étude visait à l'apprentissage basé sur l'apport d'énergie est x, paramètre de la fonction d'énergie E_ (x), qui assurera les échantillons positifs ont un score plus élevé que les échantillons négatifs. Dans cet article, nous avons unifié appelions « fonction notation. »

Une mesure typique pour le fait que la fonction de notation de rationalité en deux catégories: fonction de score basé sur la distance (fig. 4a) et sur la base de la fonction de score de similarité (4b Figure). fonction de notation en fonction de la distance mesurée par les faits à distance raisonnable entre les entités informatiques, h + r t réaliser cette transformation additionneur idée est largement utilisé par les relations entre les entités. Fonction de notation basée sur la mesure de similarité sémantique par un des faits correspondants sémantiques raisonnables, il est généralement

 Une telle formule de multiplication similaire à la transformation pour donner la queue dans l'espace de tête dans la caractérisation des entités physiques.

3) modèle de codage

Codage spécifique modèle par modèle d'architecture (modèle linéaire / bilinéaire, modèle factorisation, réseau de neurones) l'interaction entre les entités de code et les relations.

Modèle linéaire projeté par la fermeture de la tête à la fin de l'entité physique spatiale caractérisé, la relation est exprimée sous forme linéaire / carte bilinéaire. les données relationnelles affacturage destinées à la décomposition de la matrice de faible grade, caractérisée en effectuant ainsi l'apprentissage. Les réseaux de neurones sont des neurones activation non linéaire par cartographie structure plus complexe du réseau et des données relationnelles sont codées. Certains modèles de réseau neuronal commun représenté sur la Fig.

Figure 5: une vue schématique du modèle de codage neural. (A) un perceptron multicouche, et (b) d'entrée de réseau neuronal convolutif à la couche triple entièrement connecté, et exécute une opération de convolution, et d'apprendre à caractériser la sémantique. (C) une connaissance de mappage de réseau figure codeur convolutif pour générer un enrobage des entités et des relations. (D) RSN différemment à « entité - relation série » et les relations de saut sont codées.

4) des informations auxiliaires

Afin de promouvoir la représentation des connaissances plus efficace, comme la description du texte multimodal intégré, le type de contrainte, la relation entre l'information visuelle et des informations externes et des cartes routières de la connaissance fusionnée se ensemble.

Dans la communauté de la recherche sur la carte des connaissances, l'apprentissage de la représentation des connaissances est très importante. En général, nous voulons développer un nouveau besoin d'apprentissage modèle de représentation des connaissances pour répondre aux quatre questions suivantes: (1) choisir quel type d'espace de caractérisation; (2) comment mesurer l'espace spécifique rationnelle triade; (3) quel genre modèle d'interaction de la relation de codage, (4) si oui ou non l'utilisation de l'information auxiliaire.

La caractérisation la plus commune de l'espace euclidien est un point dans l'espace, il sera intégré dans les entités spatiales de vecteur, et l'interaction est modélisé par un vecteur, une matrice ou tenseur. Il a également été étudiée pour plus d'espace de caractérisation (y compris le groupe spatial collecteur de distribution gaussienne complexe espace vectoriel).

Point par rapport à l'espace euclidien, les avantages multiples de l'espace qui peut être monté sur le point de mou; insert gaussienne peut exprimer l'incertitude entre les entités et les relations et les multiples relations sémantiques; enrobage espace vectoriel complexe peut être efficacement différent modèle de relation de connexion de modélisation, en particulier, le mode symétrique / antisymétrique.

Lorsque des entités codées des informations sémantiques et l'accès aux rapports de propriété, qui caractérise l'espace joue un rôle très important. Lorsque nous avons mis au point une étude de caractérisation du modèle, choisir une caractérisation appropriée de l'espace, où l'espace est conçu pour caractériser les propriétés correspondent à l'encodage et capable d'exprimer l'équilibre entre la capacité et la complexité.

fonction de score sur la base métrique utilise le principe de conversion de la distance appropriée, seront employés les opérations de niveau composant correspondant sur la base sémantique fonction de score. modèle de codage (en particulier les réseaux de neurones) pour la modélisation de processus des interactions des entités et des relations jouent un rôle clé. modèle bilinéaire a également été une préoccupation de nombreux chercheurs, une partie de la technique de décomposition du tenseur associé à cela. D'autres procédés d'introduction de l'information auxiliaire est une description textuelle, relation / types d'entités, et des images pleines.

Tableau 2: Résumé des travaux récents d'apprentissage de la représentation des connaissances. S'il vous plaît se référer à l'Annexe C

2, l'acquisition de connaissances

objectifs d'acquisition de connaissances à construire carte des connaissances basées sur des textes non structurés, complètent une carte de connaissances existantes, trouver et identifier les entités et les relations. Une bonne connaissance de la création de cartes à grande échelle pour de nombreuses applications en aval sont très utiles, on peut donner la capacité de raisonnement basé sur un modèle de connaissance de bon sens, et ainsi jeter les bases de la réalisation de l'intelligence artificielle.

La tâche principale de l'acquisition de connaissances comprend l'extraction de relation, la connaissance de la cartographie complément, et d'autres entités pour les tâches d'acquisition, telles que l'identification de l'entité et l'entité alignée. La plupart des méthodes seules définition formelle des connaissances pour compléter la cartographie et l'extraction de relation. Cependant, ces deux tâches peuvent également être intégrées dans un cadre unifié.

Han et al mécanisme d'attention basée sur le cadre d'apprentissage mutuel a proposé une attention conjointe, mutuelle ce mécanisme est utilisé pour cartographier les données entre les connaissances et l'intégration de texte, le cadre tout en répondant à la carte des connaissances d'achèvement selon l'extraction de texte et les relations question. De plus, il y a des tâches et compléter les connaissances liées (par exemple, triple classification et la classification des relations). Dans cette section, nous allons passer en revue la liste complète des connaissances, la découverte et la relation entité extraction en trois étapes techniques d'acquisition des connaissances.

1) la réalisation de cartographie de connaissances (KGC)

Étant donné que la plupart des cartes ont aucune connaissance de l'intégrité, les gens développent les connaissances nécessaires pour compléter la nouvelle technologie va tripler d'ajouter un nouveau graphe de connaissances. Les tâches typiques incluent des liens vers les prévisions des enfants, des entités de prédiction et des relations à prévoir. Ci-dessous, nous donnons la définition de la tâche face à 3.

Définition 3: Étant donné un graphe de connaissance incomplète G = (E, R, F), destiné à compléter la cartographie des connaissances pour en déduire triplet manquant T = {(h, r, t) | (h, r, t) F}

La connaissance du spectre complet des premières recherches ont porté sur l'apprentissage à prédire triple intégration de faible dimension. Dans cet article, nous appellerons « approche fondée intégrée. »

Cependant, la plupart de ces méthodes ne peuvent pas obtenir des relations à plusieurs niveaux. Par conséquent, les travaux récents en faveur d'explorer la relation entre le chemin et l'introduction de la relation multi-niveau logique, nous avons été appelé « chemin de la relation de raisonnement » et « raisonnement fondé sur des règles. » carte triple connaissance de classification achèvement d'une tâche secondaire, qui est utilisé pour évaluer l'exactitude des triplets des faits.

2) l'entité découvertes

Entité peut obtenir la connaissance de l'entité axée sur le texte, et l'intégration des connaissances entre les différentes carte des connaissances. Selon les circonstances, une des tâches de découverte d'une entité peut être divisée en plusieurs catégories différentes.

Nous dans une séquence à la séquence (Seq2Seq) d'étudier les moyens tâches de reconnaissance de l'entité, l'entité de la tâche de classification est axée sur le type d'étiquette et le classement bruyant échantillon zéro, entité apprentissage des désambiguïsation et insert d'alignement uniforme, qui propose modèle d'alignement itératif pour résoudre le problème d'un nombre limité d'entités graines alignées. Mais si la nouvelle entité aligné mauvaise performance, il sera face au problème de l'accumulation d'erreurs.

Ces dernières années, de plus en plus de connaissances pour une langue particulière, il va inévitablement stimuler la recherche de la connaissance inter-langues alignées.

Figure 8: une vue schématique d'une tâche de découverte des entités

3) l'extraction de relation

Relation L'extraction est construit automatiquement à grande échelle carte des connaissances critiques, la tâche extraite des faits inconnus Pusu Wen de cette relation, et les ajouter à la connaissance graphique.

L'absence de données relationnelles avec la balise, la surveillance à distance de la technique (Supervision loin) (également connu comme un contrôle ou une surveillance faible de) correspondent heuristique, il est supposé sous la supervision d'une base de données relationnelle, comprenant la même phrase peut exprimer la même relation d'entité pour créer les données de formation.

Mintz, qui supervisera une classification des tâches de relation à distance, ils utilisent des fonctionnalités de texte incluent des fonctionnalités lexicales et syntaxiques, les balises d'entités nommées, ainsi que des fonctionnalités conjonctions. La méthode traditionnelle dépend fortement des caractéristiques du projet, alors que l'approche plus récente est d'explorer le lien intrinsèque entre les caractéristiques. Profondeur des réseaux de neurones changent la caractérisation des cartes de l'apprentissage des connaissances et des textes. Des études d'extraction sur la relation entre le nerf (NRE) méthode des progrès récents comme indiqué sur la figure.

Figure 9: vue d'ensemble d'extraction de relation Neural

tâche d'extraction de relations rencontrera le mode avec le bruit dans la prise en charge de la surveillance à distance, en particulier pour la surveillance à distance entre les différentes zones. Par conséquent, pour l'extraction de faible relation de contrôle est de réduire l'influence du bruit avec l'étiquette est très important (par exemple, par une Peines multiples multi-instance d'apprendre à emballer en entrée, en utilisant le mécanisme d'attention et de « soft » sur la sélection échantillon réduisant de ce fait le mode de bande de bruit, sur la base de la méthode d'apprentissage par renforcement est représenté par l'échantillon sélectionné des décisions dures. une autre est que, dans la mesure du possible d'apprendre une caractérisation plus poussée. Etant donné que la profondeur du réseau de neurones peut résoudre le problème classique de la propagation d'erreurs procédé d'extraction de caractéristique, le domaine a été dominé par la profondeur du modèle sur la base de réseau de neurones.

Tableau 4: récente extraction de relations de recherche et développement regard nerveux

3, le moment de la carte des connaissances

La plupart des études de cartographie des connaissances existantes craignent que la connaissance de la cartographie statique, ce qui fait ne changera pas au fil du temps, mais l'étude de la dynamique des changements dans les schémas de synchronisation de la connaissance est moins. Cependant, en raison de la connaissance structurée que mis en place dans une période de temps spécifique, de sorte que les informations de synchronisation est très important, et le fait que l'évolution suivra une séquence temporelle.

Des études récentes ont commencé à caractériser les informations de synchronisation en connaissance et cartographie des connaissances achèvement de la tâche d'apprentissage. Afin de générer par rapport à la précédente connaissance de cartographie statique, que nous appellerons « carte des connaissances du moment. » Pour l'apprentissage tout en intégrant le Embed calendrier et les relations, les gens ont fait beaucoup de travaux de recherche.

1) des informations de synchronisation incorporée

Embarqué avec de minutage, nous considérons les informations de synchronisation par le quad triple expansion dans le calendrier (h, r, t, ). qui fournit des informations de synchronisation supplémentaires sur le moment où les faits établis. Leblay et Chekol à partir d'études triple étiquetage avec une plage de temps les problèmes de synchronisation de prédiction, et d'élargir simplement la méthode d'enrobage classique. Par exemple, pour étendre la Transe TTransE est basé sur les vecteurs définis:

2) entité dynamique

événements du monde réel changeront l'état de l'entité, et donc affecter la relation correspondante. Afin d'améliorer les performances de prévision du temps, le calendrier plage de temps de prédiction du modèle de contexte de section pour une définition formelle du changement d'état problème de détection, en utilisant un contexte états d'apprentissage et le vecteur d'état.

« Savoir-Evolve » est une connaissance approfondie de l'évolution du réseau, qui étudie l'évolution de la connaissance des corrélations entre les entités et leur évolution. Il utilise un temps variable de processus en plusieurs points de la survenance des faits de modélisation, nous avons développé un nouveau type de cyclisme caractérisation du réseau de l'évolution des séries chronologiques non linéaire de l'apprentissage.

Afin d'obtenir l'interaction entre les noeuds, la modélisation RE-NET une séquence d'événements sur la base de codeur de cycle du réseau de neurones et voisin par polymérisation. Plus précisément, on utilise un réseau de neurones afin d'obtenir des interactions de l'entité de la série d'informations de circulation, et par la polymérisation par polymérisation voisin se produisent simultanément interagissent.

3) cadencement relation de dépendance

Dans la chaîne de relation, il existe une dépendance temporelle le long de la ligne de temps. Par exemple, « Dans le ... ... Je suis diplômé de naissance travail ... .... mourais » Jiang et al proposées sur la base du temps intégré, qui est associé à un cadre de calendrier régularisation apprentissage, introduisant ainsi l'ordre temporel et de l'information de cohérence. La synchronisation de la fonction de score est défini comme suit:

Parmi eux,

 Est une matrice non symétrique, il est un cadencement de l'r_k relation séquentielle, r_l de codage relation de synchronisation de séquence. Depuis lors, il a encore par des formules de programmation linéaire en nombres entiers appliqués disjointes (disjoints), la commande (la commande) et de l'étendue (travées) trois types de contraintes de cohérence du temps.

4) logique de synchronisation

Les chercheurs ont également étudié la logique des règles de raisonnement temporel. Chekol, qui a exploré les réseaux logiques de Markov et de programmation logique de raisonnement probabiliste sur la carte des connaissances de synchronisation non-déterministe. règles de chemin RLvLR-Stream envisager la fermeture, l'apprentissage et les règles d'inférence à partir de la connaissance de la structure de la carte du cours d'eau.

4, basé sur l'application des connaissances

Pour les applications d'intelligence artificielle, riche connaissance structurée est très utile. Mais comment ces symboles de l'intégration des connaissances aux applications réelles du cadre de calcul est toujours un grand défi. Cette section décrit certaines applications dans la compréhension du langage naturel (NLU) profondeur de tâche de la méthode fondée sur la connaissance basée sur les réseaux de neurones récemment.

1) la compréhension du langage naturel

compréhension du langage naturel du savoir est injecté par une connaissance structurée unifiée espace sémantique pour améliorer la langue pour caractériser la performance. Récemment, des progrès dans le domaine de l'utilisation de la connaissance la recherche de connaissances explicites et implicites des faits de la représentation linguistique, et d'explorer les nombreuses tâches la compréhension du langage naturel.

Chen et al proposé une carte de deux connaissances (à savoir une carte basée sur un intervalle de connaissances sémantiques (basée sur un intervalle), et le graphique de connaissances lexicales basée sur les mots) bis technique de la marche aléatoire figure à considérer l'inter-relation entre une rainure dans la compréhension de la langue parlée . Wang et al pondérée par « mot - le concept de » modèle conceptuel basé sur la connaissance de l'intégration réaliser l'étude de caractérisation améliorée court texte. Peng, qui combine les connaissances externes pour construire des cartes pour les événements les tâches de classification de l'information hétérogène texte court sociale.

2) Système Q & A

système (KG-QA) provient du fait que l'utilisation de la cartographie des connaissances pour répondre aux questions en langage naturel basé sur les connaissances quiz. Basé sur la méthode de réseau de neurones pour caractériser l'espace sémantique distribuée en question et la réponse, il y a des méthodes ont été injectées dans le symbole de la connaissance, afin de parvenir à un raisonnement de bon sens.

Par la connaissance de la cartographie comme source de renseignement extérieur, un simple système de réponse aux questions factuelles ou un répondeur de fait peut répondre à des questions simples qui permettent de cartographier une seule connaissance des faits. Bordes et al base de connaissances en tant que mémoire externe par le réseau de mémoire pour une simple question et la réponse.

Ces méthodes basées sur de neurones du réseau de neurones « codeur - décodeur » modèle combine obtenir des améliorations de performance. Mais nous voulons gérer les relations complexes à plusieurs niveaux doivent également être en mesure de traiter le raisonnement de bon sens à plusieurs niveaux, la conception de réseaux plus spécialisés. Connaissance de l'observation de bon sens structuré fournit des informations riches, et comme un biais inductive relationnelle existe, elle favorise la connaissance de bon sens de la recherche récente et de l'espace sémantique entre les symboles sur l'intégration de raisonnement à plusieurs niveaux.

3) Système de recommandation

Les chercheurs ont mené par le système de recommandation de filtrage collaboratif de recherche approfondie, qui utilise l'information sur l'historique de l'utilisateur. Cependant, cette approche ne résout pas souvent le problème du problème de parcimonie et de démarrage à froid. La carte des connaissances comme une information externe peut être donnée à l'introduction de la capacité de raisonnement de sens commun du système recommandé.

Par des informations auxiliaires (par exemple, les entités, les relations et les attributs) sur la base d'injection de cartographie des connaissances, les chercheurs ont recommandé pour l'amélioration des performances dans la régularisation intégrée a fait beaucoup de travail. Certains travaux tient compte de la structure de la relation entre le chemin et la carte des connaissances, KPRN l'interaction entre l'utilisateur et le produit est visible dans la « entité - relation » Knowledge Graph trajectoire et obtenir en fonction de la séquence LSTM, alors sur le chemin prédire les préférences de l'utilisateur.

Quatrièmement, les directions de recherche futures

Les chercheurs ont fait beaucoup de travail pour relever les défis auxquels sont confrontés les connaissances et la représentation des applications connexes, mais il y a encore des problèmes difficiles à résoudre à l'air libre, il y a un avenir prometteur de la recherche.

1, le raisonnement complexe

Pour la représentation des connaissances et le raisonnement des calculs numériques nécessitent un espace continu de vecteur, de manière à obtenir des entités d'information sémantiques et les relations. Cependant, la méthode intégrée a des limites fondées sur un raisonnement logique dans des tâches complexes, mais la relation entre ces deux voies et la recherche de la logique symbolique vaut une exploration plus poussée. chemin de circulation relation de codage sur la carte des connaissances, la méthode a une prometteuse carte de transmission d'informations de recherche basée sur les réseaux de neurones, etc., ainsi que la découverte et le raisonnement basé sur le chemin d'apprentissage de renforcement du raisonnement pour résoudre des problèmes complexes est très prometteur de la recherche.

En conjonction avec les règles et la logique intégrées, des travaux récents créera un réseau logique de Markov et moissonneuses-batteuses KGE, conçus pour exploiter les règles de la logique et de l'incertitude du processus. L'utilisation efficace de la mise en uvre intégrée peut obtenir la probabilité d'incertitude connaissance du domaine et le raisonnement, est une direction d'avenir de la recherche est intéressant de noter.

2, cadre unifié

Atlas a plus modèle d'apprentissage des connaissances caractérisent avérée être équivalent. Par exemple, Hayshi et Shimbo se sont avérés HØIE et pour COMPLEXE tâche de prédiction de lien avec des contraintes spécifiques sont mathématiquement équivalentes. Analogie certains modèles représentatifs (y compris DistMult, COMPLEXE et HØIE) donne une perspective unifiée. Wang et al. Découvrez quelques-unes des liens entre modèle bilinéaire. Chandrahas, qui explore la compréhension géométrique de l'addition et la multiplication, le modèle d'apprentissage de la représentation des connaissances.

La plupart des travaux en utilisant différents modèles complètent la définition formelle de la carte de la connaissance de l'acquisition des connaissances de toute la tâche d'extraction tâche et relation. Han et al carte des connaissances et le texte sont considérés ensemble, et ont proposé un cadre d'étude conjoint qui utilise un mécanisme d'attention mutuelle pour l'échange d'informations entre les cartes de connaissances et texte. Cependant, ces études travaillent pour une compréhension unifiée de la représentation des connaissances et le raisonnement est moins.

Cependant, cette étude la question comme un cadre unifié pour une vue unifiée du réseau, est très significatif, il comblera les lacunes dans le domaine de la recherche.

3, l'intelligibilité

La représentation des connaissances et injecté dans l'interprétabilité pour l'acquisition des connaissances et des applications réelles est une question clé. En ce qui concerne l'intelligibilité, les chercheurs ont fait des travaux préliminaires. ITransF le vecteur creux pour le transfert de connaissances et d'atteindre l'attention de l'intelligibilité grâce à des techniques de visualisation. explication CROSSE pour le lien pour générer des prévisions chemin en fonction intégré en utilisant la recherche, qui explore l'interprétation de la carte des connaissances.

Cependant, malgré un certain réseau de neurones que nous avons récemment réalisé des performances impressionnantes, mais ils sont encore limités en termes de transparence et l'intelligibilité. Certaines méthodes tentent de modèle de réseau de neurones et une boîte noire combine le raisonnement symbolique, peut être augmentée en introduisant des règles logiques explicatives.

Après tout, pour interprétabilité Realize peut convaincre les gens de prédire les résultats, les chercheurs ont besoin de faire plus de travail en termes de crédibilité et d'améliorer la connaissance de la prévision de l'intelligibilité.

4, l'évolutivité

Évolutivité est une question clé cartographie à grande échelle des connaissances. Nous devons faire un compromis entre l'efficacité de calcul et la capacité d'exprimer le modèle, mais seulement quelques travaux est appliquée au cas de plus de 1 million de scène entités. Certains procédé enrobage en utilisant une technique simplifiée pour réduire le temps de calcul (par exemple par un calcul simplifié quantité feuilles cycliques du produit de corrélation). Cependant, ces méthodes sont encore difficiles à étendre aux centaines de millions d'entités et de relations.

Similaire à l'aide du réseau logique de Markov si la probabilité est une inférence logique est les tâches intensives, ce qui rend la tâche difficile à être étendue à une grande connaissance de la cartographie à grande échelle. modèle de réseau de neurones règles récemment proposé par une simple génération de violence de recherche (BF), ce qui le rend possible à grande échelle sur la carte des connaissances. Par exemple ExpressGNN tente d'utiliser NeuralLP l'interprétation efficace des règles, mais pour faire face à des architectures complexes et la profondeur croissante de la carte des connaissances, il y a beaucoup de besoins de recherche à explorer.

5, l'agrégation des connaissances

Global Knowledge est l'agrégation de base d'applications basées sur la connaissance. Par exemple, le système de recommandation est modélisé en utilisant une carte de connaissances « utilisateur - marchandises » interactions, et le texte avec la classification de textes et de connaissances cartographie codée dans l'espace sémantique. Cependant, la plupart des méthodes de polymérisation des connaissances existantes sont basées sur les mécanismes d'attention et la conception du réseau de neurones (GNN).

Merci transformateurs et ses variantes (par exemple le modèle BERT), le traitement du langage naturel communauté de recherche en raison de la pré-formation à grande échelle a fait de grands progrès. Et une étude récente a révélé que le texte non structuré en utilisant le modèle de langue de formation pré-construit peut vraiment arriver au fait que les connaissances. À grande échelle des connaissances pré-formation est une méthode d'injection directe. Cependant, d'une manière efficace et interprétable de repenser la façon juste polymérisation est significative.

6, la construction automatique et dynamique

carte des connaissances existantes dépend fortement construite manuellement, ce qui est un coût élevé de la tâche de main-d'uvre. Largement utilisé la cartographie des connaissances dans différents domaines de l'intelligence cognitive, la connaissance de la construction automatique de la carte des grandes exigences de ENONCE de contenu non structuré.

la principale préoccupation récente de la recherche est, sous la supervision de la carte de connaissances du signal, construction semi-automatique carte des connaissances. Le visage des applications multi-modale, à grande échelle hétérogènes, la construction de carte de connaissances automatisée est toujours confronté à de grands défis.

À l'heure actuelle, la recherche grand public se concentre sur la connaissance de la cartographie statique. Peu de travail pour explorer l'efficacité d'une gamme de temps et d'informations de synchronisation ainsi que l'apprentissage des changements dynamiques de l'entité. Cependant, un grand nombre des faits établis que dans une période de temps spécifique.

Compte tenu des caractéristiques de synchronisation des connaissances de cartographie dynamique, vous serez en mesure de répondre aux limites de la représentation des connaissances traditionnelles et le raisonnement. Lei Feng Lei Feng net net

Avez-vous encore la détection d'objets 2D faire? Google a commencé un amusement 3D
Précédent
Comment raconter une nouvelle pneumonie et la grippe couronne avec l'apprentissage en profondeur? Cinq études, du dépistage initial de prédire un état critique sévère
Prochain
Fédéral apprendre les dernières tendances de la recherche
Livre d'aujourd'hui | quantification de l'incertitude, la perception prédictive de la profondeur de bord, l'estimation de la profondeur binoculaire, profondeur correspondant stéréo adaptatif
Origines machine donnée modèle de conception indépendante de la « capacité », une vue d'ensemble de la structure d'une recherche de texte: structure du réseau de neurones Série Recherche (a)
Est en direct | Surchauffe seconde avec une cargaison de direct, les oranges de vente Hubei
Vibrato, adroite, Taobao, Tencent logique de trafic en temps réel ce qui est? | super vues
Jinan « exonère » vote spécial de trois des personnes privées de TVA
Il est « l'homme le plus riche dans les légendaires » détenus Qizhong Mou, homme le plus riche du Hubei, emprisonné trois fois, est également recherché
Les acheteurs veulent « annuler pool », les experts disent: ne devrait pas annuler, la charge de votre propre
322 jours plus tard, Huang a été libéré de prison! Il « en secret » grand 3 « mise en page », même la femme debout
Lorsque le printemps occupé
Sanya, Hainan: Prendre des mesures pour protéger les travaux de recherche du ventilateur Sud
Peep il y a 13,7 milliards d'années dans le passé? NASA télescope spatial James Webb devrait atteindre