HIT Liu Ting: affaire de la carte du savoir à la carte | CNCC 2017

Lei Feng réseau AI Technology Review par: parrainé par la Fédération chinoise Computer (CCF), l'Université de Fuzhou, l'entrepreneur, Gouvernement de Fuzhou, Chine populaire National Computer Conference 2017 (CNCC 2017) Fujian Normal University, College of Engineering en association avec au 10/26 à 10/28 Journée à Fuzhou Convention internationale du détroit et du parc des expositions. Assemblée 14 jeux, en plus de rapports spéciaux, ainsi que deux jeux de forum principal, plus de 40 domaines de forums académiques, des événements spéciaux et plus de 30 jeux de trois cérémonie de remise des prix, il y a plus de 80 entreprises au cours de la même période sera également tenue l'exposition des réalisations scientifiques et technologiques. Lei Feng réseau en tant que partenaire média exclusif stratégique pour le contenu de l'Assemblée générale était une couverture complète et une couverture.

Dans le sous-forum technique de « carte des connaissances Foresee les médias sociaux », Harbin Institute of Technology professeur Liu Ting a fait un merveilleux rapport intitulé « De la connaissance à la carte carte Affair » de. Après Lei Feng réseau consentirait professeur Liu Ting, examen et organiser le contenu passionnant de ce rapport.

Professeur Liu Ting

Le professeur Liu Ting contenu du rapport est divisé en quatre parties: La connaissance et la cartographie « grands mots forêt », l'affaire a mis en avant le concept du spectre, les modèles affair travaux liés à la maison et à l'étranger, explorer affaire HIT en termes de spectre.

Cartographie des connaissances et « grands mots forêt »

Carte des connaissances a été construite la collecte de données artificielles et les données de marquage, ainsi que des divers besoins et raffinement (par exemple, nécessité d'obtenir « XX XX si la maladie peut être un traitement médicamenteux », entre « XX XX et le peuple ennemis / amis « et d'autres informations), artificiellement construit la cartographie des connaissances de plus en plus difficile de répondre aux divers besoins des utilisateurs. Sur cette base, la façon de construire automatiquement une connaissance de la cartographie de la machine à grande échelle est devenue un point de recherche à chaud.

La cartographie des connaissances, le savoir est basée sur les relations binaires, utilisés pour décrire les entités du monde réel (ou des concepts, des concepts sont des entités abstraites, comme concept de « fruit » est le « Apple ») et leur relation consistant essentiellement l'unité est « entité - relation - entités » triplets (triplet), par le biais de la relation entre les entités liées les unes aux autres pour former une structure de réseau. Par la cartographie des connaissances qui peuvent aider les utilisateurs par sujet plutôt que d'une recherche par une chaîne, qui réalisent vraiment la recherche d'information sur le plan sémantique. moteur de recherche basé sur la carte des connaissances, des connaissances peuvent être structurées commentaires directement à un utilisateur, l'utilisateur ne naviguez pas un grand nombre de pages, vous pouvez trouver ce que vous voulez les connaissances acquises.

terrain fermé et ouvert la cartographie des connaissances avantages de la cartographie des connaissances de domaine et inconvénients

A la fin de l'année 2014, HIT officiellement publié « grands mots Forest. » Www.bigcilin.com maintenant simplement taper dans votre navigateur, vous pouvez accéder à la « grande forêt de mots. » « Big Words forêt » est une des entités conceptuelles rampantes automatiques et les entités du réseau pour former une connaissance commune de hyponymie basée sur une carte. Cela signifie que si les mots saisis par l'utilisateur ne sont pas « grande forêt de mots » contenait « grands mots Lin » qui vont à l'Internet dans les recherches en temps réel pour exploiter automatiquement un concept plus large des mots dans le mot et la consolidation de la parole de ces concept plus large pour la hiérarchie. Par exemple, entrez « Lincoln » « grande forêt de mots » sera basée sur l'information sémantique « Lincoln » apparaît dans le réseau, creuser automatiquement plus du concept de « Lincoln » a, par exemple, « véhicule automobile », « Président », » « » leader « et ainsi de suite, puis en fonction du degré d'abstraction de ces concepts, ces concepts présentés comme une hiérarchie. Tels que les « leaders » par opposition à « président » plus abstrait, « chef de file » niveau que « président » dans le chiffre plus élevé.

La figure de la gauche dans le cadre du répertoire hiérarchique de « grande forêt de mots », dont le squelette était « un synonyme du mot Lin (version longue). » « Lin grands mots » choisir « un synonyme du mot Lin (version longue) » comme la raison pour laquelle le squelette: Après répété une enquête, une équipe dirigée par le professeur Liu vocabulaire Ting aurait dû considérer deux types, l'une est la « entité » et la chose réelle corrélativement, comme les noms de lieux spécifiques, l'organisation, le nom, l'autre est le « concept » et « entité » de sens abstrait, comme « plante », « fruit » et ainsi de suite. Ayant relation latérale significative entre les entités ayant une relation hiérarchique entre « entités » apparents et « concept », « concept » et « concepts », et devrait avoir une direction transversale nette et le vocabulaire longitudinal formé entre structure. Sur cette base, une équipe dirigée par le professeur Liu Ting sera « un synonyme du mot Lin (Extended Version) » en tant que niveau construit (longitudinal) « gros mots de forêt » squelette de relation.

Voici une brève introduction comme squelette « grands mots de la forêt » - « un synonyme du mot Lin (Extended Version) » problème. La première question, « synonyme de la forêt de mot » est une structure à cinq couches a seulement fixe, mais le visage de dix millions, voire des milliards à l'échelle multi-champ, la diversité du vocabulaire, structure fixe les décrire ne peut évidemment pas efficacement, d'abord deux questions est « synonyme du mot Lin (version longue) » le nombre de mots contenus très limité, et la plupart du concept abstrait, sa taille est inférieure à cent mille mots, de toute évidence ne convient pas pour une utilisation pratique. Sur cette base, une équipe dirigée par le professeur Liu tout à fait déterminé à briser « un synonyme du mot Lin (Extended Version), » les limites ci-dessus, formant ainsi le courant « grande forêt de mots. » Tout d'abord, le nombre de couches de « grande forêt de mots » est pas fixe, en fonction hiérarchiquement automatiquement au degré de mots abstraits, d'autre part, la « grande forêt de mots » contient beaucoup d'entités spécifiques (comme les noms de lieux, nom de l'organisation), sa taille est « synonyme du mot Lin (version longue) » des centaines de fois, et est constamment élargi.

Caractéristiques « grande forêt de mots » est la capacité de construire automatiquement à partir d'une variété de sources d'information vocabulaire hyponymie et le vocabulaire. Ceci est un document de conférence équipe ACL dirigée par le professeur Liu Ting publié dans un doctorat (La conférence est la conférence de haut dans le domaine du traitement du langage naturel, la société informatique a été évalué comme rang A), montre ce document en détail comment l'automatique obtenir un cadre technique pour concept multi-entité mot de sources à l'intérieur.

Bref, obtenir le concept du mot, il existe trois sources principales, 1) un moteur de recherche avec le mot maintenant obtenir une forte probabilité de récupération, la formation des mots 2) Catégorie encyclopédie en ligne étiquettes 3) les mots, pour beaucoup de mots, qui est, le suffixe mots concept du mot, par exemple, des entreprises comme Microsoft Word est le concept de Microsoft de cette entité. Par la suite, l'algorithme de tri en utilisant ces concepts mots candidats obtenus par scoring acquis, puis pris dépasse un certain seuil pour conserver le concept candidat mots « grands mots forestiers » et.

Les méthodes ci-dessus ne sont acquis un mot de concept pour mot, comme indiqué sur la gauche. Cependant, il existe une relation hiérarchique claire entre le concept du mot, comme illustré à droite, et la « grande forêt de mots » est particulière est la capacité de former automatiquement une hiérarchie entre les concepts de mots. En fonction des options de traitement ci-dessus, de « un synonyme du mot Lin (version longue) » des centaines de milliers de mots de départ, et maintenant la « grande forêt de mots » est devenu une carte de la connaissance a un vocabulaire de l'ordre de dix millions, et sa taille tous les jours jamais la croissance.

Comme la « grande forêt de mots » est construit automatiquement, ce qui les oblige à faire une évaluation de la qualité pour déterminer la « grande forêt de mot » ne figure pas beaucoup d'erreurs, à la fin Can pratique. Le professeur Liu Ting a dirigé l'équipe d'évaluer l'échantillonnage fait sur la « grande forêt de mots. » Les résultats ont montré que, pour un mot, pour trouver les mots exacts du concept de 85%, la reconnaissance hyponymie des mots entre le taux de précision de 90%.

Par rapport à d'autres carte des connaissances, « grands mots » Lin Le principal objectif de la construction automatique du vocabulaire de la linguistique hyponymie, la connaissance d'un atlas de langue. Bien sûr, une équipe dirigée par le professeur Liu Ting a également commencé à introduire des relations horizontales dans les « grands mots forêt », nous pensons que l'avenir proche sera en mesure de voir une plus complète « grande forêt de mots. »

Le concept de la carte d'affaire proposée

Carte à propos de l'affaire. base de connaissances existantes généralement basée sur « la relation entre les concepts et le concept » comme le noyau, le manque d'excavation sur la connaissance « logique du bon sens ». Le professeur Liu équipe Ting croit dans les applications pratiques, la logique de bon sens (et le modèle d'évolution entre les événements) est une très précieuse connaissance de bon sens, la connaissance de l'exploitation minière à notre compréhension de ce comportement humain et les changements dans les lois du développement social est très significatif. Pour un exemple classique, Pékinois acheter une maison, la prochaine étape est l'achat d'une rénovation de maison, achètera la décoration de meubles fait, si quelqu'un a trouvé en ligne micro-Bo a dit qu'il a acheté la maison, vous pouvez suivre l'entreprise de décoration pour faire de la publicité, qui est une prédiction. affaire Atlas est pas un nom en tant que nud central de la base de connaissances, mais en cas et est un événement de classe abstraite que la logique de base de la base de connaissances de bon sens. Par exemple, les chefs d'Etat à visiter un autre pays, c'est un événement abstrait. Professeur Liu Ting équipe il y a trois ans a proposé le concept de carte affaire.

affaire Atlas ne définit que la relation entre les deux événements: une sorte Shun Cheng, une cause à effet, ces deux relations sont dans l'ordre chronologique. Essentiellement affaire est une affaire carte de base de connaissances logique, décrit l'évolution et les tendances entre les événements, il peut être appliqué à de nombreux aspects de la vie, tels que la prévision de l'événement, le raisonnement du sens commun, l'exploitation minière de l'intention des consommateurs, générer le dialogue et ainsi de suite.

Affair carte de différence et carte connaissances, savoir la carte Les sujets étaient des entités nominales et leurs relations, l'étude est l'affaire prédicats atlas des événements et de leurs relations. La principale forme de connaissance est des attributs de l'entité carte des connaissances et des relations, le sens commun est des modèles logiques de bon sens et la probabilité de transfert d'informations. La plupart des relations entre l'évolution des événements est incertain, et la relation entre les entités est fondamentalement stable.

La définition de l'événement de l'affaire. Affaire spectre des événements est une généralisation des événements abstraits, tels que manger hot pot, à l'aéroport, regarder des films peuvent être, mais si cela est très spécifique, un an et un mois, ce qui a fait, ces connaissances ne sont pas stockées dans la carte de l'affaire . Mais pas trop abstraite, par exemple, aller dans des endroits, faire des choses, ni est-il raisonnable carte des connaissances stockées. La relation entre les événements sur les deux types de relations Shun Cheng, manger, payer et quitter le restaurant, qui est l'événement très fréquent relation Shun Cheng. Il existe une relation de cause à effet, nous croyons que la relation de cause à effet est très important, pour établir une relation de cause à effet, afin d'influencer le résultat en contrôlant la variable dépendante.

affaire Atlas a trois topologie typique, la première est enchaînée, relation Shun Cheng est typique. Le second est l'arbre, dont il est un événement psychologique est l'événement va faire quelque chose, pas vraiment fait, le troisième est un anneau pour combattre l'hôpital de représailles, par exemple, ad infinitum.

Atlas travaux liés à l'affaire à la maison et à l'étranger

La plupart des carte affaire pertinentes deux directions de recherche apprennent et scripts statistiques événement de reconnaissance des relations. l'apprentissage du script statistique est un domaine d'étude et carte affaire très proche. En 1975, le savant américain concept de scénario Schank proposé, en 2003, le chercheur japonais méthode proposée obtenir automatiquement le script, en 2008, Dan Jurafsky construire une chaîne d'événements utilisation non surveillée de la méthode, la direction de devenir un représentant du travail de pionnier. Depuis 2014, les travaux de recherche de script statistique est entré dans une phase de reprise et le développement.

En outre, il existe une relation d'itinéraire technique entre les événements (calendrier et cause à effet) la reconnaissance.

étude HIT sur la carte de l'affaire

HIT principalement dans deux domaines de modèles de travail affair d'exploration, d'une part est de construire et utiliser le champ carte Voyage de bon sens, d'autre part est de construire et d'utiliser un atlas de bon sens du secteur financier.

carte Voyage applications potentielles affaire

DOMAINE Voyage relation Shun Cheng De plus, sa construction comprend un procédé de nettoyage des données, le traitement préalable de la PNL, l'extraction et l'événement de généralisation, la génération d'un événement de candidat, l'identification de la relation Shun Cheng, Shun Cheng l'identification de direction.

La seconde est les affaires financières de l'Atlas.

La carte peut être appliquée à l'affaire du secteur financier entre les prévisions des marchés boursiers.

Résumé du savoir une carte à l'affaire

Le professeur Liu Ting résumé: carte des connaissances dans tous les domaines de la culture intensive, révélant progressivement la valeur, mais pour être une percée sous la forme de représentation des connaissances et la capacité de raisonnement à améliorer. affaire Atlas recherche connexes et des scripts statistiques d'apprentissage des événements de reconnaissance des relations de plus en plus d'attirer l'attention des chercheurs. Avec « phrase verbe » pour le noeud, une évolution de l'événement (Shun Cheng, cause et effet) pour cartographier l'affaire côté ascendante. Affaire Atlas jouera un rôle important dans le domaine de la prévision, le dialogue, améliorer efficacement le système d'intelligence artificielle interprétabilité.

Enfin, le professeur Liu Ting à son collaborateur, le professeur Chi HIT informatique sociale et centre de recherche recherche d'information, le professeur Liu Mingfu, les enseignants Ding efficaces et de doctorat Sen Zhao Dong, Li Zhongyang, Jiangtian Wen a exprimé sa satisfaction.

Au-dessus est le CNCC 2017 Professeur Liu Ting excellent rapport sur le forum , Lei Feng réseau a gagné sa licence exclusive d'organiser.

Piscine mur | jour au soleil, la lumière et la chair plus jeune fille avec oh
Précédent
Huang voiture à grande vitesse 120 tours Quelle est la situation?
Prochain
Hong Kong aube volonté d'exposition médiatique lorsque le père, le même que quatre rois, la fille de Jacky Cheung presque grandi
Plus de 10 fois le zoom: OPPO Reno afin d'apporter plus d'expérience conviviale
Star II Profonde nom et surnom grillé, il n'y a pas d'étoiles dans la culture nommée cette chose est très évidente
Est déclaration vraiment optimiste: Samsung ne perd pas la position de leader, est toujours le leader dans la prochaine décennie
« Complexe avec 4 » pré-vente au box-office casser milliards un record! Les tarifs ont augmenté, cinéma accusé manger avec laide
Interprétation des données | racks intelligents conduit la nouvelle tendance de « industrie de l'électroménager balcon. »
tempête de dragage Shenzhen a causé 10 décès, ont avertissement de tempête de pluie est encore unité de construction de travail au hasard
« Le Roi Lion » style « Black Panther », pas vraiment « Wolf 2 » beau évaluation du dissipateur de chaleur Shu
section de riz de la fin intelligente Hot Aiot important équipement de millet succès stratégique
commentateurs recherche Internet du pays: lutte contre l'esprit illégal intolérable
TF Lite est seulement une partie de l'histoire, Google a également introduit avec une nouvelle méthode de compression de modèle
Essentials Dry | application intelligente des moteurs principaux sont tout ce que vous savez vraiment?