Chat Robot Landing et combat réel avancé | Million de personnes apprenez l'IA

Ding dong ~ vous êtes frappé par le bien-être! À partir de maintenant, 299 billets pour "2020 AI Developer Conference" seront livrés gratuitement! Entrez la page d'inscription [2020 AI Developer Conference (Ticket en direct en ligne) -it Training Live-CSDN College], cliquez sur "Inscrivez-vous immédiatement", utilisez le code de réduction "AIP1410" pendant le règlement, le prix deviendra "0" Yuan Intersection

Ces dernières années, la technologie et les produits du robot de chat se sont développés rapidement. En tant qu'application tueuse de la technologie de l'intelligence artificielle, les robots de chat se sont développés en plein essor, et divers matériel intelligent ont émergé sans fin.

Dans cette classe publique, le camp de base de la technologie AI et la persévérance de la presse électronique de l'industrie ont invité le directeur général de Shanghai Wudge Intelligent Technology Co., Ltd., M. Shao Hao, doyen du chien Ferry Technology Artificial Intelligence Research Institute. Expliquez l'atterrissage du robot d'atterrissage et le combat avancé pour tout le monde.

Ce cours expliquera de manière approfondie le cadre technique et les détails de la mise en uvre de l'ingénierie du robot de chat et analysera le paradigme de génération suivante du robot de chat: la vie virtuelle. La mise en uvre de la carte des connaissances.

Ce cours convient au personnel de recherche et de développement en première ligne d'ingénierie. Vous pouvez apprendre les détails du robot de chat à travers ce cours. Convient aux étudiants, vous pouvez apprendre le cadre technique et l'algorithme typique des robots de chat à travers ce cours.

Ce qui suit est la publication du SpeedBook de la classe publique

Shao Hao: Aujourd'hui, je vais vous parler du "Robot Land and Advanced Combat". Je suis Shao Hao de Shenzhen Dogto Smart Technology Co., Ltd., et je suis maintenant responsable du travail de l'Institut de recherche sur l'intelligence artificielle de l'entreprise, principalement pour faire des produits liés à Chat Robot.

Ce dont je veux parler aujourd'hui comprend ces aspects, y compris les parties suivantes:

  • Dans la première partie, je parlerai de l'architecture et de l'architecture technique du robot de chat global du robot de chat;
  • Dans la deuxième partie, je vous parlerai de tous les aspects de la mise en uvre du projet du robot dans le projet. Ici, je coopérerai avec un code pour vous expliquer comment chaque module et chaque fonction sont réalisés. J'espère que tout le monde écoutera cette partie. Vous pouvez prendre un robot de chat par vous-même;
  • Dans la troisième partie, je veux vous parler de l'application et du chemin technique de la carte de connaissance Une meilleure façon d'aller pour aller pour résoudre de nombreux problèmes auxquels sont confrontés les robots de chat;
  • Dans la dernière partie, passez 5 à 10 minutes pour parler d'autres problèmes du projet d'atterrissage sur le projet.

C'est tout pour une brève introduction.

Aperçu des robots de chat

Introduisez d'abord l'arrière-plan. Que pensez-vous de l'intelligence artificielle maintenant? Qu'il s'agisse d'alphago ou d'alphago zéro, de vaincre les meilleurs joueurs de Human GO; ou de Project Debater, un robot participant au débat humain, créant de bons résultats en janvier de cette année; Dog, c'est aussi une très bonne application de l'intelligence artificielle, et comme Openai était également très puissant dans le jeu DOTA2 l'année dernière. DeepMind s'est récemment engagé dans la compétition "Starcraft 2". L'intelligence artificielle permettait de l'imagination des êtres humains, alors que avons-nous une impression très intuitive de l'intelligence artificielle maintenant? L'intelligence artificielle est omnipotente, nous sentirons donc que le réveil du robot maintenant dans les médias ou la destruction humaine est devenu une chose très naturelle.

Si nous regardons le robot de chat avec ce sentiment? Quel genre d'expérience avons-nous? Chers camarades de classe peuvent être comme moi. Tout le monde avec ce produit de robot de chat, nous avons pris environ 1 ou 2 jours. Après que la fraîcheur soit passée, nous avons constaté que cette chose ne sera jamais ouverte, ou nous ne discuterons jamais avec. Qu'est-ce qui cause ce phénomène? En plus du malentendu du son et de la précision, nous sommes toujours très tolérants à ces problèmes. Mais la dernière fois que nous avons vu un rapport sur les médias - qu'est-ce qui s'est passé lorsque les utilisateurs étrangers ont utilisé les haut-parleurs Echo d'Amazon? Il dormait la nuit, et soudain la lumière était allumée, puis ricana deux fois! Ce terrible, effrayant et effrayant! Si je rencontrais cette situation, l'orateur a soudainement ri au milieu de la nuit. En plus de retirer son bouchon et de le jeter du haut, il n'y avait pas de bon moyen de résoudre mon cur. Haine, afin que nous puissions voir que ce produit de robot de chat est vraiment médiocre.

En parlant de produits de robot de chat, pourquoi faites-vous si mal? En tant que praticien, je suis toujours très tolérant, car je sais où se trouve la limite du robot de chat, donc je pensais quand j'ai demandé le produit du robot de chat: ce produit de robot de chat peut avoir un problème avec cette technologie locale, donc je ne fais pas Je ne demande pas à demander ou à essayer d'éviter de le demander. Mais les utilisateurs ordinaires ne sont pas si tolérants aux produits de robot de chat. J'ai dépensé tellement d'argent pour acheter ce conférencier robot de chat. Ce que j'espère, c'est un robot qui peut me parler naturellement, mais après cela ne peut pas être atteint, il se plaindra du développement développement. par.

Les utilisateurs ont généralement une faible tolérance pour notre produit. Ils estiment que votre technologie est vraiment médiocre. En fait, le diplôme détermine. L'enseignante Zhou Ming, doyenne adjointe du Microsoft Asia Research Institute, a dit une fois que l'intelligence linguistique est la perle de la couronne d'intelligence artificielle. Si nous traitons cette beauté comme toutes nos technologies, l'intelligence artificielle est la couronne sur sa tête et que la langue intelligente est intelligente la perle sur la couronne. Quel est le sens? Le traitement du langage naturel lui-même est très difficile!

Permettez-moi de donner un exemple simple, tout le monde comprend, par exemple, j'ai dit un mot: "Évidemment, le comprendre, mais il ne dit tout simplement pas." J'ai demandé à mes camarades de classe, qui aime et qui? Qui ne le dit pas? Cette phrase est difficile. Permettez-moi de dire un mot, par exemple: "Je ne l'ai pas vu prendre votre portefeuille". Si nous avons un ton différent, des tons différents, la signification de cette phrase est complètement différente. Par exemple, "je ne l'ai pas vu prendre votre portefeuille" (le stress est de "voir"), cela signifie que je ne l'ai pas vu prendre votre portefeuille, je peux écouter le voir de mes propres yeux, ou "Je n'ai pas fait Ne le voyez pas prendre votre portefeuille "(stress sur le" portefeuille "), c'est-à-dire qu'il a pris votre autre chose, mais il n'a pas pris votre portefeuille.

Ainsi, lorsque nous comprenons une phrase, elle est en fait suivie par le contexte, qui est très lié à la vision du monde de l'orateur, à l'émotion de l'orateur, à l'environnement de l'auditeur et à la vision du monde de l'auditeur. Est-ce? " La signification du dialogue en différents personnages est complètement différente, donc la technologie NLP elle-même est très difficile.

Bien sûr, voulez-vous faire, pourquoi voulez-vous le faire?

J'ai dit une fois dans d'autres rapports que Microsoft proposait un tel slogan en 2016 appelé "Dialogue est la plate-forme". Il croit que le langage est le moyen le plus naturel pour l'interaction humaine. En coopération et en écho, lorsque vous récoltez, vous pouvez bavarder avec Tout le monde dans le village pour promouvoir l'amitié de chacun. Par conséquent, la langue est un moyen naturel d'interagir avec les êtres humains. Cependant, en raison du matériel et des logiciels, nous interagissons essentiellement avec l'ordinateur avec les claviers et les souris auparavant, donc après que nous sommes maintenant en profondeur, Big Data et l'amélioration du matériel de GPU, nous pouvons directement utiliser le langage pour interagir avec la machine. C'est C'est aussi ceci. Pourquoi Microsoft a proposé le concept de "Dialogue est la plate-forme" en 2016.

Système technologique écologique de chat de chat

Comment comprendre? Echo est un produit, Siri d'Apple est un produit, le fils Xiaobai est un produit, IBM Watson est un produit et Xiaobing est également un produit de robot de chat. Ces produits ont des formulaires d'affichage différents, tels que le transporteur de Siri est des téléphones mobiles, WeChat ou Weibo; nous avons un haut-parleur qui est son matériel. Ces produits doivent avoir un opérateur à transporter. Cet opérateur est appelé Chat Robot. La plate-forme, cette plateforme peut Incluez certaines plateformes telles que WeChat, Line, MSN, etc.AlexaLUISWitruyiUNIT

Essence

Python

ruyiruyi.aiHiHelloHi/Hello/ruyiHelloHelloruyi.ai

UNITUNITUNITunit.baidu.comUNITruyitesttest

ruyiweathercityctiy

UNIT

NLUGPSDSTDPODPLDSTDPODST

UNIT

retrievalretrieval2014

(1)

3

TF-IDFBM25CS 224NChristopher ManningNLP

ElasticSearchESHNSWPDFPPT

ESPPTESImportElasticSearchESIP172.27.1.2039201similarity_chatqa_corpus

Ensuite, le processus normal. Par exemple, nous devons d'abord initialiser un objet, un objet ES minuscule. Toutes les informations de cet objet proviennent des informations ES que nous venons de configurer, qui est le numéro de port et l'IP. Ensuite, nous voulons ajouter des données à cet ES, car nous voulons ajouter un tel lot de données à ES. Comment pouvons-nous ajouter ces données en 13 pages? Ici, nous avons une méthode de définition. Cette méthode est appelée insert_one_data, c'est ainsi que nous insérons une question et une réponse. Comment l'insérer? L'une Q&R comprend deux parties, l'une est appelée requête, et l'autre est appelée réponse, qui est un Q, A A, puis nous appelons une méthode d'index ES. Cette méthode d'index est en fait une méthode pour insérer le corpus directement encapsulé dans le corpus. Comment ça fait? Si cette base de données n'existe pas, elle générera directement une nouvelle base de données appelée ce nom et créera un tableau appelé "QA_CORPUS". Ensuite, pour chaque données, en plus de la requête et de la réponse, il s'agit de deux colonnes de données, d'une requête, d'une réponse, et génère automatiquement un ID, ce qui équivaut aux dernières données que nous générons. C'est une réponse, la troisième colonne est Id, que nous avons enregistré à l'avance de telles phrases.

Que devez-vous faire ensuite? Ensuite, nous devons effectuer une recherche. Après une question, nous avons défini une méthode appelée "similitude_chat". Le seuil. La réponse avec un degré de similitude est supérieure à 90%, le retour comme la meilleure réponse candidate. Le format du corps est une requête et ce minimum_should_match, qui est sa valeur de 90%. Ensuite, nous utilisons la méthode de recherche ES pour trouver son ensemble de candidats, et après avoir trouvé l'ensemble de candidats pour comparer ce seuil. Si tous les seuils sont inférieurs à 90% de notre conception, il renverra directement une poche, telle que sinon, réponse, Réponse Il s'agit d'une réponse de poche, puis de la réponse, il s'agit de notre méthode de mise en uvre complète.

Jetez un il au processus spécifique. Tout d'abord, l'image de gauche est les trois corpus que nous avons insérés. La requête et la réponse insérées dans les trois corpus sont "vos vêtements sont si beaux", "Merci pour vos éloges", Et puis ces deux phrases. Nous avons maintenant une question_sent est "Vos vêtements sont beaux". Nous appelons la méthode "Simility_Chat" que nous venons de configurer pour y verser ce query_sent, puis récupérer la meilleure phrase est la première. En d'autres termes, nous utilisons réellement la méthode de calcul du score de la similitude par défaut de la valeur par défaut ES ici. Cette méthode de calcul peut réellement vous dire ici. Vous pouvez modifier votre méthode de calcul car nous connaissons le degré d'appariement. Le score peut être optimisé par vous-même. Par conséquent, vous pouvez ajuster la méthode de calcul du score en fonction de votre situation réelle, puis créer un moteur de recherche plus personnalisé. Enfin, cette réponse est "Merci pour vos éloges". La méthode est brièvement introduite ici.

Pour résumer, quel est l'avantage du moteur de recherche de similitude ES? La similitude du texte elle-même a un certain support de généralisation. Par exemple, vous ajoutez un mot de ton "ah" ou "oh", ou ajoutez une virgule, ajoutez une ponctuation, qui peut jouer une meilleure récupération pan dans la recherche de similitude. Effet. Bien sûr, cette généralisation elle-même est un module plus important qui peut être dit seul. Par exemple, nos méthodes couramment utilisées sont appelées traduction automatique. Nous pouvons utiliser des méthodes de traduction automatique pour généraliser un grand nombre de phrases, afin que notre robot de chat puisse prendre en charge des phrases plus généralisées. Le deuxième point d'avantages, l'algorithme BM25 dans ES a beaucoup de poids à ajuster, et il est beaucoup plus raisonnable que la distance marginale en texte court.

L'inconvénient est également évident. Je me donne deux exemples, et tout le monde le comprend très bien. Par exemple, "vous êtes si belle", "Je pense que vous avez l'air bien", regardons la similitude de ce texte. Quels mots dedans sont la même intersection "Vous" est le même "bon", les autres mots sont différents, la sémantique est similaire, mais lorsque le caractère texte n'est pas très similaire, l'algorithme de similitude n'est peut-être pas aussi bon, mais sa sémantique est très similaire. La deuxième situation est ce qu'il faut faire? Par exemple, "Je t'aime" et "Je ne t'aime pas", cela signifie exactement le contraire, mais lorsque la récupération de la similitude du texte, si nous ne limitons pas les mots négatifs, les deux scores sont très élevés ", je suis le Des dizaines de teas comme toi "et" Je ne t'aime pas "sont très élevés, et cette situation est très difficile à faire face. Quelle est notre méthode de traitement générale? La première méthode est les règles. Par exemple, je peux définir des règles de filtrage pour les mots négatifs. Lorsque vous rencontrez "non", cela signifie l'opposé de la phrase d'origine, ou comment utiliser la méthode de sémantique de texte. La récupération de degré, nous vous dira le deuxième ensuite, comment le faire en fonction de la similitude sémantique.

(2) basé sur la similitude sémantique

Le second est basé sur la similitude sémantique. La similitude sémantique est généralement de trois étapes. Les trois de mes stratégies répertoriées ici sont trois stratégies. Je ne parle pas de quoi faire. Si vous êtes intéressé, vous pouvez lire les articles originaux tels que Word2Vec, ou regarder les modèles de langue de We Are Now Elmo, Transformer et Bert. Comment est le vecteur de mots dynamique? Je n'expliquerai pas le mot vecteur. La sortie du mot vecteur consiste à transformer un mot en vecteur, comme se transformer en un vecteur de 200 dimensions ou 300 dimensions. C'est le vecteur du mot.

La deuxième étape consiste à faire un vecteur de phrase. Par exemple, l'exemple que je viens de donner "Je t'aime" c'est trois mots. Je, comme, vous, comment pouvons-nous faire le vecteur de la phrase après avoir pris le vecteur de ces trois mots? Lorsque vous sortez, il existe des moyens, comme l'ajout de moyenne, comme la valeur du pôle vectoriel, comme le texte rapide, le saut-pensée, le thoghts rapide, qui sont récemment utilisés. Il s'agit d'une méthode très utile. Pour montrer le vecteur de la phrase. En fait, vous pouvez utiliser des vecteurs pré-formation. Par exemple, Tencent devrait avoir un vecteur de corpus à grande échelle pré-formé. Vous pouvez l'utiliser.

La troisième étape consiste à calculer la distance du vecteur. Après avoir eu deux phrases du vecteur, l'étape suivante consiste à calculer sa similitude, c'est-à-dire sa distance de vecteur. L'approche générale peut adopter le même degré de distance euro ou de la chaîne, ce qui signifie que nous obtenons un score. Ou certaines des méthodes basées sur l'apprentissage en profondeur sont les méthodes qui continuent la similitude sémantique du calcul de la similitude du texte dans notre PPT. En termes d'algorithmes de correspondance, je n'ai énuméré que certains des algorithmes les plus anciens ou les plus classiques qui ont été proposés. Si vous êtes intéressé, il existe de nombreux articles à lire, y compris récemment, il existe de nombreux nouveaux articles dans ce domaine.

Dès le premier discours, nous avons proposé deux algorithmes dans cet article dans le laboratoire Ark de Huawei en 2014. Un algorithme est basé sur l'expression et un algorithme est basé sur l'interaction. La plus grande différence entre les deux est que lorsque la phrase est calculée, l'algorithme d'expression basé sur l'expression consiste à effectuer une convolution et une pondisation de ces deux phrases, et d'obtenir son degré d'appariement via des machines perceptuelles multi-couches. L'algorithme comme Matchpyramid est basé sur l'interaction, et cet algorithme a augmenté les deux phrases depuis le début. Nous sommes équivalents à un calcul distinct. Les deux frères sont séparés d'abord, puis ils sont finalement séparés; il y a deux frères qui se frottent et se pétrisent dans une matrice. Il y a certains des opérateurs A. Tout le monde, tout le monde, tout le monde, Tout le monde, tout le monde, tout le monde, tout le monde en regardant le papier d'origine, il existe deux types d'opérateur, l'un est multiplié et l'autre maximisation. Nous utilisons ces 8 mots dans cette phrase, et chaque mot effectue une similitude avec la matrice 8 × 8. Ensuite, à ce sujet, nous le faisons. La perception finale multi-placons obtient son score final. Donc, fondamentalement, il n'y a que ces deux directions, une méthode de correspondance nommée et une méthode de correspondance interactive. Si vous êtes intéressé, vous pouvez consulter le papier en profondeur.

(3) basé sur l'apprentissage en profondeur

Troisièmement, il existe une autre méthode de récupération basée sur l'apprentissage en profondeur. J'ai choisi un article plus classique pour vous parler brièvement. L'équipe Microsoft Xiaobing a proposé une méthode en 2016, non seulement en considérant le niveau de mots, mais aussi la similitude des niveaux de phrases. Qu'est-ce que cela signifie? Pour expliquer brièvement, nous avons 4 phrases ici: u (1), u (n-1), u (n), r, il y a beaucoup de phrases au milieu, nous supposons que c'est 4 phrases, elle veut maintenant calculer U et R similitude, comment le calculer? Il intégrera chaque mot, c'est-à-dire en tant que directionnalisation, puis prendra le mot avec le mot r directement, c'est-à-dire obtenir la matrice M2. Après avoir obtenu cette matrice calculant la similitude de la chaîne de yu xian, nous obtenons la matrice de la matrice de Le M1, donc les deux matrices de M1 et M2 représentent la similitude des mots et du niveau de syntaxe, puis à travers le CNN, et un GRU, et enfin l'obtenir. Un score. C'est certains d'entre nous qui ont des méthodes de récupération en profondeur, et je ne présenterai pas en profondeur. Je viens de vous parler de la similitude basée sur le texte, de la similitude sémantique et des méthodes de récupération basées sur l'apprentissage en profondeur.

(4) Méthode d'apprentissage en profondeur basée sur la formule de génération

Le quatrième type, parlez-vous de la méthode d'apprentissage en profondeur basée sur la formule de génération. C'est le premier article, et ce devrait être un papier fabriqué par Huawei. Ce qu'ils ont fait à l'époque, c'était de générer la réponse finale directement par une phrase, c'est-à-dire, à travers x (1) à x (t), générer directement Y (1) y (1).) À y (t), ils ont proposé trois méthodes différentes. L'un est d'obtenir son contexte directement de cet état implicite, et l'inverse est d'ajouter l'attention à l'intérieur, d'utiliser cette attention pour obtenir la phrase finale, et l'autre est un contexte, et une attention au niveau des mots, ils les appellent les deux attention généré par local et mondial. Il existe également de nombreuses méthodes génératés après cela, car cette conférence est basée sur un combat réel, nous ne faisons donc pas trop d'explication en profondeur des aspects théoriques.

Conception d'architecture

Enfin, je suis arrivé à la pièce la plus compliquée. Si nous voulons utiliser notre code Python de 0 à 1 pour créer un robot de chat, comment devrions-nous le faire? La première étape consiste d'abord à concevoir l'architecture. L'architecture de ce robot de chat doit être divisée en plusieurs parties. Nous devons utiliser Python pour écrire un module DM (gestion de dialogue), puis ce module recevra des informations sur la compréhension du langage naturel (NLU). En même temps, il sera mener des phrases sur les phrases. Une analyse d'intention, en même temps, il choisira une fonction basée sur les résultats de l'intention, comme s'il s'agit d'un dialogue de tâche, d'un dialogue fonctionnel, d'une question et d'une réponse, ou d'un chat. A une manière différente de traitement. Module, il s'agit d'une architecture simple de l'ensemble du robot de chat.

: nlu Nlg. Pourquoi ne pas parler de fonction et de discussion? La fonction suppose que vous pouvez utiliser directement les packs de compétences de Ruyi et Unit, et nous ne le développerons pas. J'ai également parlé de discuter tout à l'heure. Nous avons utilisé la méthode de récupération pour discuter. Nous avons utilisé de nombreux corpus pour faire un chat de type Search. Ceci est la conception d'architecture que nous disons.

NLU

Le premier point, comment faire NLU. Laissez tout le monde, il n'y a pas de code dans NLU, pourquoi n'y a-t-il pas de code? Parce que de nombreux projets open source font du NLU, NLU est en fait beaucoup de modules. Au moins, il y a plus d'une douzaine ou vingt modules que nous utilisons maintenant. Qu'est-ce qu'il inclut ici? Mots, marques de mots, dépendance, analyse émotionnelle, liens physiques, découverte physique, troubles sémantiques, reconnaissance du sujet, jugement de l'efficacité des phrases, etc. Ce n'est pas une leçon qui peut être terminée. Mais je vous suggère, si vous voulez vraiment réaliser un robot de chat de manière simple, pourquoi avons-nous de bonnes choses? La segmentation des mots jieba est un très bon projet open source. L'Académie chinoise des sciences a également un NLPIR. HARBIN Institute of Technology a un LTP. Stanford a Corenlp. Nous avons également les sacs NLTK les plus classiques, ainsi que HanLP et Allenlp. Si vous le faites vous-même, c'est très ennuyeux si vous le faites vous-même. Par exemple, si vous divisez les mots et comptez seul, vous passerez trop de temps. La meilleure façon est d'utiliser les choses de quelqu'un d'autre. J'ajouterai une partie de ma propre personnalisation. C'est ce que je veux vous en dire.

Intention

Le deuxième point consiste à classer. Je veux vous parler le moyen le plus simple de mettre en uvre l'intention de l'intention. Il existe plusieurs types de classification de toute la méthode. Par exemple: méthodes traditionnelles, dans les méthodes traditionnelles, nous pouvons utiliser des fonctionnalités, utiliser certains classificateurs, puis directement À cette intention, comme nous, comme les États-Unis, utilisez l'arbre de décision ou SVM pour classer directement la phrase. Bien sûr, il peut être classé par des méthodes de profondeur, telles que CNN ou CNN + LSTM. L'image de droite est une méthode de classification profonde. C'est un mot après une intégration. Je suis un mot. C'est un vecteur de 5 dimensions. Ceci est un exemple. Ensuite, chaque mot a un mot. Après avoir pris cette matrice, Nous aurons des opérations de convolution et de mise en commun. La dernière chose que nous obtenons est un deuxième résultat de classification. Cela se fait également en utilisant l'apprentissage en profondeur. Mais que devons-nous considérer d'autre dans l'ingénierie? Il est également nécessaire de déterminer si nous sommes deux catégories, plusieurs catégories ou classification hiérarchique. Deux catégories sont simples, 1 et 0. La multi-classification est également très simple, par exemple, il y a une "neutralisation" dans les émotions. La classification du niveau est relativement compliquée. Par exemple, nos produits ont cinq couches de classification et plus de 300 intentions, donc lorsque je le fais, quelle méthode peut garantir qu'il a un rappel relativement élevé. C'est le problème que nous devons faire dans le projet, et c'est en fait très compliqué.

Ensuite, je vais vous expliquer comment classer l'intention des règles et méthodes. Il est très précis de classer l'intention de mettre en uvre l'intention des règles, mais son inconvénient est que nous devons couvrir chaque phrase. Le modèle deviendra Très difficile à maintenir, ce qui est son désavantage. Jetons un coup d'il à la façon dont les règles le font. Par exemple, je donne un dossier ici pour trois intentions différentes, l'une est "raconte des blagues", l'une est appelée "idiome de connexion des dragons", et l'une est appelée "temps". Les règles correspondantes sont écrites comme celle-ci, comme "une blague", qui peut être couverte. La suivante est la même.

Comment faire? Jetons un coup d'il qu'il existe deux fonctions à droite. La première fonction est appelée build, et la deuxième fonction est appelée Intent_Recognition. Le rôle de cette fonction est de compiler régulièrement et la compilation régulière devrait être très claire. Si nous pré-compilé les expressions régulières, nous pouvons accélérer efficacement la vitesse de correspondance régulière. C'est une compilation. Je n'en parlerai pas. La seconde consiste à classer la classification. S'il y a une requête, le candidat_list était vide au début. La longueur de la chaîne se classe à l'intention. En d'autres termes, il peut correspondre à différentes intentions. Pour le moment, nous devons trier les intentions en fonction de la longueur de la chaîne qu'il correspond, et enfin le candidat est trié et sorti. Un morceau de code.

God Medicine: FastText

Si vous ne voulez pas être aussi gênant, il existe un médicament magique qui guérit toutes les maladies appelées FastText, qui est une méthode de classification largement utilisée par la communauté d'ingénierie en 2018. Bien sûr, cette méthode est remplacée par des algorithmes plus avancés tels que Bert et Elmo, Transformer, et ce n'est pas une transcendance. Tout le monde le fait toujours ensemble, parfois lors de quelques méthodes d'empilement, nous utiliserons également Bert ou New GPT. Cependant, l'effet de FastText lui-même est très évident sur la classification de l'intention, et parce qu'elle est basée sur la corde, ses performances sont également très élevées. "Ce médicament magique qui traite toutes les maladies", cette médecine divine joue un très grand rôle dans La classification du monde de l'ingénierie.

Voyons à quel point FastText est utilisé, c'est très simple! Son code est très simple. Nous devons seulement préparer des ensembles de données avec des balises classifiées. Les ensembles de données classifiés sont divisés en bons mots. Par exemple, l'étiquette de cette phrase est la météo, l'étiquette de cette phrase est la musique, l'étiquette de cette phrase est une nouvelle. Nous avons préparé des dizaines de milliers d'ensembles de données pour le diviser en le diviser en le diviser en Il en y attend en lui divisant. Formé, il peut être utilisé directement avec les trains. C'est une formation. Comment l'utiliser? Nous avons mis en avant le modèle, puis nous sommes allés à l'étiquette de la prévision, puis l'étiquette de retour se termine. FastExt est un algorithme d'utilisation très facile.

DM (gestion du dialogue)

Le troisième point, la partie suivante a commencé à parler de DM. Le code de DM n'est pas publié ici car c'est trop compliqué. Permettez-moi de vous dire comment l'ensemble du cadre est réalisé. DM contrôle le dialogue. Dans de nombreux cas, plusieurs cycles de contrôle du dialogue. J'ai donné ici un dialogue multi-zones typique. Le temps de dialogue était à 8 heures le 21 mars. Son intention était la météo. Essence Après avoir tiré ces informations, nous répondrons à quoi ressemble le temps à Shanghai le 17 mars. Est-ce qu'il pleut? Il s'agit de la première phrase de l'utilisateur demande. Ce qui suit est le même.

La deuxième phrase de l'utilisateur a demandé "Quelle est la météo à Shanghai aujourd'hui", donc sa réponse finale est le temps à Shanghai le 21 mars. L'utilisateur de la troisième phrase a dit un non pertinent. L'utilisateur a l'impression que le temps est très mauvais aujourd'hui. Que dois-je faire? Il a dit: "Ne sortez pas demain." Pour le moment, nous avons commencé à dire le point. Le fait est que lorsque l'utilisateur a dit dans la quatrième phrase: "Et demain, que dois-je faire?" Après avoir examiné son processus de traitement, la phrase "demain" est entrée dans l'analyse de l'intention, nous avons constaté que l'intention normale de cela phrase Le score est très faible, c'est-à-dire que ce n'est pas comme une intention normale. Nous avons déjà chargé le contexte lorsque l'intention est jugée, c'est-à-dire le journal ci-dessus. Pour le moment, nous utilisons le modèle de classificateur pour juger ou utiliser certaines règles. Le juger peut appartenir à une certaine intention multiple. À laquelle appartient à cette intention multiple? Nous allons trouver cette fenêtre. Il y a deux fenêtres, l'une est appelée la fenêtre temporelle, et l'autre est appelée la fenêtre du numéro de roue. Il est de 5 minutes et les données en 5 minutes seront capturées. Une fois ces données capturées , nous jugeons que c'est en effet une phrase ci-dessous. Après cette phrase, nous avons rempli la fente. "Demain", nous avons jugé qu'il demandait la météo. Quelles sont les informations de la machine à sous de cette météo? Demain est des informations sur le temps, où est l'emplacement? L'emplacement, nous avons directement utilisé les informations de rainure de l'endroit où il a demandé la météo lors du tour précédent. Donc, à la fin, nos informations sur les emplacements sont en fait "Shanghai", et le temps est "22 mars", qui est le temps à Shanghai demain. Utilisez la machine d'état ici, puis décidez quel type d'opération nous faisons ensuite, il passera par les étapes DST. Dans le même temps, après avoir répondu, nous avons également ajouté ces journaux à la base de données du journal du journal, et avons finalement renvoyé une conversation. Il s'agit du processus de fonctionnement de DM.

Dialogue basé sur des tâches spécifiques

Le quatrième point est un exemple de dialogue basé sur une tâche spécifique. Il existe de nombreux codes de tâches spécifiques. Il n'y a aucun moyen de le coller, alors publiez simplement les modules les plus élémentaires. Par exemple, nous aurons d'abord une restriction sur la fente, comme la date de l'heure, y compris "aujourd'hui | demain | Temple | cette semaine | la semaine prochaine", etc. Emplacement, quand il y a une telle question, nous allons d'abord Prenons l'intention d'identifier l'intention-reconnaissance, nous identifierons cette requête. Si cette intention est la météo, elle entrera d'abord dans une extraction de la machine Et le lieu, nous avons donc une telle fonction pour pomper ses informations de temps et de place. Ensuite, après l'extraction de la fente, nous devons demander l'interface météo. Pour le moment, par exemple, nous utilisons la météo SINA, et il y a un service de météo SINA. Nous devons utiliser cette date et locale dans un tel temps, Il s'appelle météo.

Module de questions et réponses

Fifth Point, introduisez ensuite le module de questions / réponses dans le module tout à l'heure. Parlez simplement de la méthode de question et de réponse basée sur le module, il y en a plus, comme une analyse sémantique basée sur la portée de ce cours. Que faites-vous en fonction du modèle? Par exemple, l'utilisateur a demandé: "Aimez-vous regarder One Piece?" Cette phrase utilise la méthode de traitement du modèle pour correspondre d'abord à cette bibliothèque de modèles. Elle correspondra à cette phrase dans la bibliothèque de modèles la plus proche de qui. Après correspondance, nous aurons un dictionnaire d'anime. Il appartient à un seul morceau. One Piece appartient au type d'anime de divertissement, donc enfin une déclaration de réponse correspondante.

Comment faire? C'est le processus, et son approche est comme ça. Nous maintenons d'abord un ensemble de bibliothèques de modèles régulières, telles que "You Like (. *)". Cette bibliothèque de modèles régulière est d'environ des milliers ou des centaines. Lorsque la phrase entre, il est correspondra à tous les habitués de la bibliothèque de modèles ordinaire. Par exemple, la régularité régulière correspond à la phrase "vous aimez", puis tirez la partie de "vous aimez", c'est-à-dire "regardez une pièce?" ont été extraits comme candidats. Le candidat doit inclure des adjectifs, des ponctuations et des mots dénués de sens, comment les supprimer? Nous avons adopté une méthode appelée Triematch. En fait, nous pouvons utiliser la méthode la plus communément adaptée à la correspondance. Nous correspondons enfin au dictionnaire appelé "One Piece" dans le dictionnaire, puis nous dessions les mots clés "One Piece" dans le texte, "One Piece" appartient à Anime Dictionary, puis donne aux utilisateurs une réponse, ce qui est une explication simple ici.

Instance de génération de langage naturel (NLG)

Enfin, parlons de la génération du langage naturel. En d'autres termes, lorsque nous répondons, il est impossible de le laisser répondre à la réponse que nous avons trouvée. Prenant le temps comme exemple, le résultat final du temps est généralement la température de l'air et le temps est. Je ne peux donc pas répondre directement à l'utilisateur pour dire "nuageux, 10 degrés, 15 degrés", je veux vraiment répondre à une phrase très naturelle. C'est comme ceci: par exemple, nous l'avons conçu par la réponse météorologique par temps. ". Nous pouvons voir que lorsque nous avons un tel slots_info, lorsque nous avons des degrés "nuageux, 10-15", nous pouvons directement faire de ces 4 informations en une phrase. Cette phrase peut être "le temps d'aujourd'hui est le temps est aujourd'hui. La température minimale est de 10 degrés, la température maximale est de 15 degrés, le temps est un peu froid, le propriétaire porte un manteau mince ", c'est la génération du langage naturel. Code.

Pour résumer, comment est-ce que notre cadre entier est réalisé? première, NLU , Nous utilisons Jieba pour diviser le mot, Harbin Institute of Technology LTP; Une analyse Nous pouvons utiliser FastText ou Bert; NLG Nous utilisons la méthode de configuration pour faire; DM Nous écrivons avec Python par nous-mêmes; Dialogue de mission Nous utilisons des règles pour mettre en uvre; module fonctionnel Nous sommes prêts; Module de questions et réponses Nous utilisons des modèles; Module de potins Nous utilisons une méthode de récupération, afin que nous puissions réaliser un robot de chat très simple. C'est la partie principale d'aujourd'hui.

L'application et le chemin technique de la carte des connaissances dans la vie virtuelle

Ensuite, je vous parlerai des informations sur la carte des connaissances, et la technologie de base du robot de chat est sur le point de vous parler.

Parlez du test de Turing. Le robot de chat est maintenant très pauvre, mais en 2014, j'ai toujours réussi le test de Turing. Le test de Turing lui-même était un Turing inventé dans les années 1950. En 5 minutes, je suis seul. Il y a un mur. Je ne sais pas si là est un ordinateur du côté opposé. Je lui parle pendant 5 minutes. Si 30% des personnes participant au test sont trompées, je dis que cet ordinateur a réussi le test de passe. En fait, cette norme de test est très subjective. Nous pouvons utiliser de nombreux voyages pour contourner ces paramètres. Donc, en fait, le test de Turing ne reflète pas vraiment l'intelligence du robot, car quelle est la source du test de Turing? Vous avez peut-être entendu cette histoire. Turing est un test homosexuel, donc Turing est tout test quotidien que chaque homosexualité au Royaume est la première raison du test de Turing. En fait, c'est une histoire tragique. En fin de compte, Turing s'est engagé à se suicider en raison de la castration chimique puis de la dépression. C'était dommage. Donc, la raison pour laquelle nous en avons parlé est que même si nous pensons que même le robot de chat a réussi le test de Turing, il ne représente pas un effet vraiment intelligent.

Nous allons donc penser à: puisque ce robot de chat fait tellement, comment pouvons-nous améliorer son expérience et son effet? L'une des façons dont nous pensons est de donner de la personnalité et de l'IP au robot de chat, comme Big White, comme R2D2, comme les extraterrestres, il semble que ce soit Ai, ce film, "Western World", pouvons-nous mettre ces images Dans le chat, allez dans le robot, c'est ce que nous voulons faire.

Un produit de deuxième génération que nous avons fait autrefois est de savoir comment faire un robot de chat plus d'expression de la vie. La vidéo n'est pas lue à cause du temps. Nous avons donc une définition relativement complète de la vie virtuelle. Nous l'appelons "la vie virtuelle". En plus des capacités les plus élémentaires des robots de chat, il a également certains aspects de la capacité, c'est notre effet sur la vie virtuelle. La définition est que nous voulons qu'il interagisse avec un état multi-formes et multi-modes, a une forte perception et une capacité cognitive et réaliser davantage la conscience de soi et l'auto-évolution. Ceci est notre résumé de la technologie globale de la vie virtuelle. Nous pouvons voir qu'en plus des images, de l'acoustique et des interactions cognitives, nous avons également divers gestes, émotions, paroles, chant, multi-caractères, identification émotionnelle, recommandation active, etc. . La capacité.

Comment réaliser ces capacités? Ces trottoirs devant nous sont de diriger le contenu dont nous voulons parler ensuite, appelé "Connaissance Map", comment vraiment laisser le robot de chat avoir notre propre réflexion, compréhension et capacité de raisonnement, c'est ce que nous recherchons les connaissances La technologie de la carte que nous étudions. Apportez-nous ce à quoi nous pouvons nous attendre. Nous savons que à l'ère de l'apprentissage en profondeur et des mégadonnées, l'apprentissage en profondeur et les mégadonnées utilisent sa puissance de calcul et utilisent ses données, qui peuvent être perçues, comme la reconnaissance d'image, la reconnaissance vocale et la synthèse vocale. Mais lorsque vous rencontrez des problèmes Cela doit être pensé, l'apprentissage en profondeur doit être raccroché. Pour un exemple simple, par exemple, M. Xiao Yanghua a donné un exemple classique: "Je mets les ufs dans le panier, l'uf est-il grand ou le panier?" Le bon sens et le raisonnement, donc le problème des gros ufs est toujours le Question des gros paniers. De plus, je peux également poser une question: "Quelle est la nationalité de la mère de la mère de Yao Ming?" Je pense que le robot de chat actuel sera étourdi sans exception, parce que le mari de la mère de la mère de la mère de la mère de la mère de Yao Ming est en fait Yao Ming , mais le robot n'a aucun moyen de comprendre un message aussi compliqué. Mais pour le moment, si nous avons une carte de connaissances aussi riche, nous pouvons réellement mener un raisonnement raisonnable, y compris le raisonnement de bon sens.

L'ensemble du processus de la carte des connaissances

Ensuite, nous commencerons à introduire le processus global de la carte des connaissances. L'ensemble du processus de la carte des connaissances est clairement écrit sur cette image. En bas se trouve le traitement des données de trois types de données différents (structurés, semi-structurés, non structurés). Voici une variété de méthodes telles que la représentation des connaissances, la fusion des connaissances, l'extraction des relations, l'extraction d'événements, la classification physique, la classification des attributs et d'autres méthodes. Pour établir notre propre carte de connaissances, notre propre carte de connaissances est appelée "sept rythmes", j'ai donc écrit les mots "sept rythmes" ici. Après avoir établi ces cartes de connaissances, nous pouvons imaginer qu'elle peut faire de nombreuses applications, telles que les questions et réponses, le raisonnement, l'association, la recommandation, et donc le "plancher" et la lecture de la machine, afin que cette carte de connaissances puisse vraiment devenir une application de connaissances.

Source de connaissances

Tout d'abord, parlons de la source des connaissances. Notre source vient de Baidu, Interactive Encyclopedia, Zhihu, Sina, Wiki et Meng Niang Encyclopedia. Pourquoi y a-t-il Meng Niang Encyclopedia? Les produits que nous nous sommes fabriqués sont biaisés vers deux dimensions et divertissement, donc lors de l'établissement d'une carte de connaissances, nous devons établir une carte de connaissances selon notre propre domaine. Nous sommes très utiles, nous avons donc mis en place un ensemble de cartes de connaissance Vers deux dimensions.

Représentation

Ensuite, les connaissances représentent que nous savons tous que les connaissances doivent être stockées d'une certaine manière. En plus de la carte plus intuitive, nous avons également cette façon de représentation du RDF. Vous pouvez comprendre qu'il s'agit d'un groupe à trois yuans, de la femme de Trump Est Melania, la fille de Trump est Ivanka, en fait, il y a deux entités. La relation entre Trump et Melania est une relation de femme. La femme de Trump est Melani Ya, c'est ce que nous exprimons des connaissances. Donc, après avoir géré les connaissances en bas, nous ferons une représentation des connaissances nécessaires.

Connaissances

Ensuite, ce PPT vous a parlé de l'achèvement des connaissances. Comment les connaissances ont-elles été complétées? Permettez-moi de vous donner un exemple. Par exemple, la femme de Chen Daoming est du Xian. Nous sommes allés vérifier l'entrée de Chen Daoming dans l'encyclopédie. Nous constaterons qu'il a un message que sa femme est du Xian, mais lorsque nous avons vérifié Du Xian On a souligné Chen Daoming, alors si nous avons un système de connaissances, il sera limité si une personne est le mari d'une autre personne, alors cette personne doit être l'épouse de cette personne. Cette logique ne devrait pas être erronée? Cela peut être faux, pourquoi? Si les deux sont des hommes, ou si les deux sont des femmes, c'est un problème. Mais nous supposons que cela n'existe pas. Nous supposons que si une personne est la femme d'une personne, alors cette personne doit être le mari d'une autre personne. Ainsi, avec ce système de connaissances, nous pouvons compenser un côté. Par exemple, le mari de Du Xian est Chen Daoming. Cet avantage peut automatiquement inventer. Le mari de Ferida est Cheng Yuan, donc la femme de Cheng Yuan n'est que l'épouse de la femme de Cheng Yuan est Ferida, avec de tels moyens, peut maintenir l'achèvement des connaissances, ce qui doit également être fait pendant le pré-processus.

Expansion des connaissances

Qu'est-ce que l'expansion des connaissances? Autrement dit, nous avons appris des relations inébranlables et rejoint la carte des connaissances. L'exemple que je lui donne peut être inapproprié, car cette relation a déjà existé, je parle juste de la façon dont cette méthode est effectuée.

"Le 1er octobre 2015, Liu Qiangdong et la sur du thé au lait ont organisé un mariage en Australie." Il y a une relation dans cette phrase. Quelle est la relation? Liu Qiangdong et The Milk Tea Sister sont une relation mari et femme, puis nous trouvons le vrai nom du thé au lait dans la base de données à travers des liens physiques, afin que nous puissions établir une relation mari et femme entre Liu Qiangdong et Zhang Zetian directement, et prendre directement Pour cela, les connaissances s'étendent à notre carte de connaissances existante, c'est ce que nous appelons le contenu de l'expansion des connaissances.

Nouvelle découverte de connaissances

La nouvelle découverte des connaissances est également une chose que nous devons faire, car nous savons que les changements de connaissances sont vraiment trop rapides. Nous avons de nombreuses connaissances chaudes récemment pour rafraîchir notre cognition. Que signifie "Yu Sanjia"? Fait à l'origine référence aux trois grandes familles à l'extérieur de la famille de Tokugawa, qui peuvent maintenant y faire référence, telles que les trois émoticônes asiatiques: Yao Ming, directeur du musée d'or, Hyogo North, ce genre de Royal Three. Il y a aussi "Pharaon d'à côté". Le pharaon d'à côté fait référence au pharaon d'à côté. Maintenant, il a un sens qui est également appelé "papa biologique". C'est aussi une nouvelle découverte de connaissances. Nous allons trouver quelque chose. "Sacrifier le ciel" est également très chaud l'année précédente. La vidéo de la tempête, mais je pense que c'est très intéressant. Le sacrifice est un rituel qui retient les utilisateurs en tuant des programmeurs et des chefs de produit. C'est en fait une nouvelle explication des anciens mots. En fait, lorsque nous découvrons de nouvelles connaissances, nous devons découvrir de telles nouvelles connaissances. Que dois-je faire après avoir eu ces nouvelles connaissances? Il est mis à jour plus tard. Nous avons deux mises à jour. La première méthode de mise à jour est incrémentielle. Lorsque nous trouvons un mot aussi chaud, nous augmenterons la mise à jour incrémentielle des entités qui l'entourent; l'autre est la mise à jour complète, par exemple la mise à jour mensuelle de la carte des connaissances est mise à jour , parce que son coût est assez important, la mise à jour des connaissances est également une partie indispensable de notre carte des connaissances pour assurer la fraîcheur de la carte des connaissances.

Q&R basée sur la carte des connaissances

Une question et une réponse basées sur la carte des connaissances est une application de la carte des connaissances. L'exemple de cela avec vous est la question et la réponse de cette carte de connaissances basée sur le sémantique. Nous pouvons voir que l'ensemble des questions / réponses intègre divers modules de traitement du langage naturel et synthétise également les champs de connaissances que nous avons impliqués dans la carte des connaissances.

Quelle est la nationalité de la femme de Trump? Tout d'abord, nos entités attireront "Trump". "Trump" fait référence au mandarin du Sichuan? Ou fait référence à Trump? Ici, nous avons besoin d'une cartographie, d'une entité pour éliminer le dysfonctionnement, et à la fin, nous l'obtenons fait référence à Trump. La norme correspondante de "femme" est "conjoint", "nationalité" est "nationalité", "?" Est "? X", nous combinerons cette sémantique, comme le conjoint de Trump "? Y" est "?" La nationalité de "? Y" est "? X", et le dernier de nous est "? X", donc il écrira de cette façon, "sélectionner la distribution? X" Où, quelle est la condition limitée? La nationalité de "? Y" est "? X", et la restriction du conjoint de Trump est "? Y". En fin de compte, nous obtenons le conjoint de Trump, et la nationalité de Melania est les États-Unis, donc à la fin La réponse est "États-Unis". Pour des détails spécifiques, vous pouvez étudier la carte des connaissances basée sur l'analyse sémantique. Beaucoup de technologies, y compris les mots, le polymarrage, le NER, l'extraction relationnelle, etc., ne sont pas la portée de notre discussion sur les leçons.

Autres problèmes d'atterrissage d'ingénierie

Nous pensons que nous avons maîtrisé beaucoup de connaissances PNL, de nombreuses technologies KG et que nous avons des méthodes d'ingénierie, et je pense que je peux fabriquer de très bons produits. Mais comme cette image est vue pour tout le monde, quels sont les oiseaux, j'ai aussi oublié d'être des canards sauvages ou ce qu'il est. Il a glissé quand il a atterri sur la glace. C'était vraiment complètement différent de ce que nous imaginions. Par conséquent, il existe de nombreux facteurs qui doivent être pris en compte lorsque le projet atterrisse. Ce n'est pas seulement un problème technique. La technologie ne peut être qu'une très petite partie de notre produit entier. Nous devons considérer qui ce produit est vendu et comment vendre, puis nous devons considérer l'architecture de performance de l'ensemble du système.

Nous utilisons le chat et les réponses de récupération, ou faisons des questions et réponses interactives multimodales. En même temps, nous devons considérer ce qu'il ressemble à une entrée logicielle et à une entrée de main-d'uvre, à une entrée de main-d'uvre et à des conditions de marché. Surtout maintenant le robot de chat lui-même n'est plus le marché de la mer Rouge, et c'est déjà le marché du sang. Tout le monde a vraiment fait le sang sur ce marché. Si tout le monde veut toujours entrer sur le marché sous la forme d'un simple robot de chat, quoi Une sorte de compétition sera confrontée? Le petit locuteur de Xiaomi de 49 yuans sera confronté, les elfes tmall de 79 yuans seront confrontés, des camarades de classe Xiaomi Xiaoli de 199 yuans seront confrontés, et le petit degré de 299 yuan baidu est à la maison. Alors, comment faire l'ingénierie et la productibilité est également une question qui nécessite notre logique d'entreprise.

Conclusion

En fin de compte, nous avons retardé tout le monde pendant 2 minutes. Permettez-moi de parler brièvement de ce que nous faisons. Ce que nous faisons, c'est de discuter des robots. Le processus spécifique ne vous dira pas. Tout d'abord, le fils Xiaobai. En août 2018, nous avons lancé un tel nouveau produit appelé Amber. Il s'agit d'un haut-parleur de chat intelligent de la projection holographique. À l'avenir, les utilisateurs peuvent interagir directement avec Ye XIU via des robots, puis consulter certaines de ses actions. En décembre 2019, à la fin de cette année, nous lancerons une star masculine. Cette star masculine devrait être les 10 meilleures stars masculines de notre trafic domestique. La petite star masculine de niveau de viande fraîche, nous espérons également que tout le monde fera attention à nos produits.

Notre institut de recherche sur l'intelligence artificielle a été créé à Shanghai. Les experts incluent également les enseignants Zhang Min et le Dr Wang Hao Fen. Nos membres viennent de diverses universités bien connues. Ils ont également créé un laboratoire conjoint avec l'Université de l'Est et l'East Chine Normal University. Le moteur s'appelle le moteur "donné".

Ceci est ma dernière page. Vous parlez quelques mots supplémentaires. Le moteur de toute notre vie virtuelle comprend plusieurs niveaux: nous avons en fait fait beaucoup de choses sur la couche de données, y compris les cartes de connaissances, y compris l'analyse de base et les plateformes d'exploitation; Middle Dans la couche, nous ferons de l'intelligence cognitive, de l'intelligence de la perception, comme le son, l'image, la reconnaissance du visage, la reconnaissance émotionnelle et une intelligence cognitive telle que le raisonnement, l'association, la mémoire et l'émotion;, la maison intelligente, les questions multi-modes et Réponses, etc. En fin de compte, nous pouvons également fournir des points d'accès aux plates-formes ouvertes pour permettre à chacun d'accéder à certaines de nos fonctions.

Merci pour votre soutien, et c'est ce que mon cours parle.

QA

Question 1: Un système de dialogue comprend tant de contenus. Il est préférable d'utiliser le système final-end, ou vaut-il mieux le diviser étape par étape? Je pense que la quantité d'ingénierie est excellente.

Shao Hao : Regardez votre objectif. Si vous voulez faire des objectifs de recherche, il faut terminer. Si vous écrivez la thèse, vous devez y mettre fin. Ceci est hors de tout doute. L'ingénierie doit toujours être facile à utiliser, donc le principe de l'ingénierie est d'utiliser le moyen le plus simple pour obtenir l'effet autant que possible; sinon, nous pensons à d'autres méthodes.

Juste à l'heure, je parle de deux niveaux. Si vous voulez apprendre l'ingénierie, vous utilisez toujours ces règles pour le faire par vous-même; si vous voulez faire la thèse, vous vous concentrez toujours sur la thèse et le système de fin.

Question 2: L'enseignant, la carte des connaissances est-elle importante dans le système de dialogue? Est-il plus utilisé maintenant?

Shao Hao : Important, mais pas grand-chose maintenant, pourquoi? Ce que vous avez dit, c'est la carte des connaissances dans le système de dialogue. La carte des connaissances est encore très importante dans le système de questions / réponses. Nous utilisons toujours beaucoup de cartes de connaissances dans le quiz basé sur la carte des connaissances, mais dans d'autres modules fonctionnels, j'en ai juste parlé, comme les potins, comme la boîte de dialogue Task pas beaucoup. Et le monde de l'ingénierie n'est pas particulièrement utilisé dans la carte des connaissances.

Question 3: Si vous appuyez sur le mot-clé dans la fente dans DM, mais qu'il n'y a pas de date et d'heure de retour, il renverra la question correspondante à l'utilisateur. Veuillez compléter la date et l'heure. Ce problème est-il également défini manuellement?

Shao Hao : Ce problème a été défini avant d'aller faire cette tâche. Par exemple, je lui donnerai quelques rainures, l'une s'appelle "l'heure" et l'une s'appelle "Date". Je vais lui donner quelques emplacements: départ, destination, heure de départ, vol, aéroport. Ainsi, en fait, vous pouvez tâche qu'il est artificiellement défini. Cette question est simplement répondue, qui est définie manuellement.

Question 4: Si l'objectif est de stocker, de dessiner et de raisonner à partir de la base de données non relationnelle. Ce stockage est-il stocké dans SQL ou NOSQL?

Shao Hao : Comme Jena, MongoDB, DOM4J, nous devons choisir une implémentation de base de données différentes dans le projet en fonction de la scène spécifique. Pour être honnête, MySQL est vraiment très facile à utiliser dans certains scénarios, ainsi que MongoDB et ES. Cette base de données est parfois très efficace que la base de données du diagramme. Par conséquent, il est nécessaire de déterminer quelles fonctions doivent être implémentées en fonction du scénario d'ingénierie spécifique.

Question 5: L'effet de l'algorithme actuel n'est pas aussi bon que l'effet régulier ou de modèle. Alors, comment choisir?

Shao Hao : Il s'agit d'une méthode de fusion. Nous avons également un grand nombre dans notre système de robot de chat, mais nous concevons des stratégies multi-réparties. Par exemple, nous ferons quelques stratégies lorsque nous nous préoccuperons de l'identification. Nous aurons des règles avant l'intention. Si l'exactitude des règles peut être couverte est la meilleure, si elle ne peut pas être couverte, nous utiliserons des méthodes d'apprentissage en profondeur pour Classifier l'intention de classer l'intention de la classification. La méthode de fusion (empilement), nous jugerons de manière approfondie si le modèle avec les points les plus élevés sera sélectionné après l'intégration.

Et lorsque nous faisons cela, nous retournons généralement TOP3 ou TOP5. En même temps, si nous constatons que cette intention ne peut pas être poursuivie, nous avons un module "refus" ". Refus", cela devrait être sélectionné en fonction de l'effet de le produit.

Question 6: Identifiez-vous intentionnellement toutes les règles de l'intention de l'édition manuelle? Est-ce qu'il y a un autre moyen?

Shao Hao : L'exemple que je viens de donner a été utilisé par des règles pour identifier, mais il y avait un PPT derrière moi que l'intention d'identifier est en fait une méthode de fusion, afin que vous puissiez d'abord avoir des règles, puis utiliser des méthodes d'apprentissage en profondeur plus tard pour utiliser un peu de profondeur Méthodes d'apprentissage. FastText que j'ai mentionné tout à l'heure peut également être classé par cette intention, mais il existe une grande quantité de données pour la supervision et l'apprentissage.

Question 7: Comment tester automatiquement l'effet du robot de chat?

Shao Hao : Regardez les critères d'évaluation. Nous aurons nos propres normes d'évaluation à leurs propres. processus. Le nombre de roues, le temps d'apprentissage, le dialogue, le naturel de la voix, etc., seront utilisés comme effet de test des robots de chat. Par conséquent, il n'y a pas de méthode très précise et stricte pour tester et discuter des robots. Si vous voulez vous y référer, il y a beaucoup de ces robots de chat dans le monde académique. Il existe de nombreuses évaluations. Vous pouvez jeter un il. Notre livre a également une méthode d'évaluation.

Question 8: Quelle méthode est bonne pour la classification après l'intention d'identifier? Lancez directement de haut en bas au domaine ou au bot, ou le contrôle central distribuant-ils d'abord et collecte-t-il les commentaires?

Shao Hao : La pratique de chaque bot n'est pas la même. Le domaine que vous avez dit est en fait une classification à deux niveaux. Nous sommes une classification à cinq niveaux. Notre approche adoptera une stratégie à deux couches. Nous faisons d'abord une classification approximative, puis avons un résultat TOPK, puis distribuons le résultat de ce topk au sous-module k pour l'exécution. Chaque sous-module est équivalent à un compétitif Relation. Après avoir posé ces problèmes, je me suis donné des commentaires. Par exemple, je suis un module musical. Mes commentaires DM sur moi sont que je pense que je fais de mon mieux. Je marque 10 points pour moi. Si vous êtes prêt à accepter cette partition. Ensuite, DM contrôlera le contrôle central, puis déterminera ce que j'ai collecté. Par exemple, après avoir collecté la rétroaction de tous les modules à 500 millisecondes, puis décidez quel module retourner. Celui-ci n'est donc pas le même selon le système de chaque bot.

Question 9: Si le test de Turing ne peut pas refléter la nature avancée des robots de chat, quel test est utilisé pour tester les performances?

Shao Hao : C'est la même chose que le problème que je viens de dire. La communauté universitaire a plus de données d'évaluation. Vous pouvez faire attention à ces compétitions et voir comment les cercles théoriques font.

Question 10: Si vous rencontrez plusieurs intentions lorsque vous rencontrez une requête dans la reconnaissance, comment devrait-il être mieux?

Shao Hao : Nous avons en fait Topk, qui sera jugé par son score final.

Question 11: La NLU fera-t-elle du pré-procédure?

Shao Hao : Oui, vous le ferez certainement, et tous sont des modules distincts, tels que les mots de tonalité et la normalisation, qui sont fabriqués par des modules distincts.

Question 12: Comment faire le sens du mot?

Shao Hao : Il existe différentes méthodes pour la signification du mot sens, il existe des règles, ainsi que des règles. Par exemple, sur la base de la chaleur, par exemple, lorsque nous parlons de "737", il peut se référer à 737-800 ou 737max. À l'heure le temps que vous pouvez utiliser la chaleur pour disparaître. Il existe de nombreuses façons de disparaître. Nous pouvons utiliser le contexte, la chaleur et les contributions. Cela peut être utilisé.

Question 13: La performance sera-t-elle améliorée dans le champ vertical et utilisera la carte des connaissances?

Shao Hao : Il y aura certainement, car nous avons également réalisé de nombreux projets verticaux similaires au gouvernement et aux traitements médicaux, et l'utilisation de cartes de connaissances améliorera considérablement son effet de question et de réponse. Ce sera certainement.

Question 14: Le lien pour gérer le robot est très long. Comment équilibrer la qualité de la vitesse de réponse et la qualité du module de liaison?

Shao Hao : Cette question est très bonne, car nous avons maintenant un problème très grave dans le robot de chat appelé "Transmission d'erreur". Si vous avez plus de modules en série, ce sera très mauvais pour l'erreur. Lorsque nous équilibrons, nous devons configurer un "délai d'expiration" en fonction de la situation spécifique. Par exemple, lorsque certains modules sont traités en parallèle, nous choisirons la gestion de celle sans délai et le meilleur effet.

Question 15: Comment mesurer la qualité de l'émotion?

Shao Hao : Nous avons nous-mêmes un système à trois couches, environ 27 normes de jugement. Cela peut également être jugé en fonction de la situation spécifique. Il n'y a aucun moyen de donner un indicateur standard.

Question 16: Existe-t-il un indicateur pour déterminer les avantages des réponses de chat?

Shao Hao : L'un des indicateurs les plus directs est de voir si l'utilisateur est prêt à vous parler. Xiaobing a en fait proposé de nombreux indicateurs, tels que le nombre de roues que les utilisateurs vous parlent comme indicateur.

Question 17: Comment est la classification de l'intention multiple?

Shao Hao : Je devrais être clair dans PPT tout à l'heure, "Demain", il n'est pas allé aux intentions normales. Ses scores d'intention normaux sont très faible est plusieurs tours. S'il passe à plusieurs tours, nous utiliserons plusieurs tours de machines d'état pour y faire un quiz.

Question 18: Existe-t-il une méthode de correspondance pour la question et la réponse à la réponse à la question et à la réponse, ou uniquement la méthode de correspondance de la question et du problème?

Shao Hao : Cette question est meilleure, nous utilisons tous les deux. Quoi? Parce que nos données de journal sont très importantes, cela peut impliquer nos choses relativement faibles, donc je ne dirai pas grand-chose. Les deux méthodes seront utilisées et la méthode de la réponse est parfois appariée en générant la question après d'autres moyens de générer la réponse. Cette méthode est très efficace. Il est recommandé de l'essayer.

Prix d'excellence pour turation! Hanrahan et infographie pionnier prix Catmull, a félicité deux blockbusters hollywoodiens vétérans de la technologie d'animation 3D
Précédent
Une explication détaillée de la gestion des connaissances dans le dialogue heuristique | Des millions de personnes apprennent l'IA
Prochain
L'application du nouveau réseau neuronal de Transformer en traduction automatique | Million de personnes apprend l'IA
GitHub coup d'oeil à chaud: navigateur 2020 semaines Star navigateur incroyable jusqu'à plus de 3000
Après avoir lu celui-ci, vous êtes sur avenue aperçu Sécurité printemps | le programme de travail
marteau de pierre! Python Les temps difficiles cette année à un? Les programmeurs: Je suis fou
Java GC vu de nombreux articles, ces cinq questions que vous ne savent pas
Data Analyst vs algorithme ingénieur, Python programmeurs comment choisir la naissance?
Trois opérateurs vont résoudre les anciens et nouveaux émettent des droits différents paquet utilisateur, la coopération avec Surchauffe vibrato, Git 2,26 | libération Geeks titres
Comment changer la vie humaine dans l'interaction humaine-ordinateur | Million de personnes apprennent l'IA
A perdu 30 millions de dollars Bitcoins en espèces, car une carte SIM?
Le cahier détruit par Zuckerberg, caché tout le succès ou l'échec de Facebook
Congrès du Parti branche de SISHUI People « marque d'arbre pour mettre en valeur leur cur et l'âme pour aider à sortir de la pauvreté. »
« Chef-d'uvre » dans le centre-ville solitude