Université de Pékin Professeur Wan Xiaojun: laisser la machine création littéraire, quels progrès et défis?

Responsable: Cet article est l'Université de Pékin Wan Xiao Jun professeur Forum Byte l'intelligence artificielle Tech 2019 frontière Partager sur. Byte Tech 2019 battu par l'Association chinoise de l'intelligence artificielle, octets, organisée conjointement par l'Université de Tsinghua, Académie des sciences, Université de Tsinghua données co-organisée.

Je voudrais parler avant le début de la présentation, Pourquoi faire la génération de langage naturel (NLG), Avant que nous touchons plus d'une compréhension du langage naturel (NLU), qui est, de comprendre le langage humain, c'est un objectif important du traitement du langage naturel. Maintenant, nous nous attendons à des équipements intelligents, les machines et les gens à obtenir une communication plus loin, nous devons faire est d'améliorer encore la technologie NLG, à savoir la technologie de génération de langage naturel, la vraie machine interaction naturelle avec les humains et d'améliorer le niveau d'intelligence de la machine.

Tout d'abord, Quelle est la génération de langage naturel NLG? NLG large éventail de sous-tâches différentes en fonction de différents types d'entrée. Les entrées incluent des images, audio, feuilles de calcul, texte, etc., sont en fin de compte générer du texte. Texte pour générer du texte et peuvent inclure de nombreux types de sous-tâches. Tels que le texte de sortie en fonction courte longueur de texte, qui est le résumé du document, et le texte est répété Réécrivez le texte, similaire à la longueur de l'entrée et de sortie, la même sémantique du texte d'entrée pour générer du texte, mais les différences d'expression de texte se produisent.

En outre, la génération de dialogue, la traduction automatique appartient également à une génération de tâche de texte à texte. La traduction automatique de texte dans une langue en entrée, la langue de texte complémentaire sortie. génération de dialogue est généré sur la base de la réponse ci-dessus. Dialogue génère beaucoup de la traduction automatique dans ces deux domaines, généralement traités séparément et non intégrés dans le champ de texte est généré.

En plus du texte pour générer du texte, il y a des données pour générer du texte, telles que la création du texte descriptif financier selon les états financiers, ont une utilisation très importante dans le monde des affaires, il y a beaucoup d'unités dans l'étude de cette technologie.

Selon la sémantique, l'énoncé de syntaxe représente une génération de la recherche universitaire est plus une NLG tâche, dans des applications pratiques plus complexes à mettre en uvre, car il impliquera simultanément à NLU et NLG deux problèmes.

Enfin, l'image d'entrée ou vidéo, générer du texte, qui est l'objet de la recherche NLG, plus de recherche est concentrée dans le champ de vision par ordinateur (CV). Nous pouvons voir toute l'étendue de NLG est très grand, il est mon meilleur départ personnel à faire résumé du document de recherche, puis progressivement NLG autres tâches de recherche.

NLG est large gamme d'applications, Y compris le désormais très populaire chiendent robot de dialogue, génération digest, génération de nouvelles, la génération de la poésie.

À l'heure actuelle, Grande exigences d'application NLG, la demande de technologie NLG est également très large, Y compris de nombreux articles réécrits romans d'écriture de script et ainsi de suite. Mais il est très difficile de répondre à ces besoins, laissez l'ordinateur pour obtenir la création d'un véritable sens impossible et nous voulons le faire est de laisser l'ordinateur jouer un rôle de soutien peut être. Pour beaucoup l'article ré-écriture, comme la production de papier doux, comment réécrire les articles pour une variété de styles, diffusion sur Internet, de sorte que plus de gens voient. Si la réécriture n'est pas bon pour le contenu des deux articles très similaires, réécrire l'essai sera bloqué, il faut garder beaucoup sous la réécriture sémantique originale sans en changer la grande difficulté de ce processus. De plus, l'IA sera l'hôte, le débat actuel est très difficile difficulté, bien que temporairement dans l'incapacité de mettre à utiliser, mais vous pouvez d'abord la recherche et l'exploration.

Avant d'apprendre profondément populaire, NLG il y a plusieurs façons, des modèles à base de règles ou de remplissage est l'un d'entre eux, écriture première artificielle les règles, les données de remplissage ne, peuvent également générer du texte. En fait, cette méthode est simple, mais très utile dans de nombreuses applications commerciales. Il peut également être automatiquement par des méthodes d'apprentissage machine pour résumer automatiquement et obtenir modèle d'écriture.

Ces dernières années, la méthode d'apprentissage en profondeur est largement utilisé, basé sur la séquence du codeur au modèle de conversion de séquence de trame de décodeur est le plus courant du modèle de production de documents, apprentissage de renforcement et de génération de confrontation des réseaux principalement afin d'améliorer le modèle de séquence de conversion. Notre architecture de base ou codec, certaines études ont amélioré codeur, décodeur et certaines études se sont améliorées, afin de renforcer l'effet.

Voici les ressources et les modèles pour tâche typique NLG. données parallèles seront différentes dans les différentes tâches de génération de texte, notamment en fonction de la profondeur des méthodes d'apprentissage telles données parallèles. Nous voyons un résumé de données parallèles tâche générée est relativement importante, mais seulement quelques cent mille paires seulement, ces données sont comparées à la taille de la traduction automatique en termes de données de formation est relativement faible, de sorte que la génération actuelle ne sont pas idéales. Maintenant, beaucoup de tâches de génération de texte manque de corpus de formation à grande échelle, et ce corpus de formation est difficile dans l'artificiel à court terme marqué. La réalité est que tous les modèles de génération de texte n'est pas parfait, une grande partie du problème est que le modèle de données elles-mêmes, mais aussi pour faire les ajustements appropriés.

Je tiens à souligner est, le modèle de réseau de neurones NLG ne réussit pas, même si nous avons fait beaucoup de recherches universitaires, a publié de nombreux articles académiques, mais de nombreuses tâches pour autant que des performances a augmenté de 1% à 2%, papier peut être fait, mais de point de vue pratique, la technologie est difficile d'atteindre le niveau de satisfaction, donc nous devons aussi continuer à améliorer dans le modèle de données.

Notre équipe a fait beaucoup de texte résultant des travaux de recherche, la recherche visant à générer à texte X, X est une variété d'entrée, tel que le texte, les données, les images, le code, et ainsi de suite. La sortie du type de texte, y compris des phrases, des résumés courts, des articles, des poèmes, des commentaires et ainsi de suite. Par exemple, une image basée sur l'écriture de la poésie. Les poèmes sont généralement générés par mots-clés, élargi en quatre mots-clés fondés sur un thème donné, chaque mot clé en fonction de la sortie d'une ligne de poésie, quatrains mis ensemble dans un poème complet. Compte tenu des caractéristiques de la poésie, mais aussi de faire un peu de traitement, comme la rime et le rythme, cela est plus facile pour un ordinateur pour résoudre, peu de contrôle sur ce qui peut être réalisé lorsque le texte de décodage. Nous ne générons pas une seule image à partir d'un poème, mais un poème généré à partir d'un ensemble de photos, prises au cours de Voyage comme un groupe de photos, comment générer un poème pour décrire la scène, effectuer l'expression illustrée, qui est de l'image à des tâches de conversion de texte. Nous encodeur cadre à base de décodeur, utilise un mécanisme d'auto-sélection et le mécanisme de mise au point pour faire face à la présence de bruit et de l'image image de redondance Concentration, la poésie ne correspond pas à quelques-uns des mots et des problèmes de contenu de l'image.

Ce chiffre est le résultat final, l'image d'entrée ci-dessus est réglée, nous pouvons générer des vers et quatrains le coin inférieur droit du coin inférieur gauche, l'effet global résultant est la bonne poésie. Nous allons également présenter démo pertinente.

champ de génération de langage naturel il y a encore des défis.

Tout d'abord, À l'heure actuelle, notre évaluation tels que UEBL, ROUGE, etc. ne sont pas assez précis, mais le manque d'évaluation de la stabilité artificielle, pas facile à utiliser, comment trouver une évaluation précise et objective de l'automatisation, cette contribution à l'art plus que la contribution de tout modèle.

En second lieu, Comment générer dans des cas rares corpus de texte parallèle, même génération de texte non surveillée à la fin il peut ne pas être possible, mais il ne fait aucun doute que, si le corpus suffisant pour obtenir l'effet de génération de texte supervisé sera certainement mieux.

En troisième lieu, Comment décoder un texte long, le décodeur de texte actuel peut résoudre des dizaines de mots, mais quelques centaines de mots de décodage direct, la séquence de milliers de mots peut être difficile, comment atteindre cet objectif mérite d'être examinée.

Enfin, Cross-modalité façon dont le texte est généré un niveau élevé, à savoir plug-parler. La figure est les timbres 2019, nous voyons le timbre, vous dire quelque chose, ou quoi écrire un article il?

Il y a mille mille lecteurs Hamlet, chaque personne perspective de la pensée. Les résultats de l'outil de génération de plug-parler de Microsoft CaptionBot est « Je pense que c'est le personnage de dessin animé », ce résultat ne peut pas dire tout à fait tort, mais à cause du modèle et des données, la compréhension sémantique de l'image de la machine est encore très faible et ne peut pas être le raisonnement Lenovo. Si les auteurs humains à écrire, vous pouvez penser à beaucoup de choses, comme d'encourager les élèves à trois enfants, la pression d'apprentissage, les enfants grandissent front, éclairé toute la journée pour le travail, sa mère a brûlé, VEILLE mon père, encore brillant et ainsi de suite. Ainsi, nous constatons que l'imagination humaine est très forte, il sera associé à un large éventail de connaissances et d'indices, pour créer un des articles riches et intéressants. Bien que maintenant connu comme l'intelligence artificielle est très puissant, mais en réalité, au moins pour générer des tâches de texte, et les LAG humains loin derrière, et maintenant utiliser uniquement dans le commerce AI doit résoudre répétitive d'écriture simple, vous ne pouvez pas créer en profondeur article. Il y a un écart entre la communauté universitaire à des fins de recherche est l'occasion, après tout, il y a des lacunes, il y a des lacunes, seules les recherches nécessaires.

Merci.

Editeur: Wen Jing - FIN -

attention Tsinghua - données Académie des sciences de Qingdao plate-forme publique micro-canal officiel " données d'envoi THU « Sisters et n ° » Les données envoyées THU « Pour plus de conférences et de bien-être contenu de qualité.

Dragon Boat Festival Wuhan cercles de capital-risque: Lei Jun troisième fois en 2 mois Han, fonds de deux milliards anciens seront mis en place, signeront 80 milliards Forum des anciens Direction des
Précédent
Il est apparu niveau Gif ultra-bas de mauvais 15 m, mais a marqué le premier but dans la Ligue des Champions après 83 secondes!
Prochain
Zhang Bo Doyen de l'Institut Tsinghua de l'intelligence artificielle: AI est ma relation avec « premier amour après le mariage. »
Équipements de commutation 20000 Turin, Italie Santa descendues dans la rue pour la collecte de fonds à l'hôpital pour enfants
Prenez-vous relire les documents du système de recommandation d'étude approfondie Youtube, texte peur à Dieu
Publié quatre premiers téléphones S10 caméra photo du monde, Jin sur « camp cassé » de la guerre veulent capturer les groupes d'âge plus jeunes
confirmation Man Zhu Keech ne sera pas puni! L'explication officielle donnée 1, peut être suspendu pour cinq matchs en Super League
Les ingénieurs algorithmes ont besoin de connaître les techniques d'entrevue carte radar
L'avion de Merkel a fait un atterrissage d'urgence en détresse l'aéroport de Cologne a été contraint de manquer la cérémonie d'ouverture du G20
16625 documents révèlent 25 ans de lois AI de l'évolution! ère d'apprentissage profond à sa fin!
C'est une victoire AFC a attendu 1484 jours, ils ont également rempli un record de 25 ans d'une grande!
Plus d'un milliard de masses solaires trou noir, a été « expulsé » centre galactique!
le district de Guangyuan a tenu des actes Zhang Guiping rapport
[Interview] micro-bit Technologie Li Ziyang: la numérisation OCR est une technologie de base, les applets et l'intelligence d'affaires est l'orientation future de l'effort de développement