Qu'est-ce que le robot d'écriture ne peut pas écrire? La technologie et l'application de Pékin informatique de l'Université Wan Xiao Jun robot détaillé écrit | CCF-GAIR 2017

Qu'est-ce que le travail de développement de l'intelligence artificielle remplacera une grande partie de l'humanité a toujours été un sujet de préoccupation, et nous avons toujours pensé que les gens de la pensée est notre dernier bastion. Comme l'a dit Pascal, « les gens vont penser à rien d'autre qu'un roseau, » nous sommes la nature biologique les plus vulnérables, mais parce que la pensée est devenue extrêmement puissant.

En parlant, l'écriture est une manifestation directe de notre capacité à penser, Hela Li a dit dans « Une brève histoire de l'humanité », la capacité de raconter des histoires à faire l'Homo sapiens et d'autres hominidés et les animaux deviennent différentes. Si la machine peut aussi être exprimée par écrit peut aussi raconter des histoires pour créer leur propre culture, aux gens comment y faire face?

Dans organisé par la Fédération chinoise Computer (CCF), Lei Feng réseau avec l'Université chinoise (Shenzhen) Hong Kong a accueilli tout l'événement AI « Intelligence artificielle et robotique sommet mondial » de la cour de branche AI +, chercheur à l'Institut de l'Université de Pékin de petite armée informatique et de la technologie Wan à faire la « technologie de machine à écrire et à l'application du » rapport de la parole. Par la finition réseau suivant de Wan Lei Feng Xiao Jun discours d'enregistrement lors de la réunion.

fond d'écriture de la machine et le présent

Il y a quelques années, il y avait déjà des robots à l'étranger par écrit, le plus représentatif des trois sociétés des États-Unis, en Europe: ARRIA, AI, RÉCIT SCIENCE. On dit que leurs robots en utilisant l'anglais ou la langue occidentale pour écrire des dizaines de millions de manuscrits que les sites de médias bien connus.

robots domestiques ont commencé à écrire l'attention lentement à cause au cours des dernières années. Il y a beaucoup de médias dans un certain nombre d'établissements d'enseignement et avec l'introduction de l'écriture robots. En outre, Microsoft, Baidu, Tencent, les titres d'aujourd'hui des géants de l'Internet se développent également la technologie d'écriture de la machine, en raison de son propre besoin de faire créer un contenu. Principalement axé sur les sports, la finance, la vie du peuple, la classe politique générale en cause est relativement faible. Si elle vient à des erreurs de contributions politiques, le problème est relativement important, il est principalement dans les domaines de l'écriture n'est pas facile de se tromper.

mode d'écriture de robot et de la technologie

Machine à écrire de deux manières, l'une est l'original, on est la deuxième création. manuscrit original généralement pas avant, les données ne structurées, nous pouvons utiliser des données structurées pour générer un nouveau manuscrit. Par exemple, nous écrivons un rapport de prévision météo, ou d'écrire un rapport, les gains peuvent être générés directement à partir des données. En ce qui concerne un événement qui a été signalé par rapport, nous utilisons certains de ces rapports ont été mis ensemble, réécrite dans un nouveau manuscrit, qui est la deuxième création.

Création originale et secondaire repose sur la technologie ne sont pas les mêmes. utilisations originales de la technologie de génération de langage naturel, est d'exprimer des données structurées / sens génère une phrase en langage naturel. création deuxième utilise la technologie automatique de résumé, nous allons donner un résumé du matériel texte existant, il génère un nouveau manuscrit. Ceci est une des catégories technologiques critiques.

Il y a quelques autres technologies connexes: la technologie de l'information recommandation texte et technologie texte racontant. Par exemple, nous avons écrit un manuscrit du temps, parfois de citer les paroles d'une célébrité ou d'une référence à la poésie, la machine vous donnera automatiquement une recommandation. Le second est le texte paraphrase, nous ne basé sur une création manuscrit, si nous directement au contenu original copié l'original, cela est un peu suspect de plagiat. Cette fois-ci, nous devons faire une répétition, utilisera un langage différent pour exprimer la même sémantique. Voici un exemple en disant « Messi a remporté cinq Golden Globe », vous pouvez lire « Messi est le cinquième lauréat Golden Globe » peut également être réécrite comme « cinq Golden Globe décerné à Massey » cela évite le problème du droit d'auteur, mais nous permet aussi de réécrire plus vive.

écriture Robot largement

l'écriture de robot pour une large gamme d'applications. La première est la génération automatique de nouvelles et d'information. Nous entrons dans des données structurées, et a quelques articles qui peuvent générer des dizaines de mots de manuscrit de longueur contrôlable à des milliers de mots. Par exemple, une génération de bulletin de sport nous avons besoin de saisir des données de base sur les événements sportifs de l'Internet, au moyen de ces données pour faire une analyse des données, la planification des documents, des déclarations de réalisation, vous pouvez générer un sport simple à droite de la la couverture du tournoi.

L'autre est automatiquement généré longs événements sportifs signalés. Bulletin d'information contient très peu, nous voulons générer des rapports un long processus pour introduire l'ensemble du jeu. Nous trouvons souvent les célèbres événements sportifs ci-dessous ont un texte en direct, contenant généralement hôte une telle description merveilleuse des détails du jeu, au moyen de notre apprentissage machine, être en mesure de décrire ces merveilleux distingué, mettre notre rapport final ce rapport écrirait long, peut atteindre un millier de mots ou plus. Des premiers moyens d'aide de l'apprentissage machine, sorte intelligente de la déclaration de texte en direct, le choix intelligent, et enfin générer une longueur moyenne de plus de 1000 mots de la couverture du tournoi. Nous vivons pour voir le texte en général atteindra des milliers de mots, généralement plus de 5000 mots, donc de 5000 mots pour sélectionner et résoudrez plus de 1000 mots de long rapport.

Un autre est généré automatiquement les nouvelles de divertissement, nouvelles de divertissement, il y a beaucoup de différentes façons de générer. Par exemple, vous pouvez activer une base de données directement sur l'étoile pour faire une simple description. Ce que nous faisons est des nouvelles de divertissement peut être générée au moyen d'étoile micro-blog. Étoiles envoient souvent certaines d'entre elles, et certains micro-équitable pour attirer l'attention de tout le monde, constituent une des nouvelles à chaud. Nous avons un outil d'apprentissage de la machine qui permet de déterminer automatiquement qui a émis une étoile microblogging dignes d'intérêt, puis déterminer les commentaires ci-dessous microblogging, dignes d'intérêt. Ce micro-blog et ses commentaires et des informations générales relatives à la combinaison sous la forme d'une courte nouvelles.

Nous avons également fait des tentatives pour générer automatiquement l'évaluation de nouvelles. Nous avons déjà plus la couverture des nouvelles pour un événement particulier, vous devez penser à la façon dont ces rapports basés sur un long examen des événements générés automatiquement. Objets que nous utilisons avec Wikinews, son contenu est essentiellement plus objective, un examen plus neutre. Il aurait été signalé à faire une analyse à faire un peu complet, puis non partisane obtenir un long examen. Nous prenons ces données ont une expérience, de faire le dépistage et une combinaison de déclarations. Du fait de constituer un examen, il est donc pas la phrase comme une unité, mais comme des unités de Sous-thèmes. Nous avons d'abord divisés sous-thèmes, et chaque sujet correspond à un paragraphe. Puis trier une importance, et enfin choisir un paragraphe, qui est, sous-thème choisi et les sous-thèmes pertinents ont été combinés pour donner un examen plus complet de sous-thèmes événement final de la forme complète.

En plus de générer type de nouvelles autres que le fait que nous essayons de dire un robot pour générer les commentaires des utilisateurs. Nous entrons dans une fonction de certains produits ou certaines caractéristiques de la partition, comme mon entrée à ce logiciel est que mon comportement de la voiture est l'évaluation de cinq points, son apparence est une évaluation de 3 points, sur la base de cette évaluation sera génère automatiquement un commentaire en langage naturel. Nous utilisons le modèle d'un apprentissage en profondeur du droit est un tel modèle d'architecture. On peut voir un exemple de ce à l'avance, nous avons finalement généré.

La voiture dispose d'un espace, la puissance, le contrôle, et ainsi une série de fonctionnalités, les utilisateurs doivent faire est d'entrer une valeur de point pour chaque fonction, au nom de la partition de la valeur plus que vous êtes satisfait plus, plus le score est plus satisfait de la valeur. Nous voyons des exemples, tels que nous entrons dans l'espace de trois minutes, quatre minutes puissance, le confort est de 3 points, 3 points au nom du général, nous voyons le côté droit des commentaires chinois générés, l'expression résultante est « le confort général après tout, il est la voiture sportive », il est très précis sur ce point est décrit. Ensuite, dans le confort de trois points en 5 points, 5 points sont très satisfaits du texte final généré correspondant à la partie est « très bon confort, siège bonne parcelle, assise très confortable. » Notre modèle peut être des changements subtils ce score une réponse directe au résultat final du langage naturel. L'utilisateur peut saisir les scores en fonction des caractéristiques de nos produits, et de générer automatiquement une section relativement complète grande des commentaires de l'utilisateur. Ce modèle d'apprentissage est basé sur la profondeur à faire.

peu d'écriture de robot Xiao Ming avec l'Azerbaïdjan du Sud

Nous avons actuellement trois co-écrit projet de robot, est aujourd'hui un titre de Xiao Ming robot de "Xiaomingbot", le Southern Metropolis Daily "Little South," robot Guangzhou Daily "Un même". Xiao Ming Les principaux services aux Jeux Olympiques, un petit Sud, était en Afghanistan avec deux pays en 2017 pour faire un travail rapporté.

Les titres d'aujourd'hui avec le lancement du robot écrit Bob, le principal événement est généré des bulletins d'information et long rapport pour les événements sportifs, les deux peuvent générer des dizaines de SMS le mot, et peut générer un long rapport sur les milliers de mots, ce qui comprend la ligue de football, y compris les jeux NBA pendant les Jeux Olympiques ont écrit 456, le montant le plus élevé de la lecture d'un seul article est 110.000 fois. A la fin du mois dernier, un total de plus de 5000 articles écrits nouvelles, lire un montant total de 18 millions, c'est parce que beaucoup de titres utilisateurs aujourd'hui, donc la quantité de lecture sont nombreux.

Ceci est l'interface Xiaomingbot numéro de titre. La finale de la Ligue des Champions, la Juventus 1: défaite des résultats du concours Real Madrid 4 nouvelles est entièrement écrit par la machine, et le manuscrit du texte est très long, il y a 1121 caractères chinois, il est plus précisément le message principal de ce jeu ont fait une description, il est tout à fait complète l'article de nouvelles.

Petit Sud en train d'écrire l'écriture de robot sur la vie de certaines personnes APP Southern Metropolis Daily Nouvelles, nouvelles écrit un billet de train Fête du Printemps ne fin de l'année dernière, en se concentrant sur les nouvelles Guangzhou vers d'autres villes, a récemment écrit que les prévisions météo de nouvelles au cours des deux sessions le journal a également écrit un petit Sud Nouvelles deux sessions.

Petit billet de train South Festival Spring écrit en utilisant beaucoup de nouvelles pour vendre Meng phrase. Bien sûr, cela est aussi la langue de nos reporters faire un bon résumé, et enfin de faire nos robots peuvent être exprimés de façon. Récent petit robot du Sud a fait aussi des prévisions météorologiques écrit. Petit Sud Southern Metropolis Daily journal rapports statistiques principalement avec deux sessions, respectivement, qui appartiennent au champ, faire un inventaire statistique et, ainsi que les résultats de cet inventaire est exprimée sous la forme du langage naturel au cours des deux sessions. En plus dont certaines des nouvelles des modèles d'explosion a fait un résumé et un résumé sont également placés dans ce manuscrit, de sorte que la quantité d'informations de ce manuscrit est, de nombreux articles plus abondants sur les nouvelles pour l'inventaire.

Une grande partie de la même au cours des deux séances pour faire un travail, principalement sur le rapport de travail du gouvernement a fait un certain nombre de mots chauds et interpréter les données critiques, l'expression du langage naturel après la lecture est terminée. Cela se fait avec un un mot chaud sur le rapport de travail de l'analyse de la CCPPC, quel rapport de travail de la CCPPC mots chauds de cette année, ces mots chauds avec lesquels le changement par rapport à l'année dernière, cette situation change dans l'expression du langage naturel, culminant dans le journal le rapport d'impression-out. Parce que à imprimer sur le journal Guangzhou Daily, si l'erreur est la tolérance zéro, il faut passer par un examen manuel.

VS médias traditionnels, les nouveaux médias

Unités pour différentes applications, les exigences de qualité manuscrit ne sont pas les mêmes, pour certains médias traditionnels, il a le manuscrit d'erreur est la tolérance zéro. Pour publier la nécessité de réviser manuellement les journaux, et certains des médias peut être fait directement sur Internet, les fautes de frappe individuelles ou déclaration individuelle ne parle couramment n'affecte pas les utilisateurs de la lecture, les utilisateurs peuvent écrire un commentaire ci-dessous, a dit le manuscrit comment aussi il y a des fautes de frappe, mais cela ne touche pas que les utilisateurs lisent et cliquez sur. Ainsi, des médias sur le manuscrit d'une tolérance de qualité peu plus. Lorsque les deux exigences applicables dans des situations différentes ne sont pas les mêmes, donc nous écrivons dans la presse lorsque la machine sera différente.

Robot VS Reporter

Jusqu'à présent, la relation entre le robot avec les journalistes est une relation de division du travail. Maintenant, le robot n'a pas la capacité de la pensée logique, ni a la capacité de synthèse de la profondeur, il ne peut aller à une description de base des nouvelles et des faits clairement, mais nous les journalistes peuvent écrire des rapports approfondis, tels que le football chinois, il peut passer par leur propre analyse , depuis des décennies la raison derrière l'écriture football chinois, on peut conclure à partir de plusieurs points de vue, mais il est difficile de résumer le robot, notre journaliste devrait être engagé dans la création créative, très intelligente du manuscrit, et une répétition le faible niveau des contributions aux activités de création du robot est terminée, de sorte que la relation est une division du travail collaboratif.

Une autre différence est que les journalistes à écrire un manuscrit, il est très bien conscient de ce que j'écrivais, il se sait une expression sémantique. Mais en fait le robot par écrit cette fois manuscrit, bien qu'il a mis chaque phrase écrite, mais en fait, il ne savait pas quoi écrire, ce qui est le plus important d'un autre, qu'il ne comprend pas son propre manuscrit, bien que l'écrire, y compris la poésie robotique, les paroles ou écrire toutes sortes de temps, il écrit aussi la langue, mais il ne comprend pas vraiment la langue, il en est ainsi une différence relativement grande.

Perspectives d'avenir

Enfin, une vision de l'avenir. Nous voyons maintenant la machine est non seulement en train d'écrire dans l'industrie des médias, nous travaillons également avec une partie de l'industrie du jeu et de l'industrie de l'information, ils ont aussi un besoin de machine à écrire, juste au moment où vous avez besoin d'écrire une partie de ce rapport, par exemple écrire des rapports de l'industrie, ou écrire quelques articles, sont susceptibles de bénéficier de la rédaction technique de la machine, non seulement l'industrie des médias sera utilisé pour écrire des nouvelles, d'autres secteurs seront utilisés.

La deuxième direction, nous sommes toujours porté principalement sur la description écrite manuscrite des faits objectifs, et non pas en ajoutant l'attitude et la position trop, il est donc des aspects moins désirables de la nature humaine, l'étape suivante fera notre propre manuscrit a une certaine position par exemple lorsque nous avons signalé que le jeu de l'équipe chinoise contre la Corée du Sud, si nous sommes sur la position de la Corée du Sud, si l'équipe chinoise a perdu, alors nous devrions être très heureux, le titre pourrait dire: « la victoire de l'équipe sud-coréenne sur l'équipe de la Chine « Si l'équipe chinoise est debout, peut se diriger à écrire », cette position équipe chinoise en Corée du Sud Han Fu » est pas la même chose, notre manuscrit a l'attitude et la position, il serait plus humain.

Le troisième point est la chose la plus difficile est de faire des machines à apprendre et le raisonnement inductif, écrire un véritable rapports approfondis. Par exemple, nous avons rapporté que, après un match de football, nous devons analyser pourquoi cela est le résultat du raisonnement pour cette raison résumé. Ce rapport est vraiment intelligent, comme avant d'écrire le manuscrit est une époque faible intelligence artificielle, si l'on veut écrire le manuscrit d'une forte intelligence artificielle, il est nécessaire de rendre la machine a l'attitude et la position, a également un tel raisonnement inductif capacité, qui est la prochaine cible à étudier, et il est possible d'atteindre certains des objectifs. Surtout ceux avec l'attitude et la position, je pense que nous devrions être dans les deux à trois prochaines années pour atteindre. Puis, avec le raisonnement inductif, deux ou trois ans, je pense peut-être pas nécessairement assez il a besoin de plus de temps il sera possible de réaliser une percée.

(Dix mille petite armée d'enseignants est très délicat merveilleux discours, réseau Feng Wan Lei de petit professeur de l'armée a eu une interview exclusive après la réunion, pour explorer d'autres questions sur l'écriture robot, s'il vous plaît cliquer sur: « Entretien avec la petite armée informatique de l'Université de Beijing millions: robot de l'écriture produit de la nouvelle ère des médias | CCF-GAIR 2017 « )

Je suis pauvre, de l'été vu le film savoir
Précédent
"Fée II" exposé Feng Shao Feng Liu Yifei ville Wars Poster Freak déranger les dirigeants du monde de démon
Prochain
« Applet » ne pas jouer 6, « Application rapide » à nouveau
écran Pa « peu de viande, » Qui êtes-vous optimiste
environnement de voiture est pas en bonne santé? Le rapport d'évaluation donne la réponse
OPPO Fantaisie Nouvel An Show New Year frappe R17 et R17 Pro version est sur le point début
Wang jouent également sur l'autoroute, le nouveau X5 peut rester serré dans le premier luxe de taille moyenne SUV?
Le marché du téléphone intelligent, et à l'époque de la sortie 5G, 5G si le téléphone enregistre la situation actuelle
« Les observateurs de l'industrie » aspects sept normes lire 5G en Juin
Pang Maokun visiter l'exposition pour voir les uvres de Sui Jianguo dévoilées deux rivières activités créatives ...... Peut vous apprendre à jouer le goût artistique
drame Wangjun Kai Wen Qi véritable solution fatigué
Il était un bon cinq boutique, dédiée à savoir comment profiter de votre vie
GaN sur silicium pourrait conduire à plus à l'état solide demande d'énergie RF
AMD APU pointe longue exposition: architecture de processus de 12nm, plus Zen +