un bref historique de la traduction automatique que vous devez savoir après la traduction de l'intelligence artificielle de Boao Oolong,

  • Auteur: Yoon Sang Chi

  • Ceci est le premier cercle d'amis Qin Shuo 1934 Articles départ original

Boao traduction de l'intelligence artificielle de de « maladroite »

Dans cette année, le Forum de Boao pour l'Asie, en plus de l'ordre du jour principal, notamment le point chaud est Pour la première fois l'introduction de la conférence de l'intelligence artificielle avec le transfert de la technologie de traduction en temps réel . Cependant, l'idéal est plein, mais la réalité est très maigre, l'intelligence artificielle avec une grande passe n'a pas eu lieu auparavant déclaré: « Que l'industrie simultanée est sur le point de faire face à la menace du chômage » Au contraire, la traduction des convulsions sévères et les praticiens liés en fait des personnel soulagé, il semble que cette ligne peut aussi manger du riz pendant longtemps ......

Vous cherchez une nouvelle « Tour de Babel »

Cette erreur amusant ci-dessous fourniront des vues sur le plan technique, mais comme il est un bref historique de la traduction automatique, laissez-nous mettre « l'événement de traduction Boao » mettre de côté, pour revenir au point de départ de la traduction - la tour de Babel.

« Ancien Testament Genèse » décrit au chapitre 11, après la grande inondation se sont retirées, ce monde humain sont les descendants de Noé. Ils parlent la même langue avec le même accent. Quand les humains ont commencé à travailler ensemble, dans l'espoir de construire la tour, appelée la Tour de Babel Babel, le mouvement alarmé les dieux, il laissa le monde de l'humanité a commencé à avoir une autre langue, la race humaine ne fut plus la coopération unie, rendant le plan de Babel a échoué, les différences linguistiques sont devenus les plus grands obstacles à la communication humaine. Peut-être que le sang veut encore rêver de la reconstruction de la tour de Babel, de sorte que la traduction est devenue l'objet de projets culturels humains au cours des dernières milliers d'années d'histoire en constante évolution.

Les barrières linguistiques ne sont pas si faciles à briser, en particulier à interlangage comprendre les mêmes concepts, pour la première fois dans l'histoire humaine l'émergence de corpus parallèles interlangage, est produite en 196 avant JC, la pierre de Rosette (Rosetta Stone) l'utilisation de l'ancien égyptien, ancien caractère populaire grec et local, d'enregistrer l'ancien roi égyptien Ptolémée V édit du Trône. Sur la base de la connaissance du grec ancien, les linguistes peuvent comprendre facilement l'ancienne Arcane égyptien basé à l'origine sur le corpus parallèle, ce qui est aussi une étape importante dans la traduction.

Traduction automatique histoire de l'évolution

la machine à base de règles de traduction (RBMT)

En ce qui concerne la traduction de la machine source, date essentiellement de 1949, les chercheurs de la théorie de l'information Warren Weave Formellement proposé le concept de la traduction automatique. Cinq ans plus tard, c'est 1954, IBM a annoncé la collaboration avec le premier traducteur de l'Université de Georgetown du monde - IBM-701 . Il est capable de traduire russe en anglais, vous ne regardez pas à son énorme corps, ce qui en fait, il ne construit six dispositions du règlement, ainsi que 250 mots, mais tout de même, cela est encore une percée majeure dans la technologie, puis humaine Je commençais à me sentir la langue devrait bientôt être en mesure de briser les murs.

Dieu peut être conscient qu'il existe des différences, mais aussi sur les plans de reconstruction de la Tour de Babel humanité versé un seau d'eau froide. En 1964, l'Académie nationale des sciences a mis en place Comité consultatif de traitement automatique de la langue (automatique des langues Traitement Comité consultatif, renvoyé au Comité ALPAC). Deux ans plus tard, dans le rapport de la Commission a exprimé l'opinion que la traduction automatique est pas la peine de continuer à investir, parce que ce rapport, ce qui dans la prochaine décennie, les États-Unis presque complètement stagnante machine vierge Traduction.

Né du premier traducteur d'IBM dans les années 1980, lorsque la technologie grand public est la traduction automatique basée sur des règles, l'approche la plus commune est basée sur le dictionnaire de traduction mot à mot directe, bien qu'il ait été plus tard à se joindre à l'initiative de modifier les règles de la syntaxe mais pour être honnête, le résultat est avéré très frustrant, car il semble stupide extrême, donc, une telle approche des années 1980 a disparu.

Pourquoi ne peut pas appliquer les règles de la langue? Parce que la langue est un système extrêmement complexe et ambiguë, de l'ambiguïté du mot à toutes sortes de discours, toutes les règles exhaustives impossibles. Mais la chose intéressante est que de nombreuses nouvelles entreprises sont maintenant engagés dans la récente langue naturelle, beaucoup tentent encore d'utiliser un régime exhaustif pour résoudre la sémantique, le chinois se sentent toujours système extrêmement intelligent peut couvrir complètement les règles linguistiques, mais l'idée serait certainement soldées par un échec.

Je donne cet exemple pour illustrer pourquoi la règle n'est pas possible, de mentionner deux la traduction de la complexité de la transition, juste des Chinois, le concept d'un tel « livraison de courrier bientôt » Pouvez-vous penser à combien arguments ? 10 sortes? Ou 100 sortes? Dans le langage que nous avons fait avant les statistiques point de vue, il peut y avoir un total de 3600 types d'arguments, et ce nombre devrait également augmenter au fil du temps, un concept si simple phrases légères peuvent avoir un système moins compliqué de règles, si elles sont utilisées Je crains que les règles de traduction seraient une quantité phénoménale de astronomique, de sorte que l'idée de la traduction automatique basée sur des règles est devenue une chose du passé.

Based Machine Translation (EBMT de)

Dans le monde de la traduction automatique dans la marée basse, il y a un pays pour la traduction automatique a une obsession forte, et que le Japon. Japonais pauvres anglais universellement connu, et donc il y a une traduction forte de la machine juste besoin. Université de Kyoto au Japon Nagao Le professeur propose la traduction automatique basée sur des exemples. Ne laissez pas la machine qui va se traduire à partir de zéro, tant que nous gardons un nombre suffisant de phrases, même face ne correspond pas exactement la phrase, on peut comparer des phrases, la traduction n'est pas le même aussi longtemps que le remplacement du mot peut . Cette idée naïve, bien sûr que non traduit bien intelligent que la machine à base de règles, il a causé aucun problème. Mais peu de temps après, l'homme à reconstruire la tour de Babel semble vouloir re-voir l'aube.

Sur la base de la traduction automatique statistique (GMOS)

Cette détonation vague boom de la traduction automatique statistique ou IBM, dans du papier « théorie mathématique traduction automatique » publié en 1993 a proposé un modèle statistique se compose de cinq avec le mot comme une unité, connue sous le nom « modèle IBM 1 » à « Modèle IBM 5 ". (Eh bien ...... le personnel technique n'a vraiment pas comme prendre le temps de prendre un nom célèbre).

Idées modèle statistique se traduit par une question de probabilités. En principe est la nécessité d'utiliser un corpus parallèle, puis littéralement des statistiques, telles que la machine ne sais pas ce que la « connaissance » de l'anglais est, mais après la plupart des statistiques de corpus, vous trouverez une phrase aussi longtemps que il y a des connaissances qui apparaît, correspondant aux phrases en anglais il y aura « connaissance » du mot, de cette façon, même sans entretien artificiel des dictionnaires et des règles de grammaire, mais aussi faire des machines à comprendre le sens du mot.

Ce concept n'est pas nouvelle, depuis le premier Warren Weave a proposé un concept similaire, mais il n'y a pas assez de temps et corpus parallèles était trop faible et calculateur de capacité limitée, donc il n'y a pas mis en uvre. Traduction automatique statistique moderne où vous voulez aller « pierre de Rosette moderne » signifie? En fait, la source la plus importante est l'Organisation des Nations Unies, parce que les résolutions des Nations Unies et l'annonce auront des versions linguistiques des différents États membres, mais à part ça, vous voulez faire votre propre corpus parallèle, coûte désormais en termes de traduction humaine saura ce que ce coût élevé incroyable.

Dans la dernière décennie, nous connaissons les traductions Google sont basées sur la traduction automatique statistique. Entendu cela, tout le monde devrait être clair modèle de traduction statistique ne sont pas les réalisations de la grande cause de Babel. Dans l'esprit de tout le monde, la traduction automatique s'arrête au « Dégradé » plutôt que dans la mesure de « utile ». Mais en 2014, la traduction automatique a marqué le début de l'histoire des plus un changement révolutionnaire - « apprentissage en profondeur » ici!

Neural Network Machine Translation (de NMT)

réseau de neurones est pas nouveau, en fait des réseaux de neurones invention a été il y a 80 ans, mais depuis 2006 Geoffrey Hinton (Ex: les trois première grande étude approfondie de Dieu) a amélioré l'optimisation des réseaux de neurones erreur fatale est trop lent, la profondeur de l'apprentissage constamment accompagnée d'une variété de réalisations miraculeuses apparaissent fréquemment dans nos vies. D'ici 2015, la machine pour la première fois au-delà de la reconnaissance de l'image humaine, en 2016, Alpha Go a battu le champion du monde d'échecs, 2017, plus de la reconnaissance de la voix humaine sténographe, 2018, Anglais machine à lire pour la première fois au-delà de la compréhension humaine. Bien sûr, la traduction automatique dans ce domaine, mais aussi à cause de la profondeur et de commencer à apprendre ce super engrais épanouir.

étude approfondie de trois dieux Yoshua Bengio Dans le document 2014, pour la première fois établi l'architecture de base de la profondeur des technologies d'apprentissage pour la traduction automatique, il repose principalement la séquence du réseau de neurones récurrents (RNN), de sorte que la machine peut mots fonction de capture automatiquement entre les phrases, puis automatiquement écrire une autre traduction. Cet article est sorti, trésor Google, et bientôt, sous la bénédiction quantité suffisante de poudre à canon et la puissance de Dieu à Google, Google en 2016 a annoncé que toutes les étagères de traduction automatique statistique, les réseaux de neurones hôte de la traduction automatique, une traduction automatique moderne le courant dominant absolu.

Google traduction de la caractéristique la plus importante des réseaux de neurones est l'inclusion de mécanismes de la machine attention (attention), le mécanisme d'attention est en fait un analogue de la traduction humaine, sera d'abord l'il d'utilisation encore, puis choisira quelques mots clés à la sémantique confirment traiter, et elle avait le mécanisme d'attention après montée subite de puissance de bénédiction. Google affirme que le « britannique - français », « anglais - » - plusieurs langues « anglais-espagnol » et 60% de moins par rapport au système de traduction automatique statistique précédente, le taux d'erreur avec (visible avant que le problème beaucoup plus).

Bien que le réseau de neurones selon le corpus parallèle existant peut apprendre et comprendre les caractéristiques linguistiques subtiles de phrases, mais il est pas parfait, le plus gros problème vient du corpus, et il faut beaucoup de noir boîte aussi difficile à comprendre, c'est-à-dire, même si car il n'y a aucun moyen de changer le mal, nous ne pouvons fournir corpus plus correct de faire « l'apprentissage en profondeur » correcte. Et donc une même phrase, mais il peut avoir la traduction très différente. (Jetez un oeil à trois exemples de traduction dans la figure ci-dessous, espérons que cela est que Google interne politiquement correct ......)

En Février, Microsoft laisse la langue de la machine comprend immédiatement après il y a de nouvelles initiatives au-delà de l'homme, le 14 Mars, les chercheurs de Microsoft Research Asia et de l'Institut de Redmond a annoncé que ses activités de recherche et développement de systèmes de traduction automatique dans les nouvelles générales de rapports ensemble de test traduction anglais sur l'ensemble de test newstest2017, atteignant des niveaux comparables de traduction humaine. Bien entendu, ce réseau de neurones est une traduction automatique de la grande victoire, bien sûr, a beaucoup d'innovation dans l'architecture, le plus notable est l'inclusion de l'apprentissage dual (apprentissage double) ainsi que le réseau de contrôle (Délibération Networks).

L'apprentissage dual pour résoudre le problème du corpus parallèle limité, en général, la profondeur de l'apprentissage doit être fournie aux réponses de la machine, la machine pourra basée sur la différence entre les traductions et la réponse corrigée soutenue amélioration.

S'il n'y a pas assez de textes parallèles que l'apprentissage de la machine comment le traduire? double étude donne une idée intéressante, avec traduction en anglais, par exemple, à son tour directement à un modèle britannique et britannique modèle menotté ensemble tourné, une première phrase chinoise convertie en traduction en anglais à travers, puis mettre Anglais phrase prise pour convertir la traduction en anglais chinois, cette fois-ci aussi longtemps que les deux modèles ensemble, de sorte que la dernière phrase de la phrase chinoise sortie et l'entrée chinoise est le même que l'original, cela signifie que deux traducteurs ont les capacités de traduction correcte. Par conséquent, tant qu'il existe deux modèles de base de capacités de traduction de corpus parallèles avec la formation, suivi de deux modèles permettra de poursuivre la diligence double apprentissage en l'absence de corpus parallèles.

Comme l'examen du réseau consiste à mimer le processus de traduction humaine, la traduction humaine fera habituellement d'abord une traduction approximative, puis ajuster le contenu précis de la deuxième traduction, en fait, vous pouvez constater que peu importe les réseaux de neurones intelligents, terminerez encore surface de référence le plus créatures intelligentes, qui est, nous en tant qu'êtres humains.

Que Matsushita a demandé au garçon, « l'embarras disparaître

Le développement de la traduction automatique ne signifie pas que l'avenir de la profession de traduction ne sera pas la nourriture à manger. On peut noter que Microsoft a souligné que la conférence « dans la traduction anglaise de l'ensemble de test », « jeu de test Nouvelles générales newstest2017 », l'ensemble de données peut ne pas être en mesure d'effectuer bien assimiler avec la polyvalence, ce qui peut aussi expliquer pourquoi Tencent juin évidemment la traduction habituelle était bon, mais pourquoi est-performances inexactes dans l'interprétation de Boao.

Une traduction simultanée peut être dit est le point culminant de la tâche, il faut avoir une compréhension correcte de l'audience de condamnation initiale, mais aussi la conversion pendant une période de temps limitée à une autre langue, et ne pas oublier de dire qui ne se traduira pas tout le temps d'attente, donc égale reconnaissance vocale et la traduction de la machine doit être synchronisée, plus le bruit sur place, haut-parleurs expressions, le ton du mot interjections et ainsi les facteurs de confusion sont susceptibles d'entraîner une erreur judiciaire de la machine.

À mon avis, Jun traduction Tencent, peut être accusé de points peut tout simplement pas travailler assez dur, nous ne les noms propres ne pas mettre la clé d'entrée, qui sera « une route et une ceinture » cette « erreur classique » a eu lieu.

Mais à part l'interprétation simultanée, je un test classique à une traduction Google, traduction juin Tencent, le traducteur de manière appropriée et traduit de petits nuages, avec un poème « Matsushita a demandé au garçon. » Vous pouvez voir l'erreur la plus évidente est Google, qui traduit en « Panasonic a demandé au garçon, » et à partir des résultats de traduction, Tencent Choi Jun et petite traduction de traduction sont tout à fait correct, le traducteur de manière appropriée à droite seulement la moitié si la capacité de traduction Tencent ou au-dessus des niveaux de l'industrie.

De là, vous pouvez voir une différence intéressante, pourquoi l'Occident était la traduction automatique aveuglante mal, la traduction automatique, mais le pays est presque en mesure de maîtriser l'intention? En effet, Le langage humain ne peut pas être les scénarios d'utilisation divorcé existent Que nous insistons sur le fait souvent contexte l'apprentissage des langues (contexte), qui vient de notre culture passée, il y a des souvenirs du passé constitué, n'a pas lu le Google Tang ne peut naturellement comprendre l'essence de ce poème. Les barrières linguistiques seront les derniers de l'ère de l'intelligence artificielle de l'homme, parce que la langue sera en constante évolution en raison de l'usage humain, il est difficile d'usiner l'alternative parfaite.

Avec les progrès technologiques, un jour, de la traduction automatique devenir « Dégradé » « utile », et a ensuite évolué en « utile », mais comme je l'argument comme dans les articles de ces dernières, La machine ne sera pas volé du travail humain, permettent un fait humain au chômage, que la nôtre. La meilleure façon d'utiliser l'intelligence artificielle pour devenir leurs propres outils pour se soustraire à l'ennui fastidieux du travail, c'est la bonne posture pour faire face à l'avenir.

  • Auteur: scientifiques Deepbelief AI. Chine Institut scientifique des données. l'exploitation minière asiatique appartenant fondée en 2002, première grande entreprise de données de Taiwan en Chine Taiwan.

  • Une série Bref historique:

    / Rouge à lèvres Bref historique Bref historique / Une histoire de bref Bref historique Bref historique Bref historique de l'histoire de mariage de courte de bétail / High Speed Rail / paiement / dépanneur / Tokyo Ginza / Photographie Brève Histoire / Histoire Brève de parfum

« Cet article ne représente que le point de vue de l'auteur. »

« Photos | Vision Chine »

« Lire l'original » à l'école « Qin Shuo College »

Écoutez « l'histoire de la civilisation commerciale sino-américaine »

Afficher le mode Charging Dock support plat à votre téléphone intelligent et tablette devenir Président
Précédent
Débarrassez-vous du système d'évaluation de l'expérience « ligne » chargeur sans fil Bulls
Prochain
Les subventions pour les véhicules neufs d'énergie va inaugurer la plus grande descente, les prix des voitures d'énergie à tous les plans?
Tsui Hark « Di Renjie de quatre rois » a gagné le public fortement recommandé: ce sont les véritables blockbusters chinois
Je ne m'y attendais pas qu'un jour je fait aller au cinéma pour seulement Candlestick!
Comment le premier semestre 2018, le développement de la sécurité de l'intelligence artificielle
De l'achat à Yao Hao, pourquoi le marché immobilier va tomber dans le plus souligné plus le cycle?
Arts de l'habitat espace-temps XESS fenêtre flottante choc TV pleine scène communiqué
Les belles femmes et la « bête » avec dix un département de Zoologie petit ami que vous méritez!
Hong Kong International pour construire un centre d'innovation où chemin possible?
Haofeng XU « Poésie yeux fatigués fin du monde » premières images fixes d'exposition, Zhou Xun, Chen Kun après six ans d'arts martiaux au revoir
Fiez sur le maquillage peut agrandir vos yeux, je ne dis pas que dès le couteau!
Qu'est-ce que les pairs « modèles d'explosion »
« Utawarerumono hypocrite masque » Commentaire: drame hors de l'écran, et l'avenir