Google Translate est écrasé! Le premier moteur de traduction au monde DeepL est de retour, la "folie du diable" est terminée

Source: Big Data Digest

Cet article est à propos de 3200 mots , Suggérer une lecture 8 minutes

Cet article vous présente un logiciel de traduction automatique en ligne DeepL.

Tags: réalisations de pointe

Récemment, un logiciel de traduction automatique en ligne est devenu populaire au Japon.

Ce logiciel de traduction s'appelle DeepL , La raison de l'incendie est qu'il est trop responsable de son travail, La traduction est trop précise , Ce qui a provoqué une discussion animée au Japon.

A en juger par l'évaluation populaire des internautes japonais, non seulement l'effet de traduction des dialectes japonais, mais aussi les textes chinois classiques ont également été gagnés. Pas même Google Translate Chose.

Mais quelle est sa précision? En tant que logiciel technologique rigoureux, vous devez bien sûr encore utiliser Les données parlent , Le responsable de DeepL a également rendu public Résultats des tests aveugles de traduction japonais-anglais et de traduction chinois-anglais Comme le montre la figure ci-dessous, on peut voir que DeepL est simplement l'existence du niveau de concassage:

Le test aveugle consiste à évaluer le texte traduit lorsque les traducteurs professionnels ne savent pas quelle version de traduction est traduite par quel site Web. Cela a toujours été l'une des méthodes de test de DeepL.

En raison de son excellente précision, DeepL a également Reddit a également explosé , Certains internautes ont souligné que DeepL n'est pas traduit à partir de mots comme Google Translate. Comme vous pouvez le voir dans les paramètres de Textractor, DeepL prend également en charge Utilisez les traductions précédentes comme contexte pour améliorer les résultats de la traduction .

Il existe également de nombreux internautes Appelez "DeepL Powerful"!

Il y a trois ans, lorsque DeepL est apparu pour la première fois aux yeux du public, il avait attiré beaucoup d'attention. Le PDG de DeepL, Gereon Frahling, a déclaré un jour: L'objectif de DeepL est plus que des tâches de traduction, le réseau neuronal partira de la compréhension du texte et ouvrira plus de possibilités.

Quant à savoir comment développer davantage, nous avons fait une petite évaluation, puis sommes venus regarder ensemble l'histoire de la fortune de DeepL. Le petit banc a été placé, bienvenue pour vous asseoir ~

Dialectes, textes chinois classiques, articles académiques, fées de traduction automatique!

Qu'il s'agisse d'une évaluation privée ou des résultats des tests aveugles officiels de DeepL, cela suggère que DeepL peut être la traduction automatique la plus précise actuellement. Quelle est la qualité de la traduction? Vous devez toujours l'essayer vous-même.

Étant donné que cette mise à jour inclut également le chinois simplifié, avec un peu de doute et un peu de curiosité, nous sommes également préoccupés par DeepL Réalisation d'une évaluation simple , Et le courant dominant actuel Google Translator, Microsoft Translator, Baidu Translator et Youdao Translator ont été comparés.

Ce score de test Pour trois tours, le premier tour de dialectes, le deuxième tour de chinois classique, le troisième tour de papiers académiques . D'accord, nous avons maintenant cinq joueurs.

Au premier tour, regardons le dialecte.

Tout le monde sait que la culture du dialecte chinois est profonde et profonde. Si le dialecte ne peut pas être traduit correctement, alors ce taux de précision doit encore être marqué d'un point d'interrogation.

Nous avons choisi Thème 10 du dialecte du nord-est: "Je vais, tu as l'air trop stupide" . Cette question a Deux points de score, l'un est "je vais" et l'autre "frappe" . Jetons un coup d'il à la performance des cinq joueurs.

Sur le premier point de notation, Google a traduit "je vais y aller", Microsoft et Baidu ont pensé que cela signifiait "je vais y aller", et Dao a répondu "je ne sais pas", DeepL s'est très bien comporté et a été correctement traduit en «oh mon dieu» avec un ton surpris.

Sur le deuxième point, les cinq joueurs ont tous donné des réponses différentes, Google "timide", Microsoft "snobful", Baidu "shabby", Youdao "bad", DeepL "laid".

Du point de vue, les performances de Baidu dans la deuxième question sont justes, n'est-ce pas ... À peine passant, Google et Microsoft ont complètement disparu. Apprécions Test complet de DeepL :

Ceci est la première question, ne vous inquiétez pas, il y a une chance de se retourner. Ensuite, jetons un il au chinois classique. Étant donné que DeepL peut traduire le japonais ancien, il serait erroné que le chinois ancien ne puisse pas être traduit.

Le deuxième tour, le chinois classique.

En chinois classique, nous utilisons le célèbre poète de la dynastie Tang Zhang Jiuling La célèbre phrase de Mochizuki Yuanhuai: "Lune brillante en mer "Pour la question d'examen, ce poème signifie qu'une lune brillante se lève sur le vaste océan, rappelant aux gens des amis et des parents loin de l'horizon. Il devrait regarder la même lune en ce moment.

Le point de cette question est de voir si vous pouvez l'utiliser L'anglais exprime l'humeur du poème de la phrase entière . D'accord, la réponse standard pour la version chinoise a été publiée, alors qu'en est-il des performances des cinq joueurs?

Tout d'abord, du point de vue sémantique, Google, Microsoft et Baidu ont tous renoncé directement à la traduction de la deuxième moitié de la phrase. Vous avez traduit la deuxième moitié de la phrase en "Tianya à ce moment"; dans la traduction de la première moitié de la phrase, Microsoft et Baidu ont utilisé Le mot, mais la traduction de Microsoft est "La mer est née"? ? ? ?

Jetons un il à DeepL, la première moitié de la phrase est exactement la même que la réponse de Google, mais nous ne savons pas si la traduction de la deuxième moitié de la phrase a atteint le niveau de Xin Daya, mais C'est très agréable à lire, tout le monde vient aussi au goût :

La troisième question, et la dernière, nous allons examiner la traduction chinois-anglais des articles académiques par les candidats.

La clé des articles académiques En plus de la douceur des phrases, vous devez également être précis dans le vocabulaire professionnel, C'est également l'objet de cette enquête.

Pour la traduction chinois-anglais, nous avons choisi un article publié dans "International Press" l'année dernière. Les chercheurs ont étudié l'impact de la confiance des médias sociaux sur la perception du risque de confidentialité et l'auto-divulgation.

Original: Les résultats empiriques montrent que: 1. La perception du risque de confidentialité n'a pas de corrélation significative avec l'auto-divulgation; 2. La confiance dans les médias sociaux affecte négativement la perception du risque de confidentialité des utilisateurs, et la confiance interpersonnelle du réseau joue un rôle intermédiaire; 3. La confiance dans les médias sociaux est positive Influençant l'auto-divulgation des utilisateurs, la confiance interpersonnelle dans le réseau joue un rôle intermédiaire.

A en juger par les résultats de la traduction, les réponses données par les cinq joueurs sont assez satisfaisantes. Il n'y a aucun problème avec le modèle de phrase et la grammaire ,seulement C'est différent dans certains mots spécifiques . Par exemple, «auto-divulgation», DeepL et Microsoft utilisent «auto-expression», les trois autres acteurs utilisent «auto-divulgation» et «confiance interpersonnelle réseau», Youdao, Baidu et Microsoft traduit par «interpersonnel réseau» confiance ", Google donne la réponse à" confiance interpersonnelle en ligne ", DeepL est traduit par" confiance cyber-interpersonnelle ".

Comme d'habitude, regardons la réponse de DeepL.

Dans la traduction anglaise, nous avons choisi la partie introductive de l'Imperial College of Technology. Dans l'expérience utilisateur, nous devons insérer un peu, lors du passage du chinois à l'anglais à l'anglais au chinois, Seuls Baidu, Youdao et DeepL obtiennent une reconnaissance automatique , Google et Microsoft doivent toujours sélectionner manuellement la langue.

Original: L'impact mondial de COVID-19 a été profond, et la menace pour la santé publique qu'il représente est la plus grave observée dans un virus respiratoire depuis la pandémie de grippe H1N1 de 1918. Nous présentons ici les résultats de la modélisation épidémiologique qui a éclairé l'élaboration des politiques dans le Au Royaume-Uni et dans d'autres pays au cours des dernières semaines. En l'absence d'un vaccin COVID-19, nous évaluons le rôle potentiel d'un certain nombre de mesures de santé publique - les interventions dites non pharmaceutiques (NPI) - visant à réduire les taux de contact dans la population et de réduire ainsi la transmission du virus. Dans les résultats présentés ici, nous appliquons un modèle de microsimulation publié précédemment à deux pays: le Royaume-Uni (Grande-Bretagne en particulier) et les États-Unis. Nous concluons que l'efficacité de toute intervention isolément est susceptible de être limitée, nécessitant la combinaison de plusieurs interventions pour avoir un impact substantiel sur la transmission.

À en juger par les résultats, les cinq joueurs Les résultats scolaires sont relativement élevés et la normalisation de l'utilisation des langues académiques n'est pas très différente . mais, Voir la vraie connaissance pour plus de détails Seul Youdao a réservé l'utilisation de doubles tirets, mais ce n'est pas courant en chinois, à l'exception de Youdao, les trois autres joueurs n'ont pas fait de leur mieux pour exprimer "NPI".

Pourtant, le dernier rire est DeepL, bien qu'il existe encore divers petits problèmes et ne peut pas obtenir des notes complètes, mais c'est aussi un Le papier de test approprié :

Ce qui précède sont toutes les questions de test de cette évaluation, vous pouvez voir DeepL est digne d'être le numéro un des têtes de série Que ce soit le dialecte, le chinois classique ou le discours académique, a de bonnes performances, il semble que le responsable DeepL soit toujours très honnête.

Transformé de Linguee, l'apprentissage automatique permet à DeepL

Après avoir vu les performances de "spectacle unique" de DeepL, concentrons-nous ensuite sur la graine la plus performante de DeepL qui a obtenu les meilleurs résultats dans cette évaluation.

Vous ne connaissez pas DeepL? cette Linguee J'aurais dû en entendre parler, le dictionnaire de langues étrangères en ligne qui fonctionne depuis plus de dix ans, Le prédécesseur de DeepL est Linguee . Linguee est un outil de traduction qui existe depuis de nombreuses années. Bien qu'il soit largement utilisé et ait un groupe d'utilisateurs fidèles, sa qualité de traduction n'est pas comparable à Google Translate, surtout compte tenu des énormes avantages de cette dernière marque et de son statut.

mais Ce qui compte vraiment, c'est l'accumulation de technologies de Linguee , Le cofondateur de Linguee, Gereon Frahling, a travaillé chez Google Research avant, en 2007, de choisir de commencer un nouveau voyage, l'équipe Travaille sur la traduction automatique depuis plusieurs années Ce n'est qu'en 2016 qu'ils ont commencé à développer un tout nouveau système et à créer une nouvelle société, DeepL.

L'avantage concurrentiel de base de Linguee réside dans les robots d'exploration et les systèmes d'apprentissage automatique , Le premier est capable de saisir une grande base de données de plus d'un milliard de résultats de traduction de phrases et de requêtes sur Internet, tandis que le second recherche et évalue la véritable méthode de traduction de fragments similaires sur des pages Web La combinaison des deux a fait de Linguee le "premier moteur de recherche de traduction au monde" .

Dix ans accumulés, Linguee Que ce soit dans les données et l'étude de l'algorithme ne peut pas être sous-estimée Et cela est devenu directement l'avantage absolu de DeepL, jetant une base solide pour l'équipe pour former de nouveaux modèles.

Larchitecture neuronale transformatrice de DeepL fonctionne sur un superordinateur en Islande. 5.1 petaFLOPS (5100 trillions d'opérations par seconde), peuvent traduire 1 million de mots en moins d'une seconde. "L'Islande est riche en énergies renouvelables, nous pouvons donc former notre réseau de neurones ici à un coût très faible. Nous continuerons de nous concentrer sur le matériel haute performance", a déclaré Jaroslaw Kutylowski, directeur technique de DeepL.

"Notre architecture de réseau de neurones a réalisé plusieurs améliorations importantes", a déclaré Gereon Frahling. "En organisant les neurones et leurs connexions de différentes manières, Notre réseau cartographie le langage naturel de manière plus complète que les autres réseaux de neurones actuels. "

Les progrès de la recherche publiés par les universités, les instituts de recherche et les concurrents de Linguee montrent que les réseaux de neurones convolutifs sont la bonne voie pour la traduction automatique, pas le réseau de neurones récurrent utilisé par DeepL, mais ce n'est pas le moment de discuter de la différence entre les deux. Tant que vous pouvez contrôler ses faiblesses, le réseau neuronal convolutionnel fonctionnera mieux.

Par exemple, CNN traite un mot à la fois, et lorsque la fin de la phrase détermine la formation du premier mot de la phrase, cela devient un problème. Recherchez toute la phrase pour trouver le premier mot de la phrase. Si le premier mot obtenu par le réseau est incorrect, c'est trop de gaspillage. Vous devez utiliser ces connaissances pour recommencer. Par conséquent, d'autres institutions dans le domaine du DeepL et de l'apprentissage automatique se tournent vers le mot suivant ou Lorsque vous utilisez des phrases, utilisez des «mécanismes d'attention» qui peuvent surveiller ces problèmes potentiels.

DeepL in La dernière version ajoute la prise en charge du japonais et du chinois (simplifié), y compris le kanji japonais, l'hiragana et le katakana, et des milliers de caractères chinois . Actuellement, le nombre de langues prises en charge par DeepL est passé à 11 types , Bien que la prise en charge linguistique ne soit pas aussi étendue que d'autres services de traduction, tels que Google Translate et Bing Microsoft Translator prennent en charge plus d'une centaine de langues différentes, mais Précision de la traduction C'est également un point clé qui ne peut être ignoré.

L'éditeur de Techcrunch, Frédéric, qui parle plusieurs langues, a déjà commenté DeepL: "Le style de Google Translate est très direct, mais il manque certains détails et idiomes (ou traduit mal ces idiomes), et  DeepL peut souvent fournir un effet de traduction plus naturel, tout comme une traduction humaine entraînée. "

Cela dit, c'est toujours cette phrase. Il est vrai que je l'ai essayé avant de le savoir. Les étudiants intéressés peuvent l'essayer par eux-mêmes. Si vous rencontrez des résultats de traduction amusants, n'oubliez pas de nous dire ~

Enfin, le lien du site officiel remet la main:

https://www.deepl.com/translator

Editeur: Yu Tengkai

Relecture: Lin Yilin

-Terminer-

Suivez la plateforme publique officielle WeChat de Tsinghua-Qingdao Data Science Research Institute "  IA Data Pie  "Et numéro de sur" Data Pie THU  "Obtenez plus d'avantages de cours et un contenu de qualité.

Enseignez-vous à résoudre des équations mathématiques avancées en utilisant les réseaux de neurones!
Précédent
Envoyez-vous 16 conseils pratiques pour le dessin matplotlib (code joint)
Prochain
USTC × MSRA | Dr Zhou Ming conférence Record: Natural Language Processing Better Life
A « chair de poule » étape importante: les scientifiques chinois les ondes cérébrales de décodage AI, le taux de précision de 97%
De nouvelles données de recherche de la Couronne où trouver? Les chercheurs doivent-voir (lien ci-joint)
« Hey Siri » équipe de développement scientifique et technologique derrière le noir!
L'apprentissage GRAPHIC: tout le monde peut comprendre l'algorithme principe
portes logiques de protéines avec les cellules dans l'ordinateur, les jeunes chercheurs chinois Gordon sciences
Le premier moteur de traduction au monde a évolué et la «folie du diable» a pris soin du dialecte
La diffusion des « informations » plutôt que « virus »! Les programmeurs avec 500 traduction multilingue « se laver les mains »
Tsinghua lancement plate-forme de sécurité de l'équipe AI AI, algorithme haut de déception face forte, puis corriger les bugs
Limite de décision de différents modèles d'apprentissage automatique (avec code)
Petits robots aider à prendre à emporter! Parc scientifique de Zhongguancun Dongsheng ces « outil de prévention des épidémies » pour contribuer à rétablir la production de retourner au travail
tuyau de chauffage est pas chaud, les fuites d'eau ...... communautés « équipe Parkour de » l'entretien de 60 jours de plus d'un millier de fois