IFLYTEK gagner la conférence annuelle supérieure 2019 sur l'ordinateur Vision et le nombre d'examens ICDAR CVPR

IFLYTEK AI Institut de recherche en commun discours USTC et l'information linguistique traitement National Engineering Laboratory (NELSLIP) (ci-après dénommés collectivement IFLYTEK - USTC équipe conjointe) Top Computer Vision Conférence tenue récemment à CVPR 2019 et l'analyse de documents et réunion de premier ordre de reconnaissance ICDAR 2019 évaluation d'un certain nombre de tâches pour gagner le championnat en:

1. Get Objects365 minuscule piste d'abord, Objects365 pleine piste troisième succès sur l'objet détecté Défi DIW 2019 (détection dans le défi sauvage Atelier 2019) Vision par ordinateur et reconnaissance Conférence internationale (CVPR 2019) organisée;

2. Dans un certain nombre d'événements Conférence internationale sur l'analyse de documents et de reconnaissance (ICDAR 2019) organisé par et en prenant soin de la reconnaissance de la formule mathématique manuscrite Défi CROHME (concours sur la reconnaissance des Handwritten expressions mathématiques) Texte intégral de la scène visuelle, ainsi que deux tâches Q Défi ST- tous les trois VQA champion des tâches (texte Scène Answering Visual question) défi, plaques de rue a également fait défi de la reconnaissance de texte chinois rects (lecture de textes chinois sur écriteau) champion de la tâche de reconnaissance de mots.

Ces marques de série le IFLYTEK succès accumulé dans le champ de vision informatique maintiennent de plus en plus profonde, et toujours le niveau avancé et le rythme de l'exploration.

DIW Défi 2019

DIW 2019 Défi organisé conjointement par le désert chilien, comme la technologie et la source de l'intelligence artificielle Académie de Pékin, le tournoi a attiré des entrées y compris Tencent, Baidu, etc. plus de 300 octets en battant des équipes, leur utilisation ensemble de données Objects365 contient 630000 l'image, jusqu'à 10 millions boîte artificielle de callout, couvrant 365 catégories d'objets de tous les jours, la détection d'objet appelé le plus grand ensemble de données communes.

Par rapport aux bien connus et des ensembles de données IMAGEnet COCO, ensembles de données Objects365 plus proches des scènes de la nature, couvrant plusieurs catégories et fournit une marque plus intense, parce que la distribution des données est extrêmement inégale, ce qui augmente considérablement la difficulté du jeu, à algorithme mis en avant des exigences plus élevées.

Comme les deux tâches de base de la vision par ordinateur, la détection d'objet et la segmentation a longtemps été importantes sociétés de recherche de l'industrie. équipe IFLYTEK en Octobre 2018 établi une nouvelle évaluation internationale faisant autorité PAYSAGES URBAINS tous les pilotes automatiques deux sous-tâches (segmentation de la scène de conduite et la division des instances sémantiques) record du monde.

Dans ce jeu de DIW2019, IFLYTEK - équipe syndicale USTC basée sur les technologies visuelles antérieures accumulées à l'échelle des objets pour la diversité des tâches et le nombre d'échantillons répartition inégale des caractéristiques de la détection d'objet réalisé cadre classique plus rapide-RCNN améliorations ciblées: échantillon mixte stratégie d'amélioration des données pour améliorer la capacité de généralisation, réseau déformable à plusieurs niveaux tels que le terrain réceptif convolutionnel peut accueillir plus bloc candidat sous l'échelle correspondante, cascade d'améliorer progressivement la qualité du système de détection du bloc candidat. Aussi pour plus difficile tâche de Tiny Track (taille réduite de l'échantillon), la migration Objects365 piste amélioration des performances du modèle Objects365 piste minuscule, et la fusion de deux modèles de piste pour améliorer encore la détection de l'effet de la pleine piste.

la détection et la segmentation objet dispose également d'une large gamme d'applications dans le secteur industriel, l'accumulation IFLYTEK de la technologie sur la base de ces deux tâches non seulement veiller à ce que l'équipe a continué à rester compétitif dans toutes les compétitions, mais aussi fournir une base solide pour l'application de support technique soit l'identification graphique des machines de traduction iFLYTEK, domaine de l'imagerie médicale de diagnostic auxiliaire, ainsi que des techniques de structuration vidéo dans la compréhension vidéo, etc., impliqué dans la poursuite de iFLYTEK sans relâche de la technologie de base et d'application solide atterrissage détermination.

CROHME Défi

En 2018, la reconnaissance graphique ICPR MTWI Défi USTC IFLYTEK Academy a balayé tous A.I. champion trois tâches, parle le leadership IFLYTEK dans des scènes naturelles technologie de reconnaissance de caractères. La mouche auditive - USTC équipe conjointe pour sélectionner plus difficile difficulté de la tâche de reconnaissance formule mathématique manuscrite CROHME. L'événement par l'Institut de technologie de Rochester (Rochester Institute of Technology) est responsable de l'entrepreneur, a attiré MyScript, plus de Samsung, WIRIS (MathType), l'Académie chinoise des sciences Institut de l'automatisation, l'Université Zhongshan et d'autres institutions de recherche nationales et étrangères bien connu, impliqués dans le domaine de la reconnaissance de la formule mathématique manuscrite .

IFLYTEK - USTC équipe conjointe pour participer à la reconnaissance de la formule mathématique manuscrite en ligne (en ligne Handwritten expressions mathématiques de reconnaissance) et écrit à la main hors ligne de reconnaissance de formule mathématique (Hors ligne Handwritten expressions mathématiques de reconnaissance) des deux tâches principales, à l'exception de ces deux tâches est que l'ancien la trace de stylo d'entrée manuscrite des formules mathématiques, il enregistre l'ordre écrit de coups, souvent utilisés en temps réel, les scénarios d'application de reconnaissance d'écriture en ligne, les besoins en ligne du système de reconnaissance de l'écriture manuscrite pour recueillir des caractères écrits des utilisateurs sur les téléphones mobiles, tablettes et autres périphériques d'entrée de la ligne le suivi du système en entrée, cette dernière image était des formules mathématiques d'entrée écrites à la main, souvent utilisés dans la photographie, le balayage scénario d'application de reconnaissance de l'écriture manuscrite en ligne, ce scénario, l'utilisateur n'a besoin que de photographier un caractère écrit à la main dans le système de reconnaissance de l'écriture manuscrite en ligne à pour compléter l'analyse et l'identification.

CROHME 2019 ensemble de données utilisées sont collectées par l'Institut de technologie de Rochester et des formules mathématiques annotation manuscrite, dans laquelle un total de l'ensemble de la formation 9993, la validation a établi un total de 986, un total de 1199 ensemble de test, le jeu nécessite non seulement le système de la concurrence identifie formule chaque caractère nécessite également le système d'entrée donne la relation de position entre les caractères sont reconnus, et par conséquent, par rapport aux tâches OCR conventionnelles, la difficulté de la tâche est que:

1) Localisation relation

La relation de position ne sont plus seulement un seul gauche ou de haut en bas rapport de tâches de routine OCR, il existe différentes combinaisons de la relation structurelle entre la emboîtée verticalement, comprenant, norme supérieure et inférieure ainsi que la relation de ces structures;

2) la taille des caractères

les différences de taille de caractères dans les formules mathématiques plus que les tâches classiques OCR;

3) le style d'écriture

Writer style d'écriture fera entre quelques-uns des différents personnages créerait de la confusion, et les mêmes caractères écrits par différents auteurs, non seulement le caractère des différences morphologiques peut être grande pour les tâches en ligne, suivre l'ordre des accidents vasculaires cérébraux sont également susceptibles d'être incompatibles;

zones de reconnaissance de caractères manuscrits IFLYTEK cultivent depuis de nombreuses années. Avec l'idée traditionnelle d'une reconnaissance de la formule mathématique et reconnaissance de caractères reconnaîtra la relation de position entre chaque modèle est différent du système de la concurrence IFLYTEK Il se base sur l'utilisation de la technologie de reconnaissance de caractères manuscrits COdeurDECodeur basé sur l'idée d'un mécanisme d'attention spatiale pour parvenir à une formule mathématique à la fin de la relation des personnages et des lieux reconnus, ainsi qu'un mécanisme d'attention spatiale multi-échelle à des différences de résoudre par la taille des caractères plus gros problèmes de perte causés par la reconnaissance de caractères. En outre, le problème pour les auteurs de différents styles d'écriture, mécanismes proposés pour guider le mécanisme de l'attention du temps d'attention et de l'espace, améliorer la précision de l'attention des deux dimensions de l'espace et le temps, et enfin l'intégration d'une variété de différents modes d'information renforcer l'effet de la décision finale du système.

Basé sur la technologie de base solide de l'intelligence artificielle, IFLYTEK atterrissent activement dans les applications. En particulier dans le domaine de l'éducation, leader de l'industrie de la technologie de reconnaissance de l'écriture manuscrite de haute précision, technique d'évaluation intelligente pour les applications typiques au nom du système de marquage intelligent, est maintenant en CET, et plus dans l'examen d'entrée au collège pour obtenir une combinaison de scores intelligents assistée par ordinateur humain de nouvelles façons, le maximum de garantir la qualité du marquage. Pendant ce temps, dans l'enseignement quotidien, basée sur l'identification précise de chaque test étudiant la pratique du travail individuel et l'exploration de données de profondeur, IFLYTEK forment un moyen axée sur des données précises personnalisé pour atteindre l'enseignement. Photo identifier, évaluer une analyse intelligente des connaissances de chaque élève de maîtriser le maillon faible, des recommandations ciblées d'apprentissage personnalisé, de sorte que chaque enfant a une capacité de différents niveaux de devoirs pour leur maison, de sorte que chaque enseignant a plus temps individualisé favorisent.

ST-VQA Défi

ST-VQA (Scène texte Question visuelle Answering) est un cryptogramme visuel (Computer Vision Centre) challenge quiz organisé, ce qui nécessite algorithme d'analyse peut être comme une relation humaine entre l'entité d'image et répondre correctement le problème. Cet aspect de la technologie front-end et l'algorithme de segmentation détection d'image exigences proposées; aspect comprend en outre un algorithme multimodal nécessite la fusion de données, la capacité de raisonnement et de compréhension, il est l'un de la direction du développement futur de l'intelligence artificielle.

La scène afin de trouver le bus de destination bleue figure ci-dessous, il faut d'abord identifier l'emplacement du bus bleu et bus de destination inférées affiché sur l'écran d'affichage électronique en face du bus, et enfin algorithme doit identifier le contenu de l'affichage électronique.

jeu total ST-VQA est divisé en trois tâches, à savoir Task1-fortement contextualisée, Task2-Faiblement contextualisée et Task3-Ouvrir un dictionnaire, la différence entre les trois tâches que chaque image Task1 donné une liste de mots candidats, Task2 ont l'ensemble des données, étant donné une liste de mots candidats, et il n'y a aucune prévision Task3 supplémentaire pour aider le vocabulaire des réponses. Les trois tâches difficulté augmente progressivement, IFLYTEK - équipe conjointe USTC a participé à trois compétitions, et en prenant le championnat.

Pour participer à la tâche de ST-VQA, IFLYTEK - modèle d'équipe commune USTC est divisée en compréhension visuelle avant la fin du modèle et de raisonnement visuel modèles d'arrière-plan. détection de texte et le modèle de détection d'objet comme modèle frontal est extrait de l'image entité efficace, en plus de l'ensemble de données pour petit problème de corpus, dessine IFLYTEK en utilisant le modèle pré-formation sans supervision sur les tâches d'évaluation SQuAD2.0 et des idées pour améliorer intégré avec succès dans le module frontal.

Dans la conception de l'extrémité arrière du réseau, l'équipe correspondante conçu pour obtenir des informations de fusion de l'entité Encoder-Decoder modèle et délivre les données d'image obtenues à partir de l'extrait et le dessus de réponses prédites, en plus l'intégration de multiples processus de conception Encoder-Decoder Modèle concevoir des tâches, le rendant compatible avec trois tâches, de sorte que ces trois tâches de formation en même temps, se renforcent mutuellement. participer ST-VQA dans le jeu, est de voler l'information prospective dans l'exploration visuelle de la compréhension et de la convergence des données multimodaux, les techniques utilisées dans le jeu pour le développement futur de l'entreprise dans un des aspects de l'interaction multimodale de la fondation.

Comme la région Asie-Pacifique Intelligence artificielle de renommée et de la voix intelligente des sociétés cotées, les nouvelles qui volent autour du super cerveau, la technologie IFLYTEK a suivi une politique au ciel, atterrissage produit philosophie stratégique de l'innovation continue dans la technologie de base. Sur cette base, fructueuse IFLYTEK dans la voix intelligente, le traitement du langage naturel et d'autres domaines, y compris dans le domaine de la scène visuelle compréhension obtenu des progrès considérables, et promouvoir activement la piste technique pertinente atterrissage sur l'éducation, les soins de santé, la politique et le droit, et d'autres services a été fait très de bons résultats. Avenir, iFly continuera à promouvoir les itérations d'optimisation complète et l'application d'atterrissage technologie de base, et nous nous efforçons de pratiquer avec l'intelligence artificielle de la mission de l'entreprise de construire un monde meilleur.

Léger et élégant! « Monster Hunter Monde: Ice » oiseaux forestiers poison roi démon montrent Kit
Précédent
2019 CIT: Nobles Vérités spécifications ultra-haute Dolby Atmos shine Custom Theatre
Prochain
HGUC Carl Gustav ombre pulvérisation
Roi de gloire: il a été sous-estimé deux héros, dont l'un méprisent laid
Qui est le plus chaud? Maître Lu a publié « la première moitié de 2019 le téléphone Top température »
« Smart Hôtel » pour devenir la sortie suivante, un excellent miroir noir intelligent en fin de compte si ce que la technologie?
Biographie « de Splinter Cell », « Assassin 's Creed » sera un nouveau travail! Mais pour le VR exclusif
Le nouveau commutateur Lite est vraiment un frère, en fait il y a tant d'accessoires ne peuvent pas être utilisés
Roi de gloire: la figure deviner le héros, le premier est trop simple, le second un peu plus difficile
Convient pour EVA papier peint unité illustrateur, ont tous unité oh électricité
« Visage souriant » change ongles de crabe diable, vous pouvez toujours le reconnaître?
Lorsque l'approche du modèle de l'art, le sens abstrait du changement de modèle complet en RX78
Eminem belle peinture Luo Dajun, qui a subi cette
"Strange Hunting World" de cologne tout Frozen - Malédiction graphique du jeu de dragon de glace ouvert