[New Ji-won EXAMEN 20 jours � gauche en 2018, il n'a pas r�duit la popularit� de l'intelligence artificielle. En plus d'�checs, reconnaissance des visages, l'intelligence artificielle d�velopp�e exactement dans quelle mesure? R�sum� des r�alisations les plus hautes �tudes universitaires dans divers domaines, aujourd'hui, regardons la vision informatique et le langage naturel traitement situation r�elle de ces deux axes de progr�s en IA.

2018, AI en vie, les r�sultats continuent.

Bien que moins fr�quemment l'an dernier, � au-del� de l'homme � dans l'esprit, mais � aide humaine � dans l'intelligence artificielle, et maintenant exactement dans quelle mesure? Soit la venue � une fin en 2018 quand, par un examen simple.

En d�pit de la toxicit� de conversation est l'intimidation dose, et des ensembles de donn�es mis � part une t�che sp�cifique pour parler des progr�s de l'intelligence artificielle, aussi. � �tat du art.ai � MIT et �tudiants de l'UNAM font un site Web, int�gr� dans la vision couvre l'algorithme optimal ordinateur � jour, les jeux, le traitement du langage naturel, des diagrammes de r�seau et base de connaissances, des proc�dures d'induction et la synth�se de programme , traitement audio, s�rie de temps de traiter dans sept domaines.

Ici, nous avons bas� sur des documents de recherche publi�s, jetez un oeil sur le cas de la vision informatique et le langage naturel traitement de ces deux domaines de l'intelligence artificielle.

Vision par ordinateur

3D / reconstruction 3D

� 3D � peut �tre un CV mot maintenant les zones plus chaudes. Cette ann�e, il y a diverses propagande t�l�phones intelligents fait r�f�rence � la � lumi�re structur�e 3D. � Ensuite, le d�veloppement visuel 3D dans quelle mesure?

2017 CVPR, MIT, Universit� du Massachusetts � Amherst et chercheurs Google DeepMind a d�montr� le r�sultat, en utilisant un codeur automatique (VAE), construit un cadre appel� SingleVPNet, profondeur de multiples perspectives la figure ou un contour correspondant (Silhouette) g�n�re le mod�le d'apprentissage, en utilisant la fonction de rendu pour g�n�rer des images de d�tail fines de la forme 3D.

Non seulement cela, mais aussi par le cadre de leur projet de carte 2D int�gr� profondeur des perspectives diff�rentes (m�me dans le cas de l'abri), une nouvelle g�n�ration de formes 3D.

0,35 SingleVPNet r�sultats d'erreur moyenne ont �t� obtenus sur les donn�es de forme 3D fixe SharpNetCore. En d'autres termes, r�aliste forme 3D g�n�r�e par une certaine distance.

Suppl�ment, SharpNetCore est un sous-ensemble de ShapeNet comprend actuellement 55 classes d'objets communs (couvrant le champ de vision informatique commun des ensembles de donn�es de r�f�rence 3D PASCAL 3D + classe d'objet 12), environ 51.300 uniques mod�les 3D, chaque mod�le vous devez v�rifier manuellement les cat�gories et aligner les commentaires, cofond�e par Princeton, Stanford et de l'Institut Toyota (TTIC) membre du personnel technique.

reconnaissance d'action

des moyens de reconnaissance de mouvement identifiant diff�rent de l'action vid�o, cela peut �tre � travers la vid�o, ou non. reconnaissance d'image d'identification de mouvement est prolong�e, elle se rapporte � la reconnaissance d'image vid�o � partir d'une pluralit� de trames, puis rassemble les r�sultats de chacun des ch�ssis de pr�diction.

2017 NeurIPS, les chercheurs CMU College of Robot Rohit Girdhar et Deva Ramanan utilisent des m�canismes de mise en commun d'int�r�t (attentionnel), tout en maintenant la complexit� et la quantit� de l'informatique de r�seau est essentiellement le m�me, l'identification des trois images fixes et des standards vid�o de mouvement am�liorer l'identification de l'ensemble de donn�es de r�f�rence de l'op�ration. O�, dans l'ensemble de donn�es posture corporelle acquise MPII 12,5% am�lioration relative.

Cependant, regardez la valeur absolue de la pr�cision moyenne est toujours bloqu� � 52,2 pour cent au-dessus.

reconnaissance des visages

Selon les r�sultats de l'Institut national am�ricain des normes et de la technologie (NIST) a annonc� 16 Novembre de cette ann�e dans l'industrie dite � �talon-or � dans le test de l'algorithme de reconnaissance globale du visage (de FRVT) conform�ment � des dizaines de millions par la technologie de carte pr�cision de la reconnaissance sous une fausse alarme de 99%, le maintien gagnant du concours mondial de reconnaissance.

pr�cision de la reconnaissance � des dizaines de millions de sous peu plus de faux positifs de 99%, ce qui signifie sc�ne de s�curit� de base plus critique est d�verrouill�. Par rapport � la m�me p�riode de l'ann�e derni�re, la performance globale de reconnaissance augmente de 80%.

Il est � noter que, dans le proc�s-verbal, publi� en chinois pour montrer la force de la soci�t� de l'intelligence artificielle, selon les plans de la technologie (yitu), dynastie Shang technologie (sensetime), Kuang, comme la technologie (megvii) englobe les cinq si�ges dans les dix premiers, plus class� cinqui�me sur l'Institut Shenzhen de la technologie de pointe Acad�mie chinoise des sciences (de SIAT), la Chine a plus de la moiti� de l'�quipe, et � �cran tyrans � fermement cinq, le leader mondial dans l'algorithme de reconnaissance faciale.

estimation de la pose humaine

En F�vrier de cette ann�e, la ligne de la politique de l'Universit� Jiaotong de Shanghai Lu sur mon �quipe MVIG syst�me de laboratoire AlphaPose, est la premi�re dans le jeu de donn�es COCO peut atteindre le syst�me d'estimation de pose open source 70+ mAP.

Septembre, syst�me AlphaPose mise � niveau � l'aide cadre PyTorch, l'estimation de la pose sur un ensemble de test standard ensemble de validation de COCO, obtenir la 71mAP de pr�cision (sp�cifique OpenPose levage par rapport � 17%, masque RCNN opposant levage 8%), alors que la vitesse de 20fps (OpenPose rapport relativement augment� de 66%, le masque-RCNN 300% d'augmentation relatif).

AlphaPose syst�mes, deux �tapes cadre est fond� RMPE (ICCV 2017 papier) groupe de l'Universit� de Shanghai Jiao Tong MVIG propos� la construction, par rapport � d'autres syst�mes open source a consid�rablement am�lior� la pr�cision que OpenPose augmentation relative de 17%, masque RCNN augmentation relative 8.2 %.

Apr�s la mise � niveau, chacun cadre ouvert performances COCO-validation, une seule carte indicateurs 1080ti temps GPU mesur�s sont les suivants:

syst�mes Open Source

pr�cision

La vitesse moyenne

Openpose (CMU)

60 mAP

12 FPS

Masque-RCNN (Facebook)

67 mAP

5 FPS

Alphapose (SJTU)

71 Plan

20 FPS

Classification des images

Pr�cision de l'ordinateur dans la t�che de classification d'image va au-del� de l'humain, et donc la pr�cision actuelle de classification d'image les meilleurs r�sultats, souvent un sous-produit d'autres �tudes. IPSC 2017, Google cerveau Barret Zoph et Qu�c V. Le publi� un � Neural architecture Recherche avec l'apprentissage par renforcement �, ils recherchent automatiquement la structure du r�seau de neurones avec l'apprentissage de renforcement, et en fin de compte la conception AI leur propre mod�le, faire une image sur des ensembles de donn�es ICRA-10 classement obtenu 96,35 pour cent de pr�cision.

Peut-�tre surprenant, le meilleur r�sultat de la classification d'image est Facebook AI recherche de Benjamin Graham dans son 2015 traduit papier Arxiv � partiel Max-Pooling �, apr�s l'erreur est seulement apr�s 100 tests sur-10 ICRA 3,47% . Ce document pr�sente une nouvelle m�thode de mise en commun max fractionn�e et r�duire le surajustement sur une vari�t� d'ensembles de donn�es.

Le g�n�rateur d'image

En ce qui concerne la g�n�ration d'images, que la nature est g�n�r�e contre le r�seau (GAN).

GAN de plus en plus cette ann�e, ann�e BigGAN IPSC DeepMind propos�, peut �tre d�crit comme le mod�le de g�n�ration d'image actuelle la plus forte, sur la formation IMAGEnet 128x128 r�solution, BigGAN le score de lancement (IS) peut atteindre 166,3, Frechet la distance Inception (FID) 9.6.

A propos BigGAN plus de d�tails, voir ici.

GAN am�liorer aussi l'avenir et dans quelle mesure, il convient d'examiner avec impatience!

La segmentation d'images

Oui, la segmentation d'image est ce que le roi Kai Ming et al., 2017 propos� Masque-RCNN, la valeur mAP 26,2.

Ao�t 2018, l'Universit� du Michigan et des chercheurs de Google cerveau de proposer un cadre de traitement d'image s�mantique hi�rarchique qui peut r�aliser la manipulation d'images au niveau des pixels et la compr�hension s�mantique, tout ajout dans l'image, le changement, les objets se d�placent, et transparente original, vrai � Il n'y a aucune trace de PS. �

Bien que pas encore des documents �valu�s par des pairs en rapport, mais les r�sultats du papier Arxiv rapport�, ils sup�rieurs dans la segmentation d'images Selon les chercheurs.

Traitement du langage naturel

Cat�gorie / s�mantique similitude / grammaire / Critique de film / s�mantiquement �quivalent / Q / reconnaissance d'entit�s

BERT Le nom r�cemment dans le domaine de la PNL peut �tre d�crit comme en plein essor.

13 octobre mod�le BERT Google a publi� une nouvelle �quipe AI dans le niveau sup�rieur de la lecture de la machine SQuAD1.1 test de compr�hension a expos� des r�sultats �tonnants: La pleine mesure au-del� de l'humanit� � la fois! Et aussi 11 tests diff�rents PNL cr�er les meilleurs r�sultats , Y compris la r�f�rence COLLE pouss� � 80,4% (am�lioration absolue de 7,6%), la pr�cision MultiNLI atteint 86,7% (le taux d'am�lioration de 5,6% en valeur absolue) et similaires.

�quipe Google Thang Luong directement d�fini: mod�le BERT a ouvert une nouvelle �re de la PNL!

BERT nouveau mod�le de repr�sentation linguistique, ce qui repr�sente la repr�sentation du codeur bidirectionnel transformateur. Et autre langue r�cente repr�sente un mod�le diff�rent, objectifs BERT R�glage commune dans le cadre de toutes les couches sont form�s au pr�alable repr�sente bidirectionnelle en profondeur . Par cons�quent, peut �tre affin� par une couche de sortie suppl�mentaire repr�sentation BERT pr�-formation, pour construire le mod�le le plus avanc� est applicable � un large �ventail de t�ches.

Comme mentionn� ci-dessus, BERT a �tabli un record de performance dans 11 t�ches de la PNL! Dans un mouvement que l'un des r�sultats.

les r�sultats des tests COLLE, donn�s par le COLLE serveur d'�valuation. Les chiffres ci-dessous chaque t�che repr�sente le nombre d'exemples de formation. colonne � moyenne � des donn�es avec les r�sultats officiels COLLE est l�g�rement diff�rent, parce que nous avons �cart� la question du jeu WNLI. r�sultats BERT et OpenAI TPG sont les donn�es sous un seul mod�le, une seule t�che. Tous les r�sultats de https://gluebenchmark.com/leaderboard et https://blog.openai.com/language-unsupervised/

R�sultats. SQUAD BERT est d'utiliser diff�rentes formations et affinent pr�-int�gr�es les graines de point de contr�le (graines r�glage fin) du syst�me 7x.

, CoNLL-2003 R�sultats de NER. parameter Ultra ensemble s�lectionn� par le d�veloppeur, les scores de d�veloppement et de test obtenus en utilisant ces param�tres sur la moyenne des cinq red�marrage al�atoire.

Dans l'ensemble, le num�ro de mod�le BERT des t�ches dans le domaine de la PNL est actuellement obtenu les meilleurs r�sultats, y compris

Classification, similarit� s�mantique, grammaire, critiques de films, l'�quivalence s�mantique, questions et r�ponses, la reconnaissance de l'entit� et ainsi de suite.

raisonnement Commonsense

le raisonnement du sens commun (Commensense Inference), a atteint le niveau le plus avanc� est Antonio Lieto, qui en 2017 a publi� l'article: Double PECCS: un syst�me cognitif pour la repr�sentation conceptuelle et la cat�gorisation .

Bien s�r, le r�sultat de l'article est actuellement le meilleur sur le concept de pr�cision de la classification (Concept de pr�cision Cat�gorisation), 89, mais dans Dev et la pr�cision de test, le mod�le actuel est toujours les meilleurs r�sultats BERT, respectivement 86,6 et 86,3.

traduction automatique

Dans les t�ches de traduction automatique (traduction automatique), a maintenant atteint les meilleurs r�sultats de l'article Zhen Yang et al, publi� le Arxiv en Avril de cette ann�e.:

L'algorithme principal de l'article combinats Transformer + BR-CSGAN, la notation des r�sultats obtenus dans l'UEBL est 43,01, est actuellement les meilleurs r�sultats.

inf�rence de langage naturel

En mission de l'inf�rence de langage naturel (langage naturel Inference), actuellement les meilleurs r�sultats de l'article Yichen Gong et al, Publi� le Arxiv en mai de cette ann�e.:

L'algorithme utilise un DIIN de papier, en termes de taux de pr�cision est actuellement 89,84, actuellement au niveau optimal.

Ce sont les derniers d�veloppements dans la vision informatique et le traitement du langage naturel dans les deux zones. AI veulent conna�tre les r�sultats meilleurs dans d'autres domaines chaque t�che accomplis � ce jour peut se r�f�rer aux liens suivants:

https://www.stateoftheart.ai/

Route de la soie

Apprenez � conna�tre la Chine

2018 Vu do v�rit� AI d�veloppement (sur)