Auteur | iqiyi Zebian | Jia Wei

20207 F�vrier - 12 F�vrier 2020 AAAI aura lieu � New York. Il n'y a pas longtemps, un fonctionnaire de l'Assembl�e g�n�rale a annonc� les documents de cette ann�e informations incluses: Re�u 8800 � soumettre des articles, la revue 7737, recevant 1591, le taux d'acceptation de 20,6%. Cet article d�crit la th�se en collaboration avec Beihang iqiyi et d'autres organismes � ultrarapides vid�o de pr�vision de l'attention avec Coupl� connaissances Distillation �.

Documents lien: https: //arxiv.org/pdf/1904.04449.pdf

Cet article a con�u un r�seau ultra-l�ger UVA-Net, et propose un proc�d� de couplage formation de r�seau bas�e sur la connaissance de la distillation, peut �tre comparable � 11 nouveaux mod�les dans le sens de la pr�vision des performances vid�o de l'attention, alors que son espace de stockage seulement occupe 0,68 Mo, le GPU, la vitesse du processeur atteint 10,106FPS, 404FPS, am�lior� 206 fois plus rapide que le mod�le pr�c�dent.

�tant donn� que les mod�les de pr�cision de d�tection de zone d'affichage vid�o classiques ont tendance � avoir des exigences plus �lev�es sur la puissance de calcul et la capacit� de stockage, la vitesse de traitement est lent, ce qui entra�ne un gaspillage de ressources. Par cons�quent, la n�cessit� de d�tection de zone saillante vid�o pour r�pondre aux deux questions suivantes: 1) comment r�duire la quantit� de calcul et le mod�le d'exigence de m�moire, d'am�liorer l'efficacit�? 2) Comment extraire la vid�o d'une co-fonctionnalit� espace-temps efficace, afin d'�viter le taux exact est tomb�?

Pour r�soudre ces probl�mes, les auteurs ont propos� des connaissances couplage distill�e vid�o l�g�re SAILLANT m�thode de d�tection de la r�gion. d�tection de r�gion vid�o l�g�re de difficult�s est la capacit� insuffisante de g�n�ralisation du mod�le, combin� avec les rep�res spatiaux dans le domaine temporel difficiles � d�tecter les m�thodes d'impact de performance. � cette fin, les auteurs proposent une structure de r�seau l�g�re UVA-Net, et d'am�liorer les performances de d�tection de zone saillante vid�o en utilisant les m�thodes de formation de distillation coupl�e de connaissances.

MobileNetV2 comme une structure de r�seau l�ger (comme le montre le tableau 3 (a) ci-dessous), tandis que la compacit� du r�seau grandement am�lior�e, et une certaine perte de pr�cision. Sur la base de la structure de bloc MobileNetV2 CA-Res propos�, en particulier, comme indiqu� dans le tableau 3 (b), l'utilisation d'une telle structure de r�seau form�e mod�le 206 fois plus rapide que la m�thode pr�c�dente.

De la m�thode de distillation � couplage de connaissances pour former le r�seau, le proc�d� d'abord utilis� comme trames vid�o � faible entr�e de r�solution dans la vid�o autant que possible de conserver un temporel de principe important et la d�tection de l'information spatiale dans une r�gion d�sir�e, r�duire le r�seau de calcul , la structure temporelle et spatiale puis utiliser complexe du r�seau en tant que mod�le d'enseignant, coupl� � la connaissance de la distillation, structure simple formation supervis�e du mod�le �tudiant espace-temps commun, une r�duction significative de la taille des param�tres du mod�le et le besoin d'espace de stockage. Comme repr�sent� en particulier sur. La figure 6.

Figure 6: la connaissance bas�e sur la vid�o ultra-haut d�bit couplage significatif distill�e Proc�d� de d�tection de r�gion.

L'�valuation des donn�es de mod�le fix�es sur les r�sultats sp�cifiques AVS1K comme indiqu� dans les tableaux 4 et 5. De la table, nous pouvons voir les UVA-DVA-64 et d'autres mod�les de haute performance pour obtenir une performance comparable, mais le mod�le ne 2.73M, des vitesses allant jusqu'� 404,3 FPS, tandis que les UVA-DVA-32 performance l�g�rement r�duite, mais seul mod�le 0.68m, des vitesses allant jusqu'� 10106 FPS.

Tableau 4: Comparaison des performances sur le AVS1K.

Tableau 5: R�sultats sur ensemble de donn�es de trame repr�sentant AVS1K (a) de trame vid�o, (b) r�alit� de terrain, (c) HFT, (d) SP, (e) PNSP, (f) SSD, (g) LDS ,. (h) EDN, (i) iSEEL, (j) DVA, (k) SalNet, (l) m, (m) UVA-DVA-32, (n) UVA-DVA-64.

Les auteurs sugg�rent le couplage distillation ultra vid�o haute vitesse bas�e sur la connaissance de mani�re significative par rapport aux m�thodes existantes de l'algorithme de d�tection de r�gion internationale de haut niveau, la pr�cision et 11 sortes de m�thodes internationales de haut niveau plut�t, peut r�soudre efficacement la t�che en moins de capacit� de g�n�ralisation du mod�le, le domaine temporel rep�res spatiaux combin� avec le probl�me difficile de plomb, et a de bons r�sultats de la d�tection de la r�gion de saillant vid�o et migrer facilement � d'autres t�ches.

� l'heure actuelle, la technologie a �t� appliqu�e � iqiyi tentative de recherche pour le drame, la cr�ation vid�o intelligente et d'autres produits, la d�tection d'importantes r�gions de retour sur investissement de compr�hension pr�cise des images, le contenu vid�o a une grande aide. Par exemple iqiyi version verticale du mode de cr�ation intelligente, ne conservant que de contenu vid�o � partir du contenu vid�o lui-m�me d'am�liorer la compr�hension de l'exp�rience de visualisation de l'utilisateur. De plus, l'analyse de l'importance de la vid�o iqiyi multiples instructif d'affaires, par exemple des merveilles iqiyi (radar AI), il suffit de regarder � TA et ainsi de suite, donnant aux utilisateurs une meilleure exp�rience.

S'il vous pla�t citer la litt�rature:

Fu, K., Shi, P., Song, Y., Ge, S., Lu, X. & Li, J. (2019). Ultrarapides vid�o pr�vision de l'attention avec Coupl� connaissances Distillation. En AAAI 2020.

Rapport AAAI 2020:

En vertu de la nouvelle �pid�mie de coronavirus, AAAI2020 vont �galement � la r�union?

Vu refuser l'entr�e aux �tats-Unis, les participants du site AAAI2020 �chou�rent, le papier comment partager?

AAAI meilleur article publi�

AAAI 2020 l'ouverture officielle, 37% des communications accept�es en provenance de Chine, la premi�re place pendant trois ann�es cons�cutives Takeover

Une vue de texte int�gral, la connaissance carte @AAAI 2020

Hinton AAAI2020 texte int�gral du discours: Le r�seau a finalement fait la capsule droite chose

Actes de AAAI 2020: AAAI 2020 @ papier Wangjing interpr�tera (PPT t�l�charger)

Qu'est-ce que la PNL �tudie la direction du vent sur le 2020 AAAI l�?

six documents Microsoft en vedette AAAI 2020

Jingdong SKK 6 en vedette AAAI 2020 papier

AAAI 2020 s�rie de lecture de papier:

01. construire de meilleurs mod�les de reconnaissance et de traduction vocale par le biais de la traduction interactive

02. nouvelles perspectives pour explorer la � d�tection d'objet � relation mutuellement b�n�fique avec la � division d'instance � de

03. Lorsqu'une nouvelle mise en commun bilin�aire en perspective, la redondance, la nature soudaine du probl�me vient?

04. histoire en utilisant le graphique de la sc�ne pour g�n�rer une s�quence d'images pour la

05,2100 gloire du champ du roi, 1c1 pourcentage de victoires de 99,8%, Tencent doit r�aliser l'interpr�tation technique de la grippe aviaire

06. apprentissage multi-t�ches, comment concevoir un meilleur m�canisme de partage des param�tres?

07. sa langue et d'oublier? Ce mod�le peut vous aider | inverse mod�le multi-canal dictionnaire

08. DualVD: un dialogue visuel nouveau cadre

09. Avec BABELNET construire une connaissance s�m�me en plusieurs langues

10. Gully facile � remplir: fin-to-speech traduction, m�thode de pr�-convergence de la formation et de r�glage fin

11. Le temps est peut-�tre de vous deux? segments de contenu vid�o � partir d'un diagramme de temps de d�tection en deux dimensions

12. m�canismes de boule de neige pour l'apprentissage et moins de temps relation r�seau de neurones

13. En d�tectant le mod�le de caract�risation s�mantique et d�m�ler syntaxique des m�canismes c�r�braux

14. Le guidage fiducial multimodal formule multimodal abstraction automatique

15. L'utilisation du m�canisme � long d'attention pour g�n�rer la traduction de la diversit�

16. �chantillon z�ro apprendre � �largir la carte des connaissances (Vid�o Interpr�tation)

17. La r�cup�ration vid�o bas�e sur l'image du code de requ�te est open source!

18. conception de r�seau bas� sur NAS GCN (lecture vid�o)

19. diagnostic neurocognitive du syst�me �ducatif intelligent, l'apprentissage � partir des donn�es d'interfonctionnement fonction

Figure 20. La convolution en plusieurs �tapes de l'algorithme d'auto-apprentissage supervis�

21. Le nouveau mod�le, g�n�rant un dialogue plus fluide, plus personnalis� (interpr�tation vid�o, PPT ci-joint)

22. La reconnaissance de texte pour le d�couplage attention du r�seau

23. L'�tude z�ro-�chantillon sur la base de caract�ristiques visuelles contre la m�thode r�siduelle

24. Le module d'�valuation est introduit, et la ma�trise de la fid�lit� de traduction de la machine de levage (d�j� ouvert)

25. L'aide d'attitude collaborative multi-cam�ras � l'initiative pour atteindre la piste cible

26. r�examiner l'�valuation de l'image esth�tique et trouver les faits saillants point focal

27. am�lioration des objectifs de formation, afin d'am�liorer la qualit� de la traduction du mod�le non-autor�gression (d�j� ouvert)

28: balises de classification � double vue utilisant une pluralit� de faibles am�liorer les performances de classification

29. D'apr�s l'apprentissage de renforcement progressif de la politique de l'arbre

30. La repr�sentation commune bas�e sur la traduction automatique neuronal (interpr�tation vid�o)

31. Le module d'�valuation est introduit, et la fluidit� de la fid�lit� de la traduction automatique de levage (lecture vid�o)

32. Quelques fois boule de neige m�canisme de r�seau neuronal une relation d'apprentissage (interpr�tation vid�o)

33. Le non-retour auto-traduction de la machine (interpr�tation vid�o) sur la base des cibles de formation des n-uplets

34. ensemble de donn�es Examen judiciaire (interpr�tation vid�o, avec lien de t�l�chargement)

35. supervision faible segmentation s�mantique (lecture vid�o)

36. r�seaux de neurones binaires rares, ne n�cessite aucune comp�tence, pr�cision faite SOTA (interpr�tation vid�o)

Texte de la limite � 37. - Proc�d� de d�tection d'un texte de forme arbitraire

38. mod�le DCMN +: fissure � compr�hension � la lecture � des probl�mes, a remport� d'obtenir les performances du monde

39. Le double canal mod�le de raisonnement en plusieurs �tapes, un meilleur dialogue visuel pour r�soudre les probl�mes g�n�r�s

40. Inverser R? Affaiblir les caract�ristiques de saillants de la mise � niveau est d'apporter classification grains fins

41. RiskOracle: une m�thode de pr�diction accident de la circulation � grain fin espace-temps

42. Le court moment, comment pr�voir? - m�trage bas� sur le ARIMA tenseur reconstruit

43. Les jeux de soci�t� auxiliaires font, un saut marqu� (interpr�tation vid�o)

45. La nouvelle d�tection cible du faible cadre de supervision

46. algorithme d'optimisation NAS, 10 fois plus rapide!

47. L'utilisation du m�canisme d'attention pour obtenir un positionnement optimal de la cam�ra (interpr�tation vid�o)

48. Diou et Ciou: IoU corriger dans la d�tection cible ouverte

49. Pour la m�thode d'alignement de la face vid�o de masse

50. KPNet, la poursuite du d�tecteur de visage l�ger (vid�o interpr�tation)

51. La d�claration de la source et la cible n'est plus ind�pendant, repr�sentent conjointement plus pour am�liorer la performance de la traduction automatique

52. for�t compl�tement d�pendante: la facilit� de mani�re significative l'erreur transfert Relation Extraction

Route de la soie

Apprenez � conna�tre la Chine

Sur la base de distillation � couplage de connaissances, 200 fois plus rapide, une d�tection de zone d'affichage vid�o algorithme

AAAI 2020 l'ouverture officielle, 37% des communications accept�es en provenance de Chine, la premi�re place pendant trois ann�es cons�cutives Takeover

Hinton AAAI2020 texte int�gral du discours: Le r�seau a finalement fait la capsule droite chose