Fin t�l�phone phare, � Tencent excellente carte pour la premi�re fois framework open source ncnn �tude approfondie, � cadre similaire cpu le plus rapide

[Nouveau] Chi Yuan recrutement �t� AI, voile Starship. � La nouvelle g�n�ration de plan de d�veloppement de l'intelligence artificielle � publi� � l'occasion, le nouveau Chi Yuan officiellement install� Raycom Information Center, Bloc B, pr�t � partir. Au bon endroit, �toiles de mer, nous vous appelons - � se joindre � la nouvelle �quipe! COO, �diteur, �crivain, op�rations de contenu, Account Director, Account Manager, Visual Director (� temps partiel) sept nouvelles carri�res de d�marrage . Cliquez pour mettre fin � la Lire l'original Voir les d�tails.

Selon les derni�res nouvelles de la sagesse de yuans nouvellement acquise, groupe d'entreprises de r�seau social Tencent a annonc� le premier projet IA open source, qui est aussi le premier apprentissage en profondeur Tencent projet open source --ncnn excellents laboratoires de carte. ( github Adresse:

https://github.com/Tencent/ncnn)

Selon les rapports, ncnn terminal mobile avant l'optimisation ultime d'un calcul de r�seau neuronal � haute performance sur le cadre. ncnn des consid�rations de conception initiales subordonn�s profondes et utiliser le c�t� du t�l�phone. Aucune d�pendance tiers, multi-plateforme, cpu terminal mobile plus rapide que tous les framework open source actuellement connue. Sur la base ncnn, les d�veloppeurs peuvent facilement migrer vers algorithme d'apprentissage en profondeur pour r�aliser efficacement le c�t� du t�l�phone mobile, le d�veloppement de l'intelligence artificielle APP. Tencent application interne, par exemple, a �t� appliqu� dans ncnn QQ, Qzone, micro-lettres, chaque image P et similaires.

Tencent excellente carte Computer Vision Laboratory est connu pour de nombreuses applications dans le sens de ncnn sont �galement des aspects de l'image, comme la beaut� portrait automatique, photo stylis�e, super-r�solution, la reconnaissance d'objets.

New Ji-won pr�c�demment rapport�, Tencent excellente carte Tencent est l'un des trois piliers fondamentaux de l'IA, avec l'�quipe AI micro-canal et le nouvellement form� AI Lab Tencent Tencent promouvoir conjointement le d�veloppement de l'intelligence artificielle. 15 mai 2017, l'Universit� chinoise de Hong Kong titularis� professeur Dr Jia Jiaya rejoint Tencent excellent laboratoire de la carte, comme un scientifique exceptionnel. Dans la reconnaissance internationale de cette ann�e sur le jeu embl�matique --LFW et Megaface, Tencent ont obtenu d'excellents r�sultats du championnat de la carte. laboratoire de carte excellente a �t� fond�e en 2012, ax� sur la recherche et le d�veloppement et les services techniques d'atterrissage dans le traitement d'image, reconnaissance des formes, l'apprentissage automatique, l'exploration de donn�es et d'autres domaines, il a �t� pr�s de 5 ans.

algorithme d'apprentissage profondeur sur le t�l�phone au sol, pr�t-projet caffe-android-lib repose trop sur le t�l�phone de base ne prend pas en charge CUDA, les besoins du r�seau pour obtenir un acc�s rapide et petit avant. Un simple cadre simplifi�, comme caffe toujours incapable de r�pondre aux exigences de t�l�phone mobile taille du package d'installation APP, vitesse de fonctionnement. auteur ncnn estime que seulement tout con�u � partir de z�ro pour faire un mouvement pour l'extr�mit� avant de la r�alisation du r�seau, de la conception initiale de l'architecture au t�l�phone fin en cours d'ex�cution comme principe principal, tenez compte des diff�rences mat�rielles et syst�me de bout du t�l�phone et appeler la m�thode.

informations ncnn figure Tencent de pr�f�rence fournie par: comparatif actuellement connu trame similaire, cadre ncnn cpu est le plus rapide, le module d'installation de volume minimum, la compatibilit� multi-plateforme est aussi le meilleur. Pour pousser le principal CoreML Apple, par exemple, CoreML est iOS gpu informatique pouss�e principale d'Apple framework, tr�s rapide, mais seulement pour soutenir plus que iOS 11 t�l�phone iPhone, le public d'atterrissage est trop �troite, d�veloppeur principal de non open source n'a pas d'extension autonome de la communaut� open source hostile.

Comparaison avec ncnn cadre similaire

contraste

caffe

tensorflow

ncnn

CoreML

mat�riel informatique

cpu

gpu

Que ce soit open source

il est

aucun

T�l�phone vitesse de calcul

lent

rapidement

rapide

taille de la biblioth�que de t�l�phone

grand

Agrandir

petit

Compatibilit� de t�l�phone

bien

prend uniquement en charge ios11

Afin de mieux comprendre le groupe d'entreprises de r�seau social Tencent a annonc� la premi�re open source projet AI. Apr�s avoir obtenu ces informations, la premi�re fois sur le nouveau chef de projet Ji-won interview nihui.

nihui, comme C / C ++, Tencent excellente carte laboratoire de chercheur principal groupe de recherche de base en charge de l'image et de recherche sur les technologies li�es � visage et le d�veloppement de logiciels, est passionn� par la communaut� open source, le minist�re des premiers projets open source AI du groupe d'affaires de r�seautage social Tencent ncnn officiel .

entrevue Ji-won ncnn personne responsable nihui: course VGG, googlenet, mod�les ResNet tels que deux � quatre fois plus vite que d'autres framework open source connue

New Ji-won: Pouvez-vous nous dire ncnn processus de d�veloppement, en tant que personne responsable, vous voulez ce que sera le d�veloppement de ce cadre?

nihui: Dans un premier temps CNN tout en �tudiant et l'�criture de code de points et ne trouva pas une belle biblioth�que au t�l�phone, donc vous-m�me. L'espoir que ncnn peut enrichir certains, comme le soutien � plus de structure de r�seau et des plates-formes plus, la vitesse plus rapide informatique, plus important encore, l'espoir d'avoir les d�veloppeurs int�ress�s peuvent am�liorer ensemble.

New Ji-won: Que pensez-vous le plus grand avantage de l'open source peut donner Tencent apporter une excellente carte est?

nihui: Des �conomies importantes dans le co�t de l'apprentissage, beaucoup de choses l�-bas sont facilement disponibles, qu'ils ne le font � partir de z�ro une trop pratique.

New Ji-won: Pourquoi choisir ncnn pur impl�mentation C ++, donc quels sont les avantages? Comment r�pondre aux besoins des diff�rents d�veloppeurs de plates-formes?

nihui: J'aime �crire C ++, C ++ est plus proche du fond, peut contr�ler la quasi-totalit� des ressources, ex�cutez un petit prix. � l'heure actuelle principalement pour android et ios, en fait, aussi longtemps que vous le pouvez compilateur C ++.

New Ji-won: Pourquoi CPU sur le mat�riel informatique � la place du GPU?

nihui: la compatibilit� du processeur est tr�s bonne, mais les fonctionnalit�s du GPU supporte une grande vari�t� de diff�rents, pas facile � r�aliser, tels que les ios m�talliques et Android de OpenCL. Ne pas nier que le GPU sera plus rapide, mais l'optimisation du GPU est complexe, a voulu �crire un chemin GPU polyvalent est difficile, en bref, je le fais habituellement pas.

New Ji-won: Tensorflow est maintenant sur une �tude approfondie Github du cadre le plus populaire open source fournit �galement fin le d�ploiement du t�l�phone, et vous �tes compar� au plus grand avantage dans quels domaines? Comment rivaliser avec elle, gagner les d�veloppeurs?

nihui: ncnn plus rapidement au t�l�phone. Pratiquement pas de concurrence, l'accent tensorflow sur la formation, l'accent sur le d�ploiement ncnn.

New Ji-won: Comment vgg, googlenet, ResNet et d'autres mod�les sur la performance de NCNN? Avez-vous encore �t� test�?

nihui: Peut fonctionner, la vitesse 2-4 fois plus vite que d'autres connus framework open source, et nous avons r�alis� dans l'application intelligente bas�e sur les versions modifi�es de ces mod�les traditionnels

New Ji-won: lettre � micro bien connu, par exemple, comment ncnn peut �tre appliqu�?

nihui: Certains algorithmes pris en charge ncnn figure de pr�f�rence pr�vus, comme les visages des applications connexes.

New Ji-won: Can cit� Liezi plus d'applications, en particulier le traitement d'images, comment la performance?

nihui: Beaut� photos Auto portrait stylis�, super-r�solution, la reconnaissance d'objets, etc., pour un petit mod�le de r�seau peut fonctionner en temps r�el.

New Ji-won: La fin de l'application r�ussie du t�l�phone, si vous souhaitez �tendre � d'autres terminaux, comme la maison intelligente, qui sera confront� au probl�me? Votre avenir ne sera pas faire une perc�e dans ce sens?

nihui: Il place cpu ncnn peut fonctionner jusqu'�. Mat�riel clair environnement domestique intelligent, si le bras est alors transplant� devrait �tre bon.

New Ji-won: Pourquoi r�seau de neurones � partir de z�ro pour �laborer un cadre pour le d�ploiement du c�t� du t�l�phone? Est-ce que le d�ploiement de cloud moyenne a ses d�fauts in�vitables? L'avenir du nuage et comment le terminal d�veloppera? Comment la division du travail?

nihui: AR, VR besoin en temps r�el, nuage, m�me alors, ne peuvent pas je�ner en temps r�el, de sorte que le d�ploiement terminal est n�cessaire. Cloud adapt� � la manipulation de donn�es volumineuses, telles que les syst�mes de recommandation, les syst�mes de s�curit�, les terminaux pour les sc�narios d'application en temps r�el, telles que la robotique intelligente, sans pilote.

New Ji-won: En plus de ncnn, une excellente carte de ce qui projets open source?

nihui: carte excellente et quelques bonnes images et des projets li�s � l'AI, il n'y a pas de plan pr�cis, pensez � l'open source sur la source ouvrir.

New Ji-won: Selon les rapports, ncnn appliqu� au produit Tencent micro lettre, QQ, etc., nous le savons, Tencent d'autres secteurs, comme Tencent ont �galement leur propre �quipe de d�veloppement AI, alors il y aura chevauchement entre vous �tudiez? La photo montre l'excellent Tencent d'autres minist�res pour fournir le mod�le de support technique est quoi?

nihui: Tencent diff�rents minist�res ont leur propre accent sur la recherche, Tencent interne Tencent excellente carte est centr�e sur le traitement d'images, reconnaissance des formes, l'apprentissage machine, l'�quipe technique de base dans le domaine de l'exploration de donn�es, principalement bas�e sur l'ensemble de la plate-forme de r�seau social Tencent, QQ, QQ l'espace, la musique QQ, TenPay, les banques micro pour fournir l'image publique et assistance technique de reconnaissance des formes.

ncnn10 principales fonctions

1. Soutien de convolution r�seau de neurones, le soutien � entr�es multiples et � la structure de branchement multiple, on peut calculer la partie de branche

ncnn convolution de support architecture de r�seau de neurones, l'architecture du r�seau et multi-entr�e complexe multi-branche, comme vgg ordinaire, googlenet, ResNet, squeezenet et ainsi de suite. Il peut �tre bas� sur les besoins, et pour calculer un calcul de prob de branche de partie commune comme r�sultat prob d�passe le seuil, calculer ensuite la branche de Bbox. Si prob en dessous du seuil, la branche ne peut pas �tre calcul�e bbox, r�duire la quantit� de calcul.

2. Aucune d�pendance de biblioth�que tiers, ne comptent pas �BLAS / NNPACK Et d'autres cadres de calcul

ncnn pas compter sur les biblioth�ques tierces, totalement ind�pendant de la r�alisation de tous les calculs, il ne n�cessite pas BLAS / NNPACK tels que la biblioth�que de math�matiques.

caffe-android-lib + openblas

ncnn

stimuler gflags glog LMDB openblas OpenCV protobuf

aucun

3. pur �C ++ La mise en uvre, support multi-plateforme �android ios Attendez

ncnn tout le code en utilisant la mise en uvre de C / C, CMake syst�me de construction multi-plateforme, connue � la compilation ex�cuter la grande majorit� des plates-formes telles que Linux, Windows, MacOS, Android, iOS et ainsi de suite. �tant donn� que ncnn ne pas compter sur les biblioth�ques tierces, et l'utilisation de C ++ 03 impl�mentation standard utilise uniquement vecteur et std :: string deux mod�les STL qui peuvent �tre facilement port� sur d'autres syst�mes et dispositifs std ::.

4. ARM NEON Conscience optimisation niveau assemblage, calcul rapide

ncnn CPU final pour les t�l�phones mobiles a fait une course en profondeur l'optimisation d�taill�e, en utilisant le jeu d'instructions ARM NEON pour atteindre la couche de convolution, couche enti�rement connect�, couche, et la plupart piscine CNN couche cl�. Pour une plus grande architecture de registre ARMv7 pression, n�on assembleur code � la main, la m�moire pr�-align�s, les lignes de pr�-mise en cache cache dispos�es, l'utilisation de toutes les ressources mat�rielles, afin d'�viter l'optimisation accidentelle du compilateur n�gatif.

Testez le t�l�phone pour le lien 6p, Android 7.1.2.

La gestion de la m�moire et la conception fine structure de donn�es, une faible utilisation de la m�moire

Au d�but de la conception a pris en compte ncnn restrictions sur l'utilisation de la m�moire du t�l�phone, le calcul de convolution en couches, la couche tout ou similaire connect� � la mise en uvre de la couche plus grande, la multiplication de la matrice est g�n�ralement pas employ� im2col + cadre, parce que dans cette constructions fa�on une matrice tr�s grande, consomment de grandes quantit�s de m�moire. Par cons�quent, ncnn en utilisant la fen�tre glissante d'origine convolution, et optimis� sur cette base, une m�moire d'�conomie substantielle. Le calcul du r�seau au cours de la premi�re, les r�sultats interm�diaires ncnn peut �tre lib�r� automatiquement la m�moire occup�e, pour r�duire encore l'empreinte m�moire.

empreinte m�moire � l'aide de l'outil haut de statistiques RSS des articles, des combin�s de test de 6p, Android 7.1.2.

6. L'acc�l�ration de calcul parall�le � noyaux multiples, cpu big.little planification Optimisation

ncnn fournit parall�le � noyaux multiples bas�es sur le calcul de l'acc�l�ration openmp est activ� sur une vitesse de processeur multi-core de l'acc�s � des gains �lev�s. Le nombre de threads ncnn fournir une interface de commande, peut �tre r�gl�e s�par�ment pour chaque instance en cours d'ex�cution, pour r�pondre aux besoins des diff�rents sc�narios. Pour cpu t�l�phone mobile l'architecture big.little, ncnn fournit une fonction de contr�le de la politique de planification plus sophistiqu� peut �tre sp�cifi� en utilisant un grand noyau ou un petit noyau, ou ensemble, atteindre un �quilibre entre la performance et la fi�vre des limites de consommation d'�nergie. Par exemple, seulement 1 petit noyau, ou seulement 2 petit noyau, ou utiliser seulement deux gros noyau, dans vos mains.

Le volume global inf�rieur � 7. Biblioth�que �500K Et peut �tre facilement taille r�duite � moins de �300K

ncnn lui-m�me n'a pas de d�pendances, et le volume est tr�s faible, le volume des options du compilateur de biblioth�que par d�faut moins de 500 Ko, peut r�duire efficacement la charge de la taille du t�l�phone package d'installation APP. En outre, ncnn peut personnaliser la n�cessit� de charger des fichiers et des cha�nes de sortie au moment de la compilation, peut �galement enlever la couche personnalis�e non d�sir�e, facilement taille r�duite � moins de 300K.

8. conception de mod�le �volutif, support �8bit Et une demi-pr�cision magasin � virgule flottante quantification, peuvent �tre introduits �caffe mod�le

ncnn propre format de mod�le en utilisant une valeur de poids indicatif du mod�le principal de stockage de mod�le droit. ncnn mod�le contenant des champs d'extension, pour le stockage de la compatibilit� des valeurs de poids des poids diff�rents, comme un simple pr�cision conventionnelle � virgule flottante, et occupent moins d'une demi-nombre � virgule flottante et quantification 8 bits. Mod�le le plus demi-profondeur peut �tre r�duite � la moiti� du volume de pr�cision de mod�le � virgule flottante, ce qui r�duit la taille et package d'installation de temps mod�le de t�l�chargement en ligne APP utilis�. ncnn avec le mod�le de convertisseur de caffe, le mod�le peut �tre converti au format ncnn, pour faciliter la recherche rapide atterrissage.

9. supports direct � la m�moire sans copie charge de r�seau du mod�le de r�f�rence

Dans certains sc�narios, en raison du mod�le API de couche de plate-forme peut seulement acc�der � des ressources sous forme de m�moire, ou si vous voulez lui-m�me mod�le que les donn�es statiques dans le code lui-m�me, ncnn offre la possibilit� de charger le mod�le de r�seau directement � partir d'une r�f�rence m�moire. Ce chargement ne dispose pas d'une copie du mod�le en m�moire, il n'y a pas besoin d'�crire le fichier de mod�le lu dans l'entit�, et tr�s efficace.

10. Le registre peut �tre mis en uvre et �largie couche personnalis�e

ncnn fournit la couche auto-expansible d�finir enregistr�e pour atteindre, peut �tre int�gr� dans une couche sp�ciale � l'avant ncnn propre mise en uvre du processus de calcul, la combinaison d'une structure de r�seau plus libre et des fonctionnalit�s plus puissantes.

* Ceci est la sagesse de yuans de nouveaux rapports originaux, s'il vous pla�t ne pas r�imprimer sans autorisation.

Cliquez ici pour lire le message original pour voir les d�tails, esp�rons que vous pouvez rejoindre ~

Route de la soie

Apprenez � conna�tre la Chine

Fin t�l�phone phare, � Tencent excellente carte pour la premi�re fois framework open source ncnn �tude approfondie, � cadre similaire cpu le plus rapide