Cas | compte la force de combat limitant la sonde de d�tection de cible sur la sc�ne

La part de march� d'aujourd'hui est tr�s orient� d�veloppeurs qui se partageront un relativement biais� en faveur du combat, est plus comme une exp�rience m�thodologique commune de la fa�on de r�gler les param�tres. Il est soulign� que, parce qu'une grande partie du contenu du manque de math�matiques et fondements th�oriques du syst�me, il doit �tre appel� Parler, comme la diminution courbe d'utilit� marginale, comme la complexit� de l'espace caract�ristique de mentionner les concepts doivent encore �tre affin� et am�lior�, esp�rent �galement nous pouvons profiter de cette occasion et une discussion approfondie.

force limite comte se r�f�re principalement � la sc�ne dans les syst�mes embarqu�s, qui est consid�r� comme une force relativement faible pour fabriquer des puces sur le dessus de temps r�el ou quasi d�tection de cible en temps r�el. Le probl�me dans le monde universitaire et de l'industrie a toujours �t� une pr�occupation, et en profondeur l'apprentissage de plus en plus d'importance � l'atterrissage en arri�re-plan, cette question devient de plus en plus important.

probl�me

Avant de partager, d'abord soulev� plusieurs questions, nous prenons ces questions � courir � travers la part enti�re.

La premi�re s�rie de questions, dans la pratique, lorsque nous rencontrons une t�che sp�cifique, comme le probl�me de d�tection de v�hicule populaire, il appartient � la d�tection de corps rigide (int�rieur de l'objet � d�tecter aucune distorsion de la situation). Alors, combien r�seau de neurones de calcul est g�n�ralement n�cessaire pour r�pondre � la grande majorit� de la d�tection de cible dans la sc�ne g�n�rale, tout en assurant que peu de faux positifs? Lorsque nous avons besoin pour effectuer cette t�che sur une faible puissance de calcul de plate-forme mat�rielle int�gr�e, nous devrions �tre comment accomplir cette t�che?

La deuxi�me s�rie de questions, si de nouvelles t�ches auxquelles nous sommes confront�s est maintenant la d�tection de mouvement, le corps mou est d�tect� (l'objet est d�tect� la d�formation interne se produit), les t�ches de d�tection de probl�mes de corps rigide face � la m�me existence �videmment. Eh bien, parce que nous avons fait un probl�me de d�tection de corps rigide, exp�rience directement emprunt� pour vous?

La troisi�me s�rie de questions � toucher l'�me, et depuis ont �t� engag�s dans un corps mou rigide � nouveau, alors ne peut plus �tre juste une nouvelle t�che, vous pouvez appliquer le m�me ensemble de m�thodes pour y parvenir? C'est la taille standard unique pour tous les plus pr�occup�s par l'approche � alchimie �. De plus, le tr�s populaire r�seau acad�mique AutoML structure Recherche architecture r�seau Recherche et ce que l'on appelle m�me ensemble de m�thodes, que fait-il de l'importance?

Dans les caract�ristiques de d�tection d'objets sous la force limitant le sc�nario de l'op�rateur

Nous sommes � la limite de d�tection d'objet de cette m�thode est consid�r�e comme les caract�ristiques de base de la force dans la sc�ne. Google en Novembre 2016 Vitesse / pr�cision des compromis pour le papier convolutionnel d�tecteurs d'objets modernes, il y a un tel r�sultat de d�tection de coco probl�me peut �tre atteint carte mAP. Il y avait le chiffre le plus populaire du r�seau f�d�rateur et d�tecter le r�seau de neurones, leur r�seau dans diff�rentes tailles, et une certaine capacit� de la m�thode, une m�thode de temps court. Vous trouverez, toutes les m�thodes n'ont pas d�pass� la partie sup�rieure droite de la partie inf�rieure gauche le long d'une ligne en pointill�s dans les projections de la FIG, � savoir o� la vitesse et la pr�cision sont � poissons et ne peuvent pas avoir les deux, � le. De m�me, dans MNasNet documents Google a publi� en Juillet 2018, � titre de comparaison MNasNet et MobileNet-V2, et il montre aussi une courbe tout � fait similaire, sauf que l'axe horizontal remplac� par un temps de pr�diction sur le t�l�phone du GPU temps.

Ici, nous empruntons un concept tr�s populaire en �conomie, diminue la courbe d'utilit� marginale pour d�crire la courbe de ce document souvent se produire. Apr�s citer un exemple bien connu de Peisi est le scintillement de Zhu Shimao quand mang� premier bol Peisi, et son bonheur peut rayer �lev� � sept ou huit pour cent, a termin� deuxi�me bol, mai bonheur sens � d�border, mais a termin� troisi�me et quatri�me bol bol lorsque l'estimation est sur le point de vomir, mais parler aussi de ce bonheur. En d'autres termes, chaque bol une identique suppl�mentaire, les gains r�els obtenus Peisi devient de plus en plus petit, et m�me devenir n�gative.

Retour en haut de nos probl�mes, la force est consid�r� comme le visage Peisi, � notre comptage d�tection multi-cible a augment� de la m�me quantit� de force chaque fois, peut apporter pour am�liorer la pr�cision de moins en moins, et enfin tr�s peu, pire encore, Si le surajustement se produit, la courbe est �galement possible de baisser, ce qui est Peisi �t� des s�jours de la m�me broche.

Ici, il peut �tre facilement dessiner une courbe simple montre. Il convient de noter que les donn�es r�elles et la courbe vont suivre la tendance g�n�rale ne sera pas strictement s'adapter. En m�me temps, cette courbe est ni courbe ni r�ciproque polyn�me ou logarithmique, ce qui est exactement ce que la formule math�matique pour �tudier le statu quo actuel n'est pas la profondeur de l'apprentissage peut �tre d�riv� et r�solu.

En termes simples, Il est juste une ligne auxiliaire, et que ce � quoi sert-il ?

Tout d'abord, il peut nous aider � comprendre la fronti�re g�n�rale o� nous examinons la question.

En second lieu, lorsque nous concevons ajustement de param�tre exp�rimental Ils peuvent par le dessin ou faire semblant mentalement pour dessiner des courbes � diff�rentes conditions variables, ces guides peuvent nous aider � comparer les m�rites des variables. Par exemple, nous pouvons le fixer dans une variable de l'op�rateur de la force de r�glage, lorsqu'il est effectu� quelques exp�riences, donc il peut �tre tir� d'une courbe de tendance. De m�me, apr�s l'ajustement de la variable peut alors dessiner un, deux, courbe de contraste peut nous aider � juger le bien-fond� de la variable.

Le plus important, Il peut nous aider � effacer notre gamme de t�ches sur cette courbe se trouve . En premier lieu, un proc�d� pour r�soudre le probl�me dans les diff�rentes sections ne sont pas identiques, le contraste entre les diff�rentes variables dans la plage sp�cifi�e sont pas les m�mes; en m�me temps, Lorsque vous trouvez la gamme actuelle des probl�mes qui se trouve dans la courbe district monte une variable, cette variable vaut vraiment un effort de d�veloppement centr� sur les variables .

A titre d'exemple simple, comme le montre la figure, MobileNet-v1 et v2 MobileNet-, d'apr�s les exp�riences de papier ou propres, nous avons seulement besoin d'�tablir seulement une poign�e de points peut �tre tir� deux courbes. Nous devons expliquer, pour la commodit� de la pr�sentation, les donn�es uniquement sur le graphique montre la relation entre la tendance.

Il doit �tre note sp�ciale que toutes les m�thodes sont un tableau comparatif sur le look id�al excellent en une priorit� constante, par exemple, une des m�thodes d'am�lioration peu de performance (https la structure rapide downsampling MobileNet MobileNet de notre groupe depuis 18 ans, publi� simple r�glage fin : //www.jianshu.com/p/681960b4173d), dans les intervalles 100MFlops moins, mAP sup�rieur � MobileNet-v1, mais apr�s plus de 100MFlops, la MobileNet-v1 plus faible que n�cessaire.

Il faut donc d�finir la section de courbe est situ� sur la t�che.

Les op�rateurs vigueur: limitations mat�rielles

section Op�rateurs force de limitation est elle-m�me une sc�ne dans laquelle la t�che est d�finie sur la courbe a plus de facteur commun.

Comme nous le savons tous, le mat�riel lui-m�me est consid�r� comme la principale force de la puce est l'�tat actuel du d�veloppement de la puce, les prix des puces, et bien d'autres facteurs. Et, lorsque la sc�ne ne sont pas les m�mes exigences, le cas o� les m�mes conditions ne sont pas le m�me mat�riel. Si la t�che en temps r�el, il faut �t� calcul� � environ 30ms, bien s�r, sinon en temps r�el, le ralentir n'a pas d'importance. En m�me temps, et dans certains sc�narios exigent �galement la pleine puissance ne peut pas, nous devons terminer plus rapidement le temps de compter, par exemple, 10ms et ainsi de suite.

Il convient de noter la relation entre la quantit� de calcul flops (nombre d'op�rations � virgule flottante) ou MAC (multiplicateur plus) et le temps de fonctionnement r�el:

Premi�rement, �tant donn� que la structure de r�seau ayant des caract�ristiques diff�rentes de l'acc�s � la m�moire calcul�e, r�sultant en un rapport de contraste lin�aire d�faillance entre le mat�riel et l'op�rateur r�seau vigueur flops. Ici, vous pouvez vous r�f�rer �: Momenta Wang Jinwei: laisser deux perspectives d'apprentissage en profondeur le fonctionnement plus efficace. Par exemple, tr�s courant dans l�ger de convolution de la profondeur du r�seau, la quantit� de donn�es unit� d'extraction du support est plus petit que le calcul de la convolution ordinaire est plus petite que l'acc�s � la m�moire, de sorte que le cache de puce demande de plus d'acc�s en m�moire.

Pendant ce temps, dans la d�tection de cible, en plus du temps consacr� � l'�pine dorsale du r�seau de neurones, la d�tection de la t�te et a �galement pass� quelques NMS de temps. Par exemple, le nombre est pas fix� dans NMS, le temps et le co�t de cette partie du calcul du montant ne peut �tre calcul� avec plus de pr�cision.

Ainsi, si le temps directement dans le mod�le de test de la vitesse mesur�e, elle doit �tre au dispositif de mesure, il se rapporte �galement � une extr�mit� du dispositif, tel que ARM / noen, virgule flottante calcul � virgule fixe, une quantification optimis�e, est tr�s complexe, il est g�n�ralement ensuite, nous allons utiliser flops pour calculer estimation de puissance.

Par cons�quent, jusqu'� pr�sent, on peut aller sur le probl�me, Par la courbe auxiliaire, et de trouver les param�tres du mod�le optimal et la valeur maximale dans la plage valide .

La question cl� est, cette courbe comment le trouver? Cette courbe est pas vraiment n�cessaire, nous serons transf�r�s � un certain exemple de r�f�rence d�crit, nous prenons alors le temps de la courbe suivante dans notre utilit� marginale au-dessus derri�re.

Tout d'abord, la courbe est tr�s r�pandue.

Lorsque la force est le nombre enlev�, lorsque l'axe horizontal est la quantit� de donn�es, il est souvent le cas peut se refl�teront aussi l'utilit� marginale des caract�ristiques similaires, que les donn�es ne suffit pas lorsque nous sommes en plein temps, chaque augmentation d'une unit� du nombre de donn�es de distribution , le m�me mod�le de ces m�mes param�tres, la pr�cision peut �tre am�lior�e �galement en conformit� avec la courbe d'utilit� marginale d�croissante.

Donc, si les donn�es de test que vous trouverez sur l'impact des changements dans les r�sultats est tr�s grande, il est tr�s probable que votre probl�me n'est pas la quantit� de donn�es actuellement au stade, la n�cessit� de trouver des moyens d'accro�tre les donn�es. Ceci est dit plus t�t cette courbe peut nous aider � d�finir le probl�me de l'intervalle.

En outre, les crit�res d'�valuation et de validation est ensemble pas statique, dans le cas d'autres facteurs constants, la m�me m�thode que dans l'ensemble de validation simple, les r�sultats num�riques nettement sup�rieure � l'ensemble de validation complexe.

Questions sur les ensembles de formation et de validation sont derri�re nous permettra d'�largir � expliquer, nous sommes ici pour examiner le cas de t�ches diff�rentes, ce qui diminue la courbe marginale de contraste de l'utilit� est la relation entre ce que?

Par la pratique, nous avons appris que le m�me algorithme, la difficult� de la t�che de d�terminer la courbe.

Eh bien, les v�hicules et les gestes des deux t�ches pr�c�dentes mentionn�es ci-dessus, nous pouvons comparer la t�che et la courbe de relation repr�sent�e en elle?

v�hicule d'abord et les gestes de c�t�, regardez: Qu'est ce qui d�termine la diff�rence entre les diff�rentes t�ches il? Direct jeter un peu de sens intuitif: Telle est la complexit� de l'espace de repr�sentation, d�termine la diff�rence entre la t�che . Je ne peux appeler un sentiment temporaire, mais pas concluant, il vraiment oser conclusions. Bien qu'il soit le sentiment, mais la mise en place du sentiment d'un tel, nous pourrions peut-�tre de certains aider les participants � hauteur de suivi.

Alors, quelle est La complexit� de l'espace de repr�sentation Il? Ce ne sont pas une description temporaire ou quantitative du concept ne peut m�me pas d�fini avec pr�cision. Nous pouvons voir quel genre de complexe spatial, quel type d'espace est simple:

Nous savons tous que la capacit� d'apprentissage en profondeur sont les caract�ristiques de base de la description des donn�es et la g�n�ralisation, donc nous allons examiner les caract�ristiques de l'aspect particulier de donn�es comme celui-ci d'approfondir encore la compr�hension. Dans les cours de cs231n Stanford je l'ai mentionn� cifar10 ensemble de donn�es, si l'�chantillonnage pour chaque diagrammes de classes et moyenne, vous pouvez en moyenne, comme indiqu� dans le diagramme, notre intuitive pour observer la carte moyenne, vous trouverez le plus facilement reconnaissable deuxi�me voiture de classe.

Ensuite, la d�tection de v�hicule est un espace simple? Nous continuons � chercher un exemple.

Voici un exemple pour donner une moyenne, et 100 dans la s�rie de donn�es de la figure ville � l'arri�re des donn�es de v�hicule. Vous pouvez trouver le profil de toute une voiture est sortie. Et puis continuer en analyse qualitative approfondie de l'affaire, parce que le v�hicule est le premier corps rigide des donn�es, suivi d'un simple lignes claires, diff�rents mod�les des m�mes composants de base, tels que la lunette arri�re, feux arri�re, la plaque d'immatriculation, ainsi que des zones ombrag�es sous les roues de la roue. Cette carte est choisie au hasard � l'int�rieur, se sentant une petite voiture blanche de Doha, probablement parce que la voiture est pas facile de blanc sale, les gens ach�tent plus d�j�?

Il convient de noter que les exigences de la mission, la demande � la fin est de v�rifier le cul de la voiture, ou qu'il est n�cessaire de distinguer des informations sp�cifiques et d'autres mod�les de couleurs, ou m�me besoin d'une information de plaque d'immatriculation du v�hicule. Parce que quand une modification des exigences de la mission, le montant des caract�ristiques des r�seaux de neurones doivent �tre d�crits �galement changer.

Regardez � nouveau les camions. Et de la m�me voiture.

Eh bien, regardons la vue moyenne d'un ensembles de donn�es de visage humain, et des v�hicules similaires, en tirant un visage moyen presque hors d'une personne, le nez a une bouche, on ne sait pas. Mais parce que les donn�es des hommes principalement � l'ouest, donc nous allons probablement voir un des hommes occidentaux se sentent. De m�me, si la n�cessit� de t�che de distinguer le visage des �motions, qui est, des changements subtils dans les yeux, les l�vres et la demande de nouveaux r�seaux de neurones caract�ristiques d�crites dans le montant de r�clamation devra devenir tr�s grand, il est pas simple .

Continuer � regarder des exemples, des gestes, des regards vaguement pouvait voir un signe V de la victoire, cependant, cet ensemble de donn�es doivent clairement pouvoir identifier la signification fondamentale de ces gestes. Forme des caract�ristiques sous-jacentes semblent intuitive, exige aussi beaucoup.

La complexit� de l'espace de repr�sentation

Et maintenant, ont eu recours � cette caract�ristiques visuelles classiques de la carte, tout simplement, est la caract�ristique de base est des lignes et des points peu profonds, chaque couche est une couche de caract�ristiques � combiner un sens probabiliste apr�s.

Retour en haut de la complexit� des caract�ristiques de l'espace de probl�me, nous citerons un exemple extr�me, les caract�ristiques de jeu de donn�es mnist manuscrites n�cessaires, le sentiment intuitif est quelque chose polylignes droite et le cercle, et IMAGEnet est presque naturel pour une image enti�re dans la peut se rapporter � tous les aspects de l'affaire, une combinaison de caract�ristiques et les caract�ristiques de la relation a besoin presque inimaginable. Dans la pratique, nous savons tous que vous pouvez faire un bon parcours des deux r�seaux de neurones, la capacit� est loin.

Eh bien, nous savons maintenant intuitivement, pour un probl�me sp�cifique, en fait, dans une certaine mesure on peut dire qu'il a besoin d'une quantit� caract�ristique est g�n�ralement d�termin�e. Bien s�r, nous ne pouvons pas obtenir une valeur exacte du r�seau de neurones sp�cifique pour correspondre essentiellement ce montant, afin d'obtenir pr�cis que possible. Lorsque vous r�duisez les param�tres r�seau, il est li� � r�duire la capacit� du r�seau de juger certaines situations, r�duisant ainsi la pr�cision.

Je dois mentionner ici vingt-huit ans la loi, ce qui est normal dans le monde des probabilit�s, on peut g�n�ralement prendre 20% de l'�nergie pour faire face � 80% des cas, alors que 80% de l'�nergie n�cessaire pour faire face � 20% des maladies incurables restant. Nous croyons que gr�ce � l'exp�rience, probablement le r�seau de neurones pour traiter les cas difficiles que 20% des cas, avec 80% des caract�ristiques des relations combin�es, donc si vous abandonnez une partie ou toutes les maladies incurables, 20% des combinaisons possibles de caract�ristiques suffisent relation. Pourquoi diminuer la courbe d'utilit� marginale est appel�e raison d'une courbe convexe � la gauche de celui-ci.

conception exp�rimentale combat r�el

Eh bien, virtuel fini. Malheureusement, le r�sultat est que parl� devant des choses imaginaires, tout ne peut pas �tre d�duit par des formules math�matiques.

Ce Zezheng?

Salon virtuel depuis longtemps, en fait, rien de particuli�rement fa�on intelligente est d'essayer. Mais comment concevoir des exp�riences, qui est de savoir comment le test, chaque test quoi, ce qui a chang� apr�s le proc�s termin�, ou tr�s peut faire l'article. Ce qui est mentionn� ici par la conception exp�rimentale obtenir progressivement la meilleure valeur. Il est �galement le deuxi�me rapport � partager le point central.

En fait, la communaut� de recherche r�cente automl chaude ou m�thode de recherche d'architecture de r�seau est de remplacer de cette partie de l'ajustement des param�tres du processus humain cibl�.

Mais j'esp�re encore que ce rapport complet pour restaurer le processus de mise au point par des m�thodes manuelles, en r�duisant le processus de r�glage, vous montrer un petit truc et le processus de mise au point m�canisme. Bien que dans l'avenir, il risque d'�tre au ch�mage, mais il y a encore automl et nas dans le cas de l'�tape de la recherche universitaire est tr�s important, et il peut nous aider � comprendre et � l'�tude automl il.

Tout d'abord est ressuscit� dans un cadre virtuel, puis lancez un par un pour le dire.

Permettez-moi de parler de donn�es, des ensembles de donn�es, il peut y avoir un facteur � �tre ignor�. Pourquoi dites-vous, parce que nous d�pendons du degr� du papier acad�mique est encore tr�s �lev�, mais l'id�e ne papier faire, g�n�ralement en utilisant des ensembles de donn�es publics et les crit�res d'�valuation communs, parce qu'ils ne les utilisent pas comment vous vous comparez avec les pairs font? De m�me jeu n'ont ce probl�me, bien que le jeu a �t� relativement proche de la t�che r�elle, mais il doit y avoir un crit�re d'�valuation de la juste, ou ce que le classement par elle?

Mais quand faire la t�che r�elle, l'ensemble des donn�es doit avoir besoin de s'adapter aux besoins du probl�me lui-m�me, premier jeu de validation. Nous savons tous que l'apprentissage de la machine est comme la formation des �tudiants pour faire face � l'examen final. La validation set est l'examen final, les enfants pratiquent le sujet tous les jours et dans tous les cas ils ont presque l'examen final ou une force ignorante. Faites un simple ensemble de validation, la distribution des donn�es peuvent ne pas couvrir la situation r�elle dans la plupart des cas, il est possible de faire difficile, et pour certains des cas ne sera pas d�penser trop d'effort. Un autre cas est l'ensemble de validation et l'ensemble de la formation des relations en double, soigneuses normes �tablies de validation, alors qu'en fait, il y a probablement un peu plus d'ajustement de l'ensemble de la formation. Cette fois-ci personne pour faire l'ensemble de validation, vous ne pouvez compter sur eux-m�mes.

La formation ensemble de donn�es, bas� sur la relation entre l'utilit� marginale de donn�es pr�c�demment parl� avec la carte, il peut certainement essayer d'obtenir suffisamment de donn�es est roi. Peut �galement besoin d'utiliser la quantit� de donn�es ne serait pas suffisant pour apprendre quelques fa�ons de compenser la migration, o�, en raison du temps ne se fait pas. Enfin, cet article sera sur IMAGEnet et d'autres ensembles de donn�es sur la migration dans le mod�le l�ger d'apprentissage des suppl�ments.

L'importance des crit�res d'�valuation sera affich� ici, et dans des circonstances normales, nous utiliserons un crit�re d'�valuation de la d�tection des cibles communes (voir carte) pour d�crire notre d�tection de cible. Je dois admettre, est vraiment une mAP description compl�te de la base et la capacit� moyenne d'un mod�le, mais il ne peut pas prendre en compte le taux manquant et le taux d'erreur ramasser. MAP est due � une baisse de la confiance avec l'addition simultan�e de tp et fp tracer des courbes et calculer la superficie totale, donc fp ne va pas et ne sera pas ramasser l'�chantillon refl�te �videmment, le taux d'erreur pour la cueillette des questions d'int�r�t, il est pr�f�rable ou ne pas utiliser mAP.

Eh bien, nous avons commenc� � courir.

En g�n�ral, je vais prendre un certain temps pour �tablir une base de r�f�rence, la page suivante expliquer.

Ensuite, commencer l'it�ration, l'id�e de base est d'utiliser une exp�rience de contr�le (exp�rience de contr�le), changer une seule variable, toutes les autres variables fixes.

�tant donn� que chaque variable ne peut r�gler un param�tre, il est pr�f�rable d'ajuster la direction de l'am�lioration des performances le long de la plus probable, alors quelle est la variables les plus importantes? Il faut le principe familier et la recherche des r�seaux de neurones, etc. dans notre exemple sp�cifique pour illustrer.

Ensuite, nous avons parl� plus t�t pourrait �tre en mesure d'utiliser la ligne auxiliaire, apr�s plusieurs exp�riences, votre esprit peut probablement former une ou plusieurs de la courbe d'utilit� marginale d�croissante, et vous pouvez estimer la position d'une variable dans laquelle la partie sup�rieure. Ah, la tendance � la hausse des variables les plus �videntes consid�r�es m�ritent d'�tre soulign�s.

Apr�s toutes les dimensions tentent d'essayer une fois de plus, parce que, apr�s tout, un temps pour ajuster un param�tre ne prend pas en compte les interactions entre les param�tres et les param�tres.

Quand il arr�ter? Experts ajustement de param�tre g�n�ralement faible est sans fin, oui. Mais le g�n�ral est les normes �tablies de validation, mais aussi mentionn� plus haut, la main cette validation mis en situation r�aliste? Aller � une course � la situation r�elle de votre mod�le.

par exemple

Juste une question de routine de principe, maintenant nous allons donner un exemple.

Exigences Comme le montre, selon notre pr�c�dente description de l'espace de repr�sentation de la t�che, le probl�me devrait �tre possible de le compl�ter dans cette ampleur, nous devons essayer.

Tout d'abord, je besoin d'une base, bien que je veux maintenant utiliser le r�seau est 10M, les documents de 10M peuvent �tre petits, mais cette fois je vais encore aller reproduction MobileNet-v1, MobileNet-v2, shufflenet-v1 / v2, ainsi que genre de commentaires anecdotiques est encore relativement bonne r�seau toute la structure l�g�re.

Pourquoi cette question � faire d'abord, sauf en tant que cadre de r�f�rence pratique est compar�, le plus grand objectif est d'assurer la m�thode maximale lui-m�me, vous utilisez le cadre, et donc il n'y a pas de probl�me, si le temps est pas clair, � l'avenir � long terme fosse seule, ne peut �videmment pas terminer la t�che. En m�me temps, il sera tr�s facile de vous aider � trouver les d�tails du papier et du papier et faites beaucoup d'�tudiants savent que le document ne pouvait pas faire sans la cr�ativit�, de sorte que vous poss�dez probablement un document connu sous le nom de base de l'algorithme ne se mesure pas aux points pour le point de performances optimales, au contraire, le papier peut �tre une tr�s pratique, mais il semble que les choses ne sont pas tr�s innovants, et vous ne vont pas vraiment courir, on ne conna�t pas.

De plus, si le papier est d�j� un an ou deux, parmi les deux derni�res ann�es, d'autres papiers viennent avec une petite astuce int�ressante et de petits ajustements de param�tres ou petits, ces choses peuvent parfois aussi reproduire le papier classique et m�thode p�trir quand ensemble, par exemple, il a propos� Kaiming fan-in, m�thode d'initialisation des param�tres sortance peut �tre appliqu� � l'avant sur des papiers ou des projets.

Bref, c'est une uvre peut acc�l�rer le travail, le processus d'accumulation est une base d'exp�rience.

Comme beaucoup de papiers sont des papiers r�seau classifi�s ou faire diff�rents mod�les de d�tection de la t�te de d�tection, telles que l'approche en deux �tapes plus rapide RCNN, nous devons remplacer la t�te de d�tection propre usage, comme Yolo. Ensuite, je dois faire une base, et l'obtention d'un r�sultat de d�tection sous son propre ensemble de donn�es de formation.

Tout d'abord, je vais d'abord les param�tres de r�seau de base fixe, des param�tres de mise au point de d�tection de partie directement. Par exemple, ces param�tres, comme le montre la figure. Yolo SSD, ce principe est simple tentatives it�rative pour ajuster un d'un temps.

Ici dire une bouche, que ce soit yolo ou ssd, leur point d'ancrage ou d'un m�canisme de bo�te de priorit� qui est compatible avec le nombre de diminuer la courbe d'utilit� marginale, comme cette image de l'Essai v2. Vous voyez, cette courbe est pas partout. Alors, quand il convient d'augmenter la quantit� de temps pour am�liorer la pr�cision est tr�s utile, mais dans des sc�narios limit�s consid�r�s force ne peut pas ajouter trop, parce que la proposition globale sera trop, NMS deviennent aussi beaucoup.

De plus, ce point d'ancrage de la longueur sp�cifique du cluster et la largeur, tant que globalement conforme � la distribution des donn�es, peut �tre, pas tr�s pr�cis, chaque fois avec des donn�es de distribution ont augment� �galement ne pas r�p�ter le cluster, car le retour retournera automatiquement pour terminer le processus , pas trop loin d'�tre suffisant. Ici, il ne d�marre pas.

Apr�s les param�tres de d�tection ont �t� ajust�s, mais aussi se concentrer � nouveau les param�tres de donn�es d'incr�ment d'ajustement. des donn�es incr�mentales est �galement tr�s important, en fait le m�me ordre d'id�es, les donn�es suppl�mentaires est compatible avec la diminution courbe d'utilit� marginale, rien � voir avec trop, et l'augmentation des donn�es ou des donn�es pour l'augmenter.

Voici o� vous pouvez r�ellement poser la question, est cette partie des param�tres Pourquoi faire � ce stade? Pourquoi ne pas d�couper le r�seau f�d�rateur � la t�te de test plus un 10M. Ici, je suis personnellement plus enclin � tester dans le processus de mise au point ult�rieure plus end2end, parce que votre objectif est chose de d�tection de cible. En m�me temps, il est � noter que ce cas ne sont pas les param�tres optimaux du param�tre, juste une base de d�part, apr�s avoir d�termin� la prochaine it�ration du r�seau f�d�rateur viendra � nouveau.

Maintenant, nous devons commencer � r�duire la structure du r�seau, bien que l'avant-garde de cette partie de la recherche ont exprim� leur plein NAS peut �tre fait. Par exemple, Google NasNet MNasNet 2017 et 2018 ans, mais je ne pense qu'en g�n�ral, la plupart des gens ne pouvaient pas se permettre de d�ployer un cadre distribu� permet de rechercher rapidement la recherche de la structure du r�seau. Sur la droite est la recherche NasNet la structure du r�seau, il ne ressemble pas con�u.

Nous avons progressivement ajust� manuellement sur la base de la valeur initiale sur elle, il peut en effet atteindre la recherche optimale par rapport �, mais parce qu'il ya tra�able exp�riment� quand il est probable que l'utilisation processus d'apprentissage par renforcement nas un peu plus vite l'�cole . Mais cela ne peut pas se vanter, il est possible de dire que l'avenir n'est pas bon de mourir.

Les documents MobileNet-v1, il y a plusieurs directions peuvent �tre r�gl�es: la largeur, la profondeur et la r�solution.

deux articles connexes premi�re largeur, cette comparaison a, principalement ADC et AMC, fait le m�me groupe. Les deux documents peuvent �tre pas fait par �tape pour s�lectionner la largeur de la couche optimale, les r�sultats �taient bons. Ici, nous �tions, comme le taux de compression largeur MobileNet-v1, mais peut parfois �tre quelques diff�rences couche d'ajustement correspondant.

La profondeur, qui est, l'addition et la couche de soustraction. Le probl�me ici est que, puisqu'il est pourquoi ajouter la couche de compression, tout comme la largeur de la baisse, le montant du calcul a �t� sensiblement vers le bas, peut �galement augmenter la profondeur de la conformit� dans le calcul du montant et de l'ex�cution.

Il y a aussi la profondeur d'une question tr�s importante est de choisir quelques �tapes, le r�seau de classement g�n�ral est 32x sous-�chantillonnage, 5 stade Ge, Kuang selon DetNet utilis� dans 16x sous-�chantillonnage, 4 platine standard mis en avant en 2018. L'avantage est, featuremap entr�e 224x224 est d�tect�e t�te de 14x14, et peut prendre soin des d�tails de la s�mantique, tandis que la vitesse ne tarde pas.

Pour les informations s�mantiques et les d�tails pour maintenir de meilleures m�thodes de d�tection, FPN est un bon choix, mais un peu lourd � la limite de comptage de force FPN, la pression de service en temps r�el un peu gros.

Pour la r�solution, nous osons supposer que c'est une dimension n�glig�e peut temporairement en raison de la haute r�solution peut seulement apporter une petite pr�cision cible et la fronti�re am�lior�e. En g�n�ral, peut �tre ajust�e pour se concentrer sur d'autres param�tres dans une super-r�solution viable ci-dessous.

Ici aussi, il implique un certain nombre d'autres peaufinage, par exemple en utilisant la taille du noyau de convolution ou d'autres formes, par exemple pour am�liorer le champ r�cepteur. Convolution et par exemple ajour�e convolution 5x5. Mais il y a des trous dans la performance de convolution des appareils mobiles comme un g�n�ral.

La prochaine �tape est de trouver une vari�t� d'ajustement dans un point de compromis optimal, par cons�quent, j'ai essay� sur cette structure de r�seau MobileNet-v2, quelques ajustements pour essayer diff�rentes largeur, profondeur et affiner la structure. Le point de la moiti� gauche de cette largeur est sensiblement 3/8, 3/4 point de la moiti� droite de cette largeur. La fl�che indique la ligne de base apr�s une coupe simple en profondeur de finition sc�ne.

Donner un petit exemple, ici pour MobileNet-v2 est un petit point me pour mettre au point, qui est 1/4 de la taille d'un goulot d'�tranglement que quatre minuscules, si cette valeur est trop petite conduira � une description des caract�ristiques de trop faible, et son impact global sur le r�seau pour transf�rer grande quantit� de calcul est pas grande, vous pouvez essayer.

Ici somme up, il est tout simplement de trouver les dimensions de l'un des plus doivent �tre ajust�s dans l'�tat actuel, dont les dimensions doivent compter sur son exp�rience et les collines de pierre. En outre, dans des circonstances normales, il serait nettement am�lior�e si une variable, puis en se concentrant sur l'optimisation de ce qu'il chant, ce qui est dit avant la tendance � la hausse de la courbe d'utilit� marginale d�croissante est une valeur des variables plus �videntes consid�ration importante.

Et ce qui est le plus n�cessaire de l'ajuster, si l'exp�rience qu'ils ne pouvaient pas penser quand il choisissait un, car il est vraiment possible des merveilles oh. En fait, mon sentiment est que c'est en fait processus de recherche de chair humaine peut �tre consid�r�e comme un processus de descente de gradient stochastique, chacun avec leur propre fonction d'�valuation est de trouver une dimension optimale, puis � l'it�ration optimale. Et parfois, vous pouvez essayer d'ajuster une plage de valeurs que pr�vu, comme l'approfondissement de la coupe apr�s un r�seau �troit lorsque vous pouvez ajouter une couche en exc�s, pour voir la tendance. Ce sera comme un grand taux d'apprentissage, ou lorsque l'algorithme de recuit simul�.

L'ajustement est l'avantage de la chair humaine, je ne ai pas besoin d'ajuster chaque fois dans le m�me rythme d'apprentissage, parfois, vous pouvez faire un grand pas, de gagner beaucoup d'it�rations.

Eh bien, enfin trouver quelques mod�les, mais il est quelque chose d'autre, maintenant besoin de revenir en arri�re et tourner la structure actuelle, ajustez les param�tres avant. Et apr�s pour d�terminer ces param�tres, mais aussi � nouveau pour choisir la structure r�seau revalidation une fois. Cas parce qu'il ya plusieurs variables influent sur le r�sultat de l'effet combin� ici, ainsi que l'�valuation des facteurs de causalit� des d�fauts de processus de formation standard ou facteurs al�atoires. Mais ici, par rapport � la charge de travail pr�c�dente n'a pas, parce que d�j� exclu quelque chose �vidente ne pas les options de travail.

Enfin, le v�ritable test par la t�che elle-m�me pour r�gler la validation ensemble en fonction des probl�mes r�els. Si vous avez un probl�me, je revenir � un point sur le front, puis transf�r� � nouveau.

Des exemples de juste viennent temporairement � une fin en ce moment jeter la deuxi�me question, apr�s tout, dont l'avis mentionne la n�cessit� de parler, en fait, par rapport aux r�ponses que nous avons d�j� � l'esprit la r�ponse.

Selon contexte pr�c�dent, les donn�es disposent diff�rence d'espace entre ces deux questions est �norme, donc, en fait, deux questions ne peuvent pas �tre migr�es directement � apprendre, cependant, la m�thodologie est applicable ici, o� paresseux, ne d�crit comment d�velopper Remontez � nouveau, et je crois que l'exp�rience de la premi�re t�che, cette t�che n'est pas difficile � faire, le nombre d'it�rations sera consid�rablement r�duite.

Et en expliquant, je crois que le probl�me commence peut aussi obtenir des r�ponses.

r�sum�

Tout d'abord, les bases sont importantes, le besoin de conna�tre beaucoup d'exp�rience d'ajustement des param�tres de base, il est fortement recommand� que vous allez � l'apprentissage d'acc�s, comme le grand Dieu Kuang Wei Xiu Blog S�nat.

Deuxi�mement, nous devons faire m�thode exp�rimentale comparative rigoureuse pour vous aider � obtenir exactement ce temps pour ajuster les gains de performance et de r�fl�chir sur les raisons de cet ajustement apport� des changements. Car une fois les changements de param�tres multidimensionnels, il est difficile de d�terminer � la fin quelle est la dimension du probl�me, ne peut pas d�terminer avec pr�cision la cause. De plus, ici, tout en excluant l'effet du param�tre multidimensionnel composant croix, mais peut �tre compens� par une m�thode it�rative vis.

nous avons besoin en particulier, pour rappeler que l'amende conduirait � la conception exp�rimentale et le nombre de tentatives que le chemin est tr�s long, tr�s patience. A ce stade, il est n�cessaire de r�duire la dimensionnalit� avec assurance, afin d'�viter un certain nombre de facteurs que je ne sais pas par o� commencer, vous pouvez rencontrer un probl�me lors de la sp�culation audacieuse et questions hypoth�tiques, des exp�riences soigneusement con�ues pour v�rifier la probabilit�, il y aura une grande surprise.

Enfin, le travail suppl�mentaire / outil est essentiel, est la base pour l'it�ration rapide. Vous pouvez donc choisir un cadre pratique � utiliser est essentiel, pour maintenir les d�tails du cadre est �galement tr�s important. Digne de recommandation est que vous pouvez utiliser Duoka Jia Duo Kajia vitesse rapide, alors il est n�cessaire de regarder la lecture sur le disque dur et les goulots d'�tranglement d'�criture, il est recommand� pour SSD. Cependant, il y a peu de bonnes nouvelles, petit mod�le de formation unique mod�le rapide, tentative multi-facteur lors de l'it�ration vitesse peut �galement �tre accept�e.

Enfin, un bon logiciel et les habitudes de prise de notes peuvent vous aider � trier les d�tails et essayer processus logique. Dans le cas contraire, la formation d'intervalle apr�s l'ach�vement de quelques heures, je crains que vous avez oubli� ce que le dernier ajustement.

r�ponses aux questions

Plus de liens vers des questions de r�ponse, pointe du temps de r�ponse, ici pour vous dire de choisir trois sur simple.

Le premier est A propos aspect hyperparam'etre, qui est le taux d'apprentissage taille du lot, l'it�ration de configuration et des param�tres si super. Ceci est �galement la n�cessit� d'exp�riences comparatives strictes visant � essayer. En m�me temps, hyper-param�tres est peu de changement dans des circonstances normales, le nombre total de tentatives (* batchsize d'it�ration), le montant total des ensembles de donn�es de base viennent. Il est g�n�ralement de d�terminer les param�tres de super, la faible quantit� de donn�es quand vous pouvez rester intact.

Le second est A propos de la d�tection et le rappel comment �quilibrer? Cette sc�ne de probl�me quand je l'ai eu tort, en parlant de plus est de savoir comment choisir un bon crit�re d'�valuation. En fait, si vous revenez � l'utilit� marginale mentionn� ici courbe de d�clin le plus long, l'�quilibre entre le taux de d�tection et le taux de rappel, la plupart comptent sur est de trouver un mod�le super et param�tres. Plus pr�cis�ment trouver ce mod�le, le texte parle d'une m�thodologie � faire.

Le troisi�me est Selon le mod�le l�ger, avec pr�-formation IMAGEnet ont un sens? espace arri�re fonction d'arri�re-plan, parce que la capacit� de la structure de r�seau du mod�le l�ger lui-m�me est petite, de petites quantit�s peuvent contenir fonction. Mais l'espace jeux de donn�es IMAGEnet fonctionnalit� est tr�s grand, bien plus que la capacit� du mod�le l�ger. Entra�nera un mod�le de pr�-formation aux zones de description de fonction et probl�me cible loin de grande �cole pr�-formation sur les caract�ristiques de la formation sera derri�re les nouveaux probl�mes dans le processus �cras�. Par cons�quent, lorsque les donn�es ne sont pas une solution raisonnable est d'utiliser la comparaison caract�ristiques par rapport aux ensembles de donn�es similaires pr�-formation, comme le probl�me de d�tection de v�hicule, la quantit� de donn�es ne suffit pas, vous pouvez utiliser kitti, bdd100k et d'autres ensembles de donn�es certaine migration.

Source: Ville de plate-forme p�le

Route de la soie

Apprenez � conna�tre la Chine

Cas | compte la force de combat limitant la sonde de d�tection de cible sur la sc�ne