Nous ne faisons pas soucions sur la fa�on dont les mod�les d'optimisation, tout cela n'est pas un apprentissage machine

Lei Feng r�seau par AI Technology Review: les �tudiants d'apprentissage de la machine, les chercheurs, les d�veloppeurs d'affaires sont habitu�s � d�penser beaucoup d'efforts sur le mod�le d'optimisation, comme pour atteindre un taux de pr�cision plus �lev� / ASC / mAP et est donc la recherche et l'application de l'apprentissage machine tous. Mais peu de gens demandent: Excellent mod�le de test de performance est vraiment bon r�soudre les probl�mes du monde r�el il?

chercheur interpr�table �tudier la direction de la machine, � l'apprentissage de la machine interpr�table � auteur Christoph Molnar a r�cemment publi� un article sur le blog, appel de r�veil pour vous rappeler cette tendance dans le domaine, a commenc� � faire attention � l'application de l'apprentissage de la machine qui ne doit pas �tre n�glig�e question. Lei Feng r�seau AI Technology Review compil� comme suit.

Raconter une petite histoire.

Quelque part en Allemagne, une nuit tranquille. La plupart des gens ont est endormi, mais je ne. Je dois formation d'arriv�e des mod�les d'apprentissage de la machine. Je me comme dans le monde et le mod�le de gens fascin�s par la concurrence, nous devons voir � la fin qui peut obtenir le meilleur des pr�dictions du mod�le. ventilateur de l'ordinateur bourdonnait, le clavier m'a aussi frapp� glousser grincement. Mon mod�le actuel n'a pas obtenu un bon classement dans le leaderboard public est venu au milieu de celui-ci. fait vraiment les gens viennent � l'air. La pr�cision du mod�le est en fait passable, mais dans ce jeu, � passable � ne suffit pas. Mieux que tous les autres mod�les, est mon but ultime. Je dois aussi mieux fonctionnalit� fonctionne mieux algorithme d'apprentissage. J'ai une nouvelle caract�ristique de la mise en place de bonnes id�es, mais je peux mettre en am�liorer l'arbre de la for�t al�atoire. Ce mod�le de formation ne devrait prendre une demi-heure, puis je dois aller me coucher.

Quelques heures plus tard, le temps est maintenant trois heures et demie. J'ai finalement obtenu un nouveau mod�le de pr�diction peut avoir un impact d'une nouvelle position sur le leaderboard. Je suis plein d'espoir lieu sur le bouton soumettre. Je suis tr�s fatigu� �vos r�sultats sont en cours d'�valuation, � invite l'air si floue. Combien dois-je aller, pour aller au top 10% le font? J'ai commenc� douce r�verie. Mais les r�sultats r�els rapidement bris� mes illusions, ce moment jamais je me sentais fatigu�. Et encore moins obtenir un meilleur classement, ce n'est pas la performance du nouveau mod�le en tant que mod�le. Code, il y a bug? Il a �t� �quip�? Ou suis-je tort les fichiers t�l�charg�s? J'ai un cerveau et un probl�me qui sort, mais la raison me dit qu'il devait poser. Je tournions et retournions au lit, puis r�v� d'une croissance non-stop, un grand arbre que je ne comprendrai jamais.

� Je dois continuer � am�liorer mes mod�les d'apprentissage de la machine! �

Lunettes Opened regarder

Je me ai eu quelque chose comme �a � bricoler avec une exp�rience de course de mod�le d'apprentissage de la machine jusque tard dans la nuit, et maintenant je ne veux pas le faire, il y a deux raisons 1, sommeil normal est beaucoup plus important pour moi, 2, ma compr�hension de l'apprentissage machine a �t� grandement chang�.

Quand je suis entr� en contact avec un apprentissage de la machine, je pense que les comp�tences d'apprentissage machine la plus importante est de savoir comment former le mod�le le plus performant. Pour atteindre cet objectif, je mets toute l'�nergie utilis�e pour en savoir plus algorithmes, les comp�tences d'ing�nierie plus de fonctionnalit�s, plus des m�thodes d'�valuation de l'algorithme, tout pour rendre le mod�le d'erreur va imm�diatement vers le bas. Je suis tellement accro que j'ai m�me �crit un po�me pour la for�t al�atoire.

Aujourd'hui, mon avis a beaucoup chang�. Je pense que la � machine learning � le sens des mots est bien plus que la fonction de perte est r�duite au minimum. Dans une certaine mesure, le mod�le ajust� peut dire est la partie la plus facile, parce qu'il ya un grand nombre de la litt�rature, des manuels, des exercices et des outils pratiques pour vous aider � am�liorer la situation. Et vous pouvez toujours obtenir une r�troaction imm�diate (besoins uniquement � tester sur le mod�le de donn�es n'ont pas vu sur la ligne), dans l'ensemble tr�s satisfaisant. Je pense, � tout le champ de l'apprentissage de la machine est concern�e, le mod�le correspondent � cette r�gion a d�velopp� assez matures. Mais en plus de l'ajustement du mod�le, nous avons �galement besoin d'aborder beaucoup d'autres questions tr�s difficiles. Par exemple:

Comment pr�dire le probl�me r�el dans une t�che?
Comment pouvons-nous construire m�canisme de confiance dans un mod�le pr�dictif?
Si les donn�es de formation contient un biais? Une fois les donn�es de formation d'entr�e de donn�es et le d�ploiement r�el de multiples degr� �lev� de similitude?
Si le fonctionnement du syst�me n'est pas normal, comment d�boguer un mod�le d'apprentissage de la machine?
Quel genre de mod�le de pr�vision d'impact donn� (pr�vision particuli�rement mauvais) provoquera l'utilisateur et le produit lui-m�me?
L'existence de la relation de r�troaction pr�judiciable entre les donn�es actuelles et futures pr�vues ajoutera � la formation?
Un mod�le fixe sera de savoir comment type de performance dans un environnement changeant?

Dog Show porte. - � Mon chien de formation est tr�s bonne. � - � Non! � - qui est les derniers scientifiques de donn�es pour mod�liser le monde r�el, lorsqu'ils sont int�gr�s dans la mani�re

� mon avis, que les gens dans le domaine de l'apprentissage machine la plupart sont encore ne se soucient que de la fa�on dont le mod�le d'optimisation, les probl�mes que je viens de citer l'application pratique de ce mod�le rencontrerai mal compris. Mais les bonnes nouvelles est qu'en g�n�ral, nous sommes de plus en plus conscients de ces probl�mes, mais aussi de consacrer plus d'efforts pour examiner ces questions. La pens�e syst�mique, l'intelligibilit�, l'�quit�, l'impact social, le r�le des donn�es et ainsi de suite sont de plus en plus d'attention.

mod�le tentation

Je viens de la machine qui a commenc� � apprendre un quelques ann�es int�ressantes. � ce moment-l�, je viens de rejoindre une entreprise de d�marrage, responsable de plusieurs applications li�es � l'apprentissage de la machine. A cette �poque, mon niveau de programmation inf�rieur aux autres membres de l'�quipe, mais j'ai pos� beaucoup de questions, comme pour leur demander si la formation et l'utilisation des donn�es dans les donn�es apr�s utilisation dans des applications similaires. Mon professeur m'a fait l'�loge des bonnes questions, mais je ne comprenais pas pourquoi il devrait me f�liciter, alors de toute �vidence, je me soucie est mon cur, � comment je ne l'ai pas appris � utiliser un langage de programmation Scala �, et je pense aussi, savoir comment construire un des mod�les pr�dictifs plus puissants est plus important que poser ces questions. M�me maintenant, je comprends parfaitement pourquoi mon professeur m'a fait l'�loge.

Au bout de cinq ans avant que je comprends enfin, � le montage des meilleurs mod�les d'apprentissage de la machine � de la petite taille de l'impact de cette question. Vous pouvez comprendre pourquoi il faut cinq ans? Autrement dit, tous sont trop pr�occup�s par l'enseignement et de recherche sur l'apprentissage de la machine de � meilleur mod�le � et, par cons�quent, ignorer les donn�es, sans tenir compte du facteur humain, aussi passer � c�t� du mod�le complexe de pr�diction d'interaction avec l'environnement h�te.

Expand est le cas, laissez-nous � travers une machine hypoth�tique apprentissage nouvelle sensation � ce sujet. Son nom est Anna, elle est maintenant dans le Master de g�nie �lectrique, ont une base math�matique solide, il est possible d'�crire du code en langage C et Python. Sa premi�re machine d'apprentissage cours d'initiation est des cours d'apprentissage en ligne de machine Andrew Ng, alors qu'elle �tait encore � regarder � base d'apprentissage statistique (�l�ments de l'apprentissage statistique) � livre. Et tous les autres mat�riels didactiques comme des livres et des cours en ligne sont �num�r�s un par un les diff�rents mod�les, et d�crit en d�tail les principes math�matiques derri�re le mod�le. Ils ne mentionnent presque jamais comment comprendre les donn�es, comment consid�rer l'impact social et �thique, comment interpr�ter le mod�le de sc�nario, les mod�les et ainsi de suite. Bien s�r, elle verra certains cas d'application, mais ces cas sont rien de plus que la simple question id�ale par bien con�ue.

Apr�s un certain temps, elle a commenc� � participer � diverses comp�titions sur Kaggle. Encore une fois, elle a vu sur le probl�me de la pr�vision par divers Kaggle con�u simplement pour nourrir la bouche: on voit derri�re le jeu, Kaggle a le plus dur le plus fatigu� de la vie ont fait, d'abord vous recherchez des entreprises, des donn�es, des questions, pr�dire le probl�me dans la t�che, et d'examiner ensuite les donn�es � utiliser, vous pouvez avoir besoin de faire un peu de nettoyage de donn�es et de consolidation, puis s�lectionnez un mod�le standard d'�valuation, qui a organis� la Kaggle par. Pour ceux qui participent � la comp�tition Kaggle, le reste des choses � eux, en plus des caract�ristiques du projet, bien s�r, que � le meilleur mod�le d'ajustement � Ce tout! Qui a gagn� le bonus de match � l'ext�rieur est-il? Excellente performance n'est pas un mod�le, il interpr�tabilit� de l'�quipe, et non pas quand les gens prennent quelques jours de leur formation n'a besoin que de quelques secondes de l'�quipe, pas le mod�le ont vraiment la possibilit� de d�ployer une �quipe dans un environnement de production, ces mod�les pr�disent pr�cision pas cens� �tre le plus �lev�. Croyez donc Anna suivra, l'apprentissage de la machine, il est juste de trouver le meilleur mod�le pour pr�dire les performances, mais cette croyance plus fermement. Ce n'est pas une blague, tout le monde peut voir, nous avons que ceux qui peuvent tirer le meilleur mod�le pour pr�dire les primes de performance et de l'honneur,

Ainsi, l'enthousiasme de l'apprentissage machine Anna �tait tout illumin�, elle veut obtenir un meilleur classement dans le prochain match! Heureusement, la communaut� d'apprentissage de la machine est grande, tr�s ouvert, il y a beaucoup de discussions sur la fa�on de blog de technologie d�bogage performance du mod�le peut �tre pour elle d'apprendre, il y a beaucoup de biblioth�que la plus r�cente d'apprentissage de la machine lui permet d'utiliser clon� � partir GitHub. Elle a enfin compris: l'apprentissage de la machine est le meilleur mod�le en forme.

Anna a �galement commenc� � r�aliser � quel point les jeunes du domaine de l'apprentissage de la machine ont, mais aussi � quel point le milieu universitaire et l'industrie. Afin de comprendre l'avant-garde de la technologie, elle a commenc� � lire les journaux sur l'apprentissage de la machine. O� trouvez-vous le lancez, ah, bien s�r, est le plus grand nombre de citations lire le journal! Alors, qu'est-ce que le nombre de documents tr�s cit�s? Des t�ches de recherche documents de recherche cours de th�se mod�les communs et tous les types de cadre d'apprentissage machine du ......

Les donn�es scientifiques un r�ve: un mod�le, � tout r�soudre (comme le Seigneur des Anneaux �un anneau, la domination sur tout. �)

On peut dire que de cette mani�re Anna, et elle se sentait toujours ce dans le message le plus simple: Si vous voulez faire l'apprentissage de la machine, vous avez besoin d'une �tude en profondeur de l'algorithme de mod�lisation (ainsi que quelques conseils comportent des projets). Les termes et par ailleurs, presque personne n'a mentionn�.

l'ajustement du mod�le n'est pas le seul aspect important

Cela dit, je pense que cela a �t� dit depuis longtemps � comprendre, pour gagner le jeu ne suffit pas d'appeler la machine Kaggle experts d'apprentissage. Ce manque de connaissance de ce qui est? � mon humble avis, l'importance de suivre ces sujets sont compl�tement ignor�s, tout le champ de l'apprentissage de la machine doit commencer � faire attention � ces questions.

Mise en forme des questions : Le vrai probl�me se transforme en une pr�diction ou un probl�me de reconnaissance des formes.
processus de g�n�ration de donn�es : Pour comprendre les donn�es, comprendre les limites et l'applicabilit� des donn�es dans la r�solution de probl�mes.
mod�le explique : Analyse de mani�re mod�le autre que la performance de la m�thode d'estimation validation crois�e
sc�narios : Mod�le de pens�e peut affecter l'autre et le monde r�el
mod�le de d�ploiement : Le mod�le est int�gr� dans le produit ou le proc�d� de calcul

Voici quelques-uns colonne simple, nous pouvons continuer � ajouter.

Vous pouvez bien faire des erreurs dans ces domaines apr�s le meilleur ajustement du mod�le, votre mod�le deviendra inutile, ou m�me devenir nuisible. Lorsque les donn�es r�elles de vos donn�es de formation et les applications ne correspondent pas, votre mod�le peut tout simplement pas donner les pr�dictions correctes. Lorsque vos dirigeants craignent que le mod�le est une bo�te noire et a refus� de l'utiliser, vous devez venir avec un tableau blanc en essayant de les expliquer. Si vous trouvez que votre mod�le a un parti pris contre les personnes ayant une couleur diff�rente de la peau, alors vous feriez mieux de ne pas utiliser ce mod�le.

Tant que vous mettez la forme de questions, les donn�es, l'interpr�tation et des sc�narios de d�ploiement faites, votre projet peut �tre tr�s efficace, votre mod�le est tr�s g�n�rale pr�cision de la pr�diction n'a pas d'importance. D'autres aspects si bien fait, m�me si elle est un long temps de d�bogage, les donn�es de test sur le mod�le int�gr� ne peut �tre parfait pour �tre jet� dans la poubelle.

Mauvais est facile, il est difficile de faire

mod�les d'apprentissage de la machine peuvent pr�dire une bonne performance, mais l'impact des personnes et contrairement � toute attente, je vous raconter une histoire pour illustrer ce point. J'ai un ami qui travaille dans une entreprise de t�l�communications, l'un des affaires de l'entreprise vend paquet de communication mobile (appel + SMS + trafic). Il a travaill� dans l'�quipe scientifique de donn�es de l'entreprise et la soci�t� veut pr�dire quels clients sont les plus susceptibles de ne pas continuer � utiliser le package, il est �galement membre du projet, de faire de cet objectif de pr�diction est de donner aux clients ne peuvent pas continuer � �tre utilis� pour fournir plus rentable packages. Ainsi, l'�quipe du projet va commencer la construction d'un mod�le d'apprentissage de la machine, ce mod�le est la capacit� de distinguer l'utilisateur est aussi tr�s bon. Puis ils ont mis une forte probabilit� de listes d'utilisateurs, et de donner � une autre �quipe, cette �quipe passera par et par contact avec ces utilisateurs, en leur donnant des forfaits plus favorables.

Ensuite, le r�sultat? La soci�t� a annul� l'ensemble de plus en plus, pas moins!

Plus tard, ils ont r�alis� qu'ils entrent en contact un par un les utilisateurs peuvent ne plus utiliser leurs services, � une partie ne peut pas continuer � utiliser ces paquets de l'entreprise. Le mouvement de Contacter �tait devenue telle qu'ils se rendent finalement et tourn�s vers d'autres op�rateurs fusible.

Pourquoi faire quelque chose de mal? D�s le d�but, ils essaient de pr�dire le probl�me r�el devient un probl�me quand il est faux. Leur mod�le pr�dit � Comment la possibilit� de r�siliation du client X �, mais en fait, ils doivent pr�voir que � Lorsque nous contacter au client comment X lorsque la possibilit� de r�siliation de son. � Cela peut aussi �tre vu et sc�narios questions connexes, quelles sont les cons�quences apr�s ne sont pas examin�es avec soin dans le cadre de la fin de la pens�e humaine dans le oui de fin. Pour cet exemple, le mod�le peut �tre construit avec 10 points, mais les probl�mes et les sc�narios de mise en forme � consid�rer seulement 1 point.

Ne pensez pas que vos co�quipiers sur des donn�es fiables

Il est non seulement pour les d�butants que lorsque vous utilisez l'apprentissage de la machine pour r�soudre les probl�mes du monde r�el font des erreurs? Bien s�r que non. Vous voulez acqu�rir des comp�tences en dehors du mod�le d'apprentissage de la machine de montage, la meilleure fa�on est de participer � la r�solution des probl�mes du monde r�el. Mais ce n'est pas fini, il faut vraiment vouloir �tre en termes de montage en dehors du mod�le est devenu plus puissant.

Seule l'exp�rience ne suffit pas. Google, Amazon et autres investissements � grande �chelle � long terme dans l'apprentissage des affaires � la machine, ne sont pas au-del� de la port�e de tous les aspects du mod�le d'optimisation de celui-ci? En fait, non. M�me si elles ont si Duo Boshi, il y a tellement d'argent, il y a tant d'exp�riences, tant de donn�es, tant l'expertise technique, ils n'ont pas compris. En fait, ils font encore des erreurs stupides, parce que l'application de l'apprentissage de la machine est la difficult� de la t�che dans le monde r�el.

Je donne quelques grandes entreprises avec un apprentissage de la machine, puis foir� exemple:

Photos Google (Google Photos) seraient class�s comme chimpanz� noir. Ensuite, ils ont laiss� la solution est plus un mod�le de chimpanz� pr�dit cette cat�gorie. Il est comme votre mur de la maison coule, vous mettez en place le fond d'�cran � des probl�mes de couverture, au lieu de chercher pour vous parler en haut des voisins.
Google Flu pr�vision (Google Suivi de la grippe) surestiment la probabilit� d'apparition de la grippe. Ils ont ce produit hors de la ligne d'assemblage. La fa�on dont cela fonctionne est de se concentrer sur ces mots et ont une forte corr�lation entre l'apparition de la grippe, et semblait compl�tement � basket-ball de l'�cole � , comme le mot causalit� appris en elle.
Amazon mettre en place l'outil de recrutement pour les pr�jug�s sexistes. Amazon a pris son recrutement mod�le de donn�es form�, le mod�le est une r�flexion simple et directe du biais de genre Amazon dans le recrutement de (qui est, plus susceptibles de recruter des hommes). Ils ont donc pas utiliser cet outil. Mais en m�me temps leur sous-texte est la suivante: nous n'avons pas cet outil sur le droit, l'existence actuelle de pr�jug�s sexistes sera r�put�e ne pas savoir. Comme ci-dessus, tapisser des probl�mes de couverture.

Pourquoi ne pas vous simplifier la vie des donn�es? Pourquoi pas?

Si le travail il n'y a pas de commentaires pour vous dire de bien faire, de faire le bien, vous pouvez vous sentir tr�s fatigu�. Surtout pour faire des recherches universitaires, ou vous n'avez pas le sup�rieur hi�rarchique direct en cas de doute ce qu'ils font est tr�s bien une chose de bon sens. Si vous avez un patron ou sup�rieur � vous dire quoi faire, je me sentirai un peu plus facile, mais je vous dis en secret une v�rit�, personne ne peut vraiment comprendre. Quoi que vous fassiez une douzaine d'ann�es, voire des d�cennies, peu importe combien l'exp�rience sociale, vous ne pouvez pas commencer une journ�e de tout dans ce monde sont tr�s claires.

Une solution consiste � utiliser les donn�es � mesurer vos progr�s, cela vous donnera quelques commentaires. Il peut �tre consid�r� comme indicateurs du succ�s de celui-ci.

� Aujourd'hui, je l'ai lu cinq papiers. �
� Cette semaine, je termine un rapport de 10 pages. �
� Mon site ce mois-ci 10k vues. �
� Ce que je ann�e obtenu 20k bonus. �

Dans une certaine mesure, le succ�s de mesure num�rique est une excellente fa�on de vous aider � travailler Simplifier et vous aider � travailler plus efficacement. Cependant, ces donn�es sont trop simplifi�es � succ�s � cette chose, comment pourrions tous utiliser quelques conditions simples, les moyens num�riques hors de lui.

Par exemple, votre revenu est �lev�, mais vous ne aimez pas votre travail. Que vous r�ussir?
Par exemple, votre papier est souvent cit�, mais vous ne cause aucun impact r�el sur le monde r�el. Que vous r�ussir?
Par exemple, vous avez des milliers d'adeptes, mais personne dans le point dynamique apr�s avoir lu vos louanges de message. Que vous r�ussir?
Par exemple, vous obtenez une course dans la machine d'apprentissage tout premier rang, mais vous secr�tement prend avantage des vuln�rabilit�s dans les donn�es, sur les autres concurrents et la surface sup�rieure du m�me. Que vous r�ussir?

En fait, difficile de dire quand vous voulez atteindre un certain nombre et le travail, et quand ils ne le font pas. � mon avis, si vous voulez � port�e num�rique � et � difficile � l'emploi de mesure � dans (comme l'�tude des nouveaux produits, plut�t que de vendre plus de l'ancien produit) de faire un choix, le go�t de la soci�t� tout enti�re sont fortement biais� vers la r�alisation de num�rique c�t�. Apprentissage machine aussi bien.

Quand je me sens comme si quelqu'un � efforts pour parvenir � un certain nombre � de l'�poque, mon esprit �mergera de la sc�ne de la course. Il y a une tr�s belle, cheval tr�s forte, gr�ce � la formation des personnes, il peut courir tr�s vite. Ensuite, si elle obtient un bon classement dans le jeu, il donnera incitation des gens � manger des carottes (je ne suis pas s�r que le cheval n'est pas particuli�rement friands de carottes, mais pour la commodit� de mes histoires, on oublie que le favori du cheval est la carotte bar). Pour elle couvrira le champ de vision des c�t�s gauche et droit du cheval l'attention du cheval compl�tement concentr� sur la cible, les yeux des gens � cheval portant des ill�res, afin qu'ils ne voient l'avant. Maintenant que ces courses de chevaux, chacun de nous avec un bandeau sur les yeux, afin que nous puissions � aveugle � � uvrer pour l'�valuation. Mais plusieurs fois, si nous regardons autour de, peut-�tre le bord de la piste est un terrain sans surveillance de la carotte.

En tant que membre de l'apprentissage de la machine dans ce domaine, nous avons une concurrence trop longtemps dans le jeu mal d'apprentissage de la machine � l'int�rieur. Nous devons enlever la t�te de oeill�res. Alors j'�cris ce blog, je l'esp�re inspirer plus de gens � prendre leurs lunettes, et l'espoir des pr�occupations dans ce domaine ne peut plus se limiter � la performance du mod�le, et a commenc� � accorder plus d'attention aux donn�es, d'interpr�tation, et des sc�narios sociaux impact.

via https://bentoml.com/posts/2019-04-19-one-model/, Lei Feng r�seau compil� AI Technology Review.

Route de la soie