De Tsinghua � Ali, il ne lui a fallu que 6 ans pour influencer des centaines de millions d'utilisateurs

"Alibaba Technology Live" est un programme vid�o en direct sp�cialement con�u pour les techniciens, visant � partager les tendances de pointe de l'industrie, les produits secs techniques et la vie technique. Aujourd'hui, je vous pr�sente le merveilleux contenu en direct de Jing Shi, un expert senior en algorithmes d'Alibaba.

L'�mission en direct de Jing Shi, un expert senior en algorithmes � Ali

Bonjour � tous, je m'appelle Gai Kun et mon nom de fleur est Jing Shi in Ali. Il a �tudi� � l'Universit� Tsinghua pour le premier cycle et le doctorat en apprentissage automatique et en intelligence artificielle. Apr�s l'obtention de mon dipl�me, j'ai travaill� sur des algorithmes publicitaires chez Alibaba.Maintenant, je suis en charge de la technologie de publicit� display concurrente chez Alimama.Le travail que je fais comprend des algorithmes publicitaires, qui incluent des algorithmes de correspondance, des mod�les d'estimation, des algorithmes de tri et de l'ing�nierie publicitaire. Il existe d'autres parties li�es � l'intelligence artificielle, notamment les plateformes d'apprentissage automatique, notamment la reconnaissance d'images en vision par ordinateur, etc., ainsi que certaines technologies de la PNL.

Il y a trois parties dans mon partage d'aujourd'hui, j'esp�re qu'il sera utile � tout le monde.

1. Du choix d'Alibaba lors de la recherche d'un emploi, au parcours et � l'exp�rience de travail pendant six ans.

2. Faites les id�es derri�re l'IA, certaines r�alisations et la r�flexion derri�re l'IA.

3. Enfin, je vous sugg�rerai ce que vous devriez pr�parer avant d'interviewer Ali.

Origine d'Ali�: la recherche et l'application se rejoignent parfaitement

Parlons d'un d�but avec Alibaba. En fait, lorsque j'�tais �tudiant, je faisais de l'apprentissage automatique et de la vision par ordinateur, et j'ai �galement publi� des articles dans des conf�rences et des revues internationales. Quand j'ai obtenu mon dipl�me, j'en avais un, ou j'avais un souhait quand j'�tais �tudiant, que j'esp�rais que ce que j'avais fait serait non seulement partag� avec d'autres sous la forme d'une th�se, mais esp�rait aussi avoir un plus grand impact sur le monde. Alors � cette �poque, j'esp�rais trouver un meilleur endroit pour allier recherche et application. Au d�but, l'objectif �tait surtout de se concentrer sur les instituts de recherche de certaines entreprises �trang�res, et j'ai �galement parl� de certains instituts de recherche � l'�poque.

Le d�but du destin avec Alibaba �tait aussi une co�ncidence. Le forum auquel les �tudiants de Tsinghua avaient l'habitude d'aller s'appelait Shuimu Community, qui s'appelait Shuimu Tsinghua � l'�poque. J'ai trouv� une personne sur la version AI l�-bas qui a fait un post disant qu'Alibaba va faire un syst�me d'apprentissage automatique � grande �chelle, il y a beaucoup de d�fis ici. J'ai aussi r�pondu � une lettre priv�e tr�s tard dans la nuit, et je n'y ai pas beaucoup r�fl�chi � l'�poque, et quand j'�tais �tudiant, pour �tre honn�te, j'avais l'habitude de jouer � des jeux la nuit, puis apr�s mon retour , j'ai jou� � des jeux jusqu'� deux ou trois heures, et j'ai relativement bien dormi. En cons�quence, j'ai �t� r�veill� par les RH d'Alibaba � huit ou neuf heures du matin le lendemain pour un entretien.C'�tait le d�but de mon destin avec Alibaba.

Apr�s avoir re�u l'offre d'Alibaba, j'ai beaucoup r�fl�chi et lutt� pendant longtemps. J'ai finalement choisi Alibaba parce que je sentais qu'Alibaba est en plein essor dans le commerce de d�tail en Chine et que ses perspectives commerciales sont tr�s bonnes. La deuxi�me chose la plus importante dans l'apprentissage automatique, ce sont les donn�es.Alibaba a une cat�gorie compl�te de donn�es sur les consommateurs de d�tail, du shopping � l'achat, puis au comportement de suivi apr�s l'achat.

L'utilisation de m�thodes d'intelligence artificielle sur cette cat�gorie de donn�es peut faire beaucoup de choses, et il y a beaucoup de possibilit�s, donc je pense que l'intelligence artificielle aura un espace sp�cial � Alibaba. Il y a un dernier point. A cette �poque, je discutais aussi beaucoup avec mes camarades de classe d'Ali. J'avais l'impression que peu importe l'�quipe ou tous les aspects d'Ali, ils disaient tous qu'ils �taient plus int�ress�s par la recherche, et ils encourageraient recherche en plus de l'application, y compris : Encouragez tout le monde � sortir et � publier des r�sultats de recherche. Donc �a ressemblerait � �a :

1. La perspective d'application de l'entreprise est tr�s large ;

2. La recherche et l'application peuvent �tre combin�es.

A cette �poque, Alibaba a �t� choisi sur la base de ces deux consid�rations.

Je partagerai mon exp�rience tout au long du parcours chez Alibaba, y compris certaines des choses que j'ai faites. J'esp�re vous donner quelques r�f�rences. Enfin, je ferai un r�sum� par �tapes. Si vous voulez avoir plus de succ�s, quelles caract�ristiques devriez-vous avoir .

L'exp�rience de 6 ans d'Ali�: du silence pendant six mois � deux augmentations cons�cutives de 10�%, affectant des centaines de millions d'utilisateurs chaque jour

Apr�s avoir rejoint Alibaba, j'ai en fait senti que je ne savais rien au cours du premier semestre de l'ann�e, puis je suis entr� dans l'entreprise r�elle, les donn�es r�elles, bien que j'aie appris beaucoup de connaissances li�es � l'apprentissage automatique auparavant, puis j'ai trouv� que ces connaissances peuvent �tre li�es aux affaires et aux affaires. Les donn�es r�elles ne correspondent pas encore bien. Ainsi, la premi�re moiti� de l'ann�e �tait en fait une p�riode d'immersion dans les affaires et les donn�es, et c'�tait une p�riode relativement ennuyeuse et solitaire. Mais plus tard, j'ai d�couvert qu'en fait, il doit s'enfoncer dans l'entreprise r�elle et qu'il est possible de faire quelque chose de diff�rent dans les donn�es r�elles. Ce processus doit �tre exp�riment�. C'est l'exp�rience de nombreuses personnes qui travaillent dans la pratique.

Mais pour �tre honn�te, au cours des six derniers mois, bien qu'il n'y ait peut-�tre pas eu de choses bouleversantes, il y a une chose � laquelle j'ai pens�. En fait, lorsque j'ai rejoint Alibaba, l'apprentissage automatique �tait utilis� dans la publicit� et le syst�me d'estimation du CTR a commenc� � �tre utilis� � grande �chelle, puis diverses entreprises nationales ont commenc� � cr�er des �quipes pour d�velopper ce domaine. Cette pi�ce peut �galement �tre consid�r�e comme le d�but des entreprises nationales de l'industrie traditionnelle qui investissent beaucoup de ressources dans l'apprentissage automatique ces derni�res ann�es.

Car tout le monde sait peut-�tre aussi que dans toute l'industrie de l'Internet, il y a deux secteurs qui g�n�rent les revenus les plus importants : l'un est la publicit� et l'autre les jeux. La publicit� devrait �tre plus avanc�e que les jeux, et toutes les entreprises, y compris les grandes entreprises, ne font pas de jeux. Le revenu pilier de la plupart des entreprises est en fait la publicit�. Pour une activit� aussi importante de diverses entreprises, l'estimation du CTR est en fait une situation gagnant-gagnant pour les annonceurs, les t�l�spectateurs et les revenus de la plate-forme. Si elle est bien faite, c'est une situation gagnant-gagnant, de sorte que chaque entreprise a investi beaucoup de ressources pour faire �a. .

Cette pi�ce est donc l'occasion pour le machine learning d'�tre pour la premi�re fois � tr�s grande �chelle, et de jouer un r�le tr�s central dans la grande entreprise actuelle, qui est �galement un point de d�part ces derni�res ann�es. L'apprentissage automatique est � l'arri�re-plan et jouera un r�le plus important dans davantage d'entreprises, ce qui viendra plus tard.

Dans l'estimation du taux de clics, il existait une pratique classique � l'�poque, qui s'appelait les fonctionnalit�s � grande �chelle plus un mod�le lin�aire simple et une r�gression logistique. Comment comprendre cette pratique�? En fait, � cette �poque, les �l�ments � grande �chelle �taient une forme d'�l�ments d'identification. Par exemple, disons qu'il y a maintenant 1,3 milliard de personnes en Chine et que nous avons 1,3 milliard d'utilisateurs. Nous devons utiliser un vecteur, il y a le concept d'�chantillon et d'�tiquette, utiliser un vecteur et utiliser des �chantillons pour le repr�senter. Qu'en est-il des fonctionnalit�s de cet exemple�? J'ai 1,3 milliard d'utilisateurs, et j'utilise un vecteur de coefficient de 1,3 milliard pour repr�senter cet utilisateur, puis 1,3 milliard de dimensions, � quel utilisateur cet �chantillon correspond est marqu� comme 1 dans quelle dimension, et toutes les autres dimensions sont 1, ce qui est un � tr�s grande �chelle une repr�sentation clairsem�e de .

En fait, les utilisateurs peuvent s'exprimer de cette mani�re, les produits peuvent s'exprimer de cette mani�re et, fondamentalement, toutes les informations peuvent �tre exprim�es par le code de One hot. Donc, en fait, certaines valeurs statistiques continues ou certaines valeurs continues peuvent �galement �tre discr�tis�es, quelle section peut �tre chang�e en, et continuer � �tre repr�sent�e par One hot, nous encoderons une grande quantit� d'informations avec One hot ou utiliser les fonctionnalit�s d'identification Cela peut �tre exprim� comme une m�thode pour la transformer en une fonctionnalit� � tr�s grande �chelle, et la dimension de la fonctionnalit� est �galement tr�s grande. Il peut s'agir d'un concept qui n'a pas �t� expos� � l'industrie r�elle. Par exemple, les �tudiants de le syst�me de pr�diction CTR peut ne pas conna�tre un concept auparavant, c'est pourquoi l'industrie a besoin d'un si grand nombre de fonctionnalit�s.

Si de telles caract�ristiques sont r�alis�es avec une simple r�gression logistique, il y a un probl�me. Bien s�r, il y a aussi de grands d�fis. Il y a deux d�fis�:

1. La taille de l'�chantillon est particuli�rement grande et la dimension des caract�ristiques est particuli�rement grande.

Que signifie la taille de l'�chantillon�? Par exemple, si le taux de clics est estim�, notre �chantillon correspond au comportement historique de l'utilisateur. Si l'utilisateur n'a pas cliqu�, le libell� est�0, ce qui correspond � un �chantillon n�gatif�; si l'utilisateur a de nouveau cliqu�, cet �chantillon est un �chantillon positif. En fait, vous regardez beaucoup de choses chaque jour, et beaucoup d'utilisateurs parcourent le site, nous avons donc beaucoup d'�chantillons. La deuxi�me dimension caract�ristique est particuli�rement grande. Donc, pour la r�gression logistique, un d�fi est de savoir comment prendre en charge un �chantillon aussi large et une dimension aussi �lev�e. C'est le premier d�fi. Ensuite, il y aura beaucoup d'algorithmes parall�les li�s � l'apprentissage automatique.

2, r�gularisation, comment comprendre ?

C'est-�-dire que la r�gression logistique est g�n�ralement utilis�e avec une norme L1. Il y a en fait deux objectifs derri�re cela. Le premier objectif est qu'un si grand nombre de fonctionnalit�s sont sujettes au surajustement, donc j'utilise une m�thode, C'est une m�thode tr�s classique dans apprentissage automatique La m�thode de r�gularisation est utilis�e pour supprimer le surajustement, afin que le mod�le puisse mieux fonctionner dans les cas d'utilisation futurs. Le surajustement signifie que je ne me souviens que de ce que j'ai vu, mais ce n'est pas tr�s bon pour pr�dire de nouvelles choses dans le futur.

Le deuxi�me fait est que lorsque la biblioth�que de fonctionnalit�s est tr�s grande, nous pouvons �tre en mesure de supporter des fonctionnalit�s � grande �chelle lors d'une formation hors ligne, mais lorsque nous pr�voyons en ligne, nous voulons que les performances soient aussi bonnes que possible. Nous voulons donc faire une s�lection de fonctionnalit�s pendant la formation. Faut-il autant de fonctionnalit�s�? Il y a de fortes chances que nous n'ayons en fait besoin que d'une fraction d'entre eux. Pouvez-vous laisser le mod�le le faire automatiquement pendant l'entra�nement�? Il s'agit d'une m�thode de r�gularisation. Cela, plus la m�thode de r�gularisation, apportera �galement des d�fis � l'ensemble du probl�me d'optimisation, qui sont les deux d�fis et difficult�s de la r�gression logistique.

En plus de ces deux d�fis et difficult�s qui ont r�solu un probl�me majeur, il y a un autre probl�me de r�gression logistique auquel j'ai r�fl�chi. Un tel syst�me de caract�ristiques utilisant un mod�le lin�aire est-il suffisant�? En fait, ce probl�me est actuellement en apprentissage profond. Aujourd'hui, en plein essor, plus personne n'aura de doute, la non-lin�arit� fera certainement mieux, tout le monde peut le penser. Mais il y avait en fait pas mal de controverses � cette �poque.Beaucoup de gens avaient un concept, y compris certains articles qui �non�aient clairement cette conclusion, c'est-�-dire que lorsque la dimension de la caract�ristique est relativement �lev�e, un mod�le lin�aire suffit.

� cette �poque, il y a quelques ann�es, Google �tait encore le leader technique des entreprises nationales � certains �gards, et tout le monde dans certains aspects de la technologie �tait � �galit� avec Google. � cette �poque, Google utilisait �galement une fonctionnalit� � grande �chelle plus un mod�le lin�aire. Par cons�quent, si vous souhaitez cr�er un mod�le non lin�aire, de nombreuses personnes se demanderont pourquoi le mod�le non lin�aire est utile et si le mod�le lin�aire est suffisant. Maintenant, ce concept ne semble pas si unifi�, tout le monde pense que l'apprentissage en profondeur a �t� utilis�, et la non-lin�arit� est plus forte, et la non-lin�arit� doit �tre utile.

Mais � cette �poque, briser cet �tat d'esprit �quivalait en fait � remettre en question les concepts faisant autorit� � l'int�rieur et � l'ext�rieur de l'entreprise, de l'industrie et du milieu universitaire. � ce moment-l�, je me demandais si c'�tait suffisant. En fait, nous savons qu'une des pratiques est tr�s r�v�latrice, c'est-�-dire qu'en utilisant la r�gression logistique, nos fonctionnalit�s sont les fonctionnalit�s d'origine, c'est-�-dire le One hot code ou La fonctionnalit� d'identification a une grande dimension, mais j'ai encore besoin de faire du traitement de fonctionnalit�s, de l'ing�nierie de fonctionnalit�s. Par exemple, la cible de notre cible est li�e � deux, et il peut �tre n�cessaire de faire un produit cart�sien de ces deux identifiants.Faire un produit cart�sien est un processus de caract�ristiques tr�s explosif.

Par exemple, 100 millions de fonctionnalit�s utilisateur dimensionnelles et 100 millions de fonctionnalit�s b�b� dimensionnelles, si nous voulons faire leur relation, c'est 100 millions � 100 millions de possibilit�s dans le cas d'une r�union de produit cart�sienne, et cela va soudainement exploser � 100 millions de dimensions. . Dans notre travail actuel, de nombreuses entreprises ont fait ce genre de choses. Nous utilisons des ing�nieurs en algorithmes pour faire la combinaison de caract�ristiques, le traitement des caract�ristiques, et surtout le produit cart�sien, etc. C'est tr�s compliqu� et deux ou deux fonctionnalit�s peuvent �tre combin�es, si trois fonctionnalit�s peuvent �tre combin�es et s'il existe d'autres m�thodes de traitement. Il y a donc beaucoup de travail compliqu� � faire.

C'est en fait un bon exemple, c'est-�-dire que le mod�le lin�aire ne suffit pas. Si le mod�le lin�aire est suffisant, pourquoi devons-nous effectuer un traitement des caract�ristiques et le compl�ter manuellement�? En fait, c'est une pratique classique dans l'industrie � ce moment-l�. temps, un Potentiel de pens�e classique, un paradoxe de la pens�e int�rieure. Ensuite, ce � quoi je pense en fait, c'est comment enregistrer ces projets de traitement manuel compliqu�s, et le traitement manuel doit �tre limit� au traitement des caract�ristiques. Pouvons-nous r�ellement utiliser l'IA et des m�thodes intelligentes pour extraire plus pr�cis�ment des informations pour faire de meilleures pr�dictions, cela peut �tre en fait quelque chose qu'une personne faisant de l'IA poursuit vraiment dans son cur.

Donc, ce � quoi nous r�fl�chissons r�ellement, c'est si nous pouvons cr�er un mod�le d'intelligence artificielle plus puissant, pour �tre pr�cis, un mod�le d'apprentissage automatique pour remplacer le mod�le lin�aire simple d'origine de l'ing�nierie lourde. Deux objectifs�: l'un est d'�conomiser les actions de traitement laborieuses et compliqu�es�; le second est d'obtenir de meilleurs r�sultats. Un autre objectif, si nous faisons un travail intelligent, nous pouvons r�aliser un apprentissage de bout en bout, comme l'apprentissage en profondeur maintenant, peut rendre beaucoup de choses plus automatis�es.

En fait, j'ai pens� � cette question dans mon esprit pendant le premier semestre de l'ann�e, m�me si je n'ai rien fait de particuli�rement bouleversant au cours du premier semestre de l'ann�e, puis dans l'investissement quotidien dans les projets et la compr�hension des affaires, J'ai r�fl�chi � la r�ponse � cette question. Trouvez un moyen plus tard. Il s'agit de faire un apprentissage non lin�aire sur des caract�ristiques � grande �chelle et des �chantillons � grande �chelle, tout en obtenant l'effet.

Ce qui suit est une br�ve introduction � la m�thode suivante, appel�e m�thode lin�aire de fragmentation. Pour �tre pr�cis, il s'agit de l'ensemble de l'espace de grande dimension. Si la dimension est particuli�rement �lev�e, l'espace est divis� en plusieurs zones diff�rentes, et chaque zone a son propre mod�le lin�aire ind�pendant. De cette mani�re, l'espace entier devient un mod�le lin�aire par morceaux. S'il est bidimensionnel, il est plus facile � comprendre. Il s'agissait auparavant d'une ligne, mais il devient maintenant une polyligne par morceaux. Il y a suffisamment de polylignes pour approximer un mod�le tr�s complexe. courbe en deux dimensions, et il peut approximer n'importe quelle courbe arbitraire. fonction complexe.

En fait, l'id�e sous-jacente est assez simple et directe. Nous aurons deux d�fis�:

1. Comment pouvons-nous rendre la division spatiale et chaque division finale lin�aires par morceaux, et utiliser la m�thode d'apprentissage automatique pour apprendre tout cela ensemble, puis l'apprendre � travers la m�thode des donn�es�;

2. L'�chelle des donn�es que nous traitons est tr�s grande, et l'�chelle des caract�ristiques est �galement tr�s grande. Est-il possible de d�velopper une m�thode tr�s efficace pour ce faire�? Il existe une m�thode appel�e r�gression logistique mixte, qui est vraiment utilis�e dans Alimama, en utilisant la fonction Softmax utilis�e dans le sharding, et enfin en faisant une combinaison de r�gression logistique lin�aire de classification dans chaque domaine. En fait, j'aurais d� d�velopper plus d'une dizaine de mod�les diff�rents � cette �poque, il existe diverses m�thodes de fragmentation, des m�thodes de fragmentation, y compris apprendre ensemble en parall�le, et aussi un fragment tel que GBBT One piece to learn, piece to piece to continue apprendre de nombreux algorithmes diff�rents.

Il y a en fait beaucoup de probl�mes derri�re cela. Par exemple, si le mod�le fonctionne ou non. Si le mod�le fonctionne, nos fonctions complexes correspondent g�n�ralement � un probl�me d'optimisation. Le probl�me d'optimisation n'est pas capable de trouver une bonne solution. En fait, ce mod�le limitera �galement l'algorithme, si cet algorithme peut converger rapidement. En fait, ceux-ci ont rencontr� beaucoup de probl�mes. En fin de compte, ce que nous avons r�ellement laiss� maintenant, bien que cela semble tr�s simple et simple, �tait l'une des nombreuses m�thodes r�alisables apr�s avoir test� de nombreuses m�thodes � l'�poque. Il y a beaucoup de cas d'�chec derri�re cela, et c'est peut-�tre l'histoire derri�re que d'autres ne savent pas grand-chose.

Apr�s cela, il a essentiellement r�solu certains des probl�mes mentionn�s pr�c�demment. Le premier est que l'apprentissage non lin�aire peut permettre au mod�le d'extraire automatiquement et intelligemment des connaissances qui ne peuvent pas �tre exploit�es par des �tres humains dans les donn�es, ce qui permet d'�conomiser du travail manuel. m�thode intelligente, une m�thode d'intelligence artificielle tr�s puissante est utilis�e pour creuser un tr�s bon effet.

Apr�s cela, l'effet commercial de la premi�re phase aurait d� �tre d'environ six mois depuis que j'ai rejoint l'entreprise. A cette �poque, sur le secteur d'activit� en ligne, les revenus publicitaires, y compris le taux de clics, ont augment� de plus de dix%. Et il est divis� en deux phases, dont chacune est sup�rieure � 10%. Le chiffre exact � l'�poque �tait beaucoup plus �lev� que cela, mais le chiffre exact est maintenant inexact. � ce moment-l�, je me suis senti tr�s excit� pour la premi�re fois.Enfin, j'ai appliqu� mes connaissances � l'endroit r�el, ce qui a non seulement am�lior� l'exp�rience utilisateur, mais a �galement consid�rablement augment� les revenus de la plateforme. Ce que vous faites vous-m�me peut affecter des centaines de millions d'utilisateurs chaque jour. J'ai vraiment l'impression d'avoir utilis� mes connaissances professionnelles pour faire quelque chose qui peut affecter davantage la soci�t� et les utilisateurs, ce qui est tr�s gratifiant. C'est la premi�re chose que ceux qui ont rejoint Ali ont voulu partager.

R�sum� de la situation actuelle et des lois de l'apprentissage en profondeur

Permettez-moi maintenant de parler de l'apprentissage en profondeur. Que diriez-vous de l'apprentissage en profondeur? Je partage mon avis.

L'apprentissage en profondeur est particuli�rement � la mode en ce moment. En fait, nous extrayons ici quelques r�gles. Le deep learning a les propri�t�s suivantes�:

1. L'apprentissage en profondeur associe en fait le mod�le d'origine au couplage d'algorithmes. Par exemple, l'algorithme de propagation de gradient derri�re l'apprentissage en profondeur est essentiellement la m�thode de SGD. Sur la base de SGD, il y aura un �lan suppl�mentaire, un �lan adaptatif, certains algorithmes comme celui-ci . Ensuite, ces algorithmes sont devenus des algorithmes standardis�s. Vous pouvez choisir n'importe quel mod�le parmi ces algorithmes. Vous n'aurez peut-�tre pas besoin d'approfondir ces algorithmes ou de cr�er un ensemble d'algorithmes avec une probabilit� �lev�e. Ce mode de couplage est en fait un concept compl�tement diff�rent du mod�le d'apprentissage automatique d'origine.

Si vous connaissez vraiment l'apprentissage automatique ou avez �tudi� des disciplines connexes, vous saurez que SVM est en fait une m�thode syst�matique allant du mod�le � l'algorithme, la r�gression logistique est �galement une m�thode int�gr�e et le GBDT est �galement une m�thode int�gr�e. Bien s�r, son int�grit� sera tr�s bonne, mais le co�t de le faire est tr�s lourd. Il doit s'agir d'une personne avec une capacit� professionnelle tr�s forte. De la compr�hension du mod�le, de la compr�hension des donn�es � la conception de l'algorithme dans son ensemble, cela n�cessite des connaissances professionnelles tr�s solides. fais �a. Ceci est limit� en termes de productivit�. L'apprentissage en profondeur associe en fait le mod�le � l'algorithme, l'algorithme est standardis�, le mod�le peut �tre arbitrairement modifi� et construit, ce qui lib�re consid�rablement la productivit�, permet � plus d'�tudiants de participer et d'essayer des mod�les plus complexes et diff�rents.

2. La m�thode d'apprentissage en profondeur est un peu comme des blocs de construction. J'ai en fait beaucoup de modules. En fait, les entreprises et les institutions acad�miques continuent de cr�er de nouveaux modules bas�s sur des probl�mes et des donn�es r�els.

Dans de nombreux cas, en effet, l'essentiel du travail consiste � combiner librement ces modules en fonction de leurs propres probl�matiques m�tiers. C'est diff�rent de l'original. Il s'est av�r� qu'il n'y avait pas de modules. Vous devez construire un b�timent, et tout le b�timent est construit par vous-m�me. Maintenant, vous avez beaucoup de murs et de sols. Vous pouvez utiliser ce sol pour le construire. En fait, cela s'appelle la composantisation dans notre module de base actuel.. Il peut �tre divis� en composants et standardis� pour construire un syst�me complexe qui �tait auparavant inimaginable.

Ces deux caract�ristiques, l'une est le couplage, et l'autre est la composition du mod�le lui-m�me.Dans le cadre de l'apprentissage en profondeur, nos ing�nieurs peuvent construire des mod�les complexes qui �taient compl�tement inimaginables, et r�soudre les probl�mes qui ne pouvaient pas �tre r�solus auparavant, ou les effet ne r�pond pas � nos attentes. Voici quelques-unes des opportunit�s derri�re l'apprentissage en profondeur, qui, � mon avis, est un �norme coup de pouce pour la productivit�.

Donc, � ce stade, dans le cadre de l'apprentissage en profondeur, Alibaba a �galement lanc� de nombreuses recherches et applications. Ici, je vais parler d'une id�e que nous sommes en train d'apprendre en profondeur maintenant. L'apprentissage en profondeur est tr�s simple, c'est Deep, un r�seau de neurones tr�s profond. Alors, il y aura un probl�me ici, c'est-�-dire que le niveau profond est tout, ou est-ce suffisant que nous ayons seulement besoin d'�tre profond ? Ici, permettez-moi de donner une autre r�flexion. Par exemple, la reconnaissance d'image dans l'industrie. En fait, la reconnaissance d'image comporte deux �l�ments. Le premier �l�ment est constitu� de structures de r�seau bien connues ou de base, telles que le CNN monocouche, des structures telles que le pooling, etc., en particulier le CNN, qui est repr�sent� par des r�seaux de neurones convolutifs. applications dans l'image. Tout le monde construit des r�seaux profonds sur la base de cette structure.

Si le Web profond suffit, pourquoi ne pas cr�er un tel Web profond avec des liens complets ? C'est le premier exemple. En fait, il y a d'autres exemples plus tard, comme dans les s�ries chronologiques, en PNL, etc., il y aura de nombreuses structures de ce type, comme RNN dans les s�ries chronologiques, ou LSTM, un mod�le l�g�rement plus complexe qui peut �tre plus efficace dans de nombreux des champs.

Il y a deux �l�ments ici : Le premier �l�ment est une structure de r�seau qui correspond aux donn�es. Pourquoi dites-vous que cela correspond aux donn�es�? En prenant CNN comme exemple, CNN est une fen�tre de convolution locale.Cette fen�tre de convolution locale repr�sente un param�tre, et le param�tre est partag� lorsque la fen�tre de convolution se d�place. Il repr�sente en fait la nature de l'image appel�e invariance parall�le, qui est une image d'un visage humain ou d'un chien. Dans le coin sup�rieur gauche de l'image, c'est encore un chien dans le coin inf�rieur droit. C'est ce qu'on appelle l'invariance parall�le, qui est l'incapacit� � reconna�tre les objets. Des changements importants se produiront en raison du mouvement global de cette zone. Une autre reconnaissance d'objet est �galement locale, si cette position de fen�tre est enti�rement incluse dans un visage, alors l'information de cette fen�tre suffit, c'est un domaine. En fait, comme dans le domaine de l'image ou dans les domaines o� le deep learning a r�ussi, la structure du r�seau est tr�s adapt�e aux caract�ristiques de son probl�me et � ses caract�ristiques de donn�es.

Ce sur quoi nous nous concentrons actuellement, c'est comment trouver une structure de r�seau qui peut s'adapter � de telles caract�ristiques de donn�es sur Internet, comment trouver une structure de r�seau bas�e sur les donn�es utilisateur bas�es sur Internet, telles que les donn�es � grande �chelle cod�es par le num�ro d'identification tout � l'heure, puis Nous utiliserons des m�thodes approfondies pour am�liorer la capacit� de g�n�ralisation ou la capacit� d'ajustement de cette structure afin d'obtenir de meilleurs r�sultats. C'est l'une de nos r�flexions sur l'apprentissage en profondeur et une chose que nous faisons maintenant.

Quelle est la fonctionnalit� ici�? Deux exemples :

1. Il y a une donn�e tr�s importante derri�re notre recommandation, qui est le comportement de l'utilisateur, ce que l'utilisateur a parcouru dans l'historique, ce qui a �t� achet�, ou sur quelles pages vous �tes rest� plus longtemps.Cela nous aidera � analyser ce que vous ferez � l'avenir Plus int�ress�, est tr�s utile. Le premier concept est structurant, derri�re lequel se cachent des donn�es structur�es tr�s complexes. Par exemple, le comportement de l'utilisateur sur Taobao, vous cliquez sur certains tr�sors, en plus de cliquer sur l'identifiant du b�b� lui-m�me, quel est le b�b�, en fait, il y a des donn�es connexes derri�re le b�b�, telles que des images du b�b�, vous pouvez voir aussi Lorsque vous arriverez � cette image, vous aurez une r�flexion et une interaction avec l'image, et vous d�ciderez de cliquer, d'acheter ou non, et d'interagir avec le marchand.

Par exemple, si le b�b� a un titre, et si vous commandez le b�b�, le moment de la commande du b�b� dans l'histoire compte �galement. Par exemple, la page des d�tails du b�b� contient de nombreuses introductions et vous lirez �galement ses commentaires. Tout le monde trouve qu'il est li� � un certain b�b�, il s'agit donc d'une donn�e tr�s structur�e.Des donn�es provenant de diff�rentes sources sont en fait fortement corr�l�es en interne, et des donn�es h�t�rog�nes sont li�es. Si nous concevons une meilleure structure de r�seau d'apprentissage en profondeur et faisons bon usage de ces donn�es h�t�rog�nes, c'est un grand d�fi et probl�me.

2. L'autre est le timing. Dans notre environnement de commerce �lectronique, un utilisateur peut parcourir de nombreux tr�sors. Il peut regarder des t�l�phones portables et acheter un sac pour sa petite amie en m�me temps. Que pouvons-nous faire en termes de comportement C'est �galement un d�fi pour l'apprentissage en profondeur d'analyser et de concevoir quel type de structure de r�seau peut mieux et plus pr�cis�ment extraire ce qui int�resse vraiment les utilisateurs.

Ces deux exemples montrent en fait que pour un probl�me commercial pratique, tel que le commerce �lectronique, ce que vous pouvez utiliser peut en fait �tre plus �tendu que l'ensemble de donn�es qui vous a �t� fourni par le milieu universitaire. Ici, vous pouvez penser de diff�rentes mani�res, vous pouvez �tre plus cr�atif pour r�soudre ce probl�me. En fait, nous avons publi� il y a quelque temps un travail intitul� : user multi-interest distribution model Nous allons faire des structures de r�seau sur l'ensemble de la s�quence d'utilisateurs pour extraire plus raisonnablement les informations d'int�r�t de l'utilisateur. Nous avons �galement publi� ce r�sultat, qui a �t� post� sur arXiv, et il devrait y avoir quelques explications sur Internet. Si vous �tes int�ress� par les d�tails, vous pouvez voir ce mod�le.

Voici mon point de vue sur l'apprentissage en profondeur et certaines des choses que nous faisons.

Les trois processus avanc�s de la technologie, o� est Ali�?

Enfin, permettez-moi de parler de ma compr�hension de la technologie. Je vais proc�der en trois �tapes :

1. L'�tape de l'application, l'am�lioration des r�sultats commerciaux et une meilleure r�solution des probl�mes. C'est ce que tout le monde fait le plus, qu'il s'agisse de recherche ou d'affaires r�elles. Il suffit de regarder ce que fait l'industrie, comment les diff�rentes entreprises le font, quelles entreprises sont les plus avanc�es et si nous pouvons apprendre de ces pratiques avanc�es, les appliquer � notre propre entreprise et faire mieux, c'est la premi�re �tape A, qui est aussi la base d'un travail de recherche, est de conna�tre toutes les m�thodes de pointe actuelles.

2. Faire des innovations technologiques Qu'il s'agisse de notre compr�hension de la technologie ou de notre compr�hension du probl�me, comment pouvons-nous �tre cr�atifs et proposer des solutions plus r�centes et meilleures pour mieux r�soudre ce probl�me. Cette �tape, nous l'appelons l'innovation technologique.

3. Ce que je comprends peut �tre un niveau plus large, c'est-�-dire l'�tape d'utilisation de la technologie pour entra�ner des changements dans l'ensemble de la cha�ne causale et de la cha�ne commerciale. Qu'est-ce que �a veut dire? En fait, quel que soit le probl�me que nous r�solvons, il y a une cha�ne causale derri�re nous, � cause de quoi, qu'arrivera-t-il aux utilisateurs, qu'arrivera-t-il aux commer�ants, qu'arrivera-t-il � la plateforme, et une s�rie de cha�nes causales.

Le processus d'�tablissement de cette cha�ne causale consiste � �liminer de nombreuses possibilit�s dans les conditions techniques de l'�poque, car de nombreuses technologies ont d�termin� que certaines choses ne pouvaient pas �tre r�alis�es, nous allons donc �liminer de nombreuses possibilit�s et �tablir une cha�ne causale sous un tel filtrage. une entreprise existante. La raison pour laquelle Alibaba investit autant dans la technologie est que le changement de technologie conduira en fait � la causalit� que nous avons exclue � l'avenir. Le processus de pens�e de toute la cha�ne causale sera diff�rent de l'original. La forme de l'ensemble l'entreprise sera �galement diff�rente, ou une nouvelle entreprise compl�tement diff�rente verra le jour. C'est pourquoi les grandes entreprises investissent autant dans la technologie.

Alibaba a en fait beaucoup fait dans la premi�re �tape, et notre volume d'affaires est �galement tr�s bon. La deuxi�me �tape est une chose qui se fait actuellement dans l'innovation technologique. Vous pouvez voir qu'au cours des derni�res ann�es, comme dans les domaines li�s � l'apprentissage automatique et � l'exploration de donn�es, Alibaba a en fait publi� de nombreux articles lors de conf�rences internationales de premier plan. Nous avons d�j� commenc� � faire beaucoup de beaux articles dans la deuxi�me �tape. r�sultat.

Notre id�al est d'�tablir dans la troisi�me �tape. Nous esp�rons apporter notre propre force dans les changements technologiques et industriels, pour promouvoir davantage de changements dans l'ensemble de la cha�ne causale de l'entreprise caus�s par des changements dans les contraintes causales, en pensant que les changements ont engendr� de nouvelles formes d'entreprise. C'est notre mise en page. C'est l'�tape actuelle d'Alibaba.

� quel genre de techniciens Ali s'attend-il�?

Je suis intervieweur pour le poste technique d'Alibaba et responsable technique d'une �quipe.Quant � ces deux r�les, que penses-je des caract�ristiques des personnes qui pensent que l'�quipe a besoin de plus ou que l'entreprise a besoin de plus. En fait, Alibaba a deux tr�s bons r�sum�s : il y a un r�sum� intitul� "des gens extraordinaires font des choses extraordinaires avec des curs ordinaires".

Que veut dire personne extraordinaire ? Nous esp�rons que cette personne a de tr�s bonnes caract�ristiques, tout d'abord, elle est plus intelligente, r�siliente, persistante et motiv�e, capable de mieux r�soudre les probl�mes, puis m�me de r�soudre les probl�mes de mani�re cr�ative. Des personnes extraordinaires nous r�sumerons plusieurs caract�ristiques : intelligentes, solides, optimistes, introspectives. Si vous �tes optimiste et ne pouvez pas rencontrer de probl�mes, vous serez tr�s triste et vous ne pourrez rien faire. Si vous �tes intelligent, vous devez avoir un certain degr� de professionnalisme, voire vous devez avoir suffisamment de potentiel, m�me si vous n'�tes pas tr�s dou� pour cela, vous pouvez rapidement vous am�liorer dans des probl�mes pratiques ou par votre propre apprentissage. La v�rit� est que tout ce que nous faisons n'est pas facile.

Par exemple, la strat�gie cloud d'Alibaba. En fait, une personne c�l�bre � Alibaba est le Dr Wang Jian. Lorsque le Dr Wang Jian travaille sur la strat�gie cloud d'Alibaba, il faut dire qu'il subit encore beaucoup de pression. Les personnes qui suivent l'industrie savent qu'il n'y avait pas beaucoup d'entreprises qui croyaient au cloud � l'�poque. Il y a eu beaucoup de critiques de la part de tout le monde, et le Dr Wang a d� subir beaucoup de pression � ce moment-l�. En fait, le cloud d'Alibaba a fait tout son chemin, en Chine, il devrait �tre le plus grand par �tapes, et il continue d'investir plus de ressources, dans l'espoir de faire mieux.

� l'heure actuelle, tout le monde croit fondamentalement au cloud. En cours de route, je pense en fait que ce que j'admire chez le Dr Wang Jian, c'est que sous diverses pressions, de nombreuses personnes peuvent m�me remettre en question la propre compr�hension du Dr Wang de la technologie cloud. En fait, le Dr Wang Jian, avec sa ferme croyance en Yun, a insist� et a vraiment fait en sorte que cela se produise. Peu importe ce que les autres grosses vaches peuvent penser, il n'y a peut-�tre personne d'autre que le Dr Wang qui peut vraiment faire en sorte que cela se produise. Parce que la pression � supporter est tr�s �lev�e, c'est vraiment la pers�v�rance int�rieure et la conviction int�rieure en la mati�re qui peuvent faire en sorte que quelque chose de tr�s difficile se produise.

Par cons�quent, nous devons avoir ce genre d'esprit solide. Lorsque nous rencontrons des difficult�s, nous reculons. Cette grande chose ne doit pas �tre la v�tre. Si une grande chose n'a pas encore �t� faite, cela ne doit pas �tre si facile. L'introspection signifie que dans tout le processus de faire les choses, vous devez r�fl�chir � plusieurs reprises sur vous-m�me et absorber ce type de r�troaction du monde ext�rieur pour r�fl�chir � la fa�on de mieux faire cela et si votre intention initiale est bonne et si votre direction est bas�e sur votre intention initiale. C'est donc une exigence des gens.

La seconde est que chacun doit garder un esprit normal lorsqu'il entre dans la phase de travail.En effet, en passant du milieu universitaire ou d'un environnement � un nouvel environnement, vous �tes confront� � des donn�es et � des activit�s potentiellement tr�s complexes. Il peut �tre n�cessaire d'utiliser un sentiment de normalit� et de pers�v�rance, d'�tre capable de supporter la solitude, de pouvoir s'enfoncer, de comprendre ces choses � fond et de comprendre clairement les donn�es. C'est la premi�re �tape.Si vous �tes particuli�rement arrogant et arrogant, vous aurez toujours l'impression de ne pas vouloir faire beaucoup de choses, vous ne pourrez peut-�tre jamais vous enfoncer, et il sera alors difficile de vraiment faire de grandes choses.

Le dernier est une suggestion, tout en �tant normal, il doit y avoir un cur de poursuite de l'excellence. Tout d'abord, nous devons couler. Apr�s avoir coul�, nous devrons peut-�tre r�fl�chir � la meilleure fa�on de changer le statu quo. Comment faire des affaires, � la technologie est un avenir meilleur. Ensuite, continuez � r�fl�chir � des questions difficiles et � des questions pr�cieuses. Cette poursuite de l'excellence doit �tre poss�d�e. Des gens extraordinaires, des esprits ordinaires, faisant des choses extraordinaires, voil� comment nous le voyons, de quel genre de personnes nous avons besoin. En plus d'�tre intelligent, optimiste, pragmatique et introspectif sont tous de tr�s bons r�sum�s.

Comment puis-je mieux me pr�senter lors d'un entretien ?

En effet, je rencontre chaque ann�e de nombreux �tudiants � la recherche d'un emploi, je vais donner quelques suggestions ci-dessous.

Tout d'abord, quels sont les points forts de votre CV qui peuvent attirer l'attention des directeurs RH et techniques, comme le parcours scolaire, tout le monde le verra certainement, mais ce qui est plus accrocheur, ce sont les choses qui peuvent vraiment prouver votre capacit� sur un � plus grande �chelle. Cela inclut, par exemple, des articles acad�miques de haute qualit�, tels que des classements ou des r�compenses dans certains concours internationaux tels que les donn�es. Un autre exemple est de savoir si vous avez un code qui a �t� reconnu par tout le monde, par exemple, les plus classiques sont certains projets open source, le mode de participation, etc.

Ce n'est pas grave si ce n'est pas le cas, il y a quelques conseils d'entrevue � garder � l'esprit.

Le premier est l'�tape pr�paratoire. Dans l'�tape pr�paratoire, il y a quelques notions de base, telles que la capacit� de programmation. Certains �tudiants peuvent utiliser un langage de haut niveau pour faire des recherches plus tard, ce qui peut modifier la capacit� de programmation sous-jacente, comme certaines choses apprises. Oubliez �a, beaucoup de travail r�el doit �tre fait par vous-m�me, et cette chose est encore reprise un peu avant l'entretien. Pour donner quelques exemples, le premier est la capacit� de programmation de base, et le second est la connaissance la plus basique telle que la structure des donn�es.Par exemple, vous ne connaissez pas la liste cha�n�e lors de l'entretien, ce qui peut encore d�cevoir l'intervieweur. Troisi�mement, si vous passez un entretien pour un poste d'algorithme, en plus des connaissances professionnelles de l'apprentissage automatique ou de la vision ou de la recherche op�rationnelle que nous venons de mentionner, il est pr�f�rable de pr�parer quelques algorithmes de base.

En fait, je recommande certains livres classiques de l'industrie tels que "Introduction to Algorithms". M�me si vous ne passez que deux heures ou un apr�s-midi � revoir les concepts de base du ou des deux premiers chapitres, c'est tr�s b�n�fique pour les entretiens. Les capacit�s de base peuvent �tre perdues pendant longtemps aux niveaux postdoctoral et doctoral, il est sugg�r� que vous puissiez passer une heure ou deux ou un apr�s-midi � les r�viser et ce sera beaucoup mieux.

La deuxi�me est la comp�tence professionnelle, qui est routini�re.Les exp�riences ant�rieures, les projets de recherche, les travaux de recherche effectu�s pendant les journ�es �tudiantes, y compris les stages, peuvent �tre tr�s r�v�lateurs.

Enfin, parlons des techniques d'entrevue. Pendant le processus d'entretien, en fait, chacun peut s'inqui�ter de ses propres lacunes.Je pense que ce n'est pas la chose la plus importante.Le plus important est que vous pensiez que vos propres points forts sont vraiment montr�s � l'intervieweur pendant le processus d'entretien. Par exemple, apr�s tout l'entretien, l'intervieweur ne vous a pas demand� ce que vous pensez �tre le meilleur et le plus puissant. Apr�s l'entretien normal, il peut encore y avoir des probl�mes dans ce domaine.

En fait, l'intervieweur examinera le potentiel de cette personne et verra si cette personne peut mieux se d�velopper � l'avenir sous tous les aspects.Il discutera avec vous avec une telle mentalit�. Par cons�quent, vous pouvez �galement essayer de guider l'intervieweur avec un meilleur langage, vous guider vers l'endroit o� vous vous sentez le plus �blouissant et le plus fort, et avoir des discussions et des discussions avec l'intervieweur � ce sujet, ce qui est tr�s utile pour vous montrer. . Pas peur des lacunes, mais peur de ne pas dire vos points forts.

Voil� pour mon partage, merci � tous.

Route de la soie

Apprenez � conna�tre la Chine

De Tsinghua � Ali, il ne lui a fallu que 6 ans pour influencer des centaines de millions d'utilisateurs