Un entrepreneuriat basé sur le deep learning s'est disputé le droit de parler de mode traditionnelle

Illustration par Sandbox Studio, Chicago avec Ana Kova

Incroyablement complexe. La lumière entre le vide mental et le cluster de données. Comme les lumières de la ville, qui s'estompent.

William Gibson, neuromancien

Peut-être même Huang Dinglong lui-même n'a-t-il pas réalisé que l'abréviation de ses initiales (DingLong) était aussi l'abréviation de Deep Learning.

Lui et l'Américain Matt Scott ont fondé une entreprise technologique axée sur l'apprentissage en profondeur. Les deux fondateurs, l'un est né à Shenzhen, qui vient d'être balayé par la brise printanière de la réforme et de l'ouverture il y a plus de 30 ans, et n'avait jamais étudié à l'étranger pour un doctorat à l'Université Tsinghua ; l'autre était de la Big Apple City , New York, est venu en Chine et a formé un lien indissoluble entre cette terre et son peuple.

Alors que la vague de la différence et de la diversité se retire peu à peu aux États-Unis de l'autre côté de l'océan Pacifique, en Chine, deux personnes aux parcours culturels et aux expériences de vie différents s'associent pour former des partenaires entrepreneuriaux. deux entre personnes.

Bien qu'il soit en Chine depuis plus de dix ans, le chinois de Ma Te n'est toujours pas très bon et Huang Dinglong est tenu d'agir en tant que traducteur pendant l'entretien. Cependant, sous l'influence de collègues chinois, Maute a pris l'habitude d'appeler C++ "C Jiajia". Alors que Huang Dinglong présentait lentement la situation de l'entreprise aux autres, les Américains jouaient souvent le rôle de l'enthousiasme. Et un prédicateur fougueux, il parlait aux autres de son amour pour la Chine et le peuple chinois avec un ton de fierté et de vantardise unique aux New-Yorkais.

Au cours des deux dernières années environ, les deux entrepreneurs ont toujours été dans un tourbillon profond et intense, non seulement eux, mais aussi une petite fille bilingue en anglais et en japonais qui pleure à cause des erreurs dans son travail. , ils tous ont connu des hauts et des bas dans leur vie d'entrepreneur.

Plus que cette entreprise, au cours des deux dernières années ou même en remontant plus loin, le domaine technique et l'ensemble du monde des affaires, comme l'intelligence artificielle et l'apprentissage en profondeur, ont été violemment métabolisés par la naissance, la vieillesse, la maladie et la mort, tandis que les plus grands réalité Le monde encore plus.

Le monde change tout le temps. Dans ce monde changeant, les gens qui sont déjà différents, comment changent-ils et comment changent-ils le monde en leur pouvoir.

Tour de Babel

Il y a deux mille ans déjà, Aristote de Grèce disait que se connaître soi-même est le début de la sagesse. Cependant, depuis que Turing (Alan Turing) a proposé ses grandes idées sur l'informatique et l'intelligence artificielle, depuis l'émergence des machines, les êtres humains ne se contentent plus de se comprendre, ils essaient de construire une tour de Babel technologique post-moderne pour rendre les gens Il n'y a plus de fossé entre eux et les machines, ils veulent en savoir plus sur les machines et le monde chaotique contenu dans 0 et 1.

C'est cette ambition et cette curiosité qui continuent de faire progresser l'intelligence artificielle et l'apprentissage automatique ultérieur, l'apprentissage en profondeur.

En 1943, Warren McCulloch et Walter Pitts ont proposé un modèle de calcul pouvant être appliqué aux réseaux de neurones basé sur l'algorithme logique à seuil. Huit ans plus tard, Marvin Minsky, connu comme le "père de l'intelligence artificielle" par les générations futures, a assemblé la première machine d'apprentissage par réseau neuronal SNARC de l'histoire à l'âge de 24 ans.

Jeune Rosenblatt Source: peoples

Basé sur un réseau neuronal informatique à deux couches avec seulement de simples opérations d'addition et de soustraction, Frank Rosenblatt a créé un "Perceptron" pour la reconnaissance de modèles en 1957, et il a également proposé d'ajouter des couches de réseau neuronal de notation mathématique, et une telle idée n'a été réalisée que 20 ans plus tard, alors que le système de circuit logique XOR décrit par Rosenblatt dans le "perceptron" n'a été réalisé que lorsque Paul Werbos) a été appliqué aux réseaux de neurones près de 20 ans plus tard, lorsque l'algorithme de "rétropropagation" a été proposé.

Cependant, dans leur livre de 1969, Minsky et Seymour Papert ont identifié deux obstacles majeurs à l'application des réseaux de neurones aux machines informatiques, arguant que les perceptrons ne pouvaient pas gérer les circuits OU et logiques, alors qu'ils pensent également que les ordinateurs n'ont pas assez de puissance de calcul pour exécuter des réseaux de neurones à grande échelle pendant de longues périodes. Les opinions de deux personnalités faisant autorité ont interrompu de manière inattendue l'élan et l'orientation de la recherche sur l'intelligence artificielle, la vision géniale de Rosenblatt a été abandonnée par l'industrie et le développement de l'intelligence artificielle a été presque pris dans une situation de 100000 chevaux tout au long des années 1970.

En 1971, le jour de son 43e anniversaire, Rosenblatt mourut prématurément dans un accident sur un bateau, et cette année-là, certains scientifiques proposèrent l'utilisation de l'algorithme GMDH (Group Method of Data Handling, traitement de groupe de données) pour entraîner An 8- Un réseau de couches profondes a été formé. Jusqu'en 1979, l'équipe de l'Université de Stanford a finalement créé un "Stanford Cart" qui pouvait naviguer dans la pièce et éviter les obstacles par lui-même. Un an plus tard, Kunihiko Fukushima a annoncé l'utilisation du réseau neuronal multicouche "Neocognitron". pour la reconnaissance de l'écriture manuscrite, cet algorithme a inspiré la naissance du réseau neuronal convolutif qui a suivi.

En 1989, l'équipe française de Yann LeCun a appliqué avec succès l'algorithme de rétropropagation au réseau de neurones profond pour reconnaître le code postal manuscrit sur le courrier, mais les lacunes étaient également très importantes, ils n'ont utilisé l'algorithme que pour entraîner le réseau profond. Il n'a fallu que 3 jours, et le réseau neuronal profond n'a évidemment aucune utilité pour le moment.

Trois ans plus tard, Weng Juyang a proposé le "Growth Cognitive Network" (Cresceptron), qui reconnaissait automatiquement avec succès des objets 3D à partir de scènes mixtes 2D et 3D, et la machine neurocognitive des scientifiques japonais obligeait les programmeurs à fusionner manuellement la reconnaissance. le réseau cognitif croissant peut automatiquement apprendre les caractéristiques non supervisées dans chaque couche du réseau neuronal, et ce dernier peut également classer les éléments appris grâce à une analyse de fond dans le réseau neuronal.

En 1993, Jürgen Schmidhuber a utilisé le compresseur d'histoire neuronale pour résoudre "l'apprentissage très profond" avec des milliers de couches de réseaux de neurones simultanément via des "réseaux de neurones récurrents" (RNN).

Deux ans plus tard, les scientifiques ont en outre démontré que l'algorithme pouvait former avec succès un réseau neuronal à 6 couches étroitement connecté, bien que l'ensemble du processus de formation ait pris jusqu'à 2 jours. Selon les estimations de Yan Lecun, au début des années 2000, les réseaux de neurones récurrents étaient capables de traiter entre 1 et 20 % des chèques manuscrits aux États-Unis.

Cependant, en raison du temps de calcul excessif des réseaux de neurones artificiels et du fait que les scientifiques ne connaissaient pas le mécanisme de fonctionnement du cerveau humain se connectant de manière autonome via des réseaux biologiques à cette époque, dans les années 1990 et tout au long du début du millénaire, les réseaux de neurones et les réseaux profonds l'apprentissage n'ont pas été mis en uvre à grande échelle dans la pratique.

Hinton chez Google en 2014 Photo : Josh Valcarcel/WIRED Crédit : WIRED

En fait, dès le milieu des années 1980, les théories connexes de l'apprentissage en profondeur ont commencé à se répandre dans le domaine de l'apprentissage automatique, et au cours du nouveau millénaire, les premières ont également commencé à se répandre dans le monde des réseaux neuronaux d'intelligence artificielle, mais c'était ce n'est qu'en 2006 que Jeffrey Sheen Les résultats des recherches de Geoffrey Hinton et Ruslan Salakhutdinov ont attiré l'attention et l'enthousiasme de tous.

Ils soulignent qu'un "réseau de neurones feedforward" multicouche pourrait pré-entraîner une couche à la fois et entraîner chacune à son tour comme une couche de machine de Boltzmann restreinte non supervisée, puis ajuster son application à l'algorithme de rétropropagation supervisée. Cela permet d'augmenter la vitesse d'apprentissage en profondeur.

L'apprentissage en profondeur est de plus en plus passé de la théorie expérimentale aux domaines appliqués.

L'apprentissage en profondeur a montré des avantages sans précédent dans le domaine de la reconnaissance vocale

En 2009, Deng Li a invité Hinton au Microsoft Research Institute de Redmond pour mener des recherches sur l'application de l'apprentissage profond dans la reconnaissance vocale. Les deux ont organisé conjointement un séminaire dans ce domaine au NIPS cette année-là. Cette fois, ils ont principalement discuté de la parole profonde. modèle de génération (deep generative model) limites et possibilités dans le domaine du big data basé sur les réseaux de neurones profonds (DNN).

Les recherches des deux scientifiques ont finalement donné des résultats surprenants : ils ont constaté que même sans formation préalable, la formation sur les données, en particulier un grand nombre de réseaux de neurones profonds basés sur des couches de sortie de texte, avait des taux d'erreur plus élevés que GMM-HMM et d'autres méthodes génératives avancées. Les conclusions de Deng Li et Hinton ont été confirmées par plusieurs autres grands groupes de recherche sur la reconnaissance vocale.

L'apprentissage en profondeur a secoué tout le domaine de la reconnaissance vocale.Cette année également, le professeur Feifei Li de l'Université de Stanford a ouvert la base de données ImageNet qu'elle a créée en 2007.

Andrew Ng chez Google en 2012 Crédit Jim Wilson/The New York Times Source : The New York Times

Dans le passé, la principale base de données utilisée pour entraîner le traitement et la reconnaissance d'images est MNIST, qui couvre 60 000 images d'entraînement et 10 000 images de test. Jusqu'à présent, le meilleur résultat obtenu par l'équipe de recherche sur MNIST est une erreur de 0,23 % En 2012, l'équipe de Dan Ciresan a soumis un article au CVPR pour montrer les performances étonnantes des réseaux de neurones convolutifs à mise en commun maximale sur les GPU dans l'amélioration des enregistrements de référence visuels. .

Cette année-là, Google Brain, dirigé par Andrew Ng et Jeff Dean, a utilisé plus de 16000 processeurs informatiques pour former un réseau neuronal, et ils ont extrait une image de 10 millions de vidéos YouTube pour la distinguer. un réseau de neurones pour en reconnaître les chats.

L'apprentissage en profondeur remporte le concours ImageNet pour la première fois

Cette année-là, deux jeunes hommes de l'équipe de Hinton ont remporté le concours ImageNet cette année-là avec une énorme marge. C'était la première fois que l'apprentissage en profondeur participait au concours. Par la suite, l'équipe de Qileyshang a également été impliquée dans la découverte du cancer dans les images médicales. Gagner ICPR, la puissance de l'apprentissage en profondeur a choqué le monde.

En 2013, les 20 premiers du concours ImageNet ont tous adopté la technologie d'apprentissage en profondeur sans exception, et la meilleure université de New York a réduit le taux d'erreur à 0,11197. Dans le projet de reconnaissance d'objets, la première université d'Amsterdam (Université d'Amsterdam ) ) et l'équipe formée par Euvision Technologies avait une précision moyenne moyenne de seulement 0,22581. L'année suivante, Google avait remporté la première place dans les deux catégories, avec un taux d'erreur et une moyenne de 0,06656 et 0,43933, respectivement.

Enfin, l'apprentissage en profondeur est passé de la tour d'ivoire théorique au monde réel.

Dans sa conférence commémorative Alfred Korzybski de 1960, McCulloch a souligné que le but de l'enquête sur les bases physiologiques de la connaissance est de comprendre comment nous savons ce que nous savons et d'obtenir une explication satisfaisante du problème.

Plus d'un demi-siècle plus tard, des scientifiques dotés d'un courage et d'un génie surhumains ont posé la question plus profonde et plus révolutionnaire : comment faire savoir aux machines ce qu'elles savent.

Pour d'autres, leur ambition et leur curiosité résident dans la façon de faire du "César à César" une fois la machine connue, après la construction de la Tour de Babel, et comment trouver cette pièce commerciale dans ce nouveau monde, la Terre Promise.

idée dangereuse

En 2009, alors que l'apprentissage en profondeur était sur le point d'entrer dans l'histoire, afin de concurrencer Google sur le marché de la recherche, Microsoft a lancé la recherche Bing, avec le nom chinois "bing".

Cependant, la réalité n'est pas optimiste. À l'heure actuelle, Google occupe plus de 60 % de la part de recherche locale. Sur le marché chinois, Baidu occupe plus des 3/4 du territoire de recherche, et Google ne peut saisir que moins de 20% du marché de la zone de recherche.

Dans la situation où le marché de la recherche est sur le point de se solidifier, comment se démarquer de Bing est devenu le plus gros test et problème pour l'équipe Microsoft Chine à cette époque. À cette époque, Ma Te et Huang Dinglong étaient tous les deux chez Microsoft Research Asia, mais le premier appartenait au département de recherche, tandis que le second travaillait sur des produits chez MSN. Dans la structure de l'institut de recherche, il y avait un département d'ingénierie entre eux. .

Matt n'est pas habitué à ses collègues américains et à leurs comportements. C'est une personne assez assidue pour travailler jour et nuit pour ses objectifs de travail. Cependant, il est dommage que ses pairs ne soient pas aussi engagés.

Pour Huang Dinglong, des problèmes similaires le tourmentaient également. Même si l'Institut de recherche sur l'Asie à Pékin était établi depuis plus de 11 ans à cette époque, à cette époque, les attentes et les objectifs de Microsoft vis-à-vis de Bing continuaient de s'attaquer à Google au niveau local. les gens seront attentifs à sa croissance et à ses performances sur le marché chinois de la recherche, qui est affecté par de nombreux facteurs incontrôlables et a été fragmenté.

Tous deux ont à cur de faire quelque chose pour changer la situation. Cependant, le problème avec les grandes entreprises est que, très souvent, les gens qui veulent faire des choses trouvent qu'ils ne font rien de moins pour "faire des choses" que pour faire les choses eux-mêmes.

"Il y a beaucoup de résistances dans les grandes entreprises, en particulier la couche du milieu. Ce sera certainement très désagréable. Vous m'avez dépassé pour le faire, et il y a aussi beaucoup de problèmes sur le marché technique des ventes de produits de marque." Huang Dinglong s'y est maintenant habitué. .

À cette époque, Maute avait déjà fait quelques réalisations en matière d'apprentissage automatique qui pourraient être transformées en applications. Cependant, d'autres départements de l'institut de recherche n'avaient pas de réponse à cela. Seul Huang Dinglong a manifesté son intérêt. Après de nouvelles discussions, les deux se sont entendus.

Les résultats de la recherche sur l'apprentissage automatique de Code peuvent convertir le texte anglais en lecture audio, et Huang Dinglong voit son potentiel et ses perspectives commerciales sur le marché. À cette époque, seul MSN était le seul que Microsoft avait une chance de gagner sur le marché intérieur, et les utilisateurs les plus importants de ce produit de messagerie instantanée étaient les cols blancs dans les villes. Selon Huang Dinglong, ces utilisateurs avaient une forte demande pour Apprentissage de l'anglais et traduction.

La combinaison de la technologie et des besoins des utilisateurs signifie des possibilités commerciales. Les deux recrutent rapidement des personnes de leurs départements respectifs pour former une équipe, et développent finalement le dictionnaire en ligne Engkoo. Effectivement, Engkoo connaît un grand succès après son lancement. A cette époque, ce produit innovant en interne contribue à plus de 60 % de Les revenus de Bing. Le trafic, les utilisateurs mensuels atteignent 4 millions, et l'énorme trafic a apporté des publicités d'apprentissage de l'anglais pour les utilisateurs cibles, et a finalement réalisé avec succès la réalisation commerciale.

Huang Dinglong aime l'investissement et le talent de Ma Te dans son travail, Ma Te aime son attention sans partage dans sa coopération avec Huang Dinglong, et leur coopération a eu un début réussi. Cependant, c'est aussi devenu le début et la fin de leur partenariat : on choisit de partir, on choisit de rester.

Peu de temps après, les Chinois ont choisi d'aller à Tencent pour prendre en charge l'entreprise Weibo.A cette époque, personne ne savait que l'avantage du premier arrivé de Sina Weibo serait si fort que tous les concurrents finiraient par se rendre les uns après les autres. Mais Maute a continué à rester dans l'institut de recherche et a lancé successivement le dictionnaire Bing et la méthode de saisie de la bibliothèque anglaise.Bien sûr, les Américains ne se seraient pas attendus à ce que même après la défaite de Google, Microsoft n'ait toujours pas réussi à occuper son propre marché sur ce marché. L'endroit où se tenir est toujours tiède.

Ce n'est qu'en 2014 que les choses ont changé. Cette année, deux choses se sont produites, qui ont profondément affecté Huang Dinglong et Ma Te.

Tout d'abord, l'apprentissage en profondeur brille sous les projecteurs du monde extérieur, et sa valeur et sa signification ont été de plus en plus prises en compte par de plus en plus de personnes.

Deuxièmement, Ma Te a épousé sa petite amie chinoise. Les deux vieux amis se sont rencontrés. Après le mariage, dans le restaurant où le mariage a eu lieu, ils ont siroté le barbecue avec leurs index et ont discuté avec enthousiasme des changements et des scénarios d'application qu'apporterait l'apprentissage en profondeur. Avec une image spécifique et subtile , les deux ont réalisé que les progrès de la technologie avaient permis à certaines des idées du passé de se concrétiser.

Cette nuit-là, au moment le plus agréable, l'idée de "créer une entreprise" a traversé l'esprit des deux et a pris racine comme une graine de malaise.

À cette époque, ils étaient tous les deux sur une trajectoire ascendante constante dans leur carrière, avec Huang Dinglong en tant que vice-président de TripAdvisor pour la Chine et Mutter en tant que membre du programme de formation HiPo de Microsoft. Après avoir terminé le projet Yingku, qui équivaut presque à démarrer une entreprise, et après avoir fait l'expérience d'une grande entreprise qui a toujours des ressources complètes à soutenir, le plus gros problème auquel elles sont confrontées est : Vaut-il la peine de tout abandonner devant eux pour une image qu'ils ne peuvent qu'esquisser eux-mêmes pour le moment ?

Avec les différents objets et le temps, la réponse de Huang Dinglong à cette question n'est pas la même.

"J'étais très excité cette nuit-là, et j'avais vraiment l'impression de ne pas pouvoir dormir quand je me suis rendormi la nuit. À ce moment-là, je repensais à travailler ensemble sur le projet Yingku. C'était un moment très heureux et épanouissant. temps dans notre carrière pour nous. C'est très excitant et c'est une collision, si vous ne le faites pas, vous devez le faire. » Huang Dinglong, qui est en affaires depuis deux ans, l'a décrit.

Huang Dinglong a toujours été une personne rationnelle, parfois même calme et discrète au point que les gens autour de lui se sentent incroyables. Il a salué ses collègues de l'entreprise et a déclaré qu'il souhaitait retourner seul à Shenzhen pour s'occuper de ses affaires personnelles.Après son retour, il a montré à chacun son identité en tant que membre de la CCPPC de Shenzhen. C'était pareil il y a deux ans. Il n'était pas tellement excité qu'il a immédiatement sauté dans la marée de l'entrepreneuriat.Après cette nuit, Huang Dinglong et Ma Te ont passé quelques mois de leur temps libre à faire des recherches, à discuter et à répéter à plusieurs reprises l'entrepreneuriat hypothétique.

Rationnel et émotionnel, calme et impulsif, échec et succès, où sont les limites ?

En pensant au plan, une personne professionnelle rationnelle se transformera en un entrepreneur libre qui est libre du système de la grande entreprise. Quand il a déjà considéré les conséquences d'un échec mais qu'il est toujours intrépide, peu importe à quel point les gens sont calmes, ils ne peuvent pas Aidez mais soyez impulsif. Poursuivant l'appel intérieur, lorsqu'ils n'ont plus peur de l'échec, peu importe à quel point les gens sont calmes et rationnels, ils auront une confiance et un courage sans précédent pour poursuivre le succès.

Cette graine entrepreneuriale germe et grandit en quelques mois. Enfin, plusieurs mois après cette nuit qui a agité leur cur, Huang Dinglong et Ma Te ont finalement décidé de créer une entreprise.

Il existe une autre version de la réponse de Huang Dinglong à la question de savoir s'il faut ou non créer une entreprise.

Il y a dix-huit mois, il a dit à ses étudiants juniors de l'Université Tsinghua que "le succès ou l'échec est incertain, et démarrer une entreprise est toujours une question de vie ou de mort." Il a dit aux jeunes étudiants ce qu'il ressentait à l'époque : "Je ne sais pas pense que je choisirais de démarrer une entreprise si vous étiez pur. Analyse rationnelle, peu importe comment vous choisissez, vous ne démarrerez pas une entreprise.

Huang Dinglong a déclaré que s'il choisit de démarrer une entreprise alors qu'il est doctorant, ses parents pourraient lui casser les jambes.

Maintenant, quand lui et Maute ont choisi de démarrer une entreprise, ils ont pris l'initiative de se mettre dans une situation pleine d'incertitude et de risque. Il y aura des changements drastiques dont ils n'ont jamais entendu parler auparavant, ils peuvent échouer avec une forte probabilité d'échec, et la vie ne sera plus facile, paisible et deviendra inexorable.

L'entrepreneuriat est dangereux à tout moment.

Pourtant, Oscar Wilde, le perdant le plus immortel de l'histoire, a déclaré que si une idée n'était pas suffisamment dangereuse, comment pourrait-elle être considérée comme une idée.

nouveau monde

Lorsqu'ils ont lancé leur entreprise, Huang Dinglong et Ma Te n'ont même pas obtenu de financement. Chacun prit un mot des deux noms, et la société s'appelait Malong.

"Je n'arrêtais pas de penser, quelle est la prochaine étape pour les moteurs de recherche. Si la recherche est toujours sur le texte, alors la bataille est pratiquement terminée, mais la prochaine plus grande opportunité est l'image, c'est énorme Le trésor de , vient d'ouvrir un peu crack." Dès chez Microsoft, Huang Dinglong a commencé à envisager la prochaine opportunité de recherche.

Au cours des quelques mois de recherche entrepreneuriale, ils décident d'utiliser la technologie de deep learning en reconnaissance d'images, déjà mature à l'époque, mais la fonction de « reconnaissance images par images » ne suffit pas à séduire les utilisateurs et le marché.

Dans le plan d'affaires initial, ils ont nommé le produit de Malong kumo. En japonais, le mot a deux sens, "nuage" et "araignée". Kumo s'appuie sur les services cloud. En même temps, Huang Dinglong et les autres espèrent que ce produit rampe comme autant d'images que possible comme une araignée. Au final, le modèle commercial du produit qu'ils ont conçu pour Malong est d'aider les utilisateurs à prendre des décisions grâce à la reconnaissance de la recherche d'images.

Kumo est le moteur d'abord, et la valeur du moteur réside dans la connexion des mots-clés et du contenu. Kumo se concentre principalement sur les images, alors comment prouver cette valeur aux autres ? Huang Dinglong a utilisé l'exemple de Google pour faire un calcul simple. Il a comparé les revenus de Google à ce moment-là avec le nombre de recherches et a constaté que la recherche de chaque utilisateur sur Google valait 7 centimes. Dans son plan d'affaires, il a indiqué aux investisseurs que le besoin et la valeur de la recherche d'images seraient supérieurs à ceux de la recherche de texte ordinaire.

À l'époque, il avait fait une estimation prudente d'environ 55 milliards de dollars pour la recherche d'images, prédisant qu'elle deviendrait un marché de 100 milliards de dollars au cours des prochaines années.

En 2014, Google a acquis la startup d'intelligence artificielle Deepmind pour 400 millions de livres sterling.Un an plus tard, Facebook a proposé sa technologie d'apprentissage en profondeur, DeepFace, pour étiqueter et identifier automatiquement les photos des utilisateurs, qui contenaient plus de 120 millions de paramètres. Son taux de précision de reconnaissance atteint 97,35 %, soit 27 % de plus que le système précédemment utilisé par Facebook.

Cependant, ces faits et les propres prédictions de Huang Dinglong ne suffisent pas à augmenter la probabilité que d'autres croient au succès de Malong à moins qu'ils ne puissent faire leurs preuves.

Peu de temps après sa création, Malong a remporté le prix

Ma Long a été enregistré en juillet. À ce moment-là, il restait moins d'une semaine avant la date limite d'inscription pour le 3e Concours chinois d'innovation et d'entrepreneuriat organisé par le ministère des Sciences et de la Technologie. Une petite équipe composée de Huang Dinglong, Ma Te et un autre ancien designer de Microsoft Respectez la date limite pour vous inscrire au concours avec la mentalité de vous tester à moitié et de le prouver aux autres.

Les équipes participantes n'avaient pas besoin de soumettre d'objets physiques lors de l'inscription et de la soumission de matériel.Par conséquent, Huang Dinglong, qui venait de démarrer une entreprise et n'avait qu'un concept, a profité de la situation pour remplir le "moteur visuel de prise de décision". Des préliminaires en ligne, des compétitions régionales, des demi-finales de l'industrie à la finale nationale, il y a un intervalle d'environ 2 à 3 semaines entre chaque tour. Après cela, il n'y a pas beaucoup de temps pour réviser davantage votre produit.

La compétition a duré environ 2 mois. Contrairement à d'autres concurrents qui avaient déjà formé des produits, leurs produits ont été constamment modifiés et optimisés à chaque tour de la compétition. Au final, ils ont remporté la deuxième place dans le groupe de l'équipe nationale de cette compétition. Plus moins d'une semaine plus tard, ils ont de nouveau remporté le concours d'innovation en entrepreneuriat de Shenzhen.Moins de deux mois plus tard, Ma Long a été sélectionné dans le Microsoft Venture Capital Accelerator en 2015.

À cette époque, l'apprentissage en profondeur est devenu un concept technique et une pratique de Luoyang Zhigui.

L'émergence de l'apprentissage en profondeur a entraîné le grand développement de l'IA et de l'apprentissage automatique.

Comment exactement l'apprentissage en profondeur aide-t-il les gens à prendre des "décisions visuelles" ?

Commençons par les réseaux de neurones d'intelligence artificielle les plus populaires de ces dernières décennies. Il s'agit d'une discipline transversale basée sur notre compréhension du cerveau humain combinée à l'intelligence artificielle.Dans le cerveau, les nerfs peuvent être connectés à n'importe quel autre nerf à une certaine distance physique. Cependant, malheureusement, les réseaux neuronaux d'intelligence artificielle sont limités par leurs propres couches neuronales, connexions et directions de propagation des données.

Un objet est entré dans la première couche du réseau neuronal d'intelligence artificielle, puis la deuxième couche de nerf traite sa propre tâche, puis entre dans la couche suivante, répétant ce processus jusqu'à la dernière couche, et obtient finalement le résultat de sortie. Chaque neurone reçoit un poids des bonnes et mauvaises conditions associées à la tâche qu'il exécute, et la sortie finale est déterminée par ces poids. Cependant, le problème est que même le réseau de neurones le plus élémentaire a des exigences de calcul stupéfiantes et, en même temps, il nécessite également une extraction manuelle des caractéristiques de l'échantillon, ce qui entrave considérablement son application pratique.

L'apprentissage en profondeur a fondamentalement changé cela.

Il se compose de plusieurs transformations linéaires ou non linéaires pour former un grand nombre de couches neurales de traitement de tâches, et utilise des algorithmes tels que des algorithmes d'apprentissage de caractéristiques non supervisés ou auto-supervisés et l'extraction de caractéristiques hiérarchiques pour remplacer l'apprentissage et l'extraction manuels de caractéristiques, créant ainsi de meilleures représentations et dans extraction de caractéristiques à grande échelle. Utilisez ces représentations pour créer de meilleurs modèles sur des données non étiquetées à grande échelle.

Les vecteurs de mots (représentations distribuées) supposent que les données observées sont générées par l'interaction de facteurs dans diverses couches neuronales, et l'apprentissage en profondeur suppose en outre qu'il existe une correspondance entre les activités de ces couches neuronales et la composition abstraite des différents niveaux, et le le nombre et la taille varient. Différentes couches neuronales peuvent être utilisées pour fournir différentes abstractions.

Par conséquent, l'apprentissage en profondeur peut commencer à un niveau inférieur pour apprendre des concepts de niveau supérieur et plus abstraits, utiliser l'apprentissage non supervisé pour pré-entraîner les fonctionnalités d'apprentissage couche par couche à la couche inférieure et utiliser les résultats comme entrée d'une couche supérieure. Ajustée à l'aide d'un apprentissage supervisé, combinée à des algorithmes gourmands, cette approche permet à l'apprentissage en profondeur d'apprendre des concepts abstraits et de sélectionner des fonctionnalités qui l'aident à apprendre.

Autrement dit, par rapport à l'apprentissage superficiel représenté par les réseaux de neurones artificiels, l'apprentissage en profondeur peut mieux apprendre de manière autonome les caractéristiques des données et des objets et faire évoluer en permanence ses propres capacités d'apprentissage. La popularité des mégadonnées a donné à l'apprentissage en profondeur des opportunités sans précédent. plus la quantité de données est importante, plus elles seront précises. La montée en puissance de l'architecture de cluster à grande échelle MapReduce, l'application à grande échelle des GPU et les algorithmes d'optimisation qui en résultent ont considérablement raccourci le temps requis pour les données d'apprentissage en profondeur.

Lorsque l'apprentissage en profondeur a balayé l'ensemble de l'industrie, différents modèles et algorithmes sont devenus les armes uniques de chaque entreprise.Huang Dinglong était assez confiant dans la technologie de Malong. Ils ont d'abord mis en place un système d'évaluation quantitatif en interne, avant que le nouvel algorithme ne soit mis en service, il sera testé et noté dans l'entreprise.

Avant cela, Code et les autres concevront également un système pour exclure les préférences personnelles, les préférences de conception d'interface et d'autres facteurs pour permettre à chacun de marquer plus objectivement, mais cela ne suffit évidemment pas, et plus convaincant et décisif est le retour d'utilisation du client.

Désormais, Malong s'adresse aux utilisateurs professionnels, ce qui n'était pas le cas au début de l'activité, à l'époque, ils ciblaient les consommateurs ordinaires.

logique de la technologie

À Shenzhen en novembre, la température est toujours aussi élevée que 27. Yate a enroulé les stores et a respiré la brise marine chaude tout en mangeant un hamburger et des frites McDonald's fraîchement achetés pour satisfaire sa faim. Il a parlé d'abandonner, et Matt m'a dit que parfois au travail, il est nécessaire de ne pas insister ou même d'abandonner ses propres idées pour permettre à plus de gens d'exprimer leurs opinions. ambiance de travail et favoriser la croissance collective.

Malong a d'abord lancé un produit appelé StyleAI, et ils ont décidé d'utiliser la mode comme une percée pour appliquer un apprentissage en profondeur pour aider les utilisateurs à s'habiller. Bien que l'application et le compte officiel WeChat aient été lancés, aux yeux des utilisateurs et du marché, ce n'est toujours qu'un jouet sous le gimmick "intelligence artificielle + mode", et Huang Dinglong et le code y sont également revenus progressivement. , et ils ont finalement réalisé qu'il est difficile pour le deep learning de faire une grande différence dans le domaine 2C.

Le plus grand obstacle est que la mode implique trop de chaînes industrielles en amont et en aval, y compris les tissus, la production et la transformation, la conception, etc., et une petite entreprise innovante est tout simplement incapable de faire face à la boucle commerciale fermée de la chaîne écologique industrielle aux consommateurs au niveau Ils n'ont ni les ressources ni l'énergie et la patience de boucler la chaîne vous-même. Après avoir passé beaucoup de temps avec les consommateurs, ils ont soudainement réalisé qu'ils devaient se concentrer sur le lien en amont.

"C'est un nouveau domaine, ce qui signifie que vous devez résoudre beaucoup de problèmes inconnus, et certains n'ont même pas de réponses, alors vous mettez ces problèmes dans votre tête. Pensez-y quand vous mangez, et pensez-y quand vous prenez une douche, j'y pense quand je vais aux toilettes, j'y pense quand je vais dormir, j'y pense jour et nuit, et puis tout d'un coup, j'ai une idée ! C'est résolu ! » Huang Dinglong était encore excité lorsqu'il se souvient de l'époque où il réfléchissait sérieusement à la direction de l'entreprise.

Dans ce marché où l'innovation technologique joue un rôle déterminant, afin de maximiser l'effet de la technologie de deep learning et de maximiser les chances de succès commercial de Malong, l'idée qu'ont eue deux personnes de Microsoft est : Ouvrir la technologie de l'entreprise pour permettre plus entreprises à l'utiliser.

Laissez l'apprentissage en profondeur aider ces entreprises à résoudre les problèmes d'optimisation qu'elles ont rencontrés dans le passé et doivent maintenant résoudre l'optimisation, et à leur tour, laissez ces personnes profondément impliquées dans les différentes chaînes de l'industrie de la mode disposer à la fois de ressources et de participants capables de promouvoir et de promouvoir l'apprentissage en profondeur. La technologie.

Alors, ils se sont tournés vers le marché 2B et ont lancé la plateforme ProductAI, leur introduction à ce produit est l'IA pour votre produit.

Youliubao est leur utilisateur typique.

Cette plateforme d'échange de tissus s'adresse à la fois aux acheteurs et aux vendeurs. Un scénario d'application typique est que si un acheteur est intéressé par un certain morceau de tissu, il utilisera la fonction de recherche d'images pour rechercher des vendeurs de tissus similaires sur Youliubao. De tels besoins des utilisateurs ont toujours existé, mais le problème est que pour ces entreprises traditionnelles, ce n'est pas leur expertise de construire un moteur de recherche d'images impliquant l'intelligence artificielle ou même une technologie d'apprentissage en profondeur sur leurs propres plateformes, sans parler de la maintenance et des mises à jour de suivi. et le coût de l'agrandissement.

D'autre part, les entreprises de ces chaînes industrielles connexes ont déjà accumulé une grande quantité de données sur les images et le comportement des utilisateurs, mais le marquage et même l'exploration de données pour ces données sont presque inconnus pour ces entreprises. N'a joué aucun rôle.

ProductAI explore d'abord diverses images sur l'ensemble du réseau, puis sous-traite les parties non étiquetées à une équipe de centaines de personnes dispersées à travers le pays pour l'étiquetage, formant ainsi une base de données et un modèle d'apprentissage.

Chaque entreprise cliente a ses propres groupes d'utilisateurs et ses propres besoins.En vertu de ces différences personnalisées, le modèle de données est formé et l'algorithme est finalement connecté à la plate-forme construite par le client sous forme d'API pour réaliser la recherche d'images. et des images à travers des images Identification d'images et autres fonctions. ProductAI lui-même est gratuit et ses principaux revenus proviennent des appels des clients à l'API.

Le point de vue de Huang Dinglong sur la technologie, et le point de vue commercial qui en résulte, semble si radical : il pense que la vague de smartphones et d'applications s'estompe lentement. Ce n'est pas seulement une partie de la raison pour laquelle il a renoncé à continuer à développer des applications sur le terminal 2C, mais c'est aussi la raison pour laquelle il est devenu le cinquième consommateur d'HoloLens en Chine. une nouvelle vague dans un futur proche.

Cependant, le vrai paradoxe est que Huang Dinglong et Ma Te ont commencé leur activité avec la mode, et leur fin est de détruire la vie de la mode traditionnelle.

"Maintenant, quelqu'un a défini la mode, donc tout le monde est populaire. C'est parce que toutes sortes de choses sont trop chaotiques maintenant, ce qui entraîne des informations asymétriques sur diverses choses. Lorsque l'information est asymétrique, seules quelques personnes peuvent prendre la décision finale. We What nous devons faire maintenant est d'éliminer l'asymétrie d'information de la connaissance." Dans la plupart des photos publicitaires que l'on peut voir, Huang Dinglong porte des vêtements isolés du style et de la mode, et ni lui ni Mate n'ont de concept spécifique de la mode. .

Il y a 10 ans, dans "Le diable s'habille en Prada", Miranda de Meryl Streep, rédactrice en chef d'un magazine de mode, se résignait au concept de mode du nouveau venu. . C'est la scène préférée et la plus utilisée de Huang Dinglong, il m'a dit que ce que Malong doit faire, c'est s'emparer du droit de parler à la mode.

Selon l'idée de Huang Dinglong, tant qu'il y a suffisamment de photos de rue dans des villes comme New York, Tokyo, Milan, etc., nous pouvons analyser quelles sont les couleurs les plus populaires dans ces villes et même calculer les tendances de la mode dans un De manière quantitative, "par exemple, le rose De 21% la semaine dernière à 38% cette semaine, c'est une tendance", a-t-il dit.

En conséquence, la mode n'est plus l'apanage des créateurs, des critiques et des éditeurs de magazines de mode, mais seulement un travail mécanique terne et rationnel sans aucun mystère et esthétique sous la technologie d'apprentissage en profondeur.En d'autres termes, chaque personne ordinaire peut obtenir une vision intuitive compréhension des couleurs et des modes les plus populaires.

Même si nous ne pouvons pas nous tenir à l'avant-garde des tendances de la mode, même si nous ne pouvons pas diriger la mode du jour au lendemain, selon les mots originaux de Huang Dinglong, la Chine agira au moins non seulement en tant que suiveur de la mode, et il y a encore un chance de "passer de l'usine de vêtements du monde à une source de mode", c'est l'objectif du Centre d'information sur le textile chinois, et c'est aussi la principale raison pour laquelle les autorités apprécient la possibilité de la technologie Malong et choisissent de coopérer avec elle.

Pour Huang Dinglong personnellement, par rapport à des facteurs tels que le pouvoir du discours esthétique et le grand récit national, sa soi-disant "amélioration de l'efficacité et libération de la main-d'uvre" peut être la véritable motivation de son idée de mode réactionnaire.

N'oubliez pas la vision originale de Huang Dinglong de la "recherche décisionnelle visuelle" et leurs ambitions pour ce marché.

La connexion d'images est plus que de simples images. Elle n'est en fait pas très différente de la recherche de texte. Nous dirions plutôt que la recherche est le HUB le plus basique et le plus utilisé sur Internet. Elle relie les besoins et le contenu des utilisateurs. Le contenu ne se limite pas à du texte, des images, etc. Il devrait et essentiellement couvrir un contenu plus riche et plus diversifié, y compris des vidéos, de la musique, des jeux, des produits et des services.

La valeur et l'importance de la recherche ne consistent pas tant à répondre aux besoins des utilisateurs pour trouver du contenu, mais à combler le fossé opaque de l'information aux deux extrémités de la demande et du contenu, mais à briser la redondance et le fardeau sur l'ensemble de la chaîne de valeur de l'entreprise, qui est le Inévitable but et résultat de l'évolution technologique, c'est aussi l'incontournable direction des lois du marché de l'économie Internet, qui est naturellement devenue la tendance la plus importante dans l'évolution des moteurs de recherche.

Il s'agit d'une tendance à l'évolution dynamique de la recherche. Ce n'est pas seulement un outil pour aider les utilisateurs à trouver des réponses, mais fournit également le contenu qui répond le mieux aux besoins des utilisateurs. Le sens de l'apprentissage en profondeur est également là. Après une longue période d'auto-évolution et d'apprentissage , il peut faire Pour "comment savoir ce que nous savons" pour aider les utilisateurs à prendre les décisions les plus rationnelles.

ProductAI est destiné aux utilisateurs professionnels, mais en fait, il sert en fin de compte les consommateurs ordinaires. Il connecte plus que des images et des images, des images et des tissus, il peut également connecter plus de contenu via l'emballage du produit, la vidéo, la réalité augmentée, etc. Plus il y a de connexions et de contenu, plus il y a de scénarios d'application, plus il y a d'utilisateurs et de données, et plus il y a de possibilités commerciales, ce qui rendra les algorithmes d'apprentissage en profondeur plus intelligents.

En un sens, l'apprentissage en profondeur n'est pas seulement la pierre angulaire technique du moteur visuel, mais plutôt un cerveau numérique qui supprime tous les facteurs irrationnels, prenant des décisions basées sur des données basées sur le choix de l'utilisateur. Dans le passé, la recherche était un processus et un moyen, mais dans un avenir prévisible et même maintenant, la recherche elle-même est le but et le résultat, elle a donc la possibilité de boucler la boucle commercialement.

La technologie a donné aux entreprises des possibilités sans précédent.

Cette possibilité est progressivement devenue à la portée de Huang Dinglong et de Maute au cours des cinq dernières années.

Un Chinois, un Américain, ils ont trop de différences, mais ils ne se ressemblent étonnamment que par quelques points communs. Ils sont extrêmement préoccupés par certaines choses et indifférents à d'autres.

Maute utilise toujours l'iPhone 5 oxydé. Ses parents se sont autrefois fermement opposés à sa relation avec des étrangers païens. Au cours des huit ou neuf dernières années, il n'a jamais fait de compromis sur cette question et a finalement inauguré la fin heureuse.

Lors de la conférence de financement de Microsoft Research Asia, Huang Dinglong avait fait de son mieux pour se familiariser avec une scène aussi animée, mais dans le coin hors des projecteurs, il montrait de temps en temps une certaine confusion et un peu de solitude.

Ensuite, lorsque le journaliste, habitué aux gros chiffres, a demandé pourquoi le financement de 62 millions de yuans était si faible, Huang Dinglong, qui avait précédemment convenu avec Mute de ne pas tricher sur la question du financement, a souri impuissant et n'a pu que dire sans ambages sur une posture patiente et paisible. Répondre à des questions comme celle-ci - seuls lui et Matt savent que ce nombre n'est en fait pas inférieur au montant réel levé par ces startups.

Les deux n'étaient pas qualifiés pour démarrer une entreprise.

Ont-ils changé quelque chose ? Ils ne sont pas sûrs d'eux-mêmes, et le monde n'est pas sûr. La seule chose qui peut être sûre est une chose. Huang Dinglong a déclaré qu'au cours des deux dernières années, en raison du manque d'exercice et des heures supplémentaires en mangeant trop de malbouffe, ils ont devenir gros par hasard.

Un soir de novembre à onze heures, l'air chaud de Shenzhen s'est progressivement refroidi. Ma Te a regardé les quelques chips restant dans le sac en papier, a bu la dernière gorgée de Coca, a pincé les lèvres et a continué à revenir vers lui. Je veillais tard avec deux ou trois collègues à ma place. C'est la norme pour lui, mais il apprécie ça. A cette époque, à l'autre bout du monde, Huang Dinglong était encore seul dans un pays étranger pour assister à la réunion de l'APEC, où il cherchait de nouveaux partenaires commerciaux.

Comme d'innombrables nuits ordinaires, c'était leur nuit ordinaire.

Comme d'innombrables histoires entrepreneuriales, la leur ne fait que commencer.

Pour un contenu plus passionnant, suivez le compte Titanium Media WeChat (ID : taimeiti) ou téléchargez l'application Titanium Media

Liner primé! 35 ans, star de la hausse TVB avant la naissance de mise à niveau avec succès un parent: Merci pour la bénédiction
Précédent
Pour plus de bien en forme et son petit ami, le changement de style de peinture Mary est aussi grossit!
Prochain
héros du monde qui rivalise? Lorsque divisé en Liu Bei, Cao Cao, et Wei manuels sur le jeu burst "conseiller Alliance"
Président suicide émoussé après tuer son ex-femme? médecine familiale de tournesol secret de l'amour et de la haine
Un autre Gangjie amusé! Miss Hong Kong Elu meilleur petit ami riche a gagné une proposition de mariage surprise la fin des trois ans d'amour longue distance
Sicong voir aussi « femme Journey » réponse surachat inattendue
Ingénierie d'un seul homme EDC: adapté pour eux, comme comme
Par rapport à compter sur des subventions pour survivre à la Wong Cho Lam, également en tirant une dette de 12 ans, il est le plus misérable!
programme TVB pour prendre le gain de poids de 8 livres! 38 ans « Arctic Marathon Challenge » Yuan Yue: promenade se terminera
Nouvelle génération d'acteurs valeur Ni Yen tableau pour faire éclater noyau dur froid belles Photos cinématographique
Le premier jour de shoot inscription scènes de baisers! Après la TVB réélection, comme la première bataille sur le grand écran: si fort de moi
Rencontre avec des boulettes ont à courir: le roi de la terre ferme, « Coups Ghost » second changement « fantôme manger léger »
TVB renaissance sanglante remodelage « Hong Kong style Wild World », « société de Blind Man Barristers je crois frère, qui » aveugle « plus que des mots
Cela ne me dérange pas les performances sexy! Ancienne actrice TVB mise à niveau déesse femme sans détour: mari aime sexy