Le texte int�gral 6085 Les mots, lorsque l'apprentissage tout au long attendu 18 minute

Figure source: Unsplash

Race Intelligence artificielle

L'humanit� est au milieu d'une concurrence intense pour la domination de la concurrence de l'intelligence artificielle. Cinq entreprises technologiques am�ricaines (Google, Amazon, Facebook, Apple et Microsoft) seront beaucoup d'argent mis dans la recherche et le d�veloppement dans le domaine de la reconnaissance d'image, la reconnaissance vocale et l'analyse des �motions, et un taux sans pr�c�dent de la technologie de l'intelligence artificielle start-ups acquisitions.

En Chine, Baidu, Alibaba, Tencent, et le millet � l'appui du gouvernement, il se d�veloppe rapidement, pr�vu en 2025 pour devenir un leader mondial dans le domaine de l'intelligence artificielle. Cette nouvelle course aux armements est particuli�rement intense, car il semble que le r�sultat sera le gagnant du monopole industrie de l'intelligence artificielle de, take-all (ce point sera d�crit en d�tail ci-dessous).

Pourquoi les donn�es est essentielle

Elle repose sur trois partie essentielle du progr�s dans le travail de l'intelligence artificielle ensemble: Des algorithmes innovants, la puissance de calcul et des donn�es. L'algorithme d'apprentissage profond le plus avanc� est de promouvoir le d�veloppement de la technologie de l'intelligence artificielle premi�re partie importante. Avec beaucoup d'argent qui coule dans les grandes entreprises technologiques et des laboratoires acad�miques, ces algorithmes am�liorent rapidement. Depuis 2010, le r�sultat le plus direct est une explosion de la recherche universitaire. Par exemple, 2014-2017, le nombre de rapports relatifs � la CAGR de recherche sur les r�seaux de neurones de 37%. De m�me, la Conf�rence internationale de vision par ordinateur, tenue r�cemment � S�oul, a �galement le double de la croissance en 2017-2019 rapport de recherche montant soumis. Heureusement, les chercheurs universitaires ouvrent la plupart des recherches pour nous r�jouissons de partager leurs progr�s et les r�alisations des organisations d'intelligence artificielle, et un grand laboratoire technique est d�sireux d'attirer les meilleurs chercheurs du monde entier.

Index AI 2018 Rapport annuel

Faire progresser la puissance de calcul de l'intelligence artificielle est de la deuxi�me facteur cl�. Dans ce domaine, les gens continuent de faire beaucoup de progr�s, entre 2012 � 2018, ont vu le calcul jusqu'� augmentation de 300.000 fois. La croissance exponentielle de la puissance de calcul que avant de doubler tous les 18 mois de la loi de Moore. La raison de croire que, avec Cerebras, Graphcore et HorizonRobotics autre nouvelle soci�t� de d�marrage du mat�riel mis au point une puce sp�cialement pour l'intelligence artificielle pour atteindre FLOPS / Watt (il y a TPU) une croissance importante, cette tendance se poursuivra. Am�lioration de la performance est �galement accompagn�e d'une baisse des co�ts de calcul (FLOPS / $), plus un cloud computing distribu�, l'intelligence artificielle, ce qui rendra plus facile � utiliser.

La troisi�me, et une partie importante de l'�quation finale de l'intelligence artificielle, sont les donn�es. Malgr� le grand nombre d'algorithmes innovation, mais les donn�es sont encore tr�s important, parce que maintenant l'algorithme a un grand besoins de donn�es. Afin d'obtenir une compr�hension plus profonde. algorithmes d'intelligence artificielle doivent former avec de grands ensembles de donn�es, et doivent �tre valid�s avec plusieurs ensembles de donn�es. algorithmes d'intelligence artificielle pour faire du travail de donn�es mieux, un apprentissage plus rapide, plus puissant. En fait, un algorithme simple a plus de donn�es que souvent un algorithme complexe a moins de donn�es. En outre, de nombreux algorithmes ont une r�cession marginale des performances, ce qui signifie que les donn�es dont il a besoin pour entrer dans plus des ordres de grandeur, pour parvenir � une l�g�re am�lioration de la pr�cision de sortie.

Allegro intelligence artificielle appel�e plate-forme de vision par ordinateur montre un exemple des rendements d�croissants. En utilisant un coup avec plus de 200000 images (COCO) �tiquette ensemble de donn�es commun, Allegro form� algorithme deux de d�tection d'objet pour identifier automatiquement l'image cible 80 diff�rentes cat�gories (par exemple, les chiens, les chats, les voitures, les v�los ). Exp�rience, il a conclu que, au moment de la reconnaissance sur les premiers 10.000 images, la pr�cision moyenne de l'algorithme augmente rapidement, puis il a commenc� � ralentir, alors incarne compl�tement la loi des rendements d�croissants.

Les lecteurs pourraient �tre un peu confus, parce que maintenant le monde a beaucoup de donn�es. De toute �vidence, la quantit� de donn�es g�n�r�es chaque jour est �norme. 2018, ce chiffre �tait de 2,5 t�raoctets par jour, 90% des deux premi�res ann�es de donn�es est g�n�r�. Avec cette croissance acc�l�r�e que la croissance des choses, mais les choses vont faire les maisons des gens plus intelligents, de sorte que la sant� est plus durable, rendent la vie plus pratique.

Cependant, les donn�es derri�re le tr�sor, le fait ne peut pas �tre ignor�: la r�partition in�gale des donn�es. Plus pr�cis�ment, de nombreuses grandes entreprises technologiques ont la plupart des donn�es g�n�r�es. Ces entreprises sont principalement les �tats-Unis et la Chine sont les cinq � quatre. Par exemple, chaque jour 35 millions d'images t�l�charg�es sur Facebook, 65 milliards d'informations sont envoy�es sur WhatsApp, 35 millions la recherche et l'entr�e est g�n�r� sur Google.

L'acc�s aux moyens de donn�es que les donn�es est devenu un obstacle injuste pour entrer dans le nouveau monde de la technologie. Comme Pedro Dominguez (Pedro Domingos) dans le � algorithme ultime � (L'algorithme ma�tre) a dit: � Qui a le plus de clients, sera en mesure d'accumuler les donn�es les plus, le meilleur mod�le pour gagner plus le dernier client, avant et en arri�re depuis, un cercle vertueux - mais pour les concurrents, il est un cercle vicieux � dans la lutte contre ce nouveau type de g�ants de la technologie, les petites start-ups technologiques et les entreprises non technologiques difficiles � combattre. Mais tout est apparu avec les donn�es de synth�se est modifi�e.

donn�es synth�tiques pour faire de ce concours deviennent juste?

Dans la description des donn�es synth�tiques peut devenir la raison pour laquelle le changeur de jeu avant, tout d'abord expliquer les donn�es de synth�se est encore tr�s important. donn�es synth�tiques sur, ou des donn�es de simulation, par d�finition, signifie que, plut�t que de ramper � partir des donn�es d'�v�nements r�els g�n�r�s par l'ordinateur. En d'autres termes, ces donn�es est cr�� algorithmiquement Une copie de la partie statistique des donn�es r�elles. Bien que les donn�es de synth�se avaient d�j� paru dans les ann�es 1990, avec une forte baisse des co�ts de stockage de progression, g�n�rer nouvel algorithme contre les r�seaux, ainsi que dans le domaine de la puissance de calcul, l'int�r�t pour les donn�es synth�tiques raviv�.

Synth�se des donn�es largement utilis� dans de nombreux domaines, y compris les nouveaux produits, validation du mod�le, ainsi que le test le plus important des donn�es de formation de mod�le d'intelligence artificielle. Et doit recueillir chaque industrie sur des donn�es r�elles, les donn�es synth�tiques peuvent �tre g�n�r�s dans un large �ventail d'industries. Il peut �tre appliqu� exp�riences scientifiques cliniques, afin d'�viter des probl�mes de confidentialit� (voir MDClone) caus�es par des donn�es de sant�. Elle peut �tre appliqu�e au d�veloppement et � l'exploitation du d�veloppement agile pour acc�l�rer le test et le cycle de l'assurance qualit�. Les institutions financi�res peuvent utiliser des donn�es synth�tiques pour tester et former le syst�me de d�tection des fraudes. Last but not least, il peut �tre utilis� pour former des algorithmes de vision par ordinateur.

Cet article se concentrera sur la fa�on d'agir sur le champ de donn�es de synth�se de la vision par ordinateur, ce qui est une formation en informatique pour comprendre le monde � travers des �tudes sur le terrain image et la reconnaissance vid�o. Bien que 60 il y a quelques ann�es, ce domaine a commenc� dans la formation informatique et autre forme triangulaire ou carr�e distingu�e, le but ultime est de former la vision informatique et informatique humains comprennent le monde.

test pilot� par l'IA montre de la plate-forme StandardCognition comment distinguer ses clients de choisir la marchandise. (Figure Source:. StandardCognition)

les chercheurs en vision par ordinateur travaillent � r�soudre certains d'aujourd'hui est la plus importante question. Exemples d'applications comprennent l'imagerie m�dicale (voir Aidoc), les v�hicules sans pilote, magasins intelligents (voir la norme Cognition), les v�hicules a�riens sans pilote, la r�alit� augment�e (AR) et de la r�alit� virtuelle (VR). Toutes ces applications comprennent une formation de calculatrice pour reconna�tre les diff�rentes choses � d�couvrir le cancer, les accidents d'�viter, ou prendre casque AR et VR pour voir le monde. Des exemples de ces applications sont n�cessaires pour former l'algorithme avec de grandes quantit�s de donn�es. Par exemple, la n�cessit� de fournir un certain nombre d'algorithmes pour num�riser des images � des millions de cancer, afin d'obtenir un diagnostic pr�cis peut maintenant d�passer le radiologue. De m�me, la voiture de train pour identifier les obstacles, �viter les obstacles, ou au bon moment de l'arr�t, mais exige aussi beaucoup d'images pour cr�er plus s�r que de conduire un homme en voiture des v�hicules sans pilote. Le probl�me est que l'acc�s � ces donn�es deviennent des obstacles � l'am�lioration des mod�les d'intelligence artificielle toutes ces pr�cision. donn�es synth�tiques pour r�soudre ce goulot d'�tranglement majeur, et par rapport aux donn�es r�elles, ont un avantage plus important.

�volutive

Il devrait maintenant �tre clair que le principal avantage des donn�es de synth�se est extensible. �tant donn� que les donn�es de synth�se est cr��e par l'algorithme, donc litt�ralement, on peut cr�er suffisamment de donn�es pour l'algorithme en fonction de la formation requise. Par exemple, dans un autre cas en m�decine, des chercheurs de l'Universit� de Toronto ont cr�� un rayons X de synth�se, les rayons X est utilis� pour simuler certaines circonstances rares. Ils ont mis de vrais rayons X en conjonction avec ces situations, afin d'obtenir une base de donn�es suffisamment importante pour former le r�seau de neurones pour identifier les maladies rares. Cette affaire est une perc�e majeure dans de nombreux aspects, il apporte aussi des opportunit�s pour ceux qui manquent de donn�es importantes pour les entreprises am�lioration de la technologie de l'algorithme.

�viter les probl�mes statistiques

Outre l'expansion, la synth�se des donn�es aussi �viter beaucoup de probl�mes dans les donn�es d'�chantillonnage statistique � partir d'une vraie rencontre. Sur cette question le plus commun est par exemple un biais d'�chantillonnage. Difficile pour les entreprises d'obtenir des donn�es r�elles, et ces donn�es doivent couvrir une diff�rence assez grande pour repr�senter chose largement r�pandue dans le monde. Human est un bon exemple. Comme la revue r�cente � Fortune � a dit, m�me pour les grandes entreprises telles que Google, la collection couvre un nombre suffisant de donn�es faciales de races diff�rentes, est un grand d�fi. Ceci est un �norme probl�me, car l'algorithme de formation sur les donn�es de biais, l'algorithme se traduira par la face de l'�cart � performance � de l'utilisateur. Pour r�soudre ce probl�me, DataGen ces entreprises utilisent de grandes diff�rences de donn�es pour cr�er un visage humain compl�tement synth�tique pour faire en sorte que l'algorithme de formation peut �tre couvert sur la base d'une distribution de visage plus humain dans le monde r�el de la population.

Des exemples de la face (Fig. Source: DataGen) DataGen compl�tement synth�tiques cr�ent des diff�rences �lev�es

cas de pointe analogiques

Et les probl�mes statistiques li�s � des donn�es r�elles, puis g�n�rer des donn�es synth�tiques peuvent �tre utilis�es pour r�soudre des cas rares de la vie r�elle. Les �v�nements de cygne noir est difficile � contr�ler dans la vie r�elle, mais aussi dans certains cas, ou qui ne m�ritent m�me pas � traiter (par exemple, les �v�nements dangereux). Par exemple, dans le domaine de la d�tection des cibles, les accidents de la circulation ou de ramper sur les animaux sauvages qui traversent les donn�es de la route, il est tr�s difficile. Toutefois, les v�hicules autonomes, comprendre la situation des accidents de la circulation ou le sanglier traversant la route pour �viter la situation est critique. Cela est vrai m�me grab mensuel Tesla beaucoup d'images en conduisant automatiquement une flotte de voiture, il est �tabli dans le march� un des plus simulateur de pointe aux donn�es de synth�se et des donn�es r�elles pour former sa combinaison de mod�le d'intelligence artificielle raisons.

R�duction des co�ts

Un autre avantage est le moindre co�t des donn�es combin�es. Dans l'ensemble, la collecte manuelle des donn�es et le co�t r�el de l'�tiquetage est tr�s cher (et beaucoup de temps). application au cas, une fois l'algorithme en donn�es de production, de collecte et d'annotation au moins va co�ter des centaines de milliers de dollars. Sans parler du processus de collecte et d'�tiquetage prend des semaines ou des mois, qui a sans doute grandement ralenti les progr�s des chercheurs en intelligence artificielle. La chose la plus importante est de recueillir des donn�es est tr�s difficile, car ces donn�es sont difficiles � obtenir. Par exemple, la collecte de donn�es � partir d'une zone de guerre est tr�s difficile, ou aller � la montagne ou de l'environnement de l'oc�an profond est tr�s difficile d'obtenir des donn�es. Par cons�quent, les donn�es synth�tiques pour recueillir des donn�es n�cessaires pour surmonter les inconv�nients de ce co�t beaucoup de grandes opportunit�s.

Les employ�s ont une image d'entreprise �tiquette d'annotation manuelle (Figure Source: New York Times)

Lorsque vous avez besoin de changer l'�quipement mat�riel et vid�o, un large �ventail de donn�es r�elles � ramper � travers le r�seau, ce co�t sera tr�s �lev�. Tel est le cas avec des soci�t�s technologiques continuent de lancer de nouveaux produits int�gr�s � huis clos rencontr�. Chaque nouveau t�l�phone, cam�ras de surveillance, des robots ou des v�hicules a�riens sans pilote ont des param�tres de l'objectif, il faussera les m�thodes de formation pr�c�demment algorithme. Ces algorithmes sont souvent le d�but d'un rhume, il est n�cessaire de param�tres corrects pour reconvertir avec de nouvelles donn�es. Plus la diff�rence, plus les donn�es sont n�cessaires pour le nouveau produit, par exemple, si l'ancien algorithme est le niveau de l'oeil des donn�es de formation, puis un nouveau robot de nettoyage aura besoin de nouvelles donn�es. Dans tous ces cas, l'utilisation de param�tres internes et externes de l'appareil peut �tre converti facilement des donn�es synth�tis�es pour extraire les donn�es pour chaque application est parfaite.

simulation

La robotique est un autre champ de donn�es de synth�se peut produire un impact significatif. experts en robotique travaillent � r�soudre des probl�mes tr�s difficiles, mais aussi relever le d�fi des donn�es de formation limit�es. De nombreux robots utilisent la formation en profondeur pour renforcer l'algorithme d'apprentissage, ces algorithmes acqui�rent de nouvelles comp�tences gr�ce � l'auto-exploration. Cela n�cessite des milliers d'�chantillons � am�liorer. �tant donn� que le co�t du financement des robots co�teux, �lev� de ce processus est presque impossible dans la vraie exp�rience r�alis�e par une main-d'uvre it�rative. Cependant, utiliser le mot � agent � dans l'environnement de synth�se est le robot de formation bac � sable parfait.

intimit�

Un autre avantage cl� des donn�es synth�tiques est de prot�ger la vie priv�e. Si une � r�gles de protection des donn�es communes, � ce qui apporte l'illumination, il est une loi du gouvernement sur la vie priv�e sur l'industrie de la technologie a eu un impact significatif. les entreprises technologiques doivent changer leurs habitudes et le type de donn�es collect�es. Aujourd'hui, le visage de la collection, le corps humain et les gens m�me dans les donn�es est un sujet tr�s sensible. Toutefois, si les gens veulent continuer � faire face aux �normes d�fis dans l'environnement autour de quatre semaines et les humains, nous devons continuer � recueillir ces donn�es pour la formation des algorithmes d'intelligence artificielle. Pourquoi ne synth�tisent pas absolument aucun risque de la vie priv�e d'un grand nombre de personnes face � la r�alit� de l'environnement int�rieur ou des images, pour remplacer les donn�es d'appui de maisons des gens ce comportement?

Des exemples de l'environnement int�rieur DataGen compl�tement synth�tique cr��s (Figure source: DataGen)

capacit� plus radicale

Enfin, un autre avantage cl� des donn�es de synth�se est qu'il contient les donn�es r�elles que la collecte d'annotation manuelle des informations plus riches. D'une part, les donn�es de synth�se fournit la v�rit� parfaite, et l'annotation manuelle traditionnelle des donn�es, il y a toujours un certain degr� d'erreur. Cela en soi apporte une valeur inestimable pour la formation des algorithmes d'intelligence artificielle. Cependant, les pouvoirs r�els qu'il a la capacit� de fournir un niveau plus profond de la classe d'information d'annotation 3D. Comme nous le savons tous, en raison des limites inh�rentes � l'annotation manuelle, annotation 3D difficile � d�velopper. L'utilisation des donn�es de synth�se, nous pouvons couvrir toutes les informations de g�om�trie 3D, des m�tadonn�es s�mantiques 3D, des param�tres physiques, les cat�gories et m�me d'autres donn�es r�elles non disponibles. Par exemple, les donn�es de synth�se peuvent inclure des donn�es relatives � la profondeur, la mati�re, physique (masse ou de r�fraction tel que l'objet), et m�me d'autres param�tres s�mantiques. Par souci d'illustration, voir les deux exemples sp�cifiques suivants: Synth�se de l'oeil humain et la synth�se de quelque chose de pr�hension de palme.

les entreprises technologiques doivent former des donn�es oeil humain algorithmes d'intelligence artificielle sont de plusieurs raisons: la reconnaissance de l'�motion, la technologie AR et VR, et m�me du mat�riel m�dical. oeil humain synth�tique, il est possible d'obtenir des donn�es de couleur rouge, vert et bleu (RVB), les donn�es infrarouges, la carte de profondeur, et la figure divis� certains d�tails, tels que divers direction du regard r�elle de l'il et les param�tres de r�fraction oculaire ou autour de l'il humain.

Synth�se de l'oeil humain exemple suppl�mentaire de marquage (fig. Source: DataGen)

Dans le cas de la main de pr�hension de l'article, les informations ci-dessus peut �tre utilis�, mais couvre �galement des mat�riaux et de la masse des donn�es d'objet, et la position de l'objet peut �tre saisi, ou des param�tres de modification de donn�es de contexte s�mantique au cours de la part r�elle de pr�hension de l'objet. Quand quelque chose grab (magasins intelligents) ou comment saisir un objet (robot), ces variables suppl�mentaires sont cruciales dans l'algorithme de formation identifie les personnes.

Des exemples de la division suppl�mentaire (fig. Source: DataGen) de la main de pr�hension des objets

Devrait maintenant �tre clair, les donn�es de synth�se est l'occasion id�ale pour combler les lacunes de donn�es et d'acc�l�rer encore la courbe d'apprentissage des algorithmes d'intelligence artificielle de. Cependant, comme avec tous les logiciels, la capacit� de synth�tiser les donn�es uniquement dans le mod�le synchronis� cr��. Pour g�n�rer de bons r�sultats, les donn�es synth�tiques qui exigent une haute qualit�, parfait pour �tre en mesure d'appliquer au monde r�el. Comme chercheur OpenAI Josh Tobin (Josh Tobin) - brancher Evan Persson (Evan Nisselson) a publi� un article dans TechCrunch a d�clar�: � pour cr�er une pr�cision, des donn�es int�gr�es simulateur vraiment difficult�s entre le mod�le et le mod�le de donn�es r�elles est form� par la formation de la synth�se parfaite des donn�es avec une pr�cision de 3-10 fois la pr�sence d'erreurs. fracture continue des donn�es. ont pu accomplir de nombreuses t�ches bien, mais n�cessite une grande pr�cision cas, la performance actuelle est encore insatisfaisant �.

Les bonnes nouvelles sont qu'il ya beaucoup de start-up sont des efforts pour r�soudre ce probl�me. Y compris la soci�t� isra�lienne appel�e DataGen de. �quipe DataGen est de cr�er un moteur de g�n�ration de donn�es synth�tiques pour les donn�es � grande �chelle pour g�n�rer des personnages et des environnements r�alistes pour former des algorithmes de vision par ordinateur. Quand j'ai appris de la soci�t�, le plus impressionnant est le degr� de r�alisme de ses donn�es. Je crois que si les donn�es de synth�se pour pouvoir confondre une personne, de sorte que le degr� de valeur nominale, les donn�es de synth�se est suffisante pour la formation du r�seau de neurones. Cependant, apr�s avoir constat� que ce n'est pas n�cessairement le cas, l'�quipe poss�dera les donn�es et les donn�es r�elles ont �t� compar�es et a constat� que les donn�es de synth�se est all� au-del� des donn�es r�elles. Cela signifie qu'il a atteint le degr� de combler l'�cart entre la simulation et la r�alit�, et cet �cart dans la derni�re d�cennie pour repousser les nombreux chercheurs et les entreprises technologiques.

DataGen en utilisant des algorithmes pour cr�er des exemples r�alistes de ses effectifs (Figure source: DataGen)

Signification de r�duire l'�cart entre la simulation et l'importance de la r�alit�. donn�es synth�tiques vont �quilibrer la concurrence entre les grandes entreprises technologiques et ne peuvent pas obtenir le m�me type de donn�es r�elles des petites entreprises de d�marrage. Les petites entreprises technologiques auront la possibilit� de construire un adversaire fort de l'au-del� de l'algorithme, r��quilibrant ainsi la concurrence f�roce de l'intelligence artificielle.

En d'autres termes, les grandes entreprises technologiques seront �galement donn�es synth�tiques et r�elles utilis�es en combinaison, et a �t� t�moin de grands progr�s dans leurs propres algorithmes d'intelligence artificielle de. Cette concurrence croissante sera tout � fait b�n�fique pour la soci�t�, parce que la recherche sur l'intelligence artificielle de acc�l�rerait et produire de meilleurs r�sultats r�els.

Enfin, les deux start-ups et de grandes entreprises technologiques, la synth�se des donn�es conduira le champ suivant de l'intelligence artificielle et vision par ordinateur pour faire une perc�e, et inspirer le changement � jamais le cours de l'histoire humaine des innovations.

Figure source: Unsplash

pouces Message attention

Ensemble, nous partageons l'apprentissage et le d�veloppement de l'IA sec

Tels que r�imprimer, s'il vous pla�t laisser un message dans les coulisses, se conformer aux normes de r�impression

Route de la soie

Apprenez � conna�tre la Chine

Dans la course en intelligence artificielle, les donn�es de simulation est une importante force d'�quilibre?