informatique mondial H-index 10 chinois Philip S. Yu] apprentissage de la profondeur � l'ampleur de l'apprentissage

1 Nouvelle interview Ji-won

domaine informatique mondial chinois de TOP 10 H-index

Dans les donn�es Acad�mie des sciences, l'Universit� de Tsinghua, ont un savant discret, H-index sur Google Scholar jusqu'� 138, class� en informatique haute avance le 10�me auteur du monde. Vous savez, entre le professeur bien connu des informaticiens, l'intelligence artificielle du monde universitaire figure embl�matique de Michael I. Jordan indice H-indice et il a �galement par (selon Google Scholar Michael I. Jordan H-indice de 137, des donn�es montrent 138).

Ceci est le nom d'une humilit� discr�te et pleine de savants sages aujourd'hui est le h�ros de l'article - pr�sident de la science des donn�es, l'Universit� de Tsinghua, School of Software professeur invit� Yu Shi Wong.

Yu Shi Lun, il �tait mieux connu des noms peuvent �tre Philip S Yu , Voici son article a cit� des statistiques sur le nombre de Google Scholar, de 2012 � ce jour, il a cit� des �tudes un total de 40.000 fois. Philip S Yu peut �tre d�crit comme un champ informatique de pointe acad�mique.

Yu Shi Lun n� aux �tats-Unis, a fait ses �tudes � l'Universit� de Taiwan, puis a re�u son EE de doctorat de l'Universit� de Stanford en 1978. Actuellement, de nombreux chercheurs universitaires ont connu un flux industrie, et le professeur Yu Shi carri�re Lun au contraire, le d�but il a travaill� dans IBM Waston Research Center, a servi comme directeur des outils logiciels et groupe technologique. Il est actuellement professeur �m�rite et pr�sident Wexler Universit� de l'Illinois � Chicago.

Selon sa pr�sentation de profil, le professeur Yu Shi Wong a plus de 300 brevets am�ricains, et est membre de l'ACM et l'IEEE. Ses recherches portent sur l'exploration de donn�es, en particulier compte tenu des donn�es / exploitation r�seau, l'apprentissage machine, les m�dias sociaux, la publication de conservation des donn�es priv�es, flux de donn�es, bases de donn�es, des technologies d'applications Internet.

Haut H Index des sciences informatiques et �lectroniques (donn�es ant�rieures, les donn�es maintenant �t� mis � jour)

Professeur Yu Shi Lun jours de la semaine cl� tr�s faible, tr�s peu d'acc�s aux m�dias. R�cemment, le nouveau Ji-won grand honneur � Tsinghua University Park des scientifiques de haut niveau a eu une interview exclusive avec les ann�es de labours profonds dans le domaine des chercheurs en sciences informatiques bavard� au sujet de son point de vue sur l'�lection du boom de l'intelligence artificielle.

Chatterbox ouvert, nouveau Yuan-chi a demand�, pour les chercheurs ordinaires, comment parvenir � ce professeur universitaire Gao Yu Du Shi Lun de fa�on acad�mique?

Shi Lun Yu a d�clar�: " En fait, rien de sp�cial, comme tout autre domaine, est d'avoir un int�r�t d'investissement, un peu d'ambition. Quelque chose � faire que la r�alisation, le premier est l'investissement, il faudrait beaucoup de temps. Si huit heures du matin pour aller travailler cinq heures � travailler, je ne peux pas faire trop de leurs places. En outre, une passion pour quelque chose qu'ils aiment, puis le travail jusqu'� la fin Peu importe, vous voulez bien faire les choses, comme Steve Jobs, tout ce que vous voulez faire votre favori. En fait, le probl�me est non seulement de faire de l'argent, faire de la recherche est la m�me chose que vous devez vous sentir bien. Mais aussi un peu d'ambition, la poursuite de la satisfaction et le sentiment d'accomplissement. Faire des choses une perc�e, vous �tes pr�t � prendre le temps d'aller. Quelles sont comme cette industrie. "

Si dix algorithme de r�-�lection d'aujourd'hui, d'ajouter une �tude approfondie et de l'algorithme de recommandation

Google Scholar, nous voyons l'un des plus grand nombre de r�f�rences article Yu Shi est Lun un article critique sur le top 10 des algorithmes de data mining: "Top 10 algorithmes de data mining", introduit C4.5, k-means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes et un total de 10 algorithme CART, il a �t� publi� en 2008.

Dans une �tude approfondie aujourd'hui si chaud, m�me s'il est recommand� 10 algorithme le plus influent, quelle diff�rence cela fera?

Le professeur Yu Shi a dit Lun, Tout d'abord, assurez-vous que la profondeur de l'apprentissage � l'int�rieur. 2008 Document publi� en temps Bien que des recherches pr�liminaires sur les universitaires d'apprentissage en profondeur, mais n'a pas �t� si le feu. Selon lui, le volume de plus en plus rapide des donn�es et les performances du mat�riel a �galement contribu� au d�veloppement rapide de l'apprentissage en profondeur. Le deuxi�me est un algorithme de recommandation collaboratif (filtrage collaboratif) Il est d�riv� du commerce �lectronique plus t�t, puis plus largement dans de nombreux domaines ont collaboration algorithme de recommandation applications connexes, comme les soins m�dicaux.

Selon Wikipedia: filtrage collaboratif (en anglais: le filtrage collaboratif), il est tout simplement l'utilisation d'un des int�r�ts similaires, groupe de pr�f�rences, d'avoir l'exp�rience de l'information recommand�e d'int�r�t pour l'utilisateur, les informations personnelles donn�es par un degr� consid�rable de m�canismes de r�ponse de la coop�ration ( que les scores) et enregistr� afin d'atteindre l'objectif de filtrage est un filtrage des informations et d'aider les autres, sans r�ponse n�cessairement limit�e d'un int�r�t particulier, surtout pas int�ress� par les informations d'enregistrement est �galement tr�s important. Le filtrage collaboratif peut �tre divis� en �valuation (Note) ou filtre de groupe (filtrage social).

Lun Yu Shi-recherche approfondie sur la technologie de recommandation. Il pense recommand� comme une technologie de clustering de classification, la profondeur de l'apprentissage est �galement recommand� de le faire. l'apprentissage en profondeur est principalement utilis� pour trouver des caract�ristiques, peut �tre fait en fonction des caract�ristiques recommand�es. Il existe de nombreuses applications recommand�es, produit recommand� peut aussi recommander le film, les m�dicaments de traitement recommand�s, et m�me la publicit� aussi appartiennent probl�me de recommandation. La technologie recommandera la partie sup�rieure de conf�rence ACM sur les syst�mes recommender est son objectif � long terme d'une r�union.

L'ordinateur est en fait un champ d'application, je suis optimiste sur le domaine des soins de sant�, le transport et d'autres applications

Peut-�tre le retour du milieu universitaire de l'industrie avec lui l'exp�rience li�e, dans une interview, le professeur Yu Shi Lun pr�f�rent utiliser du point de vue de la technologie. Il a d�clar� que le nouveau Ji-won, en fait, est une des applications informatiques. Parce que nous avons un tel sc�nario, peut-il �tre le d�veloppement de ces technologies. Sans l'Internet, on n'a pas besoin de faire une recherche, n'aurait pas tant de recherches effectu�es sur la recherche. S'il n'y a aucun commerce, aucun algorithme de recommandation besoin, seul le greffier peut recommander.

Du point de vue de l'application, la recherche de Yu Shi implique Lun traitement m�dical intelligent, m�dical ou de pr�cision. Il pr�sente en papier a r�cemment publi� une m�thode pour le diagnostic technique de l'apprentissage en profondeur de la maladie du cerveau dans KDD. Mais il croit que la sant� m�dicale intelligente particuli�rement pr�cis au d�but et comme il est aussi une recommandation de cette technologie. En outre, un autre point chaud dans le domaine de l'intelligence artificielle, de calcul et de pr�vision du trafic urbain, lui et son �quipe de recherche a r�cemment �galement des r�sultats de recherche tout � fait fructueux.

� Data Mining qui cherchent � faire des sc�narios d'application r�els, tels que les r�seaux sociaux, la diffusion de l'information. �, A d�clar� le nouveau Lun Yu Shi Ji-won, un r�seau social qui est actuellement dans le domaine de la recherche, il est plus int�ress� par Spam (informations fausses) pour identifier .

Il a dit: � Par exemple, les commentaires du public bien connu, s'il y a trop de fausses donn�es ci-dessus, vous pouvez rencontrer un faux voudra pas utiliser. �

� son avis, la technologie de recommandation ou d'une autre pr�diction, la technologie d'identification ou, en fait, sont consid�r�s comme l'intelligence artificielle de, et il n'y a pas de ligne de d�marcation claire � consid�rer intelligent pour dire quel niveau de la technologie de l'intelligence artificielle. Ce point de vue est conforme � sa pratique de faire des recherches autour de l'application, plut�t que de faire des recherches sur la technologie.

applications � propos, Yu Shi Lun tr�s optimiste au sujet du traitement m�dical pr�cis. Il a dit: � En fait, aujourd'hui, signifie que nous sommes un traitement tr�s difficile, comme la chimioth�rapie � un patient, � la fin ce genre de m�dicaments efficaces pour lui, nous ne savons pas, seulement Statistiquement, 20% des patients atteints de la drogue A de. efficace, m�dicament efficace B ont 10% des patients, des m�dicaments efficace C 5% des patients avec un essai de m�decin commencera � partir d'un, mais la situation r�elle peut �tre appropri�e pour un C, si d'une mani�re classique patient donn� peut ne pas essayer de C , le patient ne serait pas tenir ".

diagnostic AI du cancer du sein, le cancer du poumon, etc., pour atteindre le niveau d'experts dans l'�tude, si recommandation m�dicale pr�cise de quelle �tape?

Lun Yu Shi a d�clar�: � Les donn�es chinoises entre les h�pitaux n'ont pas eu plus difficile aux �tats-Unis, il y a beaucoup de donn�es historiques ne sont pas n�cessairement compatibles, mais la situation id�ale est d'obtenir toutes les donn�es du patient si proche, � la diff�rence g�ant du commerce �lectronique tant que suffisamment de donn�es. � ce sujet. suffisamment de collaboration les utilisateurs ont besoin, ou nous n'ont recommand� ".

Eh bien. techniques d'apprentissage profondeur utilis�es dans quelle mesure m�dicale? Shi Lun Yu a d�clar�: " Vous ne pouvez pas regarder juste � toute technologie de l'exp�rience historique. Des �tudes ont tant de gens aujourd'hui, m�me si pas en forme, au fil du temps il peut y avoir de nouvelles perc�es. "

Grandes quantit�s de donn�es est roi, mais le d�fi est de savoir comment mettre ensemble l'int�gration de donn�es

Avant boom artificiel, gros volumes de donn�es est la plus recherch�e. calcul plus tard la mise sous tension, et divers autres aspects des conditions sont r�unies, la vague a percut� l'intelligence artificielle. L'intelligence artificielle en pr�lude � la grande donn�es.

R�cemment nouvelle version Zhiyuan de l'article � [1 milliard + ensemble de donn�es, IMAGEnet mille fois] une �tude approfondie � l'avenir, Google a reconnu les donn�es est roi �, l'article d�crit une exp�rience g�ante Google a fait, ils ont constat� que: les donn�es ont une performance significative intelligence artificielle impact. Avec la croissance des donn�es, la performance mod�le lin�aire t�ches de vision par ordinateur compl�te augmente. M�me � 300 fois IMAGEnet une si grande �chelle, la performance n'a pas souffert plate-forme. (Google a ajout� un contenu total de jour suppl�mentaire de l'article). AI ont une � violence calcul�e �, et maintenant ajout� une nouvelle � donn�es sur la violence. � Mais aussi ce que les grandes donn�es remettent en question il?

Compte tenu Shushi Lun, le d�fi le plus difficile des donn�es ne sont pas assez grand, mais - nous avons une multitude de donn�es, comment les m�langer ensemble.

La profondeur peut �tre davantage l'accent sur l'apprentissage est la profondeur, la profondeur de bonnes choses tra�n�. Exploitation mini�re grandes donn�es n�cessite non seulement en profondeur, mais aussi large.

Nous pensons que lorsqu'un probl�me vient, Quelles donn�es peut vous aider � faire mieux? Par exemple, maintenant, nous pr�disons la voiture de l'Universit� de Tsinghua � Wangfujing combien de temps. Bien s�r, vous pouvez utiliser des donn�es historiques pour pr�dire, c'est simplement une donn�e. Nous avons une grande vari�t� de donn�es peuvent �tre utilis�es, telles que les donn�es des m�dias sociaux, il y a maintenant contenu li� � la circulation. Par exemple, il a �t� dit aujourd'hui dans un accident de voiture quelque part dans la ville de Victoria, alors vous savez que la ville de Victoria est susceptible de bloquer le passage.

Autre exemple, il y a une parade aujourd'hui, Tsinghua, ou sur le chemin il y a une grande baisse des prix de d�crochage, cela aura une incidence sur l'heure d'arriv�e.

Comme autre exemple, on peut aussi consid�rer le facteur de temps, par exemple, vous voulez savoir tout de suite sous la pluie, vous serez affect� par l'Universit� Tsinghua aux donn�es de Wangfujing.

Nous avons donc besoin de comprendre comment l'int�gration de ces donn�es ensemble. Si vous pouvez penser � une fa�on toutes ces donn�es, vos pr�dictions peuvent �tre plus pr�cis, ce qui est la raison pour laquelle nous voulons mettre l'accent sur l'ampleur de l'apprentissage.

Mais l'int�gration des grandes donn�es ne sont pas simples Les diff�rentes propri�t�s des diff�rentes sources de donn�es, les r�seaux sociaux ont des donn�es de texte, la relation entre l'homme et l'homme est la structure du r�seau des donn�es, comment vous int�grez? La pr�cision de chaque source de donn�es ne sont pas les m�mes, certaines sources de donn�es sont achevaient la tr�s cr�dible. Certaines donn�es ont un peu de bruit � supprimer.

Trouver des donn�es plus pertinentes, la pr�cision pourrait faire mieux. La cl� est que vous voulez vous sentir les donn�es est de r�soudre le probl�me.

la source Parlant des donn�es, pensez Yu Shi Lun il y a trois: 1 dans l'entreprise peut �tre certaines donn�es sont end�miques, comme vous Tencent vous pouvez disposer de donn�es micro-canal, dans ce jeu, le roi de gloire, vous pouvez ajouter des donn�es suppl�mentaires � la micro-lettre, vous la recommandation pourrait faire mieux. 2. Il existe �galement des donn�es accessibles au public, vous devez monter pour prendre la recherche; 3 il y a des donn�es disponibles.

Pour l'impact des grandes donn�es sur les �tudes scolaires, il conc�de, Le vrai probl�me est l'�cole elle-m�me est un manque de donn�es. enseignant de l'�cole est de maintenir la coop�ration de l'industrie, tels que l'Universit� de Tsinghua laboratoire commun et Tencent, Tencent a un avantage parce que les donn�es. Mais cette approche a aussi quelques probl�mes, de sorte que certains enseignants sont all�s au secteur industriel tout � fait.

Tourn� norme � l'envers de d�veloppement technique, mais loin du pic �tude approfondie

Data mining est un important domaine de recherche du professeur Yu Shi Lun, il a frapp� une vie de relations avec ce sens, les profondeurs de feu la technologie d'apprentissage � l'exploration de donn�es si des progr�s ont apport� pas la m�me chose?

Shi Lun Yu estime que l'�tude approfondie de l'exploration de donn�es d'une grande aide � un grand nombre de donn�es est l'une des meilleures m�thodes.

�tude approfondie est bien s�r le feu, mais il a �t� tr�s t�t invent�. Chaque technologie a �t� d�velopp�e dans des circonstances diff�rentes, mais la situation objective changera.

l'apprentissage en profondeur est non conforme � l'invention lorsque l'invention de la situation actuelle, mais la chance a tourn�. Lorsque les donn�es devient de plus, tous les algorithme est comme un apprentissage en profondeur qui a une �volutivit� (�volutivit�), conviennent pour le calcul parall�le (parall�lisme). Je ne peux dire que les conditions objectives sont adapt�s � l'apprentissage en profondeur, peut faire de bons r�sultats. Mais ce n'est pas son objectif initial peut �tre d�crit comme un bonus inattendu.

New Ji-won a publi� un article [PNL] refl�te porter la profondeur de tr�pied d'apprentissage de nouveaux sommets empirisme, le rationalisme est pas la fin, traduit de l'�glise Kenneth � cloche swing trop loin � (un pendule all� trop loin), article crois que nous sommes � empirisme Peak, et va rapidement revenir � la classique rationalisme . Yu Shi Lun scientifiques de haut voir comment les tendances technologiques les deux sens?

Shi Lun Yu route � la r�ponse de Jane �tait: � La Le destin a � son tour se produira souvent partout, y compris la technologie. � Parfois, nous particuli�rement � une certaine fa�on, mais apr�s un certain temps, il pourrait ne pas �tre si facile � utiliser, et nous pourrions avoir besoin des r�gles de base du classique se sont av�r�s.

Cependant, Yu Shi Wong a d�clar�: � Je ne pense pas que la profondeur de l'apprentissage va bient�t perdre son importance. �

Il a dit: � trop de donn�es, nous avons l'apprentissage en profondeur pour le texte, les images, la vid�o et d'autres donn�es, mais ces solutions ont rien � faire encore? Tous les domaines continuent d'avoir de nouvelles donn�es et applications apparaissent. Un probl�me peut �tre r�solu dans des domaines sp�cifiques, mais il y a de nouveaux probl�mes g�n�r�s ailleurs. Le court terme, l'apprentissage en profondeur ne peut pas r�soudre tous les probl�mes maintenant. "

Par exemple, il a dit: � Par exemple, mod�le de profondeur dans diff�rents domaines, la capacit� de g�n�ralisation des donn�es h�t�rog�nes est encore faible Nous �quipe Tsinghua dans le monde pour la premi�re fois pour mener � bien les m�thodes de recherche pertinentes et le mod�le de migration de profondeur th�orique de l'apprentissage, a fait une perc�e importante. Dans un autre exemple, comment g�n�rer automatiquement des images de haute qualit� et texte vid�o � partir du mod�le de la profondeur, l'apprentissage sans supervision efficace est toujours les sujets � l'avant-garde de l'intelligence artificielle, l'�quipe Tsinghua dans le r�seau bay�sien de profondeur, les r�seaux de g�n�ration de profondeur, a �galement fait une le travail a une influence internationale. Il y a des probl�mes plus difficiles, sans parler a commenc� � �tudier. "

Shi Lun Yu a continu�, comme dit avant le programme de traitement m�dical pr�cis recommand� par une sorte de maladie, mais nous avons des milliers de maladies, on peut dire simplement encore commenc�.

Il a dit, et l'environnement est en train de changer, nous devons l'�nergie verte, nous avons besoin de l'intelligence, mais aussi l'�mergence de probl�mes diff�rents. Avant thermique, combien vous avez la demande, donner la quantit� d'�lectricit� que vous envoyez. Plus tard, l'�nergie solaire, l'�nergie �olienne est pas le cas, mais il n'y a pas voir le soleil il n'y a pas de vent. La sagesse doit �tre grille de tarification flexible, tarification en fonction de l'offre et de la demande. Il y a la ville intelligente, le r�seautage, l'�ducation et ainsi de suite. Pour chacun de ces domaines ont beaucoup de donn�es, que vous pouvez taper, Il y a beaucoup de demande, nous n'avons pas exploiter pleinement le potentiel de l'apprentissage en profondeur, mais aussi loin du sommet.

De l'industrie � des milieux universitaires, de l'Illinois Universit� Tsinghua en Chine, encore un retour d'adolescent

Lun Yu Shi de l'industrie (IBM Waston) a commenc� sa carri�re, puis revint dans le milieu universitaire, et maintenant, que ce soit en Chine ou aux �tats-Unis est beaucoup plus fr�quent dans les chercheurs universitaires pour le d�veloppement de l'industrie, voir Yu Shi Lun comment aujourd'hui ce ph�nom�ne?

Il croit que l'industrie et le milieu universitaire en circulation est une chose normale � l'autre: � Le domaine de l'informatique est la orient�e vers l'application, de l'application pratique, nous avons m�me pas aucune donn�e. �

Il a �galement, par exemple, Google Page Rank fondateur commence � �crire des articles, et enfin mettre en uvre cette technologie � la soci�t� Google. pr�sident John Stanford Hannis, il a m�me sorti entreprise a ouvert quelques ann�es, puis de retour dans le milieu universitaire pour faire le pr�sident. Des gens comme des universitaires mais parfois il y a des id�es dans l'industrie veulent v�rifier et voir si elle est efficace, il ne peut pas �tre pleinement rejoindre l'industrie, peut-�tre trois � cinq ans de retour dans le milieu universitaire. Bien s�r, certaines personnes restent dans l'industrie, ainsi que des professeurs sortent de l'entreprise, Ce ne sont pas mauvais ph�nom�ne, mais est une bonne chose.

Actuellement les �coles Lun Yu Shi tout en servant aux �tats-Unis et la Chine, sur le bureau de Tsinghua, il a expliqu�: .. � Je suis professeur invit� � l'�cole de logiciel, l'Universit� de Tsinghua avant ma sp�cialit� est grande �cole d'exploration de donn�es � �tablir lorsque l'Institut des sciences et de Big Data , je prends naturellement en compte, je pense que ces derni�res ann�es, le d�veloppement technologique de la Chine est tr�s rapide, les grandes donn�es lui-m�me est une technologie de rupture �.

Qui a dit que le papier chinois seulement quantit� sans qualit�? Cette �volution �tonnante d�cennie

En tant que scientifique chinoise vivant en Am�rique depuis de nombreuses ann�es, Yu Shi Lun croit la Chine pour promouvoir incroyablement rapide dans le pass� niveau de la recherche de dix ans. Il y a dix ans, dans une revue de premi�re classe, le papier de la Chine beaucoup, et maintenant le papier de la Chine et plus incroyable. Il a dit: � Dans le domaine informatique, le papier de la Chine a �t� plus que la somme de l'ensemble il y a des d�cennies, l'Europe, nous pensons que beaucoup du Japon, le Japon est maintenant absolument impossible .. �

Pour certains croient que le nombre �lev� de papiers chinois, mais la mauvaise qualit� de la parole, Yu Shi Lun ne pense pas, dit-il, les meilleurs universit�s chinoises telles que l'Universit� de Tsinghua, la qualit� du papier est superbe.

Yu Shi Lun exprim� ne doute pas: Nous sommes la technologie chinoise rapidement, cela est tout � fait raison. Surtout dans le domaine informatique

, Des nouvelles technologies, nous avons commenc� � peu pr�s le m�me, il est facile de suivre. Et maintenant, le financement de la recherche accrue de la Chine, contrairement aux �tats-Unis, mais dans la r�duction de financement de la recherche.

) Je suis un peu oeuf �pic�)

New Ji-won: Il y a quelque temps un d�bat LeCun et Yoav sur arXiv qui n'est pas assez pr�cise arXiv ci-dessus, les gens ont souvent l'irrigation, il a �t� sugg�r� que le pays ne met pas arXiv comme documents officiels, mais comme un BBS sur la ligne, comment voyez-vous arXiv?

Lun Pas d'amis de nuire. Tout peut �tre abus� ah. Nous arXiv papier comme un lieu de stockage. Je me suis int�ress� de voir les derniers travaux. Mais nous voyons aussi dans l'�quipe d'�lite du papier de chercheurs ou c�l�bres, de toute fa�on l'irrigation habituellement personne ne le voyait, il n'y a pas beaucoup de mal.

Liste de r�f�rence:

Top H-Index pour la science informatique et �lectronique: http: //www.guide2research.com/scientists/
Top 10 des algorithmes dans l'exploration de donn�es: http: //www.realtechsupport.org/UB/CM/algorithms/Wu_10Algorithms_2008.pdf
Wikipedia: https: //en.wikipedia.org/wiki/Philip_S._Yu
Google Scholar: https: //scholar.google.com/citations user = D0lL1r0AAAAJ & hl = zh-CN?
[PNL] r�flexion portent la profondeur de tr�pied apprendre de nouvelles hauteurs empirisme, le rationalisme est pas la fin

Cliquez ici pour lire le message original pour voir les d�tails, esp�rons que vous pouvez rejoindre ~

Route de la soie

Apprenez � conna�tre la Chine

informatique mondial H-index 10 chinois Philip S. Yu] apprentissage de la profondeur � l'ampleur de l'apprentissage

Top H-Index pour la science informatique et �lectronique: http: //www.guide2research.com/scientists/

[PNL] r�flexion portent la profondeur de tr�pied apprendre de nouvelles hauteurs empirisme, le rationalisme est pas la fin