informatique mondial H-index 10 chinois Philip S. Yu] apprentissage de la profondeur à l'ampleur de l'apprentissage

1 Nouvelle interview Ji-won

domaine informatique mondial chinois de TOP 10 H-index

Dans les données Académie des sciences, l'Université de Tsinghua, ont un savant discret, H-index sur Google Scholar jusqu'à 138, classé en informatique haute avance le 10ème auteur du monde. Vous savez, entre le professeur bien connu des informaticiens, l'intelligence artificielle du monde universitaire figure emblématique de Michael I. Jordan indice H-indice et il a également par (selon Google Scholar Michael I. Jordan H-indice de 137, des données montrent 138).

Ceci est le nom d'une humilité discrète et pleine de savants sages aujourd'hui est le héros de l'article - président de la science des données, l'Université de Tsinghua, School of Software professeur invité Yu Shi Wong.

Yu Shi Lun, il était mieux connu des noms peuvent être Philip S Yu , Voici son article a cité des statistiques sur le nombre de Google Scholar, de 2012 à ce jour, il a cité des études un total de 40.000 fois. Philip S Yu peut être décrit comme un champ informatique de pointe académique.

Yu Shi Lun né aux États-Unis, a fait ses études à l'Université de Taiwan, puis a reçu son EE de doctorat de l'Université de Stanford en 1978. Actuellement, de nombreux chercheurs universitaires ont connu un flux industrie, et le professeur Yu Shi carrière Lun au contraire, le début il a travaillé dans IBM Waston Research Center, a servi comme directeur des outils logiciels et groupe technologique. Il est actuellement professeur émérite et président Wexler Université de l'Illinois à Chicago.

Selon sa présentation de profil, le professeur Yu Shi Wong a plus de 300 brevets américains, et est membre de l'ACM et l'IEEE. Ses recherches portent sur l'exploration de données, en particulier compte tenu des données / exploitation réseau, l'apprentissage machine, les médias sociaux, la publication de conservation des données privées, flux de données, bases de données, des technologies d'applications Internet.

Haut H Index des sciences informatiques et électroniques (données antérieures, les données maintenant été mis à jour)

Professeur Yu Shi Lun jours de la semaine clé très faible, très peu d'accès aux médias. Récemment, le nouveau Ji-won grand honneur à Tsinghua University Park des scientifiques de haut niveau a eu une interview exclusive avec les années de labours profonds dans le domaine des chercheurs en sciences informatiques bavardé au sujet de son point de vue sur l'élection du boom de l'intelligence artificielle.

Chatterbox ouvert, nouveau Yuan-chi a demandé, pour les chercheurs ordinaires, comment parvenir à ce professeur universitaire Gao Yu Du Shi Lun de façon académique?

Shi Lun Yu a déclaré: " En fait, rien de spécial, comme tout autre domaine, est d'avoir un intérêt d'investissement, un peu d'ambition. Quelque chose à faire que la réalisation, le premier est l'investissement, il faudrait beaucoup de temps. Si huit heures du matin pour aller travailler cinq heures à travailler, je ne peux pas faire trop de leurs places. En outre, une passion pour quelque chose qu'ils aiment, puis le travail jusqu'à la fin Peu importe, vous voulez bien faire les choses, comme Steve Jobs, tout ce que vous voulez faire votre favori. En fait, le problème est non seulement de faire de l'argent, faire de la recherche est la même chose que vous devez vous sentir bien. Mais aussi un peu d'ambition, la poursuite de la satisfaction et le sentiment d'accomplissement. Faire des choses une percée, vous êtes prêt à prendre le temps d'aller. Quelles sont comme cette industrie. "

Si dix algorithme de ré-élection d'aujourd'hui, d'ajouter une étude approfondie et de l'algorithme de recommandation

Google Scholar, nous voyons l'un des plus grand nombre de références article Yu Shi est Lun un article critique sur le top 10 des algorithmes de data mining: "Top 10 algorithmes de data mining", introduit C4.5, k-means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes et un total de 10 algorithme CART, il a été publié en 2008.

Dans une étude approfondie aujourd'hui si chaud, même s'il est recommandé 10 algorithme le plus influent, quelle différence cela fera?

Le professeur Yu Shi a dit Lun, Tout d'abord, assurez-vous que la profondeur de l'apprentissage à l'intérieur. 2008 Document publié en temps Bien que des recherches préliminaires sur les universitaires d'apprentissage en profondeur, mais n'a pas été si le feu. Selon lui, le volume de plus en plus rapide des données et les performances du matériel a également contribué au développement rapide de l'apprentissage en profondeur. Le deuxième est un algorithme de recommandation collaboratif (filtrage collaboratif) Il est dérivé du commerce électronique plus tôt, puis plus largement dans de nombreux domaines ont collaboration algorithme de recommandation applications connexes, comme les soins médicaux.

Selon Wikipedia: filtrage collaboratif (en anglais: le filtrage collaboratif), il est tout simplement l'utilisation d'un des intérêts similaires, groupe de préférences, d'avoir l'expérience de l'information recommandée d'intérêt pour l'utilisateur, les informations personnelles données par un degré considérable de mécanismes de réponse de la coopération ( que les scores) et enregistré afin d'atteindre l'objectif de filtrage est un filtrage des informations et d'aider les autres, sans réponse nécessairement limitée d'un intérêt particulier, surtout pas intéressé par les informations d'enregistrement est également très important. Le filtrage collaboratif peut être divisé en évaluation (Note) ou filtre de groupe (filtrage social).

Lun Yu Shi-recherche approfondie sur la technologie de recommandation. Il pense recommandé comme une technologie de clustering de classification, la profondeur de l'apprentissage est également recommandé de le faire. l'apprentissage en profondeur est principalement utilisé pour trouver des caractéristiques, peut être fait en fonction des caractéristiques recommandées. Il existe de nombreuses applications recommandées, produit recommandé peut aussi recommander le film, les médicaments de traitement recommandés, et même la publicité aussi appartiennent problème de recommandation. La technologie recommandera la partie supérieure de conférence ACM sur les systèmes recommender est son objectif à long terme d'une réunion.

L'ordinateur est en fait un champ d'application, je suis optimiste sur le domaine des soins de santé, le transport et d'autres applications

Peut-être le retour du milieu universitaire de l'industrie avec lui l'expérience liée, dans une interview, le professeur Yu Shi Lun préfèrent utiliser du point de vue de la technologie. Il a déclaré que le nouveau Ji-won, en fait, est une des applications informatiques. Parce que nous avons un tel scénario, peut-il être le développement de ces technologies. Sans l'Internet, on n'a pas besoin de faire une recherche, n'aurait pas tant de recherches effectuées sur la recherche. S'il n'y a aucun commerce, aucun algorithme de recommandation besoin, seul le greffier peut recommander.

Du point de vue de l'application, la recherche de Yu Shi implique Lun traitement médical intelligent, médical ou de précision. Il présente en papier a récemment publié une méthode pour le diagnostic technique de l'apprentissage en profondeur de la maladie du cerveau dans KDD. Mais il croit que la santé médicale intelligente particulièrement précis au début et comme il est aussi une recommandation de cette technologie. En outre, un autre point chaud dans le domaine de l'intelligence artificielle, de calcul et de prévision du trafic urbain, lui et son équipe de recherche a récemment également des résultats de recherche tout à fait fructueux.

« Data Mining qui cherchent à faire des scénarios d'application réels, tels que les réseaux sociaux, la diffusion de l'information. », A déclaré le nouveau Lun Yu Shi Ji-won, un réseau social qui est actuellement dans le domaine de la recherche, il est plus intéressé par Spam (informations fausses) pour identifier .

Il a dit: « Par exemple, les commentaires du public bien connu, s'il y a trop de fausses données ci-dessus, vous pouvez rencontrer un faux voudra pas utiliser. »

À son avis, la technologie de recommandation ou d'une autre prédiction, la technologie d'identification ou, en fait, sont considérés comme l'intelligence artificielle de, et il n'y a pas de ligne de démarcation claire à considérer intelligent pour dire quel niveau de la technologie de l'intelligence artificielle. Ce point de vue est conforme à sa pratique de faire des recherches autour de l'application, plutôt que de faire des recherches sur la technologie.

applications À propos, Yu Shi Lun très optimiste au sujet du traitement médical précis. Il a dit: « En fait, aujourd'hui, signifie que nous sommes un traitement très difficile, comme la chimiothérapie à un patient, à la fin ce genre de médicaments efficaces pour lui, nous ne savons pas, seulement Statistiquement, 20% des patients atteints de la drogue A de. efficace, médicament efficace B ont 10% des patients, des médicaments efficace C 5% des patients avec un essai de médecin commencera à partir d'un, mais la situation réelle peut être appropriée pour un C, si d'une manière classique patient donné peut ne pas essayer de C , le patient ne serait pas tenir ".

diagnostic AI du cancer du sein, le cancer du poumon, etc., pour atteindre le niveau d'experts dans l'étude, si recommandation médicale précise de quelle étape?

Lun Yu Shi a déclaré: « Les données chinoises entre les hôpitaux n'ont pas eu plus difficile aux États-Unis, il y a beaucoup de données historiques ne sont pas nécessairement compatibles, mais la situation idéale est d'obtenir toutes les données du patient si proche, à la différence géant du commerce électronique tant que suffisamment de données. à ce sujet. suffisamment de collaboration les utilisateurs ont besoin, ou nous n'ont recommandé ".

Eh bien. techniques d'apprentissage profondeur utilisées dans quelle mesure médicale? Shi Lun Yu a déclaré: " Vous ne pouvez pas regarder juste à toute technologie de l'expérience historique. Des études ont tant de gens aujourd'hui, même si pas en forme, au fil du temps il peut y avoir de nouvelles percées. "

Grandes quantités de données est roi, mais le défi est de savoir comment mettre ensemble l'intégration de données

Avant boom artificiel, gros volumes de données est la plus recherchée. calcul plus tard la mise sous tension, et divers autres aspects des conditions sont réunies, la vague a percuté l'intelligence artificielle. L'intelligence artificielle en prélude à la grande données.

Récemment nouvelle version Zhiyuan de l'article « [1 milliard + ensemble de données, IMAGEnet mille fois] une étude approfondie à l'avenir, Google a reconnu les données est roi », l'article décrit une expérience géante Google a fait, ils ont constaté que: les données ont une performance significative intelligence artificielle impact. Avec la croissance des données, la performance modèle linéaire tâches de vision par ordinateur complète augmente. Même à 300 fois IMAGEnet une si grande échelle, la performance n'a pas souffert plate-forme. (Google a ajouté un contenu total de jour supplémentaire de l'article). AI ont une « violence calculée », et maintenant ajouté une nouvelle « données sur la violence. » Mais aussi ce que les grandes données remettent en question il?

Compte tenu Shushi Lun, le défi le plus difficile des données ne sont pas assez grand, mais - nous avons une multitude de données, comment les mélanger ensemble.

La profondeur peut être davantage l'accent sur l'apprentissage est la profondeur, la profondeur de bonnes choses traîné. Exploitation minière grandes données nécessite non seulement en profondeur, mais aussi large.

Nous pensons que lorsqu'un problème vient, Quelles données peut vous aider à faire mieux? Par exemple, maintenant, nous prédisons la voiture de l'Université de Tsinghua à Wangfujing combien de temps. Bien sûr, vous pouvez utiliser des données historiques pour prédire, c'est simplement une donnée. Nous avons une grande variété de données peuvent être utilisées, telles que les données des médias sociaux, il y a maintenant contenu lié à la circulation. Par exemple, il a été dit aujourd'hui dans un accident de voiture quelque part dans la ville de Victoria, alors vous savez que la ville de Victoria est susceptible de bloquer le passage.

Autre exemple, il y a une parade aujourd'hui, Tsinghua, ou sur le chemin il y a une grande baisse des prix de décrochage, cela aura une incidence sur l'heure d'arrivée.

Comme autre exemple, on peut aussi considérer le facteur de temps, par exemple, vous voulez savoir tout de suite sous la pluie, vous serez affecté par l'Université Tsinghua aux données de Wangfujing.

Nous avons donc besoin de comprendre comment l'intégration de ces données ensemble. Si vous pouvez penser à une façon toutes ces données, vos prédictions peuvent être plus précis, ce qui est la raison pour laquelle nous voulons mettre l'accent sur l'ampleur de l'apprentissage.

Mais l'intégration des grandes données ne sont pas simples Les différentes propriétés des différentes sources de données, les réseaux sociaux ont des données de texte, la relation entre l'homme et l'homme est la structure du réseau des données, comment vous intégrez? La précision de chaque source de données ne sont pas les mêmes, certaines sources de données sont achevaient la très crédible. Certaines données ont un peu de bruit à supprimer.

Trouver des données plus pertinentes, la précision pourrait faire mieux. La clé est que vous voulez vous sentir les données est de résoudre le problème.

la source Parlant des données, pensez Yu Shi Lun il y a trois: 1 dans l'entreprise peut être certaines données sont endémiques, comme vous Tencent vous pouvez disposer de données micro-canal, dans ce jeu, le roi de gloire, vous pouvez ajouter des données supplémentaires à la micro-lettre, vous la recommandation pourrait faire mieux. 2. Il existe également des données accessibles au public, vous devez monter pour prendre la recherche; 3 il y a des données disponibles.

Pour l'impact des grandes données sur les études scolaires, il concède, Le vrai problème est l'école elle-même est un manque de données. enseignant de l'école est de maintenir la coopération de l'industrie, tels que l'Université de Tsinghua laboratoire commun et Tencent, Tencent a un avantage parce que les données. Mais cette approche a aussi quelques problèmes, de sorte que certains enseignants sont allés au secteur industriel tout à fait.

Tourné norme à l'envers de développement technique, mais loin du pic étude approfondie

Data mining est un important domaine de recherche du professeur Yu Shi Lun, il a frappé une vie de relations avec ce sens, les profondeurs de feu la technologie d'apprentissage à l'exploration de données si des progrès ont apporté pas la même chose?

Shi Lun Yu estime que l'étude approfondie de l'exploration de données d'une grande aide à un grand nombre de données est l'une des meilleures méthodes.

étude approfondie est bien sûr le feu, mais il a été très tôt inventé. Chaque technologie a été développée dans des circonstances différentes, mais la situation objective changera.

l'apprentissage en profondeur est non conforme à l'invention lorsque l'invention de la situation actuelle, mais la chance a tourné. Lorsque les données devient de plus, tous les algorithme est comme un apprentissage en profondeur qui a une évolutivité (évolutivité), conviennent pour le calcul parallèle (parallélisme). Je ne peux dire que les conditions objectives sont adaptés à l'apprentissage en profondeur, peut faire de bons résultats. Mais ce n'est pas son objectif initial peut être décrit comme un bonus inattendu.

New Ji-won a publié un article [PNL] reflète porter la profondeur de trépied d'apprentissage de nouveaux sommets empirisme, le rationalisme est pas la fin, traduit de l'église Kenneth « cloche swing trop loin » (un pendule allé trop loin), article crois que nous sommes à empirisme Peak, et va rapidement revenir à la classique rationalisme . Yu Shi Lun scientifiques de haut voir comment les tendances technologiques les deux sens?

Shi Lun Yu route à la réponse de Jane était: « La Le destin a à son tour se produira souvent partout, y compris la technologie. « Parfois, nous particulièrement à une certaine façon, mais après un certain temps, il pourrait ne pas être si facile à utiliser, et nous pourrions avoir besoin des règles de base du classique se sont avérés.

Cependant, Yu Shi Wong a déclaré: « Je ne pense pas que la profondeur de l'apprentissage va bientôt perdre son importance. »

Il a dit: « trop de données, nous avons l'apprentissage en profondeur pour le texte, les images, la vidéo et d'autres données, mais ces solutions ont rien à faire encore? Tous les domaines continuent d'avoir de nouvelles données et applications apparaissent. Un problème peut être résolu dans des domaines spécifiques, mais il y a de nouveaux problèmes générés ailleurs. Le court terme, l'apprentissage en profondeur ne peut pas résoudre tous les problèmes maintenant. "

Par exemple, il a dit: « Par exemple, modèle de profondeur dans différents domaines, la capacité de généralisation des données hétérogènes est encore faible Nous équipe Tsinghua dans le monde pour la première fois pour mener à bien les méthodes de recherche pertinentes et le modèle de migration de profondeur théorique de l'apprentissage, a fait une percée importante. Dans un autre exemple, comment générer automatiquement des images de haute qualité et texte vidéo à partir du modèle de la profondeur, l'apprentissage sans supervision efficace est toujours les sujets à l'avant-garde de l'intelligence artificielle, l'équipe Tsinghua dans le réseau bayésien de profondeur, les réseaux de génération de profondeur, a également fait une le travail a une influence internationale. Il y a des problèmes plus difficiles, sans parler a commencé à étudier. "

Shi Lun Yu a continué, comme dit avant le programme de traitement médical précis recommandé par une sorte de maladie, mais nous avons des milliers de maladies, on peut dire simplement encore commencé.

Il a dit, et l'environnement est en train de changer, nous devons l'énergie verte, nous avons besoin de l'intelligence, mais aussi l'émergence de problèmes différents. Avant thermique, combien vous avez la demande, donner la quantité d'électricité que vous envoyez. Plus tard, l'énergie solaire, l'énergie éolienne est pas le cas, mais il n'y a pas voir le soleil il n'y a pas de vent. La sagesse doit être grille de tarification flexible, tarification en fonction de l'offre et de la demande. Il y a la ville intelligente, le réseautage, l'éducation et ainsi de suite. Pour chacun de ces domaines ont beaucoup de données, que vous pouvez taper, Il y a beaucoup de demande, nous n'avons pas exploiter pleinement le potentiel de l'apprentissage en profondeur, mais aussi loin du sommet.

De l'industrie à des milieux universitaires, de l'Illinois Université Tsinghua en Chine, encore un retour d'adolescent

Lun Yu Shi de l'industrie (IBM Waston) a commencé sa carrière, puis revint dans le milieu universitaire, et maintenant, que ce soit en Chine ou aux États-Unis est beaucoup plus fréquent dans les chercheurs universitaires pour le développement de l'industrie, voir Yu Shi Lun comment aujourd'hui ce phénomène?

Il croit que l'industrie et le milieu universitaire en circulation est une chose normale à l'autre: « Le domaine de l'informatique est la orientée vers l'application, de l'application pratique, nous avons même pas aucune donnée. »

Il a également, par exemple, Google Page Rank fondateur commence à écrire des articles, et enfin mettre en uvre cette technologie à la société Google. président John Stanford Hannis, il a même sorti entreprise a ouvert quelques années, puis de retour dans le milieu universitaire pour faire le président. Des gens comme des universitaires mais parfois il y a des idées dans l'industrie veulent vérifier et voir si elle est efficace, il ne peut pas être pleinement rejoindre l'industrie, peut-être trois à cinq ans de retour dans le milieu universitaire. Bien sûr, certaines personnes restent dans l'industrie, ainsi que des professeurs sortent de l'entreprise, Ce ne sont pas mauvais phénomène, mais est une bonne chose.

Actuellement les écoles Lun Yu Shi tout en servant aux États-Unis et la Chine, sur le bureau de Tsinghua, il a expliqué: .. « Je suis professeur invité à l'École de logiciel, l'Université de Tsinghua avant ma spécialité est grande école d'exploration de données à établir lorsque l'Institut des sciences et de Big Data , je prends naturellement en compte, je pense que ces dernières années, le développement technologique de la Chine est très rapide, les grandes données lui-même est une technologie de rupture ».

Qui a dit que le papier chinois seulement quantité sans qualité? Cette évolution étonnante décennie

En tant que scientifique chinoise vivant en Amérique depuis de nombreuses années, Yu Shi Lun croit la Chine pour promouvoir incroyablement rapide dans le passé niveau de la recherche de dix ans. Il y a dix ans, dans une revue de première classe, le papier de la Chine beaucoup, et maintenant le papier de la Chine et plus incroyable. Il a dit: « Dans le domaine informatique, le papier de la Chine a été plus que la somme de l'ensemble il y a des décennies, l'Europe, nous pensons que beaucoup du Japon, le Japon est maintenant absolument impossible .. »

Pour certains croient que le nombre élevé de papiers chinois, mais la mauvaise qualité de la parole, Yu Shi Lun ne pense pas, dit-il, les meilleurs universités chinoises telles que l'Université de Tsinghua, la qualité du papier est superbe.

Yu Shi Lun exprimé ne doute pas: Nous sommes la technologie chinoise rapidement, cela est tout à fait raison. Surtout dans le domaine informatique

, Des nouvelles technologies, nous avons commencé à peu près le même, il est facile de suivre. Et maintenant, le financement de la recherche accrue de la Chine, contrairement aux États-Unis, mais dans la réduction de financement de la recherche.

) Je suis un peu oeuf épicé)

New Ji-won: Il y a quelque temps un débat LeCun et Yoav sur arXiv qui n'est pas assez précise arXiv ci-dessus, les gens ont souvent l'irrigation, il a été suggéré que le pays ne met pas arXiv comme documents officiels, mais comme un BBS sur la ligne, comment voyez-vous arXiv?

Lun Pas d'amis de nuire. Tout peut être abusé ah. Nous arXiv papier comme un lieu de stockage. Je me suis intéressé de voir les derniers travaux. Mais nous voyons aussi dans l'équipe d'élite du papier de chercheurs ou célèbres, de toute façon l'irrigation habituellement personne ne le voyait, il n'y a pas beaucoup de mal.

Liste de référence:

  • Top H-Index pour la science informatique et électronique: http: //www.guide2research.com/scientists/

  • Top 10 des algorithmes dans l'exploration de données: http: //www.realtechsupport.org/UB/CM/algorithms/Wu_10Algorithms_2008.pdf

  • Wikipedia: https: //en.wikipedia.org/wiki/Philip_S._Yu

  • Google Scholar: https: //scholar.google.com/citations user = D0lL1r0AAAAJ & hl = zh-CN?

  • [PNL] réflexion portent la profondeur de trépied apprendre de nouvelles hauteurs empirisme, le rationalisme est pas la fin

Cliquez ici pour lire le message original pour voir les détails, espérons que vous pouvez rejoindre ~

Lorsque les prix mondiaux du pétrole sont encore bavardages, les acheteurs chinois achètent l'huile ou RMB importés
Précédent
École Venezuela? Après le dollar coupé soudainement des services de compensation et de règlement des banques centrales de l'Iran, les choses changent une nouvelle résurgence
Prochain
Lapin, venez à la maison!
Ancien pilote Qinshou! Tibet en voiture besoin de préparer à toute épreuve
Université Ning Lac d'enseignement: la sélection est plus importante que l'éducation
7 Ce poème poésie Shu, là pour briser la plus belle apparence
Comme lapin prédateurs, Zigong chaque fille est gâtée fille Terminator
Les médias étrangers: Canada depuis 1951, semble la plus grave crise économique, l'acheteur chinois ou retrait anticipé
« L'apprentissage de transfert Google cerveau » pour réduire les paramètres de réglage directement dans l'ensemble de données mieux apprendre l'architecture d'image
« Le nec plus ultra intelligente »: seule en coopération avec une perception de la machine, les êtres humains peuvent atteindre l'auto-évolution!
Qui a dit que sept must Highlander SUV? Ce SUV plusieurs faits est pas mal
2018, les soldats méritent!
« Apprentissage non supervisé » comment les enfants humains apprennent à nous apprendre, mais aussi la façon d'enseigner l'IA
billets Air +3 nuits à l'hôtel avéré être un peu plus de 900! Maintenant, Xiamen absolument pas une grosse perte!