Exclusive | apprentissage article lu transfert (trousse d'apprentissage ci-joint)

1. introduction

l'apprentissage de transfert (apprentissage Transfert, TL) pour l'homme, en donnant la priorité absolue est d'avoir la capacité d'apprendre. Par exemple, nous apprenons après avoir roulé un vélo, apprendre à conduire une moto est très simple, après avoir joué au badminton dans l'apprentissage, pour apprendre à jouer au tennis pas non plus si difficile. Pour les ordinateurs, le soi-disant apprentissage de transfert, est de rendre l'algorithme de modèle existant ajustement mineur appliqué à une nouvelle région et dispose d'une technologie.

Il n'y a pas longtemps, le professeur Yang Qiang Hong Kong University of Science et technologie Go examen guerre AlphaGo et Ke Jie quand il a dit, regards AlphaGo comme l'existence de Dieu, semble être parfait au coeur de la machine GMIS Assemblée générale, et si nous apprenons du point de vue de la machine point de vue, il est une faiblesse, mais cette faiblesse est encore très grave. Cette faiblesse à savoir AlphaGo la différence des humains ont la capacité de transférer son apprentissage. Il ne peut pas aller après avoir appris, ont la capacité de migrer vers les échecs, les limites de ce besoin d'étude à migrer à briser. Un autre Daniel Andrew Ng dans NIPS 2016 tutoriel a également dit qu'il était très optimiste quant à la perspective de la mobilité d'apprentissage. Il croit que la migration sera après avoir pris connaissance de l'apprentissage supervisé, la prochaine vague de puissance réussie ML dans des applications commerciales. complexe du monde réel, contient de nombreuses scènes. l'apprentissage de transfert peut nous aider à attraper des problèmes par phénomène commun, intelligent nouvelle entente avec le problème rencontré.

apprentissage machine traditionnelle ont généralement deux hypothèse de base que les échantillons de formation et des échantillons de test infirment l'hypothèse d'indépendants et identiquement distribués et doivent avoir des hypothèses d'échantillons de formation disponibles suffisantes. Cependant, dans la vie réelle les deux hypothèses de base, il est parfois difficile de répondre. Par exemple, les données sensibles au facteur temps est souvent stock très forte, en utilisant les données du modèle le mois dernier formés, ont souvent du mal à utiliser pour prédire le mois prochain pour aller, par exemple, la société a ouvert une nouvelle entreprise, mais vous inquiétez pas il n'y a pas suffisamment de données pour établir recommande aux utilisateurs modèle. Ces dernières années, a attiré l'attention générale dans le domaine du transfert d'apprentissage de l'apprentissage machine précisément pour résoudre ces deux problèmes. l'apprentissage de transfert avec les connaissances existantes pour résoudre seulement une petite zone cible données étiquetées échantillons même sans données de problèmes d'apprentissage, la relaxation des hypothèses de base de la machine traditionnelle d'apprentissage fondamentalement. Depuis qu'il a été donné la sagesse de donner la priorité absolue à l'étude de migration spécifique-humaine peut être appliqué pour modéliser la migration des données volumineuses sur une petite donnée trouvée problèmes communs qui émigrent de modèle universel aux données personnalisées, la migration personnalisée.

2. L'apprentissage de transfert des définitions généralisées

  • Conditions: les tâches d'apprentissage Ts donnés Ds sur le domaine source et un domaine source, Tt tâches d'apprentissage sur le domaine cible et le domaine cible Dt

  • Objectif: apprendre à prédire la fonction f sur le domaine cible avec Ds et Ts (·)

  • Contraintes: Ds Dt, Ts Tt

Catégorie 3 Etude de la migration

3.1 par caractéristique spatiale

  • Isomorphisme apprentissage de transfert (Homogeneous TL): les mêmes caractéristiques spatiales des domaines source et cible, XS = XT

  • l'apprentissage de transfert Hétérogène (TL Heterogeneous): Different espace caractéristique des domaines source et cible, XS XT

3.2 selon les points de scénario de migration

  • l'apprentissage de transfert inductif (inductive TL): source de tâche d'apprentissage et cible différents domaines

  • l'apprentissage direct de transfert Push (transductive TL): les domaines source et cible différents, les mêmes tâches d'apprentissage

  • Migration apprentissage non supervisé (Unsupervised TL): les domaines source et cible ne sont pas d'étiquettes

4. La méthode de base de la mobilité d'apprentissage

  • migration d'échantillon (TL par instance)

Trouvé dans le domaine source et le domaine cible de données similaires, cette valeur de données sont des poids ajusté, de sorte que la nouvelle correspond à des données les données du domaine cible. On constate, par exemple, à la Fig. 3, un exemple de domaine source, puis augmenter le poids de l'échantillon, de telle sorte que la proportion du domaine cible pour prédire augmenté. L'avantage est simple et facile à mettre en uvre. Inconvénient qui mesurent les poids de sélection en fonction de l'expérience de similitude, et le domaine source et le domaine cible la distribution des données sont souvent différentes.

  • Caractéristiques de la migration (TL basé entité)

En supposant que les domaines source et cible contiennent une caractéristique transversale commune par la caractéristique de transformation, du domaine source caractéristiques et le domaine cible est transformé dans le même espace, de sorte que l'espace dans les données de domaine source et les données de domaine cible ayant la distribution de données identiquement distribuées, puis apprentissage machine traditionnelle. L'avantage est la méthode la plus appropriée est mieux. Inconvénient qu'il est difficile à résoudre, se sont rapidement adaptés a eu lieu.

  • modèle de migration (TL sur la base des paramètres)

En supposant que les domaines source et cible partageant les paramètres du modèle, fait référence au domaine par une grande quantité avant que les données source au modèle formé est appliqué pour prédire le domaine cible, comme l'utilisation de millions d'images pour former un bon système de reconnaissance d'image quand on rencontre un nouveaux problèmes de l'image lorsque vous ne disposez pas d'aller à former des dizaines de millions d'images et migrez simplement le modèle initialement formé dans de nouveaux domaines, souvent dans de nouveaux domaines des dizaines de milliers d'images à assez, la même chose peut être très haute précision. Avantage qui peut tirer parti des similitudes entre les modèles. L'inconvénient est que les paramètres du modèle convergent difficile.

  • Migration des relations (TL en fonction de parenté)

    Supposons que deux domaines sont similaires, il partagera une relation similaire entre eux, la logique d'application dans le domaine source au réseau de relations domaine cible migrent jusqu'à, par exemple, les virus biologiques se développent à la propagation des virus migrate informatiques.

L'apprentissage du scénario de migration

Recherche Valeur 5.1 Transfert théorie de l'apprentissage

  • Résoudre la rareté des annotations de données

ère Big Data de centaines de millions de pistes de données statistiques à l'échelle de rang à des données hétérogènes, l'absence de problème d'étiquetage devient pire. Marqué perte de données peut causer des overfitting graves d'apprentissage traditionnel supervisé. Les méthodes actuelles pour résoudre la pénurie de données en matière d'apprentissage semi-supervisé traditionnel, la formation en collaboration, l'apprentissage actif, mais ces méthodes nécessitent un certain degré de données de marquage dans le domaine cible, alors que le coût additionnel d'acquisition l'étiquette des données étiquetées manuellement lorsque les données sont trop rares grande. Ensuite, vous devez transférer l'apprentissage pour aider à améliorer les résultats d'apprentissage dans les zones cibles.

  • Partager l'erreur de généralisation non stationnaire

théorie de l'apprentissage statistique classique donne à l'industrie pour assurer que l'erreur de généralisation dans des conditions de modèle indépendant et distribué de façon identique. Dans l'environnement non stationnaire (différents champs de données non soumis à des hypothèses indépendantes et distribuées de façon identique), la théorie traditionnelle apprentissage automatique ne tient pas, ce qui donne une analyse de l'exploration de données hétérogènes apporte un risque théorique. Dans un sens large, la migration peut être considérée comme la promotion de l'apprentissage de la machine d'apprentissage traditionnel dans un environnement non stationnaire. Ainsi, dans un environnement non stationnaire, l'étude de la migration est un complément important à la théorie classique de l'apprentissage de la machine.

5.2 Migration application pratique de l'apprentissage

  • bras robot de formation

Sur un vrai modèle de formation du robot est trop lent, et très cher. La solution est d'apprendre la simulation, l'étude de simulation a appris à migrer vers la formation du robot dans le monde réel, l'espace caractéristique ici entre les domaines source et cible sont les mêmes. Ces dernières années, la recherche dans ce domaine a conduit à l'intérêt de beaucoup de gens. La figure est un travail Google DeepMind: La figure est déplace vers la gauche, après une bonne formation, le transfert de connaissances peut être formé dans un environnement simulé du bras du robot au bras robotique du monde réel, le vrai robot bras un peu d'entraînement peut atteindre très bon effet, comme le droit à la figure.

Voir la vidéo: https: //www.youtube.com/watch v = YZz5Io_ipi8?

  • Analyse de l'opinion publique

l'apprentissage de transfert peut également être appliquée dans l'analyse de l'opinion publique sur l'évaluation de l'utilisateur. Pour les produits électroniques et de jeux vidéo évaluation des utilisateurs, par exemple, est loué dans l'étiquette verte, l'étiquette et le rouge pour la rétroaction négative. jeux vidéo est extrait de la carte d'évaluation de l'électronique à gauche (domaine source) caractéristique, le modèle en matière d'évaluation des produits de l'électronique, puis l'appliquer à droite (domaine cible), la migration à grande échelle de l'opinion publique, et dans la nouvelle le terrain ne nécessite pas d'étiquetage.

  • système recommandé

l'apprentissage de transfert peut également être utilisé dans le système recommandé, faire un système de recommandation dans une zone donnée, puis appliquer clairsemée, de nouveaux marchés verticaux. Par exemple, déjà matures système de recommandation de film sonore peut être appliqué à un démarrage à froid dans le système de recommandation de livre.

  • dialogue personnalisé

la formation d'abord un système de dialogue universel, puis le fixer basé sur de petites données dans des domaines spécifiques, ce qui rend la tâche du système de dialogue pour adapter à un domaine particulier. Par exemple, un utilisateur d'acheter du café, il ne veut pas répondre à toutes les questions complexes, comme demander un grand ou un petit, chaud-froid?

  • -GAN de migration des données d'apprentissage générative

Réseau formule de confrontation (de GAN) est une nouvelle idées d'apprentissage de la machine. GAN deux joueurs agissent comme une formule de modèle sont le modèle (modèle génératif) et des modèles discriminants (modèle) discriminante. modèle Génération capture la distribution des données G de l'échantillon, avec une distribution de sujet (uniforme, gaussienne, etc.) pour générer un échantillon de bruit z une véritable données de formation similaire, l'effet est plus comme la véritable quête d'un meilleur échantillon, le modèle D est deux discriminante classificateur évalue un échantillon à partir des données de formation (plutôt que les données générées) probabilité, si l'échantillon provient des données de formation réelle, D sortie haute probabilité, sinon, la production de D faible probabilité. L'optimisation de GAN est un problème de jeu, le but ultime est difficile de juger quand la sortie du générateur au discriminateur est vrai ou faux.

Si nous avons un bon modèle génératif, dans un ensemble de données a été une formation bien, s'il y a des nouvelles données et les données antérieures définies significativement différentes, nous pouvons utiliser les « GAN + conditions aux limites », la les données de modèle génératif migrés vers la nouvelle distribution. Par exemple, lorsque nous écrivons, chaque signature est différente, nous n'utiliserons pas imprimé à signer, parce que les caractéristiques de chacun d'entre nous a sa propre écriture. Donc, si un grand nombre de mot imprimé comme la première partie de l'échantillon de formation pour former un bon modèle général, mais avec italiques manuscrites personnelles font la deuxième partie de l'échantillon de formation, vous pouvez utiliser le modèle imprimé Wasserstein GAN de la migration vers une signature personnelle. En d'autres termes, une telle signature sera plus personnalisée fonctionnalités.

6. le transfert d'apprentissage compétition en question

  •  (Http://www.causality.inf.ethz.ch/unsupervised-learning.php)

  • (

7. chercheurs représentatifs de la migration d'étude

La recherche a mené la migration peut commencer l'étude de suivi de l'étude de la migration des chercheurs des résultats représentatifs. représentants d'apprentissage des migrations nationales et étrangères sont les suivants:

  • Professeur Yang Qiang Hong Kong University of Science et technologie

  • Quatrième paradigme PDG (https://scholar.google.com.sg/citations?user=AGR9pP0AAAAJ&hl=zh-CN)

  • Université Technologique de Nanyang Professeur adjoint  (Http://www.ntu.edu.sg/home/sinnopan/)

  • Professeur agrégé, Institut d'informatique (

8. Migration Kit d'apprentissage

  •  (Http://www.cse.ust.hk/TL/code/C_TraDaBoost.rar), Wenyuan Dai, Yang Qiang, et al., Langage C

  •  (Http://cs.brynmawr.edu/~eeaton/TransferBoost/TransferBoostExp.java), Eric Eaton et Marie DESJARDINS, Java

  •  (Http://www.mysmu.edu/faculty/jingjiang/software/DALR.html), Jiang Jiang, C ++

  •  (Http://www.intsci.ac.cn/users/zhuangfuzhen/code&data_TriTL.rar), Fuzhen Zhuang, Luo Ping, et al., Matlab

  •  (Http://www.cse.ust.hk/~yinz/htl4ic.zip), Yin Zhu, Chen Yuqiang, et al., Matlab

  •  (Https://github.com/viggin/domain-adaptation-toolbox), Ke Yan, Matlab

9. Références

2017 Université de Hong Kong de la science et Yang Qiang Presque GMIS humain discours sommet

2016 Université de Hong Kong de la science et de la technologie Yang Qiang KDD Chine Discours du Sommet

Sinno Jialin Pan et qiang Yang, une enquête sur l'apprentissage de transfert

Karl Weiss, M. Taghi Khoshgoftaar et Dingding Wang, une enquête sur l'apprentissage de transfert

La recherche sur Long Sheng Ming, les questions de migration et les méthodes d'apprentissage

Note: Certaines images prises au-dessus de références ci-dessus

Luneng 10 dernières minutes 3 fois de suite a subi une pénalité controversée, super arbitres professionnels trop « amateur »!
Précédent
Sécurité nationale donne le coup fou! Zhang Yuning remplacé l'adolescent de moins de 23 ans, quatre minutes sur le banc pour marquer!
Prochain
Regarder la Coupe d'Asie 51 jeux, en laissant les Orangistes ne équipes pas vraiment faibles
Vous apprendre à utiliser TensorFlow et Keras pour créer l'APP "Hot Dog Recognition" dans la série télévisée américaine "Silicon Valley"
Portefeuille échelle de risque merveilleux! Beaucoup sont d'origine VC projet « HAITOU » par « Mongolie » dans
publique de la police Heze voulait 20 fugitifs! Venez maison Conseil Nouvel An droit
Explosion des modèles pour créer un produit de victoire rapide, prendre pied aux données | dialogue Laboratoire de données Additionne Est
Huppé a volé à East Lake pour l'hiver
Singularity University Fondateur: AI dépassera l'intelligence humaine devenir plus avancée intelligente
Chengdu Xingcheng appel rideau dans le runner-up de la couronne
carnaval « Double 11 » en fait été de 10 ans, plus de 11 personnes sécher son premier single
Exclusive | trajectoire de menteur discrimination avec la souris
Jamais! Seulement approché avec la Chine, le pays « se battre »
7 minutes des objectifs de planification de raid + 1V3 vague tourné dans le monde, 22 ans, Zhang Yuning 2 Conquérir la sécurité nationale de l'aide étrangère!