Fédéral apprendre la situation réelle de la naissance de 1000 jours Shu Wan mot texte

étude fédérale, est sans aucun doute l'un des plus industrie de la recherche sur l'intelligence artificielle de courant et des milieux universitaires concernés.

Les deux dernières années, le professeur Yang Qiang promotion conjointe d'experts de classe mondiale, la majorité des géants technologiques nationaux et internationaux, ont commencé à construire une étude fédérale des équipes de recherche et d'application.

Sur cette base, Lei Feng réseau « AI Financial Review » et fédéral en commun « AI Technology Review » a invité cinq experts de premier plan d'apprentissage, commencer à « apprendre fédérale financière classe ouverte. » Ce qui dans la première partie de la classe hier ouverte, le focus Professeur AI Micro directeur de la Banque Yang Qiang a partagé la « frontière fédérale et l'apprentissage de la valeur de la discussion. » (Texte complet et programme d'examen vidéo, seront publiés dans le numéro du public « AI Financial Review »)

Aujourd'hui, nous allons jeter un regard en arrière complet à la naissance des trois années d'apprendre fédéral, de « l'autonomie » du mode Pour C, le mode B interfonctionnement entre les entreprises, au processus d'applications financières, médicales, sécurité et autres de toute la scène.

La naissance de l'apprentissage fédéral: une vision intéressante à C

Le concept de l'étude fédérale, d'abord proposé en 2017 un billet de blog de Google Blog AI.

Un auteur de l'article est Blaise Aguëray Arcas, il a rejoint Google en 2014, a tout d'ingénieur distingué chez Microsoft. Après l'ajout de Google, Blaise a dirigé le dispositif côté Google sur l'appareil projet Machine Intelligence (Intelligence Machine), est également responsable de la recherche fondamentale et de nouveaux travaux de développement de produits.

Après avoir rejoint Google peu de temps après a commencé une étude de l'étude fédérale. Jusqu'en 2017, quand ils ont fait certaines réalisations, seulement il est publié dans le billet de blog.

  • étude fédérale sur l'appareil

Blaise, qui (peut-être aussi dans une certaine mesure au nom de Google) concernent, plus étude fédérale sur l'appareil - qui est les scénarios d'application fédéraux présentés au début du concept d'apprentissage.

Étant donné que le réseau de neurones est encore limitée par l'efficacité de l'apprentissage, il faut beaucoup de données de formation, de sorte que certaines grandes entreprises, comme Google, Microsoft, Amazon a commencé à offrir de grandes quantités de données doivent être collectées lorsque les services d'intelligence artificielle à grande pour former le réseau de neurones. Il a également fait des choses la communauté.

Pour le côté de l'appareil (téléphone par exemple mobile) en mode application intelligente dans le cas normal, les données générées par l'utilisateur sur l'appareil sont téléchargées vers le serveur, puis formés par un modèle de réseau neuronal est déployé sur le serveur sur la base de grandes quantités de données collectées obtenir un modèle, les fournisseurs de services pour fournir des services aux utilisateurs en fonction de ce modèle. Avec l'utilisateur de l'équipement terminal de données mises à jour en continu et téléchargées sur le serveur, les mises à jour du serveur pour mettre à jour le modèle en fonction de ces données. Il est évident que cela est une méthode de formation de modèle centralisé.

Cependant, il y a plusieurs problèmes de cette façon: 1) ne peut pas garantir que la confidentialité des données utilisateur, toutes les données utilisateur générées lors de l'utilisation de l'équipement seront collectées par les fournisseurs de services; 2) difficile à surmonter la latence du réseau causée par Caton, qui exige services en temps réel (comme méthode d'entrée) est particulièrement évident dans.

Blaise, qui il voulait, que ce soit en faisant un grand cadre distribué de formation de modèle de réseau de neurones, de sorte qu'aucune donnée d'utilisateur local en même temps (dans la formation de leurs appareils) peuvent également obtenir la même expérience de service.

Road est la solution: Télécharger des poids, plutôt que des données.

Nous savons que le modèle de réseau de neurones est la connexion entre les couches constituées réalisées entre les neurones dans les différentes couches est par poids à atteindre, ces poids déterminent ce que les réseaux de neurones peuvent faire: Certains poids sont utilisés pour distinguer entre un chat et le chien, l'autre groupe peut être distingué tableau et des chaises. De la reconnaissance visuelle au traitement audio sont déterminés par le bon poids. La formation sur la nature du modèle de réseau de neurones est que ces poids de formation.

Ainsi, Blaise proposé côté du dispositif d'apprentissage fédéral, ne permettant plus aux utilisateurs d'envoyer des données au serveur, puis former le modèle sur le serveur, mais la formation des utilisateurs locaux, le modèle de formation de téléchargement de chiffrement (de poids), le serveur sera intégré des milliers la rétroaction de l'utilisateur pour le modèle d'utilisateur après l'amélioration du modèle.

Ici, peut-être intéressant de souligner que ce modèle sur le côté de l'appareil est comprimé avant, mais pas le genre de grande échelle serveur de réseau de neurones. Par conséquent, la consommation d'énergie de formation modèle est très faible, presque indétectable.

En outre, Blaise dit une métaphore très vive, qui est, les gens vont se mettre à jour leurs systèmes cérébraux cognitifs rêveurs dans le sommeil, le même système d'équipement terminal peut également être mis à jour par la formation du modèle et au repos. Donc, dans l'ensemble, il n'a pas l'expérience utilisateur tout impact.

Pour résumer l'appareil étude fédérale processus :

  • Télécharger la version dispositif côté du modèle actuel;
  • Pour améliorer le modèle en apprenant les données locales;
  • L'amélioration du modèle se résume comme une mise à jour relativement faible;
  • Les mises à jour sont envoyées cryptées vers le cloud;
  • Mises à jour avec d'autres utilisateurs l'intégration instantanée, comme une amélioration au modèle partagé.
  • L'ensemble du processus a trois la clé :

  • Selon l'usage des clients, chaque modèle de téléphone pour personnaliser l'amélioration de la locale;
  • Former une modification de modèle intégral;
  • Appliqué au modèle partagé. Ce processus se poursuivra le cycle.
  • L'avantage est évident:

    Tout d'abord, les données ne peuvent pas être téléchargées nuage, les fournisseurs de services ne peuvent pas voir les données des utilisateurs, ce qui peut augmenter la confidentialité des données utilisateur. Par conséquent, il ne doit pas compromis entre la vie privée et la fonctionnalité, il peut être à la fois. Ceci est particulièrement important dans le cas de la confidentialité des données actuelles de plus en plus d'attention.

    En second lieu, le délai est réduit. Si l'utilisateur toutes les données téléchargées vers le cloud, et le service lui-même est la rétroaction du nuage, puis à un environnement de vitesse plus lente, la latence du réseau se dégrade considérablement l'expérience utilisateur. Le service à l'apprentissage de la bénédiction fédérale ne se produit pas, parce que le service lui-même d'un local.

    En même temps, l'émergence de l'étude fédérale, mais permet également aux utilisateurs de spectateurs de l'intelligence artificielle, un changement réel pour les participants dans le développement de l'intelligence artificielle.

    Pour dilemme B de la grippe aviaire: la vie privée, les données sont petites, îlots de données

    En fait, l'étude fédérale de Google, ne résout pas le problème des silos de données entre les entreprises.

    Le programme de Google peut être comprise comme à C, l'application sur le côté du téléphone mobile de l'utilisateur, le programme est la même société basée sur la demande interne entreprise à C généré par l'ensemble de données pour résoudre les problèmes de confidentialité.

    L'étude écologique du gouvernement fédéral dirigé par le professeur Yang Qiang construction plus est approche de B pour résoudre le problème des silos de données entre les entreprises pour les entreprises, une plus grande ouverture écologique des alliances commerciales similaires.

    Dans l'ensemble, le programme d'apprentissage fédéral de Google est horizontale, il utilise les mêmes caractéristiques de données, et donc seulement besoin de construire le même modèle.

    Le nouveau régime est un apprentissage fédéral longitudinal, les données caractéristiques sont souvent différentes entre les différentes entreprises, même si l'utilisateur fait face à la même scène, l'ensemble du cadre des solutions techniques et des modes de réalisation ne sont pas les mêmes.

    Assemblée Professeur Yang Qiang Lei Feng réseau a accueilli le CCF-GAIR 2019 « spécial finances AI », a souligné, mus par des intérêts, les entreprises ont dans le passé et ne veulent pas mettre les données à d'autres sociétés et d'échange. En plus du « Big Mac » La société a une poignée d'utilisateurs de masse, avec des produits et services avantages, le plus difficile pour les entreprises d'une manière légitime sur le sol de l'intelligence artificielle fracture numérique, ou pour eux de payer d'énormes le coût pour résoudre ce problème.

    De plus, Les autorités de réglementation ont pris des mesures très strictes de protection de la vie privée.

    En mai dernier, le premier à proposer des lois sur la confidentialité des données européennes GDPR, l'utilisation des machines de l'intelligence artificielle, l'utilisation des données et des données est en effet le droit, ont mis en avant des exigences très strictes que Google a été condamné à une amende plusieurs fois, chaque fois que la quantité de dizaines de millions euro autour.

    Parce GDPR que l'on ne peut pas déroger aux dispositions de cet accord d'utilisation des données signé par l'utilisateur, l'utilisateur peut analyser les données importantes, il peut être utilisé pour améliorer l'expérience du produit, mais si les entreprises prennent ces systèmes de dialogue de données de formation, une violation de l'accord. Si l'entreprise mettre ces données faire d'autres choses, et d'autres prennent même ces échanges de données, la prémisse doit être sûr d'obtenir le consentement de l'utilisateur.

    Il y a aussi un certain nombre d'exigences strictes, y compris le droit d'être oublié, qu'un jour l'utilisateur ne souhaite pas que leurs données utilisées dans votre modèle, et qu'il a le droit de dire à la compagnie, la société a une responsabilité aux données de l'utilisateur à partir des années modèles out. Cette exigence non seulement en Europe mais aussi en Californie a mis en uvre une loi de protection des données similaires très strictes.

    La Chine à la vie privée et la protection des données ont également été une étude minutieuse, 2009-2019 une série d'actions, mais aussi de plus en plus stricte, après une longue discussion et les interactions peuvent avoir récemment introduit une série de mesures juridiques formelles.

    D'autre part, nos données pour la plupart des petites données: Sans un bon modèle ne sera pas en mesure de faire une bonne automatisation, souvent besoin de modèle bon bon gros volumes de données, mais souvent de haute qualité, des étiquettes de données sont de petites données.

    Et les données changent, les données et les données à chaque étape d'une étape a une distribution différente, peut-être il y aura des caractéristiques différentes. Ces données dans les données d'annotation en temps réel, ils veulent former une bonne formation prend beaucoup de main-d'uvre.

    À l'heure actuelle, la plupart des applications sont des données limitées existent et les problèmes de mauvaise qualité, dans certains segments très spécialisés (tels que le diagnostic médical) est encore plus difficile d'obtenir suffisamment de données pour l'étiquetage de soutien de la technologie de l'intelligence artificielle.

    En troisième lieu, Défi « contre l'apprentissage ». C'est, pour les applications de fraude de l'intelligence artificielle, Par exemple, la reconnaissance faciale peut être fausse, synthétisée pour le visage. Comment faire face aux défis de ce « l'apprentissage de la confrontation », qui est un sujet majeur dans le domaine de l'intelligence artificielle, scène de la sécurité financière.

    Non seulement la scène financière, la scène juridique, aussi, en particulier la scène médicale. Chaque ensembles hospitaliers de données sont limitées, si vous ne pouvez pas passer à ces données, chaque ensemble de données ne peut faire simple modèle ne peut pas répondre à la qualité requise des médecins humains pour identifier la maladie.

    Dans une telle situation, beaucoup de gens pensent hiver intelligence artificielle peut revenir - mais de l'avis de l'enquêteur étude fédérale, ce qui est une occasion de transition technique.

    étude fédérale: horizontale, verticale, migration

    Yang Qiang a décrit l'essence de l'étude fédérale:

    Chacun de nous a une donnée du cerveau, lorsque deux personnes qui écrivent ensemble un livre ou faire des devoirs ensemble, on n'a pas mis deux têtes ensemble physiquement, mais deux personnes de communiquer dans la langue. Nous avons donc écrit un livre, écrire une partie d'une personne par l'échange de la langue et enfin la coopération de la rédaction d'articles ou sur.

    Nos échanges sont des paramètres, il y a des paramètres dans le processus de communication en aucune façon de protéger la vie privée de notre cerveau faire? Est-il possible, cette approche est de permettre aux organismes différents paramètres de transfert chiffrés entre eux, pour créer un modèle partagé, les données ne peuvent pas localement.

    De définition simple, l'apprentissage fédéral est local aux données locales pour construire un modèle, puis les paramètres clés de chiffrement de ce modèle, qui se propagent au décryptage de chiffrement des données en nuage, il n'y a aucun moyen, parce qu'il a obtenu est un paquet de données chiffrées, les dizaines de nuages de millions de paquets modèle avec un algorithme de transmission à polymériser, pour mettre à jour le modèle existant, puis la mise à jour . Fait important, le nuage tout le processus serveur ne connaît pas le contenu de chaque sac rempli.

    Avant cette pratique plus difficile, mais avec l'émergence de l'état crypté de sorte que l'efficacité de l'opération a fait une mise à jour majeure, qui calcule l'algorithme de chiffrement peut passer à travers la couche de cryptage. Mais notez que ce n'est que l'exemple 2C, est un exemple de visage nuage grande base d'utilisateurs.

    Il peut chiffrer polynômes, répartis dans chaque cryptage polynomiale, cryptage de A + B en A, le cryptage B plus le cryptage, ce qui est une contribution très grande. Parce qu'il nous permet de prendre un algorithme, l'algorithme à l'extérieur à l'ensemble crypté, la couche de cryptage peut pénétrer à l'intérieur de chaque cellule. Vous pouvez faire cela peut changer les algorithmes d'apprentissage machine existante de manuels pour devenir tout algorithme de cryptage.

    Pour une étude horizontale, verticale et la migration fédérale, Yang Qiang donne l'explication suivante:

    • apprentissage latéral fédéral

    l'apprentissage latéral fédéral chaque ligne viennent peut être vu que les données d'un utilisateur. Selon les points de l'utilisateur, peut être considéré comme l'un, deux, trois téléphones mobiles, il est appelé un apprentissage latéral. Une autre raison est qu'ils sont des caractéristiques verticales, comme modèle de téléphone, le temps de téléphone, les batteries ainsi que la localisation des personnes, etc. Ce sont des caractéristiques. Leurs caractéristiques sont les mêmes, l'échantillon est pas le même, ce qui est une étude fédérale horizontale.

    L'approche principale est d'abord obtenir une cote de crédit, puis faire dans une polymérisation à l'état crypté, la polymérisation qui n'est pas une simple addition, mais un très complexe plus, puis Redistribuer modèle de bas de crédit.

    • étude longitudinale fédérale

    tout le monde Feature n'est pas la même chose que d'une agence rouge, un bleu de l'agence, on peut imaginer deux hôpitaux, un patient de faire des tests à l'hôpital rouge, faire un peu détecté en plus à l'hôpital bleu, quand on sait que ces deux ont le même hôpital un groupe de patients, dans le cas où ils ne veulent pas échanger directement des données, il n'y a aucun moyen de modélisation conjointe?

    Parmi eux, il y a un mur de division, nous pouvons construire un modèle d'apprentissage des deux côtés de leur profondeur, lorsque la modélisation est une descente de gradient étape critique, descente de gradient dont nous avons besoin de connaître plusieurs paramètres pour correspondre à la ronde suivante sur les paramètres, la perte (gradients) un paramètre de pondération du modèle.

    Ce processus, nous devons obtenir le niveau des paramètres tous les modèles, ce besoin de temps à échanger lorsque l'échange peut être chiffré par les algorithmes homomorphes peut également être calcul multipartisme par sécurité, et il y a une série d'algorithmes, les deux parties échangent des paramètres de chiffrement, l'autre effectuée mise à jour, l'échange de nouveau paramètres jusqu'à ce que le capot du système.

    • étude fédéral des migrations

    Ils sont identiques dans les caractéristiques, ou différents de caractère, mais ils ont une intersection des utilisateurs, lorsque l'utilisateur dispose et il n'y a pas d'intersection, nous faisons un pas en arrière et penser, nous pouvons mettre un espace où ils réduisent le litre de dimension ou dimension, nous les avons pris dans une autre pièce pour aller.

    Un espace supplémentaire se trouve dans leur sous-espace est interactif, l'interaction de ces sous-espace peut être migré à apprendre. Bien qu'ils ne se chevauchent pas directement des fonctionnalités et des utilisateurs, nous pouvons trouver l'étude de la migration commune.

    Dans l'ensemble, l'étude fédérale cette idée, en fait, non seulement pour la protection de la confidentialité des données utilisateur et mise à jour du modèle de l'appareil.

    Nous allons les propriétaires point de vue de l'utilisateur de l'appareil abstrait, traité sous forme de données, qui peuvent être porteurs de téléphone cellulaire, peuvent également être entreprises, les hôpitaux, les banques, etc., le serveur ou d'un modèle de nuage partagé considéré comme une plate-forme intégrée.

    Comme étude fédérale d'un nouvel apprentissage présente les caractéristiques suivantes:

    • Dans le cadre de l'étude fédérale, le statut de chaque participant sur l'autre, pour parvenir à une coopération équitable;
    • Les données conservées localement, pour éviter les fuites de données, à la vie privée des utilisateurs et répondre aux exigences de sécurité des données;
    • Pour faire en sorte que les parties impliquées dans le maintien de l'indépendance de l'échange d'informations sont cryptées avec les paramètres du modèle, et en même temps de se développer;
    • Modélisation de l'effet de l'effet de la modélisation de l'algorithme d'apprentissage traditionnel ou moins profond;
    • l'apprentissage fédéral est un mécanisme d'apprentissage « boucle fermée », l'effet dépend du fournisseur de données de contribution du modèle.

    Un tel succès directe de nouveaux points de douleur au développement des technologies de l'intelligence artificielle de, mais aussi commencé à entrer dans les scénarios d'application principaux eux.

    crédit d'apprentissage fédéral et le contrôle des risques financiers

    Parmi les nombreux aspects des services financiers, la confidentialité des données et la souffrance îlotage contrôle en difficulté du risque de crédit, est sans doute l'une des meilleures scènes du terrain d'apprentissage fédéral à atteindre.

    Micro Focus équipe d'étude de la Banque fédérale a noté que la solution de contrôle d'apprentissage fédéral du vent à base de crédit « au cours du processus de modélisation, les deux parties ont échangé valeur gradient, semblable à la direction du concept de vecteur, l'échange est les variables intermédiaires, les données originales. En même temps, pour les variables intermédiaires aussi le cryptage homomorphique, les données ne sont pas la bibliothèque, et du côté de l'application pour assurer la sécurité des données de source de données ".

    principes de collecte et de minimisation des données locales adoptées par l'étude fédérale, permettra de réduire le nombre de risques et les coûts de la vie privée systémiques associés aux centres traditionnels de méthodes d'apprentissage de la machine, un tel effet est également adapté pour améliorer la direction du contrôle du risque de crédit.

    En général, cette approche est Essayer de contrôle des risques de crédit grâce à une meilleure réseau de données fédérales, l'utilisation de données plus intégrée pour déterminer le risque de crédit à la clientèle avant la session, à la société d'aide financière ou le filtre de liste noire de crédit n'a évidemment pas se traduire par des prêts à la clientèle, ce qui réduit encore la lettre d'audit en fin de processus d'approbation des prêts coûts.

    En matière de crédit, l'utilisation de solutions d'apprentissage fédérales principalement pour fournir des prêts basés sur le comportement des modifications de l'utilisateur a procédé à un produit d'évaluation des risques pour aider les prêteurs aider-tune décision, le montant de l'ajustement des prix.

    Pour le programme élimination des risques post-prêt collection offre des produits peuvent être prévus en fonction du comportement des clients et aider les prêteurs à évaluer la collecte des politiques, ajuster les stratégies de collecte pour améliorer l'efficacité de la collecte.

    Micro équipe d'étude fédérale Mise au point a dit que dans la mise en uvre spécifique, la solution va d'abord étudier l'utilisation des services de cloud fédéral pour le démarrage à froid d'affaires, et en établissant un modèle d'affaires en boucle fermée et AI, la modélisation de petits échantillons, puis continue dans un modèle de mode itératif optimisé pour réaliser le projet numérique, crédit facile et à la consommation côté commercial des partenaires d'affaires peuvent continuer à accumuler des données optimisées modèle fédéral.

    Micro Focus pour le cas des banques et des entreprises partenaires, par exemple, micro congrégation est caractérisée par de nombreux utilisateurs Y, des ensembles de données peuvent être divisés en X et Y, X est les caractéristiques et le comportement de l'utilisateur, Y est la conclusion finale, nous dans la banque la conclusion est en retard crédit a eu lieu, dont la probabilité est en retard, les sociétés partenaires coopératives ou sociétés Internet peut être la vente de voitures ou de vente d'assurance, pas nécessairement des données de conclusion Y, mais il a beaucoup d'informations comportementales X.

    Or, ces deux domaines pour le même groupe d'utilisateurs qui veulent modèle, appartiennent à l'étude longitudinale fédérale pour construire des applications verticales de l'étude fédérale, et enfin obtenu de bons résultats, l'indice ASC fortement augmenté taux de créances classées a considérablement diminué.

    données multidimensionnelles modélisation par la conformité aux lois fédérales, le modèle de contrôle des risques peut améliorer l'effet d'environ 12%, les organisations liées efficacement économiser le coût de l'examen du crédit, le coût global devrait baisser de 5% à 10%, et parce que la taille de l'échantillon de données et de promotion riche, les capacités de contrôle des risques encore améliorés.

    Pour les établissements de crédit partenaire, la capacité de contrôle des risques de crédit est également améliorée de manière significative.

    En filtrant la première instance de la liste noire et ne peut pas être prêts convertis aux clients, dans la « lettre de l'entonnoir d'essai première étape » moins client invalide, de sorte que le coût d'un seul appel à l'interface devrait permettre d'économiser 20 à 30% dans la phase préalable au procès de crédit, contrôler efficacement le coût de l'examen du crédit .

    fédéral de la santé et l'apprentissage AI

    chemin de la croissance AI comme indispensable médicale « alimentaire », les données AI a été le sol médical « pierre d'achoppement ».

    champ de données santé de longue date « îlots d'information » problème, même dans les différents domaines de données médicales entre les différents hôpitaux n'est pas connecté, il n'y a pas de norme uniforme. En même temps, les problèmes de sécurité des données sont également des défis importants.

    Hier encore, laboratoire Tencent jour Yan a annoncé publiquement leur recherche et le développement des banques de micro-publique médicale étude fédérale sur l'application du taux de précision de la prédiction de la course jusqu'à 80% concentrée dans les données pertinentes.

    peut apprentissage fédéral contourner les obstacles à l'information entre les institutions médicales, ne considèrent pas la fusion de leurs données, mais la transmission d'informations après avoir été cryptées par un accord dans l'intervalle, le processus de cryptage avec un certain degré de mécanisme de protection de la vie privée pour assurer les informations ne sont pas cryptées générer des fuites de données. institutions médicales diverses par l'utilisation d'informations chiffrées pour mettre à jour les paramètres de ces modèles, ce qui permet l'utilisation du processus de formation de toutes les données des patients sous la condition sans exposer les données d'origine.

    Par exemple, si l'hôpital A et B souhaitent la formation conjointe d'un modèle prédictif de la maladie d'accident vasculaire cérébral, deux cas de données de recherche en milieu hospitalier à leur disposition, en outre, l'hôpital dispose également d'un modèle de données d'étiquette B est de prédire l'incidence des accidents vasculaires cérébraux, tels que des étiquettes. Pour la confidentialité des données et des raisons de sécurité, l'hôpital A et B ne peuvent pas échanger directement des données. système d'apprentissage fédéral peut utiliser des techniques d'alignement de l'échantillon de patient en fonction de chiffrement, à la fois confirmer total des patients à l'hôpital A et B ne sont pas divulgués dans les données respectives de la prémisse, et le patient n'est pas exposé ne se chevauchent pas les uns les autres, de sorte qu'une combinaison de ces caractéristiques de la modélisation de l'utilisateur après la détermination de la population totale d'utilisateurs, vous pouvez utiliser ces modèles pour prédire les données de formation de la maladie.

    De cette façon, la technologie d'apprentissage pour atteindre le modèle de prédiction de la maladie fédéral pour protéger la confidentialité des données dans différents hôpitaux, et cette technologie est prédite domaine de la maladie d'atterrissage, laboratoire et banque publique micro-Yan jours construit avec succès un « accident vasculaire cérébral le risque modèle de prédiction ".

    En utilisant un certain nombre de dossiers médicaux à partir des données réelles de traitement hôpital vérification des TOP5 et centralisée performance du modèle de formation d'apprentissage modèle fédéral est presque constante, le modèle prédictif précis du taux d'accidents vasculaires cérébraux de 80%, seulement 1% de moins qu'une précision du modèle de formation centralisée.

    En même temps, la technologie d'apprentissage fédéral améliore considérablement le modèle effet indépendant des différents hôpitaux, en particulier pour le petit nombre de cas confirmés d'accident vasculaire cérébral deux hôpitaux, l'étude fédérale était d'améliorer le taux de précision de plus de 10% et 20%.

    En plus du modèle de prédiction de la maladie, les deux parties vont apprendre davantage sur la dimension du fédéralisme coopératif dans l'application des grandes surfaces de données médicales, y compris le contrôle des dépenses d'assurance-maladie, le diagnostic rationnel, domaine médical et d'autres précises, telles que l'apprentissage pour obtenir une protection par la carte de santé électronique de puissance fédéral la modélisation de la vie privée des utilisateurs et ainsi de suite, contribuant ainsi au développement de l'industrie médicale et de la santé, améliorer la qualité des services médicaux.

    En 2019 analyse d'image médicale supérieure MICCAI, l'application de l'étude fédérale sur l'imagerie médicale officiellement entré dans le domaine des chercheurs de vision.

    collaboration avec NVIDIA King College de Londres et une société de start-up française owkin, l'application des techniques d'apprentissage fédérales et l'intelligence artificielle dans le centre d'imagerie médicale dans le tout nouveau Londres.

    Étant donné que la réglementation sur la confidentialité des données médicales, la collecte et le partage des données des patients dans une centralisation des données sur le lac est souvent impossible. Est de former une machine d'apprentissage algorithme défis, tels que la profondeur des réseaux de convolution nécessite souvent beaucoup d'exemples de formation différents.

    étude fédérale par les propriétaires de code pour apporter des données patient, et le centre de formation de modèle pour information uniquement entre eux, afin d'éviter cette difficulté. Bien que ces modèles peuvent être polymérisées de manière appropriée pour obtenir un modèle plus précis, le modèle peut être partagée fuite locale des données indirectement la formation.

    Ce document présente un système technique d'apprentissage fédéral pour la segmentation des tumeurs du cerveau, explique l'étude de faisabilité de la technologie de confidentialité différentielle dans le système fédéral pour protéger les données des patients.

    Le test est basé sur l'IRM prises Brats 2018 ensemble de données de réalisation des données divisées tumeur au cerveau, Brats 2018 ensemble de données avec 285 patients atteints de tumeurs cérébrales.

    Les chercheurs ont déclaré: « L'apprendre fédéral sans avoir à partager des données du patient, peut être réalisé en collaboration avec la formation du réseau de neurones décentralisé la formation de chaque nud est responsable de son propre modèle local, et régulièrement soumis au Accumulez du serveur de serveur de paramètres et d'agrégats. les contributions respectives, créant ainsi un modèle global, partagé avec tous les nuds ».

    Les chercheurs ont en outre expliqué que, bien que l'apprentissage de la vie privée fédéral peut garantir une sécurité élevée, mais par le modèle d'inversion, vous pouvez toujours essayer de reproduire les données. Pour aider à améliorer la sécurité de l'étude fédérale, les chercheurs ont testé la possibilité d'utiliser le cadre de la vie privée différentielle -. Ce cadre est une définition formelle de la méthode de perte de confidentialité, vous pouvez utiliser ses ressources de solides garanties de confidentialité pour protéger les données des patients avec l'agence.

    l'équipe NVIDIA explique, devrait apprendre des connaissances de polymérisation des organismes fédéraux efficaces de l'acquisition de données privées locales, afin d'améliorer encore la capacité de précision, la robustesse et la généralisation du modèle de profondeur.

    NVIDIA et King chercheurs College de Londres sur MICCAI ont présenté plus de détails de mise en uvre des technologies d'apprentissage fédérales:

    Apprentissage en profondeur les réseaux de neurones dans une variété d'applications médicales ont montré de bons résultats, mais il dépend fortement du nombre et de la diversité des données de formation. En imagerie médicale, ce qui constitue une difficulté particulière: par exemple, en raison du nombre ou du type de raison de la pathologie du patient, les données de formation nécessaires peuvent ne pas être disponibles dans une seule institution. En outre, parce que les règles de confidentialité des données médicales, la collecte et le partage des données des patients dans une centralisation des données sur le lac est souvent impossible.

    apprendre fédéral DNN permet la collaboration et la formation distribuée sans partage des données des patients. Chaque nud former leur propre modèle local, et soumettre régulièrement aux paramètres du serveur. Le serveur collecte et agrège les nuds individuels du modèle pour générer un modèle global et partagé avec tous les nuds.

    Il convient de noter que les données de formation pour chaque nud sont privées et ne seront pas partagées dans le processus d'apprentissage. modèle de partage ne peut être mis à jour ou la formation de poids, de façon à maintenir la confidentialité des données du patient. Par conséquent, la solution simple à apprendre fédérale aux nombreux défis de la sécurité des données, des données sur les besoins locaux, et soutient la collaboration de plusieurs organismes.

    Document de processus de formation du modèle client décrit également, le procédé de polymérisation modèle côté serveur, le déploiement du module de protection de la vie privée du client, et configuré avec les résultats expérimentaux du projet pilote d'apprentissage fédéral. Les chercheurs ont dit qu'ils vont explorer l'avenir de l'algorithme différentiel de confidentialité SGD pour les tâches d'analyse d'images médicales.

    Apprentissage et de la sécurité fédérale

    Sécurité, vision par ordinateur est la réalisation des zones de plus en plus rapide.

    Comme la technologie PDG Yu Zhang Peng Lei Feng avait mentionné dans une interview accordée à l'entretien du réseau, « La sécurité actuelle capacité d'atterrissage AI et des besoins des utilisateurs, il y a un grand écart, le premier besoin de confidentialité des données de visage et le contrôle de la sécurité, à faible coût, la réingénierie des processus, le changement organisationnel et d'autres défis. "

    Plus précisément, le point le plus central de la douleur est que les données ne sont pas assez de diversité et de fermeture anormale.

    La Chine a une énorme population, le nombre d'utilisateurs et de point de capture d'image, après le dépistage après que les entreprises concernées pour obtenir les données, filtre, superposé, combiné, aura progressivement la mise à niveau de leur algorithme d'effet.

    Mais ce type de mise à niveau est un style personnel, un style minimaliste.

    Chaque fournisseurs de sécurité sont la construction du système AI semblable à un après l'autre de l'architecture « cheminée », « cheminée » est verticale architecture.

    Chacun a ses propres systèmes informatiques et périphériques de stockage, ainsi que des outils et des bases de données de gestion distincts, différents systèmes ne peuvent pas partager les ressources et l'accès ne peut être délivré, la formation des ressources insulaires et des silos d'information.

    Étant donné que les modèles de base de données conçus pour différentes entreprises et différents objectifs, ils ne peuvent pas échanger directement, le modèle de partage.

    Même parmi la base de données des entreprises connexes peuvent être intégrées, mais sous réserve de la protection des renseignements personnels, la sécurité et d'autres questions, ne sera jamais vraiment la peine.

    Il y a des scènes données manquantes, il est difficile de partager des données. Ceci est une des questions de sécurité communes, y compris AI, y compris de nombreuses industries existantes, mais aussi font obstacle à l'IA plus gros points de douleur Pratt & Whitney.

    D'une part, l'IA ne fait que commencer à explorer l'industrie de la sécurité, d'autre part, l'IA limitée ne les nutriments nécessaires et les données de mauvaise qualité, il est difficile de briser les barrières entre les différentes sources de données.

    En dehors d'une poignée d'utilisateurs ont massivement, avec des avantages de produits et services des entreprises géantes, la plupart des petites et moyennes entreprises est la sécurité AI difficile d'une manière rationnelle, légale sur le sol de l'intelligence artificielle fracture numérique, ou la nécessité de payer un coût énorme pour résoudre ce problème.

    Plus que le monde universitaire, leader de l'industrie a déclaré: Les progrès du point de vue actuel, la technologie « d'apprentissage fédéral » peut être le meilleur choix pour résoudre les problèmes ci-dessus.

    Un campus vendeurs de ces données, les fabricants B et les données d'usine, les fabricants C ont des données communautaires, et les trois entreprises ont recours à des techniques d'apprentissage fédérales.

    A partir du niveau opérationnel, A, B, C trois sociétés seront un accès direct aux deux capacités: 1, optimiser rapidement leur entreprise; 2, la plus rapide expansion des affaires nouvelles.

    Optimiser leurs performances d'affaires dans le plus rapidement, il y aura plusieurs plate-forme similaire Un des fournisseurs de plate-forme pour entrer dans le modèle de données d'entreprise après le cryptage chaque jour, et ces modèles de données d'autres fabricants est le manque de données A et A peut selon les fabricants ces données pour mettre à jour leur modèle d'algorithme.

    Le plus rapide expansion nouvelle performance commerciale, A, B, C Chaque fournisseur a son propre bon de construction modèle pour obtenir plus en agrégeant modèle de données, les flux de données obtenir les meilleurs résultats sans données de circulation, peuvent être obtenus par des ressources complémentaires dans les plus brefs délais en toute sécurité la capacité de l'autre à développer de nouvelles affaires.

    Du point de vue de la vie privée, les données sont des caméras généralement intelligentes produites seront téléchargés sur le serveur back-end, puis par le modèle de réseau de neurones déployé sur le serveur basé sur de grandes quantités de données recueillies à partir de la formation pour obtenir un modèle, les fournisseurs de services basés sur ce modèle est utilisateurs.

    Ceci est une méthode de formation de modèle centralisé, cette approche est difficile d'assurer la confidentialité des données.

    L'étude fédérale ne ne permettent plus les données sont envoyées à l'arrière-plan, mais la formation sur le propre serveur de chaque entreprise, modèle de formation et de téléchargement crypté, l'arrière-plan sera des milliers de modèles intégrés, puis retour à l'utilisateur d'améliorer le programme.

    Un cas d'application typique, est très perspective et les banques micro-publiques conjointement lancé le premier système visuel de l'étude fédérale de la Chine.

    Flamme identifier la caméra vidéo à titre d'exemple, les ingénieurs qu'ÅI laborieusement formés pour identifier un modèle pour la détection de la flamme, nous voulons utiliser dans une caméra de surveillance, d'identifier s'il y a le phénomène de la combustion, de sorte que la probabilité d'incendies ont été analysés pour obtenir alarme incendie.

    Les algorithmes IA originaux peuvent identifier plus précisément effacer une grande partie des scénarios courants et feu brûlant eu lieu. Cependant, le visage d'une flamme sur plus légère, la caméra sur certains « ignorants » du.

    Si vous voulez que le modèle pour améliorer la capacité à identifier, les exigences de formation traditionnelles AI sont applicables aux parties capables de fournir des échantillons de données, qui a vu le jour en raison de la précision de l'algorithme n'est pas élevé en raison de la protection des renseignements de la bande passante et les données du réseau.

    Source: fedai.org

    Dans le système de vision fédérale, en se fondant sur la modélisation locale, les données pour assurer toutes les parties non dans des conditions locales, pour améliorer la précision des algorithmes AI.

    Dans un partage public, le directeur général adjoint de la banque du secteur micro-publique AI Chen Tianjian a dit: « Dans le projet « Vision System fédéral », grâce à la technologie d'apprentissage fédéral, la performance globale du modèle jusqu'à 15%, et aucune perte de modèle d'effet, ce qui améliore grandement efficacité modélisation ".

    Fédéral apprendre lieu inconnu

    contrôle des risques de crédit, les applications médicales et de sécurité, ce qui permet l'apprentissage sont juste la pointe de l'iceberg fédéral divers domaines.

    Avenir, y compris médical, financier, sécurité, commerce de détail, le gouvernement, l'industrie et d'autres horizons, différents scénarios peuvent être basés sur cette technologie pour atteindre l'efficacité des coûts, de réduire les coûts.

    étude fédérale de construction écologique sont réalisées simultanément, seule la coopération multilatérale, reconnue dans le cadre du multipartisme apprentissage, il est prévu fédéral pour obtenir un bénéfice maximal.

    Si vous souhaitez participer à l'étude de l'intelligence artificielle et l'atterrissage à l'avant-garde des derniers résultats de la recherche et l'application de l'étude fédérale, s'il vous plaît continuer à se concentrer sur le professeur Yang forte classe ouverte finition examen complet, ainsi que la série « Learning fédéral classe ouverte » Autres cours .

    Lei Feng Lei Feng Lei réseau de réseau de réseau Feng

    Trump a été joué! Foxconn d'investir 10 milliards de vous, « la huitième merveille du monde » est devenu une plume
    Précédent
    La Chine a pris la tête dans le nouveau vaccin contre le virus de la couronne d'essais cliniques de phase II, gel de recrutement Lenovo, reporter la promotion de la hausse salariale, FAW Group a dépe
    Prochain
    Interactive Data médias Question: histoire de la NBA avec les équipes du numéro de la gamme la plus forte?
    « Titre du smash parti »: les médias occidentaux pour discréditer l'OMS, un complice de diffamation politique
    Trump avant « tiré Forge » Twitter les médias américains ont déclaré jeu « pot rejet » a commencé
    « À partir de zéro » à « effacer le patient, » Hill Hospital à Wuhan Raytheon livre fermé pour la sauvegarde, le site montre
    A propos de l'avenir de la « priorité absolue », Xi Jinping ces mots chaque mot suprêmement
    Collectez 127,9 millions de dollars! Un concert de 8 heures dans l'histoire!
    les incendies de forêt Lijiang, des milliers de personnes impliquées dans la lutte
    La réglementation environnementale ne se relâche pas, Shanghai et au bon déroulement de l'inspection de l'application des lois sur l'environnement (c)
    2020 wangwen Platinum grand Dieu est révélé: Certaines personnes de chirurgie en direct, était de créer un « flux continu »
    Pont construit 19 toilettes, 7,77 millions cette année pour voter encore et encore « révolution des toilettes »
    nouveau format cible cette année, le marché de gros Guangzhou Baiyun mettra à jour 30
    S'il n'y a pas de voitures françaises