Kong University of Science Professeur Yang Qiang: �tude f�d�rale et de l'application de la recherche de pointe

Petite protection de la confidentialit� des donn�es dans le � filet �.

Auteur | Kaka

Modifier | fin Cong

R�cemment, l'intelligence artificielle chef officier public micro banque, Hong Kong University of Science et technologie Professeur de Yang Qiang invit� "Learning Series financi�re f�d�rale classe ouverte Lei Feng r�seau AI AI Technology Review Revue financi�re et co-organis� par la" recherche apprennent f�d�ral de pointe et de l'application " comme th�me, avec complet et d�taill� pour expliquer l'apprendre f�d�ral comment faire face aux deux d�fis des �les de donn�es et la protection de la vie priv�e. Cet article a analys� le contenu du discours, des articles un peu plus longs, les r�pertoires sont les suivants:

A, dilemme du d�veloppement AI: petites donn�es et � la protection de la vie priv�e

En second lieu, le f�d�ral apprendre � briser les silos, les donn�es compl�tes � puzzle �

2.1 �tude f�d�rale lat�rales: �chantillons avec des caract�ristiques diff�rentes

2.2 �tude longitudinale f�d�rale: chevauchement d'�chantillon comprend iso

2.3 �tude f�d�ral des migrations: �chantillons, une fonction pas de chevauchement

2.4 Syst�me de recommandation f�d�ral

En troisi�me lieu, la sc�ne f�d�rale pour en savoir plus des exemples d'application

En quatri�me lieu, l'�tude f�d�rale r�alis�e lors de la construction �cologique

Ce qui suit est le texte int�gral du discours Yang Qiang a pr�sent� Q & A:

Yang Qiang:

Le sujet d'aujourd'hui est li�e et financi�re, laisserait parler � tout le monde pourquoi il est particuli�rement n�cessaire dans le secteur financier pour prot�ger la confidentialit� des utilisateurs. J'esp�re que vous vous rappelez un mot: les donn�es intactes, le mouvement du mod�le.

1, dilemme du d�veloppement AI: petites donn�es et � la protection de la vie priv�e

Dans le secteur financier, et maintenant la plupart des applications sont bas�es sur des donn�es, fait face � de graves d�fis.

Tout d'abord, la puissance de l'intelligence artificielle de grandes quantit�s de donn�es, mais les donn�es sont rencontr�es plus petit dans le processus d'application r�elle. Disons que les affaires juridiques, une personne a les statistiques, la plupart seront collect�es des dizaines de milliers de cas. Comme autre exemple de blanchiment d'argent financi�re, cas blanchiment d'argent parce qu'un ph�nom�ne minoritaire, de sorte que chaque cas est tr�s important. Pour des images m�dicales, des images m�dicales marqu�es tr�s bon �galement tr�s faible. Ainsi, nous pouvons trouver: Plus de donn�es autour d'un petit, mais l'IA juste besoin d'utiliser de grandes donn�es.

Quelques exemples: tout d'abord dans le secteur financier, tels que le contr�le du risque de cr�dit, le marketing, ont besoin d'un grand nombre de donn�es de formation. Pr�ts importants et le contr�le des risques tr�s peu de cas. Si faire mod�le d'apprentissage profond, avec seulement un petit �chantillon de ces pr�ts importants ne suffit pas.

Un autre exemple est la ville intelligente. Smart City a beaucoup de cam�ras, chaque cam�ra peut acqu�rir des donn�es est limit�e en fait, nous voulons des donn�es agr�gation autre appareil photo. Mais si elles proviennent de diff�rentes entreprises, ou impliquent la confidentialit� des utilisateurs, nous ne pouvons pas fusionner simple et brut.

Nous savons tous que l'avenir de l'intelligence artificielle (sens d'application) est des v�hicules sans pilote, mais les nouvelles donn�es chaque face d'un v�hicule sans pilote est limit�. Si vous mettez � jour notre mod�le, nous avons besoin de beaucoup de nouvelles donn�es, qui proviennent de diff�rents v�hicules sans pilote, chaque donn�e de v�hicule qui est sans aucun doute une vie priv�e, mais aussi les petites donn�es.

Un autre exemple est des achats en ligne, comme les syst�mes logistiques, les syst�mes de cha�ne d'approvisionnement, il y a beaucoup de stockage, si vous voulez automatiser, il y a beaucoup de besoins de surveillance, ces donn�es sont souvent peu de donn�es, les donn�es sont dispers�es, il est pas si r�unit facile.

Par exemple, prendre le t�l�phone lire les nouvelles, il y a beaucoup de syst�me de recommandation, toutes les informations de pr�f�rences de l'utilisateur de t�l�phone mobile obtenu ci-dessus, est l'agr�gation une petite donn�es, il est �galement confront� au probl�me de la vie priv�e des utilisateurs.

La question est: Entour� par de petites donn�es, il est impossible de r�unir, ensemble comme plus? Bien s�r, cela est notre pens�es les plus directs, le d�but du d�veloppement de l'intelligence artificielle est de le faire, mais fait maintenant face � un s�rieux d�fi.

niveau social, la vie priv�e et sensibilisation � la s�curit� est de plus en plus, la r�glementation gouvernementale, les lois et r�glementations plus strictes.

D'abord pr�sent� aux r�glementations europ�ennes appel�es GDPR. Il a une vari�t� de termes, le plus important est de prot�ger la confidentialit� des donn�es pour assurer la confidentialit� repose dans les mains des utilisateurs. Depuis son lancement 2018 � l'avenir, il y a eu de nombreuses grandes entreprises ont re�u une amende, tels que Facebook et Google.

Aux �tats-Unis un peu plus lents progr�s, mais aussi de suivre avec la loi californienne, et a appel� ACFPC. La Chine est aussi la loi des lois et des r�glements stricts, complets, tous les milieux sont apparus.

2, f�d�ral apprendre � briser les silos, les donn�es compl�tes � puzzle �

Nous esp�rons que dans le cadre du mod�le de formation a une grande masse de donn�es, la r�alit� est que l'une �le des donn�es. silos de donn�es veulent se connecter pour former une grande quantit� de donn�es, mais a rencontr� des limites strictes des lois et r�glements.

Deux probl�mes techniques auxquels nous faisons face, mais aussi des questions d'int�r�t � mes recherches personnelles: la premi�re consiste � apprendre � utiliser la migration vers l'adresse de petites donn�es, ce n'est pas la conf�rence d'aujourd'hui. Aujourd'hui, l'accent sur le c�t� droit de ce sch�ma: les donn�es sont divis�es, et si vous voulez mettre des morceaux de donn�es, quelles sont les alternatives? Ici, nous devons parler de nos solutions, l'apprentissage f�d�ral (apprentissage f�d�r�).

Apprentissage f�d�r�, ils veulent �videmment de parvenir � un �tat: une pluralit� de sources de donn�es, une pluralit� de silos de donn�es, les donn�es de chaque source de donn�es ne bouge pas, sont localement. Mais que certains d'entre eux ont c�t� a une source de donn�es (propri�taire) peut parvenir � un accord afin que nous puissions construire ensemble un mod�le, il est le mod�le f�d�ral. Il existe diff�rentes fa�ons et les algorithmes peuvent �tablir un mod�le de coop�ration, mais le m�me objectif g�n�ral: est de changer la pratique ant�rieure, de sorte que les donn�es ne se d�place pas localement, en �changeant une partie du mod�le d'information, de sorte que le mod�le grandissant.

Cela n�cessite des outils math�matiques et des outils informatiques, le plus important de l'ancien est de la vie priv�e, des outils de mod�lisation de chiffrement, ce dernier est l'apprentissage de la machine distribu� le plus important.

Certains �tudiants peuvent �tre la premi�re fois que j'entendu le terme �tude f�d�rale, j'utiliser un exemple simple pour vous expliquer.

Supposons qu'un mod�le d'apprentissage de la machine analogie des moutons, nous esp�rons que les moutons mangent de l'herbe peut se d�velopper dans l'avenir.

La pratique ant�rieure est d'obtenir l'herbe ensemble construire le mod�le. Disons que le mod�le gauche gauche est la fl�che pointant vers le mouton. Les moutons ne se d�placent pas, mais l'herbe a �t� achet� au centre. L'�quivalent d'un moyen simple et brut pour obtenir les donn�es, la formation de grandes quantit�s de donn�es pour construire le mod�le.

Mais nous voulons �tre en mesure de prot�ger leur vie priv�e, alors laissez l'herbe ne bouge pas, laissez le mouvement des moutons. En d'autres termes, nous prenons le mod�le � diff�rents p�turages d'acc�s, puis les moutons grandi au fil du temps --- c'est la nouvelle fa�on d'apprendre la F�d�ration, est de laisser sans p�turage d'herbe, les propri�taires locaux ne peuvent pas savoir ce que les moutons mangent de l'herbe, mais les brebis ont �t� cultiv�es.

2.1 �tude f�d�rale lat�rales: �chantillons avec des caract�ristiques diff�rentes

Comment l'atterrissage? La premi�re approche, on suppose que chaque �chantillon de donn�es a un autre parti, mais a essentiellement les m�mes caract�ristiques verticales. Cela �quivaut � l'ensemble de donn�es que nous avons tellement de gros volumes de donn�es, coup� � l'horizontale, formant des tas d'�chantillons, mais leurs caract�ristiques sont similaires.

Par exemple, chacun de nos t�l�phones personnels sont en cours d'utilisation, la formation d'un groupe d'�chantillons. Il existe diff�rents t�l�phone cellulaire, t�l�phone cellulaire essentiellement prendre chacune de ces caract�ristiques sont les m�mes, mais l'�chantillon est diff�rent. Nous esp�rons que dans le cas de donn�es non mobiles, ces capacit�s peuvent �tre des donn�es agr�g�es sur ces t�l�phones, la mise en place d'un grand mod�le de donn�es.

Comme cet ensemble de donn�es sont repr�sent�es sur la figure gauche, tourner � droite au-dessus correspondant � chaque terminal de donn�es. Ils sont caract�ris�s par longitudinal, X1, X2, X3 sont similaires, mais les �chantillons U1, U2 ... U10 est diff�rent. Donc, on appelle cela une coupe lat�rale, en coupant l'�chantillon, appel�e l'�tude f�d�rale transversale.

l'apprentissage lat�ral f�d�ral, repr�sent� sous la forme est une matrice math�matique. Un ensemble de donn�es est le coin sup�rieur gauche, un ensemble de donn�es est le coin inf�rieur droit, ils ont beaucoup de chevauchement en termes de fonctionnalit�s, mais ils ne se chevauchent pas les exemples d'utilisateurs, ils peuvent avoir leur propre label.

� gauche et � droite ont leurs propres �tiquettes, mais nous voulons profiter de toutes les donn�es � mod�le, plut�t que de compter uniquement sur un terminal des donn�es ci-dessus pour construire un petit mod�le, dans l'espoir de les rassembler et construire de grands mod�les, mais ils ne peuvent pas d�placer les donn�es .

Cette fois-ci nous avons besoin d'utiliser le mod�le d'alliance horizontale de l'apprentissage. En termes simples, chaque serveur terminal et ont une connexion, assurez-vous de communiquer que nous communiquons avec le serveur, et non pas les donn�es, mais seulement les param�tres du mod�le de communication. Voici les param�tres w1, w2 jusqu'� semaine, � c�t� de ces param�tres dans les deux supports � angle droit (), le chiffrement repr�sentatif math�matiquement, o� il est utilis� pour chiffrer un mod�le math�matique.

Apr�s ces param�tres sont chiffr�s, le paquet chiffr� au serveur, ne savent pas ce paquet cryptage qui � la fin, il suffit de savoir que c'est un des param�tres li�s � un logiciel de chiffrement. Il y a une technique qui peut �tre des paquets chiffr�s ensemble sur le c�t� serveur, le r�sultat sera mis en place pour former un nouveau mod�le, est montr� que le mod�le de r�seau de neurones ci-dessus. Ceci est la premi�re �tape � la sixi�me �tape du processus.

Math�matiquement, une telle combinaison est en fait un mod�le de superposition, deux ensembles de donn�es diff�rents, deux mod�les de classification diff�rents, il construit un mod�le lin�aire, l'autre peut �tre un mod�le KNN, deux mod�les ensemble il formera un mod�le d'espace de grande dimension.

Nous esp�rons que ce processus de mod�lisation, chaque ensemble de donn�es ne divulgue pas les donn�es sur le serveur lui-m�me, mais leurs arguments au cours de la communication. Et les param�tres de communication sont �galement chiffr�s, ce qui garantit la vie priv�e.

chiffrement homomorphique

D�tail, il y a maintenant une m�thode de cryptage particuli�rement bonne, deux paquets de chiffrement lorsque polym�ris�, ne peut pas voir � l'int�rieur de chaque paquet de donn�es crypt�es, mais nous l'emballage et le mettre � son �change noyau, de sorte qu'un le cryptage plus b sont crypt�es, un plus b est �gal au chiffrement.

M�taphoriquement, deux choses qu'il emball�s ensemble, l'emballage de sortir, et il y a deux choses. Cette technique est appel�e cryptage homomorphique, les �tudiants ici Si vous �tes int�ress�, il y a beaucoup de ressources en ligne. Il y a aussi beaucoup d'experts dans les aspects particuliers des r�alisations de chiffrement homomorphique. L'une des raisons pour le chiffrement homomorphique bien fait dans le pass� est trop de calculs, a maintenant trouv� un algorithme de bonne solution, associ�e aux progr�s dans tous les aspects du mat�riel, le cryptage est donc homomorphic pas un probl�me.

L'effet de l'apprentissage de la machine de cryptage homomorphique inspir� l'imagination de beaucoup de gens. Par exemple courbe Sigmod, il est non-lin�aire, peut �tre approch�e par un lin�aire, il est possible de calculer la perte d'approximation de la fonction et le r�sultat de chiffrement ult�rieur. cryptage homomorphique propri�t� distributive (loi de distribution) fait dans le cryptage global et le cryptage de chaque �l�ment.

Google premier � voir les avantages, il pr�sente un calcul de la moyenne f�d�r�e appel�, une �tude f�d�rale de l'approche lat�rale.

On peut imaginer dans une moyenne f�d�rale, qui est, il mod�le sont n, exigent maintenant leur moyenne, mais les choses � faire sur le c�t� serveur, nous ne voulons pas que le serveur soit en mesure de voir le contenu de chaque �l�ment qu'il contient, on suppose que t�l�phone chaque jour pour obtenir de nouvelles donn�es plus tard, nous devons mettre � jour certains du t�l�phone au-dessus du mod�le d'apprentissage de la machine. Disons que la prochaine pr�diction de mots et de reconnaissance faciale. Nous pouvons choisir des t�l�phones, un r�sum� f�d�ral cette approche avec les nouvelles donn�es, et enfin, tout en prot�geant la confidentialit� des utilisateurs, de conserver les donn�es sur votre t�l�phone.

Cela a �t� Google, le syst�me Android a �t� appliqu�, il y a maintenant un grand nombre d'op�rateurs de t�l�phonie mobile, y compris nos op�rateurs nationaux de t�l�phonie mobile sont tr�s int�ress�s. D'autres fournisseurs tels que les r�seaux, la maison intelligente de ces entreprises, si vous ne l'avez pas entendu parler de l'�tude f�d�rale, ils deviendront obsol�tes.

2.2 �tude longitudinale f�d�rale: chevauchement d'�chantillon comprend iso

Il suffit de parler de la F�d�ration transversale, il est divis� par l'utilisateur, en fonction de l'�chantillon � fractionner. Qu'il n'y a pas cette situation: l'�chantillon est presque le m�me, avec le parti � des donn�es diff�rentes, mais pas les m�mes caract�ristiques. Par exemple, les diff�rentes institutions, entre les entreprises, les utilisateurs sont confront�s sont presque les m�mes, mais leurs caract�ristiques ne sont pas les m�mes.

Par exemple, le site vid�o a beaucoup de pr�f�rences vid�o de l'utilisateur, une boutique vendant des livres ont presque le m�me ensemble d'utilisateurs, mais leurs caract�ristiques ne sont pas la m�me chose, ici est li� au livre, il est sur la vid�o. Un autre exemple, deux banques, une banque peut avoir beaucoup de pr�ts, d'autres banques peuvent avoir beaucoup de moyens financiers, leur base d'utilisateurs peuvent �galement avoir beaucoup de chevauchement.

La pratique ant�rieure est d'acheter sur les donn�es, puis �tre polym�ris�e sur un serveur, et maintenant cette chose fonctionne pas. Nous pensons que l'apprentissage f�d�ral peut faire cette chose.

De telles caract�ristiques sont diff�rentes f�d�ral, mais des �chantillons qui se chevauchent, caract�ris� en fonction de couper verticalement, que l'on appelle F�d�ration longitudinal. Comme repr�sent�, le m�canisme de communication entre les deux est crypt� param�tres du mod�le, plut�t que les donn�es elles-m�mes. Pour deux des donn�es A et B, tous les �chantillons ne sont pas n�cessairement chevauchement. Mais si nous avons un moyen de trouver suffisamment de chevauchement partie peut �tre mod�lis� dans cette partie, apprendre � utiliser le mod�le f�d�ral.

Ici est divis� en deux questions:

Sans la divulgation de donn�es lui-m�me de la confidentialit� des utilisateurs, ne dit pas le principe de l'utilisateur et les valeurs propres, deux peuvent travailler ensemble pour trouver le propri�taire de l'�chantillon de donn�es qu'ils ont en commun.

Apr�s avoir trouv� ces �chantillons, utiliser ces exemples comme des donn�es � la formation d'un mod�le commun. Apr�s il est � utiliser.

Comment le mod�le:

La r�flexion sur la F�d�ration longitudinal, ce mod�le est un mod�le de la partie c�t� A, c�t� B a une autre partie du mod�le. Comme Charms Warring �poque Etats, une impression est coup�e en deux, et seulement lorsque cela est enti�rement imprim� qui se chevauchent, afin de prouver que le g�n�ral �tait un v�ritable ordre du roi --- a mod�le gauche A, le mod�le B a le droit ces deux ensemble, peuvent former une alliance pour conjointement raisonnement.

Regardez les d�tails: Tout d'abord, il y a un mur, le mur repr�sente les donn�es ne peuvent pas �tre �chang�es � travers le mur. A gauche une institution A, ont le bon m�canisme B, les deux institutions devraient �tre tr�s prudent lors de la communication, communiquer seulement quelques-uns des param�tres du mod�le chiffr�s.

Cet algorithme est � droite ici pour �largir quatre �tapes ci-dessous je vais d'abord vous donner �tape par �tape pour expliquer.

�tape 1: Comme le montre, en supposant que cette institution a laiss� un tel utilisateur ou d'un ensemble d'�chantillons de X, Y sur la droite a aussi une collection d'un �chantillon, peut trouver leur intersection sans exposition � X et Y.

Deuxi�me �tape: compter chaque mod�le, pensez � faire une partie de l'agence organisation Un mod�le B pour faire l'autre partie du mod�le. Une premi�re �tape dans l'organisation faire en premier abord, les param�tres initiaux pour chaque �chantillon et faire quelque chose produit scalaire, le r�sultat de ce produit scalaire de chiffrement, puis le donner � B. algorithme de chiffrement

�tape: B a le paquet, ne sait pas ce qui est l�, mais il peut aller mettre � jour les r�sultats de l'�chantillon � travers le cryptage homomorphique, le r�sultat obtenu apr�s comparaison � la valeur r�elle, il donnera une valeur de perte, il sera le dos rechiffrement de perte A.

Souvent ce cas, s'il y a un organisateur (coordonnateur), qui simplifiera la proc�dure, il peut �galement entra�ner B directement au coordonnateur.

Quatri�me �tape: Coordinateur a le r�sultat apr�s Rechiffrer le r�sultat, plus un peu de bruit, puis distribu� � A et B, et les laisser aller leurs propres param�tres du mod�le mis � jour, ce qui rend chacun des participants ne se connaissent pas donn�es et caract�ristiques, et il peut mettre � jour ses propres param�tres. Apr�s ce processus plusieurs fois, A et le mod�le B sont progressivement form�s.

Si un nouvel utilisateur sur par la Partie A et qui peuvent chacun participer � la partie B, est r�alis� par un processus similaire --- qui est la pr�misse de la F�d�ration longitudinale, les caract�ristiques ne se chevauchent pas, les �chantillons qui se chevauchent, chaque �chantillon ne connaissent en partant du principe, il peut aussi �tre mod�lis�.

R�sum�: Le soi-disant �tude f�d�rale lat�rale, selon les donn�es de coupe transversale, plus de sc�narios d'utilisation que le f�d�ral apprendre beaucoup de terminaux et un serveur. �tude longitudinale f�d�rale, selon les caract�ristiques des donn�es de coupe. En utilisation, il est essentiellement au m�me endroit ou entre le niveau, les deux soci�t�s.

Ainsi, le plus appropri� f�d�ral lat�ral gauche pour toC, sur le c�t� droit de la TOB f�d�rale longitudinale plus applicable.

veulent surtout dire est qu'au d�but des 18 ans, nous avons constat� que les banques de micro-publique, la protection de la vie priv�e des utilisateurs est un d�fi pour beaucoup en cas de co-propri�taire des donn�es, comment la mod�lisation conjointe entre les diff�rentes banques et institutions, tout en prot�geant Protection des donn�es? Nous avons d�velopp� une �tude f�d�rale de Tob.

L'�quipe de recherche de Google a suivi l'�quipe Android, donc ils sont plus pr�occup�s par l'�tude f�d�rale transversale. Maintenant, les Etats-Unis et en Europe sont plus lat�ralement, dans notre pays est plus verticale. �tude f�d�rale est maintenant le d�veloppement dirig�.

Un tiers peut aussi se d�barrasser?

�tant donn� que des tiers peuvent divulguer la confidentialit� des utilisateurs, il peut (supprim�), pour ajouter quelques �tapes, les �tapes g�n�rales deviennent plus longues, mais peut �tre fait, ne pas entreprendre ici.

cha�ne bloc f�d�ral et l'apprentissage comme elle?

cha�ne bloc f�d�ral et l'apprentissage est en fait pas la m�me chose, la plus grande diff�rence est que: l'apprentissage est l'utilisation de la valeur de donn�es f�d�rale, il est une caract�ristique des donn�es ne peuvent pas �tre copi�s sur l'autre nud. cha�ne bloc et pour assurer la transparence des informations ne peuvent pas �tre falsifi�es, de sorte que les donn�es doivent �tre r�pliqu�es sur diff�rents noeuds. Alors que le but ultime est la formation d'un consensus multipartite sur un joint, mais ils varient.

D'un point de vue math�matique, du point de vue de l'ordinateur, lors de l'introduction d'un m�canisme multipartite, de poser la question suivante � trois questions:

La premi�re demande, la coh�rence. Maintenant, il y a plusieurs, donc je fais les choses dans un ordre diff�rent, le r�sultat que je re�ois est pas la m�me chose? Nous voulons la m�me chose. Pour la base de donn�es, les r�sultats doivent �tre les m�mes. l'apprentissage f�d�ral est le m�me.

La deuxi�me question, atomique. Quand une partie a raccroch�, nous ne sommes pas en mesure de se retirer dans leur �tat d'origine.

La troisi�me question, la r�sistance de perplexit�s, est la s�curit�. Ceci est caract�ristique particuli�rement importante d'une �tude f�d�rale. Mais cette cha�ne multi-blocs et de l'informatique, l'informatique s�curis�e, et ce mod�le de coop�ration dont nous parlons a � peu pr�s rien � faire des calculs et des donn�es.

2.3 Migration �tude: �chantillon, dans lequel un non-chevauchement

Juste parl� soit chevauchement des �chantillons, ou de chevauchement des caract�ristiques, mais si aucun d'entre eux se chevauchent, cette fois-ci serait pour une �tude sur la migration.

L'id�e est de l'apprentissage de transfert, en supposant que les deux ensembles de donn�es d'�chantillons et caract�ristiques presque rien en commun, je peux trouver dans leur sous-espace il y a chevauchement. Comment trouver? Ceci est par cryptage homomorphique et juste ledit m�canisme interactif distribu�. Une fois trouv�, il peut �tre lat�ralement ou longitudinalement sous-espace f�d�ral dans la F�d�ration.

Aux termes de la participation de plusieurs parties prenantes et comment identifier le centre de nuds malveillants

Comment mauvais gens entrent dans le pass�? Par exemple faire OCR (reconnaissance de l'�criture manuscrite), nous laissons l'ordinateur reconna�t 0. Sinon chiffr�, nous ne disposons pas d'un m�canisme, peut �tre fait la confrontation soi-disant, vous pouvez contrer les m�chants peuvent deviner les fuites de donn�es brutes par une s�rie de param�tres ou d�grad�.

math�maticiens Alors r�fl�chir � des fa�ons de classer les m�chants.

Honn�te o� (honn�te) est bon, semi-honn�te (honn�te mais curieux) est curieux, mais en elle-m�me est pas mal. D'autres sont malveillants, veut pratiquer le sabotage, les utilisateurs veulent la vie priv�e, puis profit.

Pour diff�rentes hypoth�ses, nous pouvons concevoir diff�rents algorithmes d'apprentissage et de l'algorithme de calcul f�d�ral de multipartisme, peut faire z�ro connaissances (z�ro) et des connaissances (Quelques connaissances) classification. Server ne peut pas distinguer entre le centre malveillant, les noeuds de donn�es noeud de donn�es malveillantes et non malicieux.

Disons qu'il est un t�l�phone con�u sp�cifiquement veulent des donn�es fausses, afin de contr�ler le mod�le moyen de l'ensemble du serveur. Comment �viter ce ph�nom�ne? Ces questions impliquent dans la classe ouverte apr�s une s�rie de ces travaux sont en cours, nous pouvons aller en ligne pour rechercher.

La strat�gie de s�curit�, il existe deux exemples sp�cifiques, on peut tout trouver en ligne. Un mod�le appel� l'attaque, qui est contr�l�e par le mod�le entier des param�tres du mod�le f�d�ral des mains et des pieds. Il y a aussi une attaque de donn�es, qui a impliqu� l'int�rieur de l'informatique f�d�rale, ce qui rend son contr�le sur le mod�le f�d�ral pour obtenir un r�le d�cisif, ce sont des articles et des solutions.

De plus, la fa�on dont nous pouvons continuer � encourager ces parties ont des donn�es diff�rentes, a continu� � participer � l'int�rieur de la mod�lisation f�d�rale, de sorte que tout le monde continuent d'obtenir un revenu, mais pour maximiser les avantages collectifs? Ceci est la th�orie des jeux et de l'�conomie, le mod�le devrait faire, mais aussi dans la r�alisation de recherches dans ce domaine beaucoup de travail.

2.4 Syst�me de recommandation f�d�ral

Il peut �galement �tre g�n�r� dans le syst�me et a recommand� que l'intersection de l'�tude f�d�rale, disons deux c�t� donn�es, recommander des films et des livres recommand�s, deux d'entre eux peuvent ne pas �tre commercialement comp�titifs, ils ont d�cid� de coop�rer, mais ne veulent pas � la perte de la vie priv�e de l'autre c�t�, ils peuvent apprendre � faire avec l'approche moins f�d�rale:

ABC propri�taire des donn�es diff�rentes, par voie de d�composition de la matrice, chaque partie aux donn�es appartenant � l'utilisateur en tant que produit d'un certain nombre de sous-matrice, le produit d'un tel sous-matrice form�e par l'alg�bre lin�aire, ces trois utilisateurs diff�rents d�compos� vecteurs de caract�ristiques dans trois livres d'utilisateurs multipli� par une matrice de vecteurs de caract�ristiques, le calcul de ces vecteurs est que nous voulons �tre en mesure d'apprendre par le f�d�ral calcul�. Sp�cifique � la fa�on dont le calcul, il est un algorithme qui semble relativement nouveaux et complexes, nous allons probablement se confondre.

Il suffit de dire quelque chose au sujet de la pratique:

Chaque propri�taire des donn�es, les premi�res donn�es sur leur propre d�composition de la matrice, puis la partie int�rieure du param�tre, comme vient de le dire des livres de vecteurs propres transport�s vers le crypte serveur, vous pouvez mettre ces diff�rents vecteurs, par apprentissage moyen homomorphic lat�ral f�d�ral, puis met � jour la valeur moyenne de la re-distribu� aux diff�rents utilisateurs finaux. Gr�ce � la pratique d'un tel peut �tre fait au cadre f�d�r� Averageing pour obtenir la matrice mise � jour.

Maintenant, nous pouvons �galement �tre �tendue au syst�me de recommandation longitudinale, les utilisateurs qu'ils ont un grand chevauchement, mais la fonction ne se chevauchent pas. Micro Focus a lanc� aujourd'hui la premi�re banque une �tude f�d�rale, f�d�ral recommande de faire de la publicit� syst�me, que l'on appelle la publicit� f�d�rale. Le syst�me publicitaire ne peut pas conna�tre la vie priv�e de l'utilisateur, nous ne pouvons pas savoir � coup s�r la vie priv�e des m�dias.

3, des exemples d'application de l'�tude f�d�rale multi-sc�ne

Banque contr�le des risques

Parce que nous voulons obtenir est gros volumes de donn�es, que les donn�es sous diff�rents angles, par exemple l'utilisateur de g�rer le risque de cr�dit, ces donn�es n�cessite beaucoup d'avis financier, public, judiciaire, fiscal, administratif, etc., ils sont tous diff�rents donn�es propri�taire qui, nous esp�rons qu'ils forment une alliance f�d�rale conjointement model�e. Par exemple, une banque et une entreprise coop�rative, qui est longitudinalement f�d�ral, parce que l'utilisateur a un chevauchement suffisant, mais leur identit� est pas la m�me chose, faite de ces algorithmes que les effets mentionn�s, beaucoup am�lior�, o� le correspondant il est la forte baisse du taux de cr�ances class�es.

coop�ration assurance

Nous sommes une soci�t� de r�assurance suisse en profondeur la coop�ration, la soi-disant r�assurance est l'assurance pour les compagnies d'assurance, les soci�t�s de r�assurance, vous pouvez l'imaginer il y a beaucoup de compagnies d'assurance ci-dessous, ces compagnies d'assurance sont � la fois rapport de concurrence et de coop�ration entre eux la coop�ration devra utiliser l'�tude f�d�rale.

En F�d�ration longitudinale, peut �galement F�d�ration lat�rale, �galement longitudinale et transversale par une combinaison de f�d�rale, f�d�rale devient faible port�e lat�rale, une large gamme de la F�d�ration longitudinale. Il existe une vari�t� de la structure tr�s int�ressante, mais a aussi obtenu de tr�s bons r�sultats.

Vision par ordinateur

On suppose diff�rentes images informatiques de diff�rentes entreprises, parmi eux il y a cette volont� de coop�rer. Imaginez l'apprentissage d'un syst�me f�d�ral transversal, parce qu'ils ne sont pas les m�mes que les �chantillons d'image, mais presque tous les m�mes caract�ristiques, tous les pixels, il peut �tre utilis� dans la fabrication de la sagesse, la s�curit�, les villes dans ces domaines, qui sont en cours d'application.

Gr�ce � notre coop�ration avec la perspective tr�s, par exemple, l'un de ses affaires est � aider les compagnies de construction pour surveiller la s�curit� des chantiers de construction, il y a beaucoup d'entreprises de construction propre vie priv�e, ne veulent pas divulguer � d'autres entreprises de construction, mais leurs donn�es � chaque tour est limit�, il est en mesure de mettre en place le mod�le global de l'apprentissage par les autorit�s f�d�rales de les distribuer pour r�pondre � leurs exigences de s�curit� de la construction.

reconnaissance vocale

Les syst�mes vocaux peuvent �tre diff�rents de l'enregistrement, par exemple l'enregistrement sur l'enregistrement des centres de services, certains t�l�phones portables, d'autres soci�t�s d'enregistrement, l'enregistrement de chacun peut avoir �t� diff�rent cette perspective d'observer ces utilisateurs. Y at-il un moyen de mettre ces enregistrements assemblez, sans d�placer les donn�es que la pr�misse de la mise en place d'un mod�le g�n�ral en utilisant diff�rents audio d'enregistrement, la langue, jeu de donn�es pour former notre mod�le f�d�ral?

v�hicules sans pilote

environnement de laboratoire des v�hicules sans pilote, les donn�es obtenues sont limit�es, mais supposons pas de voitures remplies tous tout le temps d'obtenir de nouvelles donn�es. Il n'y a aucun moyen de ne pas exposer chaque donn�e sp�cifique de v�hicule sans pilote, alors qu'il se r�unissent, peuvent former un mod�le f�d�ral? Plus pr�cis�ment, cette ensemble d'�tude avec l'apprentissage de renforcement f�d�ral, est de renforcer l'�tude f�d�rale.

le financement de la cha�ne d'approvisionnement

Il y a beaucoup de gestion d'entrep�t et de surveillance, d'utiliser cette communication vient de dire la vision par ordinateur et l'apprentissage f�d�ral. La relation entre l'amont et en aval, pr�vision d'inventaire, la cha�ne d'approvisionnement, ce qui est le probl�me, peut �tre mieux abord� par cette �tude f�d�rale.

4, lorsque le f�d�ral apprendre la construction �cologique

Imaginez ce que l'avenir de l'apprentissage f�d�ral, une technique aux exigences r�glementaires telles que GDPR ainsi que la confidentialit� des utilisateurs, cinq ans plus tard, notre soci�t� deviendra ce genre de forme? Je crois aussi que nous serons sur un tel noeud social, il y a beaucoup d'alliances formeront, ce qui est l'�cologie.

Il existe de nombreuses soci�t�s diff�rentes organis�es volontairement par l'�tude f�d�rale, la libert� de coop�rer en vertu du principe d'aucun int�r�t, l'�tude f�d�rale des incitations serait juste de laisser cette �co continuent de survivre, de plus en plus, comme une terre de boule de neige d�velopper. Il emp�che le monopole de donn�es, de sorte que l'entreprise a une petite donn�es peuvent aussi vivre - ce que nous appelons l'intelligence artificielle sociale, qui est une technologie peut vraiment faire l'IA �thique.

Apr�s l'apprentissage Federated le mot se produit, nous avons �t� traduits en chinois et pense � la parole. Nous prenons en compte le fait que chaque c�t� a des donn�es comme un � �tat �, la relation entre eux, comme une des relations diplomatiques. Ils peuvent aussi avoir un coordonnateur, ou ils ont un mod�le commun, couramment utilis�, il est comme une commune de service � toutes les parties, est un � f�d�ral �.

Nous menons �galement la mise en place de la premi�re norme IEEE, les normes ne sont toujours pas compl�tement termin�, nous sommes entr�s dans la derni�re minute. Il existe de nombreuses soci�t�s connues bien-sont impliqu�es dans la pr�sente norme. Lorsque cela se produit apr�s la norme, il sera la premi�re �tude internationale sur les normes f�d�rales, apr�s tout, peut �tre r�alis�e selon cette norme par le temps f�d�ral du monde pour apprendre la coop�ration, il y a un langage commun pour interagir. Nous avons �galement activement la promotion des normes nationales, y compris les normes et les organismes nationaux de normalisation.

F�d�ral apprendre projet open source FATE

Supposons que nous ayons une plate-forme d'apprentissage f�d�ral, la plate-forme de s�curit�, l'utilisateur aura des pr�occupations, inquiets de la pr�sence de la porte arri�re. La meilleure fa�on est public, open source, nous pouvons voir que chaque ligne de code, vous pouvez �tre assur� d'utiliser. Nous, d�s le d�part que l'apprentissage ax�e sur la technologie f�d�rale, open source ne peut pas �tre s�par�e. Donc, nous ouvrons le premier projet open source sur l'�tude f�d�rale, est r�pertori� comme la m�daille d'or de la fondation Linux du monde, est le syst�me de SORT.

Il s'agit d'une �tude f�d�rale-niveau industriel, a soutenu ce que je l'ai dit F�d�ration transversale, F�d�ration verticale, l'apprentissage des transferts f�d�raux, l'apprentissage de renforcement et l'Alliance f�d�rale recommand�e. Maintenant, il y a un nouveau support de version pour le calcul h�t�rog�ne pour soutenir une vari�t� d'apprentissage f�d�ral, et la profondeur de notre coop�ration avec VMWare, les liaisons de profondeur, a introduit un syst�me syst�me appel� KubeFATE aux utilisateurs d'aide mieux d'�tre au-dessus de l'application dans le Cloud .

apprendre f�d�ral �tudie ce qui vaut la peine? Il y a aussi beaucoup de choses que vous pouvez faire, dire, comment nous pouvons assurer la conformit� de la s�curit�, pr�venir les attaques, d'am�liorer l'efficacit� de l'algorithme, pour am�liorer l'architecture du syst�me, comment utiliser la technologie pour faire plus, de faire un bon m�canisme d'alliance, m�canisme incitatif � encourager tout le monde. Ainsi, dans tous les aspects de notre juste un d�but, il y a beaucoup de travail qui doit �tre fait plus tard.

Questions et r�ponses choisies Interactive

Q: Qu'est-ce que la machine d'apprentissage f�d�ral et distribu� apprendre � distinguer le meilleur point?

Yang Qiang: La premi�re est la distribution des donn�es. En g�n�ral, les donn�es sont r�parties uniform�ment l'apprentissage machine (IID) est distribu� aux noeuds respectifs impliqu�s dans le calcul, un objectif parall�le est d'am�liorer le calcul de l'efficacit�. Naturellement pr�sent dans les �les de donn�es d'apprentissage f�d�ral dans diff�rents domaines, m�canisme, la distribution des donn�es de grande diff�rence, in�galit�s (non-IID). Aussi DISTRIBU� apprendre davantage pr�occup� par l'efficacit�, souvent dans le centre de donn�es, propri�taire des donn�es est la m�me personne. en savoir plus concern� f�d�ral sur la s�curit�, les donn�es sont propri�taire de plusieurs personnes.

Q: Il y a des entreprises qui font la cha�ne de bloc avec MPC (tels que l'apprentissage f�d�ral, le chiffrement homomorphique) combin�s, comment envisagez-vous?

Yang Qiang: cha�ne bloc avec une bonne combinaison de l'apprentissage f�d�ral peut �tre compl�mentaire. l'apprentissage f�d�ral peut �tre mis en uvre dans une cha�ne de blocs fonctionnels distribu�s tels que la facturation des parties impliqu�es dans la valeur des swaps et des incitations efficaces peuvent �galement �tre utilis�s au centre des propri�t�s de la cha�ne de blocs pour atteindre le nud central de la participation f�d�rale dans le calcul d'apprentissage alternatif. cha�ne Block et apprendre diff�rents f�d�ral, Block Chaining la duplication du m�canisme de r�plication des donn�es dans chaque noeud pour parvenir � un consensus sur l'ensemble des donn�es de l'UE sont publiques, mais les parties impliqu�es dans l'apprentissage diff�rent et les donn�es f�d�rales est priv�e.

Q: Le mod�le f�d�ral de l'apprentissage et la formation est un mod�le commun, mais est souvent non-IID donn�es de chaque client, je me demande si les enseignants ont des id�es?

Yang Qiang: am�lioration Effet (transversal) provient principalement de la valeur de l'�chantillon d'�tude f�d�rale dans chacune de la polym�risation, un objectif de formation est d'obtenir toutes les parties sur toutes les donn�es applicables a la capacit� de g�n�ralisation du mod�le. Les parties de distribution de donn�es non-idd peuvent �tre d�termin�es par les dollars canadiens f�d�raux apprendre � apprendre, apprendre � r�soudre multi-t�ches.

Q: Comment assurer la qualit� de chaque partie des donn�es? Par exemple, des donn�es d'imagerie m�dicale de diff�rents label de qualit�.

Yang Qiang: Dans la production r�elle, peut �tre effectu�e par une m�thode de m�canisme deploy d'inspection sur les parties � la qualit� des donn�es de nud impliqu� dans le seuil de l'�chantillon de formation �limin�, il peut aussi combiner plusieurs techniques d'apprentissage machine, comme GAN, pour simuler g�n�rer des �chantillons de formation pour les tests. En outre une utilisation plus validation crois�e et d'autres m�thodes de validation des donn�es peut contr�ler efficacement la qualit� de la formation.

Q: L'�tude f�d�rale, les diff�rents silos de donn�es dans le processus f�d�ral d'apprentissage s'il y a des poids cach�s (c.-�-algorithme mod�le de conception lui-m�me est pas le poids, mais l'�tude r�elle la formation de poids diff�rents), comment r�soudre?

Yang Qiang: algorithme d'apprentissage f�d�ral lui-m�me fonction de la taille de la quantit� de donn�es � attribuer des pond�rations suppose que les donn�es sont distribu�es uniform�ment. En effet, les coefficients de pond�ration peuvent �galement �tre con�ues par des proc�d�s tels que l'analyse de la source de donn�es de similarit� et de la source de donn�es cible.

Q: cadre FATE et tensorflow cadre-cadre f�d�r� de quels avantages et inconv�nients?

Yang Qiang: cadre est FATE la premi�re image de FL de qualit� industrielle, � partir du soutien de l'industrie de horizontal, vertical et migration apprentissage f�d�ral et d'autres cadres d'apprentissage et de prot�ger les composants informatiques. TensorflowTF soutient actuellement Federation paysage, et plus adapt� � la recherche universitaire, relativement simple et facile � utiliser.

Q: l'impact de l'APR sur le d�ploiement de l'apprentissage f�d�ral et des ensembles de donn�es d�ploy�?

Yang Qiang: �tude f�d�rale peut �tre utilis�e comme composant de l'APR en utilisant des techniques d'IA. APR multi-s�parateur face non standard, les donn�es et d'autres d�fis, le syst�me d�ploy� RPA peut am�liorer la performance des produits par l'�tude f�d�rale.

Q: apprendrai f�d�ral comment appliquer � grand champ de donn�es de l'�ducation?

Yang Qiang: l'apprentissage peut f�d�ral aider � atteindre une �ducation personnalis�e. Les �tablissements d'enseignement � partir des donn�es stock�es dans les appareils mobiles personnels des �tudiants (tels que les t�l�phones intelligents et les ordinateurs portables) dans la construction d'un programme d'apprentissage de mod�le commun en collaboration. Dans cette base de mod�le, mais aussi selon les points forts de chaque �l�ve, les besoins, les comp�tences et les int�r�ts, construire sur mesure, le mod�le d'orientation personnalis� d'apprentissage.

Route de la soie

Apprenez � conna�tre la Chine

Kong University of Science Professeur Yang Qiang: �tude f�d�rale et de l'application de la recherche de pointe