Source: AI Technology Camp

Cet article sur 2300 mots lecture recommand�e 9 minutes

Amazon �quipe AI ouvrir un nouveau cadre de formation DGL-KE sp�cifiquement indiqu� pour la connaissance de la cartographie � grande �chelle int�gr�e, ce qui permet aux chercheurs et aux utilisateurs de l'industrie facilement et effectuer rapidement des t�ches sur une machine de formation des connaissances d'apprentissage � grande �chelle atlas ensemble de donn�es.

la cartographie des connaissances (Knowledge Graph) comme une technologie importante au cours des derni�res ann�es a �t� largement utilis� dans divers domaines de la recherche d'information, le traitement du langage naturel, et les syst�mes de recommandation. Int�gration apprendre carte repr�sente (Knowledge Graph Plongements) est une m�thode pour g�n�rer un noeud de fonction (fonction de nud) � partir de la connaissance de la configuration du mod�le sans supervision, les caract�ristiques qui en r�sultent peuvent �tre utilis�s sur une vari�t� de t�ches d'apprentissage de la machine. Par exemple, par enrobage, on peut pr�voir si un noeud est repr�sent� par une liaison (de pr�diction de liaison) entre deux noeuds.

Cependant, avec le d�veloppement d'une illustration typique des r�seaux sociaux, les syst�mes de recommandation et d'autres donn�es de la sc�ne, l'ampleur des connaissances de la cartographie est en constante augmentation. Dans un sc�nario r�el dans l'industrie, les techniciens ont souvent besoin de faire face aux dix millions, voire des centaines de millions de nuds de niveau de donn�es cartographiques � grande �chelle. Comment rapidement et efficacement repr�sent� EMBEDDED sur une grande formation de connaissances de cartographie � l'�chelle est actuellement un d�fi.

R�cemment, l'�quipe Amazon AI apr�s DGL, a ouvert le code source d'un nouveau cadre de formation DGL-KE sp�cifiquement indiqu� pour la connaissance de la cartographie � grande �chelle int�gr�e, con�ue pour permettre aux chercheurs et de l'industrie afin de faciliter aux utilisateurs de cartographier rapidement les donn�es des connaissances � grande �chelle l'apprentissage de la machine sur un ensemble de missions de formation.

Adresse github: https: //github.com/awslabs/dgl-ke

Par rapport au cadre open-source existante, les faits saillants de DGL-KE sont les suivantes:

Soutient tous les principaux algorithmes d'apprentissage de la repr�sentation des connaissances de cartographie, y compris Transe, COMPLEX, DistMult, TransR, RESCAL, etc. Faites tourner;
Le seul cadre existant open source pour soutenir CPU multi-core, GPU multi-cartes, la formation hybride CPU-GPU, et distribu� carte des connaissances de formation cadre de pr�sentation int�gr�;
Facile � utiliser, les utilisateurs ne doivent �crire du code directement aux donn�es de carte en entr�e � la connaissance;
Haute performance et d'�volutivit�. Selon DGL-KE a publi� ensemble de donn�es Freebase (plus de 86 millions de nuds, 300 millions de c�t�s) Indice de r�f�rence affich� sur AWS EC2 plate-forme, une formation p3.16xlarge (8 processeurs graphiques) peut �tre compl�t� en 100 minutes. 4 r5dn.24xlarge (4 * 48 processeurs) la formation peut se faire en 30 minutes, et atteint lin�aire speedup. Ce r�sultat est similaire que le syst�me le plus rapide en cours (comme Facebook a publi� Pytorch-BigGraph) 2-5 fois plus rapide.

Figure 1: DGL-KE Architecture du syst�me

�t� en mesure d'avoir DGL-KE une telle performance, principalement en raison de la mise en place de nombreux syst�mes innovants et des algorithmes d'optimisation:

(A) segmentation algorithme bas� sur la carte METIS de formation distribu�e

Pour les grandes donn�es cartographiques � grande �chelle pour la formation, la formation distribu�e est essentielle. Quelle est l'id�e principale pour agrandir un original divis� en diff�rents sous-graphes, chaque machine est responsable de la formation de descente de gradient stochastique sur un sous-graphe, les param�tres du mod�le de serveur de synchronisation (param�tre Server) parmi toutes les machines. L'architecture comme indiqu� ci-dessous:

Figure 2: DGL architecture distribu�e

Cependant, si seulement pour une grande carte pour la coupe al�atoire, provoquera une �norme quantit� de communication de donn�es entre la machine et le serveur de param�tres de formation (besoins de la machine locale � la demande de donn�es de mod�le de la machine � distance dont ils ont besoin), ce qui entra�ne des goulets d'�tranglement du r�seau. Pour r�soudre ce probl�me, DGL-KE sera pr�d�coup�e aux donn�es brutes avant la formation par METIS graphique de partitionnement algorithme.

algorithme METIS est une vision efficace d'un informaticien George Karypis propose la segmentation algorithme en 1995, alors que George Karypis est �galement l'un des auteurs du projet DGL-KE. METIS algorithme sera un noeud sur une grande carte associ� plac� dans la m�me division (s�paration) autant que possible. La plupart de ces frais g�n�raux de communication r�seau peut �tre converti en machine de copie de la m�moire, ce qui am�liore grandement la vitesse de formation distribu�e.

Dans cet ensemble de donn�es de formation pratique Freebase, algorithme METIS peut �conomiser pr�s de 90% du mod�le de bande passante du r�seau, de sorte que la formation distribu�e pour atteindre lin�aire speedup. formation distribu�e DGL-KE utilise des composants DGL-KVStore. Syst�me DGL-KVStore DGL est con�u pour le param�tre de module serveur d�velopp� sur mesure est utilis� pour synchroniser le mod�le de communication. L'assemblage est r�alis� par le fond de la douille C ++, des files d'attente de messages, et l'orientation pour optimiser la s�rialisation de donn�es rares, et peut de mani�re transparente algorithme de segmentation METIS Fig.

(B) sur la base de la m�moire partag�e � plusieurs processus de formation unique

Multi-Core (Multi-core) est devenu l'architecture actuelle de l'ordinateur standard, de nombreux postes de travail puissant dans une machine, il y aura plus de dizaines de curs de processeurs et des centaines de Go de m�moire, et m�me sur T. Pour de nombreux noeuds de donn�es cartographiques de dix millions, ce type de performance autonome a �t� suffisante pour g�rer les donn�es de cette taille.

DGL-KE pour cette sc�ne a �galement fait l'optimisation du syst�me correspondant, ce qui permet aux utilisateurs autant que possible les limites de performance d'une machine mini�re. Avec le multithread traditionnel (Multi-thread) optimisation parall�le sur la base de diff�rents DGL-KE utilise un multi-processus sur la base d'un grain grossier (Multi-Process) optimisation parall�le. parall�lisme � gros grains peut augmenter la limite maximale du parall�lisme en cours d'ex�cution du programme, augmentant ainsi speedup. En outre, DGL-KE mod�lis� par la synchronisation de la m�moire partag�e (Shared-m�moire) entre les diff�rents processus, ce qui r�duit consid�rablement les frais g�n�raux de communication inter-processus.

Figure 3: sur la base de la m�moire partag�e � plusieurs processus de formation unique

(C) la formation hybride-GPU CPU

Formation connaissance des processus de repr�sentation cartographique int�gr�e va g�n�rer beaucoup d'op�rations de la matrice, et les op�rations de la matrice peut �tre acc�l�r�e par le GPU. Pour les donn�es de carte � petite �chelle pour, DGL-KE permet aux utilisateurs de mod�les graphiques complets dans le GPU dans la formation, de mani�re � atteindre une performance optimale. Cependant, par rapport � la m�moire du processeur, la m�moire GPU est beaucoup plus petite, mais la taille d'un mod�le Plongements d�passe la limite de la m�moire GPU ne peut pas �tre form�. Pour le sc�nario d'un tel, DGL-KE offre aux utilisateurs un mode de formation hybride CPU-GPU.

mixte CPU-GPU en mode de formation, la CPU est stock�e dans le mod�le m�moire Plongements et stocke une copie du GPU de mani�re mini-lot par une petite quantit� de donn�es dans chaque it�ration sera un processus de la CPU � la formation du GPU. Pour �viter la surcharge de la copie de donn�es entre la CPU et le GPU, les donn�es de mani�re asynchrone formation DGL-KE copie en m�me temps que le chevauchement calcul�. Cependant, le mod�le de calcul asynchrone va faire baisser la vitesse de convergence et de pr�cision, DGL-KE utilise ici une autre optimisation et la mise � jour Entit� Embedding Int�gration de la Relation de diff�rentes mani�res: relation mise � jour synchrone et asynchrone � l'aide enity mise � jour.

Cela se fait parce que dans le processus de formation proprement dite, par rapport � de nombreux ensembles de donn�es sont la distribution longue queue ont montr� que certains types de types de relations occupent la grande majorit�, de sorte que la mise � jour asynchrone provoque une grande quantit� par rapport l'int�gration du processus de formation le mod�le de conflit, affectant ainsi la convergence et la pr�cision du mod�le. L'entit� dans le processus de formation est g�n�ralement clairsem�e, la formation asynchrone ne produira que si peu de conflits. Avec une telle optimisation simple, DGL-KE � la fois pour assurer la convergence de la formation du mod�le, et peut assurer la performance du syst�me.

Figure 4: m�lange CPU-GPU formation

En plus de l'optimisation ci-dessus, DGL-KE fournit �galement un certain nombre d'autres m�thodes d'optimisation. Par exemple, l'utilisation de processus d'acc�l�ration n�gative �chantillonnage conjoint Sampler n�gatif utilis� pour r�duire la copie des donn�es Relation processus de formation de la partition et l'utilisation du mod�le pour assurer la convergence de synchronisation p�riodique et similaires. DGL-KE construit plusieurs ensembles de donn�es cartographiques de connaissances pour g�rer les formats, les utilisateurs peuvent t�l�charger.

En outre, Benchmark DGL-KE offre une formation sur deux petits ensembles de donn�es FB15k, wn18, ainsi qu'un vaste ensemble de donn�es Freebase, l'utilisateur peut directement par le script pour reproduire les r�sultats de la formation dispens�e. Et par rapport � cadre conventionnel open source, DGL-KE avantages significatifs, les r�sultats montrent la comparaison avec la performance DGL-KE Graphvite par rapport, et ainsi Pytorch-Biggraph FB15k Freebase ensemble de donn�es dans l'ensemble de donn�es.

DGL-KE vs Graphvite

DGL-KE vs Pytorch-Biggraph

Editeur: Wang Jing

Comment� par: Lin Yilin

- FIN -

attention Tsinghua - donn�es Acad�mie des sciences de Qingdao plate-forme publique micro-canal officiel " �AI pour envoyer des donn�es �� Sisters et n � � Les donn�es envoy�es THU �� Pour plus de conf�rences et de bien-�tre contenu de qualit�.

Route de la soie

Apprenez � conna�tre la Chine

Une demi-heure de formation cent millions connaissance de la cartographie � grande �chelle, open source Amazon cadre de repr�sentation des connaissances AI carte int�gr�e

(A) segmentation algorithme bas� sur la carte METIS de formation distribu�e

(B) sur la base de la m�moire partag�e � plusieurs processus de formation unique

(C) la formation hybride-GPU CPU