CIKM AnalytiCup 2018 programme de championnat est sorti, ils ont construit un mod�le pour voir l'astuce

Lei Feng r�seau AI Technology Review nouvelles, CIKM AnalytiCup 2018 (Ali Xiaomi robot de comp�tition de algorithme de correspondance court texte interlangage) vient de se terminer, Luo Zhipeng par Microsoft, Microsoft Sun Hao, Huang forte Universit� de P�kin, l'Universit� Huazhong des Sciences et Technologies Liu Zhihao �quipe DeepSmart compos�e d'un mille plus gagner les participants, a remport� un seul coup.

Le concours de l'algorithme de robot de discussion, le plus algorithme de correspondance de texte commun comme objectif, de construire un mod�le d'appariement court texte dans plusieurs langues gr�ce � des technologies d'adaptation linguistique. Dans ce concours, la langue source est l'anglais et la langue cible est l'espagnol. Les participants organisation selon l'une des donn�es fournies par la conception de la structure du mod�le s�mantique d�termine si les deux m�mes questions. Finalement, les organisateurs du tournoi �valuera la performance du mod�le dans la langue cible. Dans cette comp�tition, les organisateurs des ressources ext�rieures �taient strictement limit�es. La formation ensemble de donn�es contient deux langues, les organisateurs offrent un bon anglais 20000 des questions de marque quant � la source de donn�es, tout en fournissant 1400 a marqu� une bonne question pour l'espagnol, et 55669 question espagnole non marqu�. Tous les r�sultats marqu�s par la langue et des experts dans l'annotation manuelle sur le terrain. En m�me temps, fournit �galement la traduction pour chaque langue.

description de la r�gle

Les organisateurs esp�rent que l'attention des joueurs sur la question de l'appariement court texte et l'adaptation linguistique, tous les joueurs doivent faire attention aux limitations suivantes:

1) la formation de mod�le ne peut utiliser les donn�es fournies par les organisateurs, y compris les donn�es annot�es, corpus sans �tiquette, traduction, vecteur de mot et ainsi de suite. D'autres donn�es ne peuvent pas �tre utilis�s ou mod�le de pr�-formation.

2) Si vous avez besoin d'effectuer une pr�-terme des vecteurs de formation, vous ne pouvez utiliser le mod�le de mot vecteur FastText pr�-formation.

3) Si vous avez besoin d'un mod�le de traduction ou d'un corpus de traduction, traductions uniquement fournies par les organisateurs.

4) joueurs de corpus parall�les peuvent th�oriquement fournies par les organisateurs pour former un mod�le de traduction, de telles m�thodes ne sont pas interdites, mais pas recommand�.

DeepSmart Notre �quipe:

Luo Zhipeng (getMax): ing�nieur algorithme Microsoft Bing recherche publicitaire, Master of Software Engineering, l'Universit� de P�kin, ax� sur la recherche et l'application de la technologie en PNL d'apprentissage profond, match de la pertinence des annonces, le CTR et d'autres estimations.

Huang forte (Jack Strong): Master of Software Engineering, la lecture de P�kin, de bonnes caract�ristiques techniques, le traitement du langage naturel, l'apprentissage en profondeur.

Sun Hao (fastdeep): service de publicit� de recherche Microsoft Bing ing�nieur en chef de d�veloppement, mettant l'accent sur l'innovation et de l'application de l'apprentissage de la machine et l'apprentissage en profondeur dans le domaine de l'algorithme de recherche et de recommandation, engag�e � am�liorer l'algorithme de correspondance de la publicit� en ligne, le mod�le de corr�lation et pr�-CTR mod�les d'�valuation pour stimuler la croissance des revenus publicitaires.

Liu Zhihao (LZH0115): Institut de l'automatisation de contr�le Universit� Huazhong des sciences et du g�nie Master of Science en lecture, la direction de la recherche principale de reconnaissance d'image, l'apprentissage z�ro-shot, l'apprentissage en profondeur.

De gauche � droite: chef m�canicien services de publicit� de recherche Microsoft Bing Sun Hao, de gauche: ing�nieur algorithme recherche Bing annonce Microsoft Luo Zhipeng

L'�quipe prim�e dossier:

NeurIPS 2018 AutoML (Phase 1)

1�re place
KDD Cup 2018 (deuxi�me pr�vision de 24 heures Track)

1�re place
KDD Cup 2018 (Derni�re pr�vision � 10 jours Track)

1�re place
Pr�vision Weibo chaleur

1�re place
Shanghai BOT Big Application Data de la concurrence

1�re place
Classification texte Daguan

1�re place

Ce qui suit est l'interpr�tation des membres de l'�quipe DeepSmart exp�rience Luo victoire Zhipeng et programme d�taill�:

1. Il y a quatre membres de votre �quipe, vous savez par quels canaux? Comment l'arri�re-plan de tout le monde, ainsi que la division du travail dans la course? A quoi bon � leur travail?

D�but du jeu de notre �quipe avait trois personnes, dont moi, fort et Sun Hao Huang (Allen), qui est mon fort Jeune jaune imm�diat, Sun Hao est mon chef de file de la technologie de Microsoft, est un expert en correspondance de la publicit� et de recommander des domaines. Lorsque le jeu est sur le point d'entrer dans la deuxi�me �tape, j'ai vu dans le jeu Exchange Group fusion Liu Zhihao recherche �quipe, et nous avons eu l'impression que certains mod�les se compl�tent, sur la formation de 4 �quipes. En raison de la forte et Brian sont � l'�cole d'�tudes sup�rieures, relativement plus de temps libre, ils ont pass� beaucoup de temps sur les caract�ristiques du traitement des donn�es et l'ing�nierie, la conception principale caract�ristiques de la structure du mod�le et moi et Allen, forte et Zhihao a �galement particip�.

Personnellement, je bien � la conception et la mise en uvre du mod�le d'apprentissage en profondeur, a �galement une grande exp�rience dans l'ing�nierie de fonctionnalit� et de l'int�gration du mod�le, Allen comme la publicit� v�t�ran recommand� domaines d'algorithmes correspondants grand public familier, approfondie et une connaissance approfondie des donn�es, il industrie bas�e exp�rience pratique de l'algorithme de faiblesse fait une vari�t� d'am�liorations pour nous aider � �viter certains des pi�ges de donn�es, Zhihao forte et bien � des caract�ristiques de conception, les donn�es ont une intuition aigu�, peut atteindre rapidement des r�sultats et obtenir fonction de r�troaction pour acc�l�rer le mod�le it�ratif.

Dans l'ensemble, nos membres de l'�quipe ont leurs domaines d'expertise respectifs, nous compl�ter mutuellement, communiquer bien pendant la course, la coop�ration, enfin laissez-nous d�marquer parmi les concurrents.

2. Vous avez enfin atteint la premi�re place, le score final est bas� sur ce que cela d�pend?

Le score final est calcul� � partir des cinq indicateurs, la ligne de score a repr�sent� 20% de la sc�ne, deux �tapes ont repr�sent� 30% de la ligne de partition, innovante, ce qui repr�sente 20% de la syst�mique, ce qui repr�sente 10% des donn�es est compris, ce qui repr�sente 20 APPLICABILIT� %.

R�sultats Phase I: r�sultats pr�liminaires en ligne.

�tape deux r�sultats: la ligne des r�sultats en demi-finale.

Creative, syst�matique: id�es de conception innovantes, unique aux donn�es du mod�le � partir des r�sultats locaux pr�-validation de la conception globale, l'utilisation rationnelle des biblioth�ques open source, faire jouer pleinement le r�le du mod�le open source, ne pas copier aveugl�ment, mod�le de conception de l'algorithme clair, la discussion d�taill�e de la conception du mod�le avantages, conform�ment aux caract�ristiques de l'application des donn�es de match pour le titre, l'architecture de mode algorithme propose un service clarifient de mani�re significative l'objet des travaux li�s � la conception des caract�ristiques et avantages pour la cible de pr�diction; les r�sultats du mod�le de l'algorithme montrent une strat�gie raisonnable peut prouver des r�sultats optimaux sont soigneusement que celui-ci a conclu que, plut�t que de mener � la chance.

Les donn�es comprises: comprendre la signification des champs d'�chantillons de donn�es, les donn�es montrent clairement le pr�traitement.

Praticit�: Entr�es conception du mod�le de l'algorithme, pratique pour les affaires ou l'inspiration dans le monde r�el.

Figure: classement de la Phase II

3. Ali des r�gles de concurrence sont strictement limit�es, vous ne pouvez utiliser les donn�es qu'ils fournissent, par exemple lorsque la formation du mod�le, ne peut utiliser le mot mod�le vectoriel pr�-form� FastText, si vous avez besoin d'utiliser la traduction de mod�le ou d'un corpus de traduction, ils ne peuvent utiliser la traduction fournie en cons�quence, il sera diff�rent de votre jeu? Il apportera de nouveaux d�fis?

Ces restrictions peuvent rendre plus �quitable de la concurrence, nous utilisons les m�mes ressources pour mener � bien l'effet de la concurrence, mais elle pourrait utiliser des ressources ext�rieures peuvent contribuer � renforcer l'effet, mais en fait le jeu et la diff�rence est grande, mais aussi laisser nous nous concentrons sur les donn�es officielles.

4. Les membres de l'�quipe savent si quelqu'un en espagnol? Si vous comprenez l'espagnol, occupera certains avantages dans le jeu?

Non. Si vous comprenez la langue espagnole pourrait �tre en mesure de le faire pour un traitement de donn�es ou d'une fonction mod�le d'extraction pour renforcer l'effet des besoins sp�cifiques de l'exp�rience pour v�rifier la validit�.

La difficult� de la concurrence ax�e sur quoi?

limiter strictement l'utilisation des ressources externes.
Moins de donn�es de formation fournies, la v�rification locale instable.
Comment utiliser efficacement les donn�es en anglais.

6. Vous pouvez parler des id�es sp�cifiques sur pr�traitements donn�es, l'ing�nierie de fonction, validation, s�lection de mod�les, int�gration de mod�le?

Les donn�es pr�-traitement, uvres de fonction

Nous validons les caract�ristiques de l'effet des mod�les LightGBM disposent d'uvres apr�s le texte ne pr�-traitement diff�rent. �prouv�e, les caract�ristiques form�es apr�s m�lange du texte diff�rent pr�traiter tr�s b�n�fique pour am�liorer la capacit� de g�n�ralisation d'un mod�le unique. Nous deux probl�mes �voqu�s Q1 et Q2, alors caract�ristiques �num�r�es sont utilis�es et d�crites caract�ristiques des diff�rentes m�thode de pr�-traitement utilis�.

Les caract�ristiques sont les suivantes:

Texte de la fonction. Le texte peut �tre plus facilement d�termin�e � partir du texte diff�rent, le texte est souvent similaire au nombre de mots et le nombre de caract�res sont plus proches seront les mots identiques ou similaires, et la distance d'�dition est plus courte. Pendant ce temps, l'utilisation des mots-cl�s poids-idf tf sera �lev�, au lieu de l'utiliser pour extraire un nombre de fonctionnalit�s plus efficace. Ce qui suit est le texte de l'utilisation des caract�ristiques:

caract�res Distance: la diff�rence entre le nombre de q2 q1 et caract�res �chelle de valeur absolue.
Mot distance: le m�me mot poids tf-idf et repr�sentaient tous les mots tf-idf poids et proportions, q1 et q2 m�me nombre de mots, la proportion du nombre de tous les mots, q1 et � distance de Jaccard q2 mot du nombre d'intersection, mots q1 et q2, et d�finir le nombre, la diff�rence entre le nombre de mots et ainsi de suite.
Caract�re distance fuzzywuzzy: utiliser le calcul de la distance de modifier les caract�res fuzzywuzzy et ainsi de suite.
Mot fuzzywuzzy Distance: calcul�e en utilisant la distance d'�dition fuzzywuzzy mot et ainsi de suite.

vecteur Caract�r. Trois vecteurs ont �t� mots utilis�s: vecteur officiel de texte, l'utilisation de la formation des donn�es officielles, les donn�es pr�visionnelles, la formation des mots de donn�es sans �tiquette vectorielle, ainsi que vecteur de mot apr�s la suppression de la formation des mots d'arr�t. Bien que petit ensemble de formation et de test ensemble quantit� de donn�es, mais en utilisant le vecteur de mot d�riv� de leur formation afin de mieux refl�ter la nature des donn�es. �tant donn� que les longueurs de mots des deux questions ne sont pas �gaux, et des diff�rences similaires dans l'ordre des mots des phrases grandes, vous voulez utiliser le calcul vecteur de mot de similarit�, nous devons convertir des mots en phrases vecteur vecteur mot vecteur du probl�me, nous avons d� obtenir deux traitements vecteurs de phrases de la m�me dimension avec le vecteur de mot, � savoir mot vecteur tous les mots de la moyenne, vecteur mot norme de tous les mots et en divisant le vecteur de mot de mot, utilisant � la fois la similarit� des phrases de vecteur est calcul� � partir du vecteur de mot angle calcul similitudes entre les deux probl�mes. Nous utilisons le vecteur de mot a �t� construit les caract�ristiques suivantes:

Q1 et Q2 Mots mots vecteur moyen du vecteur moyen de similarit�, calcul de similarit� comprenant cosinus, cityblock, Canberra, euclidienne, Minkowski, braycurtis, ces distances diff�rentes de diff�rents angles pour mesurer le degr� de similitude.
mot de q1 q1 divisant vecteur de mot et la norme vectorielle des vecteurs de similarit� de mot q2 q2 et mot de vecteur 2 divis� par la norme, le calcul de similarit� comprenant cosinus, cityblock ,, Canberra, euclidienne, Minkowski, braycurtis.
Le vecteur de mot calcul des probl�mes Distance de Word Mover.
Extraits des mots-cl�s � la fois selon les questions valeur-idf tf mot de deux questions, calcul de similarit� mot-cl� vecteur cosinus mot. Deux probl�mes en raison de la plupart des mots critiques ne causent pas des peines similaires ne sont pas similaires, de sorte que le calcul du probl�me d'abord par mot-cl� tf-idf, puis calculer le vecteur mot-cl� similarit� de mots.

mod�le sujet dispose. mod�le sujet est couramment utilis� similitude texte mod�le de calcul, en utilisant le mod�le de sujet pour extraire le texte des caract�ristiques de similarit� se joindre � notre mod�le a grandement am�lior� la capacit� de g�n�ralisation du mod�le. Nous utilisons LSI et le mod�le LDA pour cartographier la phrase sujet � l'espace vectoriel de faible dimension, en raison du th�me faible vectoriel de dimension, vous pouvez utiliser le vecteur et moins caract�ristique de th�me directe susceptible de conduire � un mod�le surajustement, et peut venir aux deux questions bas�es sur le vecteur de th�me dans lequel la similitude calcul des vecteurs li�s refl�tent directement l'objet des deux probl�mes sont similaires, en utilisant la fonction de mod�le suivants concernant:

q1, sujets q2 comme le LSI 3,5,7,9, vecteur th�me LDA
La valeur absolue de q1, th�me q2 diff�rence de vecteur
Similarit� q1, vecteur th�me q2

suit Pr�traitement:

Texte original: 1,2,3,4, texte deux probl�mes en utilisant une grande diff�rence par rapport � l'�chantillon dans laquelle pr�f�rent diff�rentes.
+ Petite lettre � la ponctuation: dans laquelle 1,2,3,4,5,6,7,8,9,10,11 utilis�, ou non modifier substantiellement la s�mantique de la ponctuation, les majuscules et les lettres minuscules texte s�mantique court il est pas affect�, il est converti en minuscules et la ponctuation pour extraire des caract�ristiques plus efficace.
+ Ponctuation � petite lettre mot + 2-tuple: en utilisant une fonction 2,4,9,10,11, n m�tamod�le mod�le populaire pour le traitement du langage naturel en utilisant un mot n-uplet caract�ristiques extraites � un mod�le mot augmente informations entre l'ordre des mots.
Aller ponctuation + pour + petite lettre pour mettre fin � des mots: en utilisant la fonction 1,2,3,4,5,6,7,8,9,10,11, les mots d'arr�t sont souvent pas de v�ritable sens, puis retirez les mots d'arr�t mod�le caract�ristique d'extraction afin d'am�liorer les mots non-stop de l'information.
Aller cl� ponctuation + � petite lettre mot + mot + pour d�sactiver le 2-tuple: l'utilisation des fonctionnalit�s 2,4,11
Aller ponctuation + pour + petite lettre � l'intersection des probl�mes de mots: utilisation 1,3,4,5,6,7,8,9,10,11 fonction des caract�ristiques du mod�le d'extraction donnent le mot pour �liminer l'intersection des probl�mes am�lior� non-intersection du mot informations.

donn�es non marqu�es � l'aide:

donn�es non marqu�es inclus espagnol vers l'anglais et l'explication des r�gles du jeu ne peuvent pas utiliser l'interface de traduction, donc d'abord nous formons un mod�le de traduction, mais parce que trop peu de donn�es de formation, qui ont s�rieusement mod�le surajustement, et enfin nous abandonnons l'utilisation de la traduction mod�le.

Apr�s l'analyse des donn�es trouv�es ensemble de donn�es sans �tiquette contient la traduction anglaise des parties du jeu de test, nous utilisons donc la domination espagnole pure de la traduction anglaise de l'ensemble de test ont �t� extraites des donn�es sans �tiquette, afin que nous puissions former de la part du mod�le anglais et jeu de test pr�visions. Il a �t� constat� que lorsque nous utilisons un match faible, bien plus peut �tre adapt� au droit anglais, mais l'effet est pas en ligne, � travers l'analyse a r�v�l� qu'il ya une faible erreur de mappage de correspondance, mais une fois l'erreur de cartographie peut facilement �tre pr�dite � un proche de 0 la valeur de probabilit�, et le cas �ch�ant, l'�tiquette d'origine, l'�chantillon est de 1, la perte devient importante, donc nous essayons de faire un match de correspondance exacte, malgr� ce petit �chantillon appari�.

Selon notre m�thode de correspondance plus pr�cise, l'ensemble de test dans la liste A, on peut en extraire de l'essai 50002888, a port� sur le tableau de test B, on peut en extraire de 10.0004334 tests. Un tableau dans l'utilisation du mod�le de formation en anglais pour pr�dire que 2888 tests Ensemble du mod�le valid�, l'int�gration mod�le espagnol et en anglais sur la liste A peut am�liorer le score de 0,003 � 0,004, en raison de l'�chantillon a repr�sent� plus de matches sur la liste B moins, peut augmenter l'effet sera r�duit.

D'apr�s les exp�riences, nous d�montrons l'efficacit� du mod�le anglais, si vous utilisez la traduction anglaise de l'interface peut certainement obtenir de meilleurs r�sultats, en plus, peuvent �tre traduits dans plusieurs langues pour faire la mise en valeur des donn�es.

v�rification

Nous avons utilis� les deux modes d'authentification suivants.

validation Irr�ductible:

Depuis la suite de tests sont de langue maternelle espagnole, et un ensemble de formation donn�e est divis�e en deux cat�gories, l'une est de 20.000 paires traduits de l'anglais de l'espagnol, une classe de 1400 traduction de l'espagnol sur l'anglais. De toute �vidence, les 1400 paires espagnol est plus appropri� pour faire la v�rification, ensemble de validation et parce que le test en ligne est proportion in�gale des positifs et n�gatifs, donc nous copions l'�chantillon espagnol 1400 paires et ajustons la proportion d'�chantillons positifs et n�gatifs, et, finalement, obtenir 34,061 paires ensemble de validation, en m�me temps nous rempla�ons � plusieurs reprises le mod�le de semences de nombres al�atoires, en prenant la moyenne de plusieurs mod�les pour pr�dire l'ensemble de validation pour obtenir le score final de l'ensemble de validation. Une fois la liste A des points de contr�le, l'am�lioration du score de pr�diction de jeu de validation et de mise � niveau Une liste des scores pour maintenir un bon accord.

validation k fois:

�tant donn� que l'ensemble de donn�es est faible, seulement utiliser une m�thode de v�rification ne garantit pas la capacit� de g�n�ralisation du mod�le, donc nous utilisons �galement l'ensemble de la formation de 21.400 paires de plus de dix fois la validation crois�e. Dans chaque fois, nous avons mis de c�t� dans le cadre d'un ensemble de validation, dans le cadre d'un ensemble de test, et le reste de l'ensemble de la formation. La prise en compte d'un seul partitionnement de donn�es, la diff�rence distribution des donn�es plus des donn�es de distribution et de l'ensemble de test peuvent �tre diff�rents, de sorte que le r�sultat de la v�rification peut �tre incompatible avec la ligne de fil, nous avons donc mis une graine al�atoire pour g�n�rer plus divis�e . Super r�glage des param�tres des lignes du mod�le de cette fa�on d'obtenir une meilleure coh�rence de la ligne. Lorsque les param�tres de mod�le ultra sensiblement d�termin�s, on utilise ensuite une m�thode de validation crois�e g�n�rale pour former le mod�le, de telle sorte que chaque fois plus de donn�es d'apprentissage.

S�lection mod�le, mod�le d'int�gration

Dans le choix du mod�le, nous utilisons principalement la profondeur du mod�le de r�seau de neurones, y compris trois types de structure de r�seau. Dans l'exp�rience, nous avons test� une vari�t� de formes de mots int�gr�e, nous avons utilis� le vecteur de mot donn� de 300 dimensions, et 128 mot form� dimensions vecteur � travers un corpus donn�. Nous avons trouv� gr�ce � des exp�riences en utilisant un corpus vecteur mot form� pour atteindre logloss bas, cela peut �tre parce que le vecteur de parole d'un corpus donn� de la formation sur la base du probl�me lui-m�me cibl�, peut apprendre � une meilleure repr�sentation de la t�che; De plus, nous avons �galement test� les caract�res tri-lettres et convolution, parce que les r�sultats exp�rimentaux ne sont pas d�finitifs inutilis�s.

Un mod�le: M-CNN

Le mod�le est un mod�le d'appariement s�mantique par notre innovation ind�pendante. Int�gration premi�re utilisation de q1, q2 pour coder chaque mot extraction de caract�ristique s�mantique, puis apr�s le mot traits s�mantiques sont normalis�s � BN, puis nous utilisons diff�rentes couches de construction de convolution de filtre de taille, chacun du filtre pour extraire une caract�ristiques s�mantiques partiels, le filtre plus la dur�e s�mantique partiel plus grand. Ici, nous utilisons le CONV1-conv5 et maxpooling obtenir cinq diff�rents vecteur de phrase s�mantique caract�ristique, puis q1 et q2 vecteurs locaux de caract�ristiques s�mantiques correspondant � la similitude cosinus peut �tre obtenu cinq similarit� cosinus, nous avons �galement ajout� les caract�ristiques transversales similaires , y compris COS1 * Cos2, COS1 * COS3, COS1 * COS4, concat ensuite reli�s pour former une nouvelle couche de pr�sentation, et enfin � travers dense, Prelu, chute de tension, BN, la sortie pour obtenir un r�sultat de correspondance final. En outre, nous avons effectu� une optimisation plus pouss�e, on q1 and Embedding, q2 matrice de similarit� cosinus est calcul�, o� tous les vecteurs de chaque mot par mot le mot et l'autre extr�mit� de la similarit� du cosinus de la composition, et nous avons retenu la similarit� comme le TOP10 mot s�mantique, puis convolutionnel, maxpooling, dense pour obtenir un degr� suppl�mentaire de mise en correspondance, et enfin ajout� � la concat � Cos. Depuis l'ind�pendance de l'ordre de q1 et q2, donc ici Embedding, convolution BatchNormlization et toutes les couches sont partag�es.

Mod�le 2: Attention d�composable

L'alignement est le noyau du mod�le, � savoir la correspondance entre les mots et les mots, l'alignement utilis� dans les deux endroits, qui participent � un cadre, sont utilis�es pour calculer la relation entre l'attention de deux phrases, comparer l'autre partie, mot entre deux phrases pour comparer chacune des unit�s de traitement sont bas�es sur le mot, et enfin avec les r�seaux de neurones, ne pr�disent qu'il n'utilise pas le mot par rapport au moment de la peine, mais il est moins et les param�tres courir plus vite que le bloc, dans l'exp�rience a �galement obtenu de bons r�sultats.

Mod�le de trois: ESIM

D�composables Mod�le de l'attention pour le respect, apr�s l'ESIM Embedding ajout� couche BatchNormlization, la couche de projet, et la comparaison et les couches de l'original remplac� BiLSTM Dense. Ici, l'attention de raisonnement local (Local Inference Modeling) est aussi un processus, sauf qu'il est dans la s�quence de sortie LSTM calcul�e. En outre la mise en commun couche Pooled est effectu�e � chaque pas de temps de LSTM, mod�le ESIM avec de solides relations de synchronisation g�n�ralement capables d'obtenir de bons r�sultats dans le calendrier t�che d�licate, dans cette comp�tition, a �galement effectu� ESIM bien.

Utilisez la fonction dense que l'optimisation du mod�le de porte:

Nous utilisons le mot dans le texte du LightGBM, caract�ris� tf-idf, similitude mot de vecteur, LDA, LSI et ainsi de suite, alors que nous int�grons ces caract�ristiques � un mod�le d'apprentissage en profondeur, certaines des caract�ristiques que nous appelions fonction dense. A constat� que l'effet direct d'une couche de mod�le caract�ristique dense et concat nn est pas bon, on se r�f�re aux produits concepts de r�seaux de neurones et LSTM porte dans la conception, nous avons caract�ristique dense comme une porte � l'utilisation, nous utilisons la densit� dans l'exp�rience caract�ristique � travers toute la couche de connexion obtenue et la dimension sous-mod�le en tant que vecteur indiquant, puis ajouter la fonction d'activation sigmo�de, puis �l�ment sage-multiplication, de fa�on caract�ristique dense peut contr�ler le flux de sous-mod�les d'information, a trouv� exp�rimentalement que cette configuration dans chacun des sous sur le mod�le ont �t� grandement am�lior�es. Mod�le structure optimis�e est la suivante:

Porte-ESIM:

Nous avons fait cette comp�tition sur le mod�le est l'int�gration relativement simple, le r�sultat final combine les quatre mod�les, y compris la porte-M-CNN, Porte-DA, Porte-ESIM et LightGBM, pour ces quatre mod�les nous avons form�s en anglais et en espagnol version, la premi�re en deux langues ont �t� fusion pond�r�e, le r�sultat de la fusion des deux langues.

7. Beaucoup d'entre vous avant la deuxi�me place sur la liste, le facteur d�cisif dans la comp�tition pour obtenir le championnat quoi?

Propos� une porte d'architecture de r�seau � faire avec la fonction dense.
La conception de la structure de r�seau sur la base d'une pluralit� de similarit� locale CNN.
En utilisant deux authentification locale, ce qui permet de renforcer l'effet est plus stable.
Ne jamais correspondre les donn�es de l'�tiquette anglaise, la fusion du mod�le des deux langues.
L'utilisation de deux versions de la porte de la diff�renciation de la configuration des fonctionnalit�s denses, ce qui augmente la diff�rence dans le mod�le.
D'apr�s les donn�es officielles form�s vecteur fasttext mot, puisque le vecteur de mot dans la premi�re couche du r�seau, et prend beaucoup de param�tres, utiliser un autre mod�le de formation de vecteur de mot a une grande diff�rence.
Fusion LighGBM et le mod�le DNN.
Construit plusieurs structure du mod�le de diff�renciation, pour renforcer l'effet de fusion, ce qui augmente la stabilit� des r�sultats.
En utilisant diff�rentes m�thodes de pr�traitement des caract�ristiques structurelles pour am�liorer les caract�ristiques d'expression.
Plus m�thode de mesure de distance de vecteur de phrase, comprenant en combinaison mot moyenne de vecteur de distance, Distance Word Mover et les vecteurs TF-IDF avec le mot.
En utilisant LDA, LSI, fuzzywuzzy l'ajout de fonctionnalit�s comme la diversit�.

8. Vous avez particip� � de nombreuses comp�titions de classe d'exploration de donn�es telles que la Coupe KDD de cette ann�e, NeurIPS 2018 AutoML, ces �v�nements ont en commun ce? Quels sont vos crit�res de s�lection des �v�nements?

Ce sont la conf�rence acad�mique sup�rieure organis�e par le jeu, le jeu de haute qualit�, l'impact �lev�, il y a beaucoup de concurrents exp�riment�s et tr�s forts.

Le concours principal est nos int�r�ts personnels, nous avons particip� � un certain nombre de diff�rents types de jeux, principalement utilis�s dans les applications de donn�es industrielles. Dans le jeu, nous avons l'occasion de vraiment r�soudre ces probl�mes pour les applications industrielles, ce qui nous fait un bon sens de l'accomplissement, donc nous n'avons pas des crit�res stricts d'�v�nements de s�lection, d'apprendre quelque chose du jeu et r�soudre le probl�me des applications industrielles est � nos crit�res de s�lection .

9. Pour la participation r�guli�re des �l�ves de jeu de classe d'apprentissage machine ce que de bons conseils et de l'exp�rience � partager? Comment puis-je faire comme votre score?

participent souvent � l'apprentissage des �l�ves machine de classe de comp�tition sont g�n�ralement �tudiants int�ress�s par concours d'apprentissage de la machine, une � l'�cole, un peu de travail, les �tudiants sont g�n�ralement plus � l'�cole, au service relativement moins.

Pour les �tudiants, la participation � la comp�tition d'apprentissage de la machine peut am�liorer rapidement leurs comp�tences professionnelles, mais aussi � l'accumulation de l'exp�rience pratique, d'une grande aide � obtenir des stages et la recherche de travail, pour servir les �tudiants qui esp�rent concours amateur tout en apprenant � �tre en mesure de quelque chose de la course appliqu�e aux travaux en cours dans le pass�, parce que la course prend beaucoup de temps, a �galement sugg�r� que l'�quipe a relativement plus de temps � l'�cole, esp�re aussi que la riche exp�rience des �tudiants participants peut �tre beaucoup � partager avec avec de nouvelles personnes.

En fait, l'Internet a beaucoup d'exp�rience � part, notre part est simple: pour plus de partage de papier et la t�che des �quipes gagnantes, plus de r�flexion, peut �tre combin� avec les sc�narios d'affaires r�els pour des t�ches sp�cifiques exploration en profondeur.

Atteindre les meilleurs r�sultats dans l'apprentissage machine non seulement � la force de la concurrence a �galement besoin d'un peu de chance, l'�tat d'esprit d�tendu, avec l'attitude d'apprendre � jouer le jeu, le jeu dans le processus, afin d'am�liorer leur capacit� � rencontrer d'autres amis ayant des int�r�ts similaires, c'est la plus grande r�ussite.

Lei Feng Lei Feng net net

Route de la soie

Apprenez � conna�tre la Chine

CIKM AnalytiCup 2018 programme de championnat est sorti, ils ont construit un mod�le pour voir l'astuce