La machine n'apprend pas: recherche s�mantiquement li�s app

Notre travail se heurtent souvent � la fa�on de trouver deux phrases similaires, telles que la fa�on de d�terminer la requ�te de recherche et requ�te ad similaire � la requ�te de recherche, et l'application est similaire � un autre, comme court texte similaire au syst�me de r�pondeur, et ainsi de suite. Ce qui est une bonne fa�on de le faire, voici un petit r�sum� de c'est personnel.

contenu:

Tout d'abord, les premiers r�sultats affich�s

En second lieu, le court texte similaire aux m�thodes couramment utilis�es

En troisi�me lieu, l'objet du mod�le d'application

Quatri�mement, construire un mod�le d'apprentissage profond

(A) d'abord affich� les r�sultats de l'ancienne m�thode, l'�chantillon est trait� requ�te de recherche et clique requ�te, le taux de pr�cision d'environ 95%

La figure 2 est un format d'�tiquette (semblable � 1, 0 est pas similaire), la pr�diction de l'�tiquette, une valeur (sup�rieure � 0 � 1 est pr�vu des �tiquettes), une requ�te de requ�te de recherche @ ad

(B) Nous m�thode utilis�e couramment: application de recherche s�mantiquement li�s (b) Sur le blog de court texte similaire --qjzcy

1, la m�thode de corr�lation de session

2, le proc�d� de vecteur de phrase: la g�n�ration d'un mod�le d'espace vectoriel pour une phrase (par exemple un poids de TFIDF), trouver la distance � partir de la formule (telle que cosinus)

3, la loi de saut multi-niveaux

4, la m�thode du mod�le de l'algorithme: mod�les et th�mes tels que comparer le mod�le de word2vector d'incendie

Application (c) mod�les sujet

Ici, dans le mod�le de sujet, nous avons en fait un probl�me avec la fa�on dont le mod�le de sujet? Prenez mod�le word2vector, il fournit vecteur de chaque mot, avec ce vecteur peut �tre une bonne calculer la similitude entre les deux mots, mais il y a une phrase en quelques mots comment bon, comment le calculer?

Plusieurs m�thodes:

1, chaque mot de la superposition de vecteur, cette m�thode est un peu rude, mais simple.

2, la premi�re m�thode possible, il est facile de penser du mot attention si nous pouvions obtenir une peine, lui donnant un effet de pond�ration est mieux, mais comment se concentrer sur le mot, mais aussi un probl�me (TFIDF clairement pas optimale, un Amway mots cl�s la fa�on dont je fais: http: //blog.csdn.net/qjzcy/article/details/51737059).

3, le vecteur directement � encha�ner dans un vecteur long, cette m�thode n'a pas l'exp�rience, mais pense qu'il ya beaucoup de questions, ou paresseux pour dire qu'une telle m�thode simple, jamais entendu une mauvaise personne ayant un effet positif ^ _ ^.

4, si le mot dans la phrase elle-m�me peut constituer un espace vectoriel � une dimension, le th�me de chaque mot, mais aussi une dimension vectorielle. Bien entendu, nous ne pouvons pas esp�rer r�soudre ce probl�me par convolution

Mod�le (quatre) pour construire l'apprentissage en profondeur

Question: Puisque nous voulons utiliser le mod�le de l'apprentissage en profondeur, alors comment faire le mod�le pour identifier nos donn�es initiales?

Nous pouvons:

1, respectivement, chaque phrase pour produire un vecteur de convolution, en utilisant ce vecteur et distance de recherche

Par exemple, le mod�le Microsoft

2, la phrase est �galement appliqu�e en tant que mot caract�ristique dans le train avec

Par exemple, ce document suit l'id�e de word2vector:

Repr�sentations distribu�es des peines et des documents

3, je fais: les deux phrases �piss� dans une phrase, s�par�s par identification, formant ainsi une structure de donn�es 2D en entr�e, avec formation cnn

Je pr�f�re cette m�thode car elle est plus simple structure de donn�es, nous permet de nous concentrer sur de se concentrer sur d'autres aspects de la structure du mod�le.

R�soudre le probl�me que nous avons couru dans le regard du mod�le, Duang! mod�le d'optimisation sera en mesure de faire ce taux presque aucune pr�cision d'environ 93%, et bien s�r la profondeur ont encore beaucoup � apprendre � faire de la science.

Route de la soie

Apprenez � conna�tre la Chine

La machine n'apprend pas: recherche s�mantiquement li�s app - court texte similaire