Tutoriels de construction Python et ElasticSearch inclus Easy Search

l'apprentissage de la machine et le traitement du langage naturel

1 ElasticSearch Vue d'ensemble

Comprendre ES 1.1

ElasticSearch est un moteur de recherche bas� sur la biblioth�que Lucene. Il fournit un moteur de recherche distribu�, support multi-locataire texte int�gral, vous pouvez stocker rapidement, rechercher et analyser des quantit�s massives de donn�es. Il peut �tre utilis� pour rechercher une vari�t� de documents et le support multi-location. ElasticSearch besoin au moins 8 Java.

1.2 sc�narios d'application

boutique en ligne en ligne qui permet aux clients de rechercher des produits que vous vendez. Dans ce cas, vous pouvez utiliser ElasticSearch stocker l'ensemble du catalogue de produits et de l'inventaire, et de fournir des suggestions de recherche et de saisie semi-automatique pour eux.

ou la collecte et l'analyse des donn�es du journal des transactions et l'exploration de ces donn�es pour trouver des tendances, statistiques, sommaires ou anormale. Dans ce cas, vous pouvez utiliser Logstash pour collecter, agr�ger et analyser les donn�es, puis laissez Logstash ces donn�es � ElasticSearch. Une fois que les donn�es sont dans ElasticSearch, vous pouvez effectuer une recherche et d'agr�gation pour exploiter toute information qui vous int�resse.

plate-forme d'alerte de prix qui permet aux clients de sp�cifier une r�gle ma�trise des prix, tels que � Je suis int�ress� par l'achat d'un produit �lectronique, si le prix du gadget dans le mois suivant ci-dessous $ X de tout fournisseur, je veux �tre inform�. � . Dans ce cas, vous pouvez gratter le prix des fournisseurs, poussant dans ElasticSearch inverse et utiliser la fonction de recherche pour faire correspondre les changements de prix et les demandes des clients, et a finalement trouv� apr�s les alertes match Pouss� � ses clients.

1.3 Concepts cl�s

cluster de cluster: cluster est une collection d'un ou plusieurs nuds, qui, ensemble, sauvegarder vos donn�es et procurera indice commun et des capacit�s de recherche sur diff�rents tous les nuds.

noeuds nud: nud de cluster dans le cadre d'un seul serveur, le stockage de donn�es et de participer � l'indexation et la fonctionnalit� de recherche du cluster.

Index Index: index est une collection de documents caract�ristiques similaires. Indice identifi� par son nom, doit �tre en minuscules, dont le nom est utilis� dans l'ex�cution de l'indexation de documents, recherche, mise � jour et les op�rations de suppression lorsque les r�f�rences d'index.

Document Document: Document est l'unit� d'information de base peut �tre index�. Index qui fait r�f�rence � un document d'enregistrement unique.

fragmentation et r�plique: Index de grandes quantit�s de donn�es peuvent �tre stock�es dans un seul nud peut d�passer les limites mat�rielles. Pour r�soudre ce probl�me, ElasticSearch fournit une fonctionnalit� appel�e index subdivis� en plusieurs tranches.

1.4 Module de base

analyse: analyse lexicale et est principalement responsable du traitement de la langue, qui est, nous disons souvent le mot, peut se former en fin de compte la plus petite unit� de stockage ou de recherche � terme par le module.

Cr�ation d'emplois est principalement responsable de l'indice: Module d'index.

Module de magasin: la lecture et l'�criture est principalement responsable de l'indice, principalement parce que certaines op�rations de fichiers, son but principal est abstrait et ind�pendant de la plateforme de stockage du syst�me de fichiers.

modules QueryParser: principalement responsables de l'analyse de notre requ�te Lucene g�n�re la condition sous-jacente peut �tre identifi�e.

Module de recherche: principalement responsable du travail de l'index de recherche.

modules de similarit�: principalement responsables de la notation de la pertinence et de r�aliser le tri.

1.5 M�thodes d'extraction

simples requ�tes de mots: terme fait r�f�rence � une requ�te. Pour trouver une telle cha�ne contenant � Lucene � document, vous pouvez simplement trouver le terme � Lucene � dans le dictionnaire, puis obtenir la table invers�e correspondante dans la liste des documents peut �tre.

ET: fait r�f�rence � l'intersection de plusieurs collections. Pour trouver une telle cha�ne contient � la fois le document Lucene et Solr qui contient la cha�ne, puis regardez les �tapes suivantes: trouver dans le dictionnaire terme Lucene Lucene obtenir la liste des documents correspondants. TermSolr trouv� dans le dictionnaire, correspondant pour obtenir la liste des documents Solr. La liste combin�e, les listes de documents que l'intersection des deux op�rations.

OU: se r�f�re � une collection d'une pluralit� de rechercher et d'ensemble. Par exemple, pour trouver des documents qui contiennent la cha�ne qui contient la cha�ne luence ou Solr, vous trouverez les �tapes ci-dessus, deux documents listes de t�ches et op�rations de jeu, le r�sultat de la combinaison contiennent ou contient Lucene Solr.

NON: un moyen de diff�renciation pour d�finir une pluralit� d'ensembles. Pour trouver une telle cha�ne contenant une cha�ne Lucene Solr mais ne contient pas le document, regardez alors les �tapes ci-dessus, les listes de documents comme la diff�rence de deux op�rations de r�glage ont �t� inclus dans l'ensemble de la documentation comprend Lucene Solr moins l'ensemble des documents, apr�s l'op�ration le r�sultat est inclus, mais ne contient pas Solr Lucene.

2 ES caract�ristiques et avantages et inconv�nients

2.1 Propri�t�s ES

ElasticSearch �volutive structur� et des donn�es non structur�es jusqu'au niveau PB.

ElasticSearch peut �tre utilis� pour remplacer le stockage MongoDB de documents et d'autres t�ches.

ElasticSearch utilisation de non standardis� pour am�liorer les performances de recherche.

ElasticSearch est l'un de la soci�t� de moteur de recherche populaire, actuellement utilis�e comme Wikip�dia, GitHub et ainsi de suite.

ElasticSearch est open source, disponible sous la licence Apache version 2.0.

2.2 avantage ES

ElasticSearch est un d�veloppement Java, ce qui le rend compatible avec presque toutes les plateformes.

ElasticSearch en temps r�el.

ElasticSearch est distribu�, ce qui le rend facile � �tendre et � int�grer dans toute grande organisation.

En comparaison avec Apache Solr, tr�s facile � manipuler plusieurs tenance ElasticSearch en.

ElasticSearch en utilisant un objet JSON en tant que r�ponse.

ElasticSearch prend en charge presque la plupart des types de documents, mais ne supporte pas le type de document texte rendu.

2.3 lacunes ES

ElasticSearch prennent pas en charge plusieurs langues et formats de donn�es dans le traitement des demandes et des r�ponses donn�es (disponible uniquement en JSON), ne peut pas �tre utilis� contrairement � l'Apache Solr CSV, format XML et similaires.

ElasticSearch l�sions c�r�brales, il y a des probl�mes, se produira bien dans de rares cas.

3 installation et le d�ploiement ES

Ce document utilise l'installation ElasticSearch sous Win10, bien s�r, pour installer Linux plus facile op�ration. Apr�s avoir termin� l'installation de package ElasticSearch de python, et le cas Interact.

La premi�re �tape: v�rifier l'�tat

ElasticSearch besoin au moins Java 8, premier besoin java -version voir la version actuelle.

�tape 2: Installer ES

Utilis� ici ElasticSearch-7.1.0-windows-x86_64 Lien de t�l�chargement: https://pan.baidu.com/s/1k5AOGpMy8uJEXtA6KoNb7g Code d'extraction: qtmj.

bin: les instances ElasticSearch requis pour ex�cuter des scripts et plug-in de gestion

Le r�pertoire dans lequel le fichier de configuration: confg

lib: utilisation de la biblioth�que ElasticSearch

Tous les emplacements de m�moire utilis�s pour les donn�es ElasticSearch: donn�es

journaux: le fichier journal des �v�nements et de l'erreur sur la

plugins: o� stocker les plug-ins install�s, tels que l'outil de segmentation de mot chinois

Puis ex�cuter bin / ElasticSearch (Mac ou Linux) ou bin \ elasticsearch.bat (Windows) pour d�marrer le ElasticSearch. Nous avons constat� que, apr�s la page de d�marrage ne sont pas des informations r�alistes, si le r�seau local test� Unicom:

d�faut g�n�ral se trouve, les donn�es requ�te montre en raison de probl�mes de pare-feu, test� pr�s du � pare-feu r�seau public �:

Nous allons ping dans IP locale:

A cette �poque, il a �t� d�montr� que le statut de ping, recommencer bin \ elasticsearch.bat (Windows), ouvrez http: // localhost: 9200 / affiche l'installation suivante a r�ussi ES.

� La troisi�me �tape: python install� ES

Le t�l�chargement est https://www.elastic.co/downloads/elasticsearch. Si les dispositions font r�f�rence � l'article sous Windows. Si les d�veloppeurs Python peuvent utiliser pip installer ElasticSearch installation.

4 ES pour construire la recherche en texte int�gral

4.1 Ins�rer des donn�es

Ouvrez l'environnement d'ex�cution python, premi�re importation d'importation ElasticSearch ElasticSearch [], puis �crire une m�thode pour ins�rer les donn�es:

�# Ins�rer des donn�es

�def InsertDatas ():

# L'h�te par d�faut est localhost, port, mais vous pouvez �galement sp�cifier l'h�te et le port � 9200.

es = ElasticSearch ()

es.create (indice = "my_index", DOC_TYPE = "test_type", id = 11, ignorer = , body = { "name": "python", "adr": 'Sichuan'})

# R�sultats de la requ�te

entra�ner = es.get (index = "my_index", DOC_TYPE = "test_type" id = 11)

imprimer ( � donn�es en un seul complet: \ n �, r�sultat)

Des exemples de ElasticSearch, � savoir, lorsque la valeur par d�faut est l'h�te NULL est localhost, le port 9200. Vous pouvez �galement sp�cifier IP r�seau et le port est vide. En cr�ant des index et des index des documents, cat�gorie DOC_TYPE id document, le corps pour ins�rer le contenu des donn�es, o� les donn�es ES uniquement support type JSON, ignorer = 409 ignorer l'exception. Les r�sultats sont les suivants:

4,2 insert en vrac donn�es

Le cas ci-dessus, nous ins�rons un message, requ�te et afficher un certain nombre de param�tres, y compris l'indexation, type de document, le document ID unique qui identifie le num�ro de version. Qui contient des informations de ressource de donn�es, si nous voulons ins�rer plusieurs �l�ments d'information peuvent se r�f�rer au code suivant:

�# ins�rer des donn�es en vrac

�def AddDatas ():

es = ElasticSearch ()

donn�es =

pour i, les donn�es �num�ration (donn�es):

es.create (indice = "my_index", DOC_TYPE = "test_type",

�id = i, ignorer = , body = donn�es)

# R�sultats de la requ�te

entra�ner = es.get (index = "my_index", DOC_TYPE = "test_type" id = 0)

print ( '\ n complet d'insertion en bloc de donn�es: \ n', r�sultat )

Nous mettons donn�es liste des donn�es, si nous JSON les donn�es sont stock�es dans un fichier, vous pouvez �galement lire des messages texte et stock�s dans les donn�es, le peut �tre ins�r� suivant. J'ai utilis� ce dans le fichier �num�ration num�ro d'identification ou un nombre al�atoire peut �galement �tre utilis� pour sp�cifier le format. Apr�s tout ins�rer notre premier identifiant de requ�te d'information de s�lection = 0, o� les diff�rentes requ�tes ci-dessus, nous examinons le contenu de l'article peut �tre le r�sultat employ�e m�thode, les r�sultats suivants:

4.3 Donn�es de mise � jour

Si nous ins�rons les donn�es en question, nous voulons modifier. m�thode de mise � jour peut �tre utilis�, il y a contact avec notre MySQL, MongoDB et d'autres instructions SQL similaires. La seule note que nous avons mis � jour les donn�es lors de l'utilisation { � doc �: { � name �: � python1 �, � adr �: � Shenzhen 1 �}} en mode dictionnaire, en particulier logo doc ne peut pas oublier le code pour obtenir les r�sultats suivants:

�# 3 Mise � jour des donn�es

def UpdateDatas ():

es = ElasticSearch ()

es.update (indice = "my_index", DOC_TYPE = "test_type", id = 11, ignorer = , body = { "doc": { "name": "python1", "adr": "Shenzhen 1" }})

# R�sultats de mise � jour

entra�ner = es.get (index = "my_index", DOC_TYPE = "test_type" id = 11)

print ( '\ n id = 11 mise � jour des donn�es est termin�e: \ t', r�sultat )

nous voulons juste ici pour savoir si le champ Nom de l'information mise � jour peut �tre utilis� plus tard la source ajout� m�thode, pourquoi avez-vous le d�finissez? Voir l'analyse des donn�es ins�rer des r�sultats d'exploitation.

4.4 aux donn�es de suppression

Il est relativement simple, nous sp�cifions un index des documents, types de documents et ID de document peut �tre.

�# Supprimer les donn�es

�def DeleteDatas ():

es = ElasticSearch ()

entra�ner = es.delete (index = 'my_index', DOC_TYPE = 'test_type', id = 11)

imprimer ( '\ n suppression des donn�es ach�vement id = 11: \ t')

Les donn�es de 4.5 Conditions

Nous ins�rons les donn�es pour cr�er des donn�es simples I, si nous voulons obtenir tous les documents dans l'index peuvent �tre utilis�s { � requ�te �: { � match_all �: {}}} requ�te de crit�res, il est � craindre d�sign� est la m�thode de recherche utilis�e, ci-dessus requ�te des donn�es en utilisant la m�thode get, en fait, les deux peuvent �tre utilis�s comme une requ�te. Code est la suivante:

�# Requ�te Condition

�def ParaSearch ():

es = ElasticSearch ()

query1 = es.search (indice = "my_index", body = { "requ�te": { "match_all": {}}})

print ( '\ n interroger tous les documents \ n', query1)

query2 = es.search (indice = "my_index", body = { "requ�te": { "terme": { 'name': 'python'}}})

print ( '\ n Trouvez le nom de la documentation Python: \ n', query2 )

Nous obtenons un index de toutes les informations de documents

Obtenir les informations contenues dans le nom du document de Python

Cet article de l'apprentissage de la machine et � la cr�ation de traitement du langage naturel, nous pouvons nous concentrer ondes ~

Ici, l'enseignant � partager avec vous leur propre sorte de bien ce cours d'apprentissage Python, l'espoir que nous pouvons en tirer des le�ons, en particulier pour les d�butants Python pratique, quatri�me ann�e de ma fille, alors je lui laisse commencer un petit apprentissage des langues de programmation pour les deux langage Java et Python, je laisse mes filles commenc� � apprendre Python, puis d'apprendre une autre langue de programmation, Python est aussi la nature concise d�termine la priorit�, mais nous avons pr�f�r� a d�cid� s�lective!

Eh bien, a d�clar� que les accusations ne parlaient pas beaucoup, juste leur dire d'apprendre la route, puis je l'ai �galement envoy� un il me souviens tr�s bien, nous pouvons sp�cifiquement regarder!

Python gamme compl�te de l'itin�raire d'apprentissage

La premi�re �tape: Python Mise en route de la deuxi�me phase: Python en profondeur et am�liorer Phase III: r�seau Python et la programmation concurrente quatri�me �tape: Base de donn�es de programmation Bases Phase V: Linux Programmation fondation sixi�me �tape Environnement: noyau Python propose septi�me �tape: Web la programmation huiti�me �tape Fundamentals: cadre Python_Django neuvi�me �tapes: apr�s l'entr�e: cadre Python_Tornado de la dixi�me �tape: Python_ principal fournisseur d'�lectricit� onzi�me �tape du projet: phase de d�veloppement des reptiles Python XII: entrevue d'emploi r�ussie et la treizi�me �tape Cheats la croissance rapide de la CTO

Fondamentaux vid�os Python vous pouvez professeur priv� lettre (apprentissage) ont �t� acquis, l'enseignant peut ne pas avoir le temps, nous avons le temps de le faire le plus t�t possible!

Route de la soie

Apprenez � conna�tre la Chine

Tutoriels de construction Python et ElasticSearch inclus Easy Search