Code d�taill�: Construction d'une matrice de voisinage avec Python

Comment construire une matrice de voisinage? Seule la connaissance th�orique, la compr�hension difficile approfondie de la question.

Dans cet article, nous avons un mod�le � titre d'exemple:

\ Tilde {Y} = W \ cdot YY ~ = WY

O� W est une matrice, il peut �tre d�fini comme (par exemple):

w_ {ij} = 1wij = 1

Lorsque j dans le plus proche i K, Wij = 1, 0 sinon.

Ci-dessous, nous allons introduire les m�thodes en utilisant numpy, scipy et la visualisation de matplotlib pour cr�er une matrice W en d�tail.

Les donn�es d'�chantillon

Pour parvenir � des fins de d�monstration, nous avons cr�� un cube virtuel, la taille des �chantillons de formation N = 12, M = 3 �chantillons d'essai:

importer numpy comme np

XY_train = np.array (, , , , , , >)

XY_test = np.array (, , , >)

Le regard de d�posons sur la distribution de ces points: le point rouge est les donn�es de formation, tandis que Green Point est les donn�es de test.

quartier � la recherche

quartier � la recherche d'outils modernes sont tr�s simples. Ici, nous avons choisi d'utiliser scipy, parce que les autres outils de ce paquet plus tard, mais sklearn ou d'autres paquets peuvent aussi faire le travail. Lors de l'utilisation scipy, d'abord cr�er un cKDTree en utilisant l'ensemble des donn�es de formation:

de cKDTree d'importation scipy.spatial

arbre = cKDTree (XY_train)

L'arbre se trouve � nouveau:

K = 3

entra�ner = tree.query (XY_test, k = K)

Trois ici, nous avons besoin d'�chantillons d'essai des �l�ments de l'�chantillon de formation le plus proche voisin. Par d�faut, l'indice tree.query de retour et de la distance de corr�lation de voisinage. Nous retiendrons les deux.

distances, indices = r�sultat

l'accent sur Let tableau index�.

array (, , , >)

Numpy r�seau est un index de tableau, comprenant M (nombre d'�chantillons test�s) rang�es et K (le nombre de voisins) colonne. Alors, comment le convertir en une matrice nous en avons besoin? Les exemples sont les suivants:

Voir le quartier s�lectionn� dans une parcelle dans ce sera int�ressant:

matplotlib.pyplot importation comme plt

n = 0 # premier �l�ment dans l'ensemble de donn�es de test

xy_test = XY_test

Index = indices

voisins = XY_train

plt.clf ()

plt.scatter (xy_test , xy_test , color = "red")

plt.scatter (voisins , voisins , color = "blue")

plt.xlabel ( "x")

plt.ylabel ( "y")

plt.xlim (-2, 2)

plt.ylim (-2, 2)

plt.show ()

Bon, alors le quartier et recherche semblait �tre aussi efficace que pr�vu! Faites-nous savoir comment convertir un index de tableau de matrice est enti�rement disponible, notre objectif devrait �tre de:

111000000000

000111000000

000000111000

000000000111

�tant donn� que le test a �t� observ�e 0 (la premi�re ligne) est form� pour observer le voisinage de 0, 1 et 2, de sorte que le test a �t� observ� une (deuxi�me rang�e) dans le voisinage est la formation observ�e 3, 4 et 5, et ainsi de suite.

Cr�er une matrice

Tout d'abord, nous allons cr�er une telle matrice d'index � l'aide numpy:

importer numpy comme np

a = np.array ()

i =

# Array ()

Mais vous trouverez qu'il ne concerne pas les tableaux multidimensionnels.

Nous avons choisi la solution est d'utiliser la matrice clairsem�e scipy, ce qui peut cr�er une liste d'index. Par exemple, pour cr�er une taille N = 4 dans la matrice diagonale utilisant une matrice creuse peut �tre exprim�e:

de rares d'importation scipy

i_index =

j_index =

values =

matrice = sparse.coo_matrix ((valeurs, (i_index, j_index)), forme = (4, 4))

impression (matrice)

# (0, 0) 1

# (1, 1) 1

# (2, 2) 1

# (3, 3) 1

SciPy Ainsi l'obtention d'un premier �l�ment de r�seau i_index j_index et i et j, et le premier �l�ment du tableau de valeurs dans la matrice finale Situation. Ou en d'autres termes, la valeur z�ro est de 1 ...... autres �l�ments non sp�cifi�s ailleurs la valeur de l'�l�ment (0,0) est �gal � 1, la valeur de l'�l�ment (1,1).

Si vous pr�f�rez la repr�sentation de tableau, vous pouvez saisir le code ci-dessous pour voir les r�sultats:

matrix.toarray () # transforme la matrice clairsem�e dans un tableau numpy juste pour la visualisation

#array (,

# ,

# ,

# >)

Ici vous pouvez voir une matrice diagonale.

Prenons un exemple pour la seconde expliquer plus clairement tout. Maintenant, nous voulons cr�er est la matrice diagonale inverse:

array (, , , >)

Le code est le suivant:

i_index = # < == c'est le seul changement par rapport � l'exemple pr�c�dent!

j_index =

values =

matrice = sparse.coo_matrix ((valeurs, (i_index, j_index)), forme = (4, 4))

Note: Seulement lorsque la matrice est relativement faible pour passer � la repr�sentation clairsem�e de la repr�sentation dense, sinon il y aura des probl�mes de m�moire (raison de l'existence d'une matrice creuse!)

Comment cr�er une matrice W?
Pour matrice w, j_index (� savoir "colonne") correspondant � l'index adjacent:

j_index = indices.flatten ()

#ARRAY ()

Ensuite index de ligne i_index correspondant � l'indice de l'�chantillon de test, mais requiert des temps r�p�t�s K pour correspondre � la j_index tri�e:

i_index = np.repeat (np.array (plage (M), DTYPE = int), les r�p�titions = K, axe = 0) .ravel ()

#ARRAY ()

Cela signifie que dans la premi�re rang�e (indice de ligne 0) de 0, 1 et 2 auront un indice. Dans la premi�re colonne de la deuxi�me rang�e 3,4,5 (1) il y a un index ...... Si vous regardez la position des �chantillons de test / formation (premier chiffre) � nouveau, le r�sultat est le m�me!

Nous partons du principe que toute la valeur de � 1 �:

= valeurs np.ones (M * K) # M = nombre d'�chantillons de test, K = nombre de voisins

Ou il repr�sente une fonction en fonction de la distance, par exemple:

values = 1. / distances.flatten () ** 2

Enfin, notre matrice ressemble (une valeur de � 1 �):

matrice = sparse.coo_matrix ((valeurs, (i_index, j_index)), forme = (M, N))

# Array (,

# ,

# ,

# >)

Retour � notre question initiale
Maintenant, nous pouvons calculer le produit scalaire (matrice clairsem�e ou dense):

y_tilde = matrix.dot (y) # o� y a la forme (N,)

Enfin, le probl�me est r�solu, il!

Route de la soie

Apprenez � conna�tre la Chine

Code d�taill�: Construction d'une matrice de voisinage avec Python