Avec des données scientifiques sur Python: Vous avez oublié le concept de 8

Lei Feng note de réseau AI Yanxishe: Cet article est une compilation du groupe de sous-titre Lei blog technologie de réseau Feng, le titre original Python pour la science des données: 8 Concepts Vous pouvez avoir oublié, auteur Conor Dewey.

Traduction | Pangyou Zhen, finition Huang Zhongjie | Ling deux

problème

Si vous vous trouvez encore et encore la même question de rechercher, de grammaire ou de concepts dans la programmation, alors vous n'êtes pas seul.

Je me suis si souvent.

Bien que les sites de recherche StackOverflow et d'autres ressources est normal, mais il à votre avantage est relativement faible, et augmentera votre compréhension des difficultés de la langue.

Nous vivons dans une ère semble d'avoir à l'information illimitée et des ressources gratuits illimités, il semble mettre la question de recherche est résolu. Toutefois, cela peut être à la fois une bénédiction et une malédiction. Si vous ne pouvez pas gérer efficacement et intégrer, dépendance excessive à ces ressources bloquera nos progrès à long terme.

Source: xkcd

Je me suis retrouvé plusieurs fois pour copier et modifier le code du forum, plutôt que de prendre le temps d'apprendre et de consolider les connaissances peuvent me rencontrer la prochaine fois.

Cette méthode est paresseux. Bien que cette approche peut être une résistance à court terme est relativement faible, mais elle finira par nuire à votre croissance, l'efficacité et la capacité de la syntaxe de rappel.

objectif

J'ai récemment Udemy par un cours en ligne sur « Data Science et Machine Learning Python » nommé. A travers cette série de cours, je compilé une partie de mon analyse de données Python ignoré la syntaxe et les concepts.

Afin de consolider ma compréhension de ces concepts et vous faciliter la recherche Stackoverflow, ici je trié je suis en utilisant Python, certains points de connaissances NumPy, Pandas dans.

Pour chaque connaissance que j'ai donné une brève description et des exemples. De plus, je donne également une vidéo et des liens vers d'autres informations, ce qui contribuera à approfondir la compréhension des points de connaissances.

Liste compréhensions

Lorsque le cycle d'écriture, chaque liste de définition est tout à fait un tas de ennuyeux. Heureusement, Python construit une méthode appelée compréhensions de la liste, cette méthode utilise une seule ligne de code peut résoudre ce problème. Liste de début compréhensions peut être difficile pour vous, mais une fois que vous connaissez, vous utilisera souvent.

Source: Trey Hunner

Ce qui suit est un premier exemple de la formulation de chaque élément des exigences ordinaires de la place, et le second est une liste d'écriture de type dérivé.

x =

out =

pour objet x:

out.append (article ** 2)

imprimer (out)

# Vs.

x =

out =

imprimer (out)

fonction lambda

Certains seulement besoin de quelques fonctions dont vous avez besoin pour définir une nouvelle fonction, si vous êtes fatigué de ce encore? fonction lambda peut résoudre ce problème! fonction Python Lambda est couramment utilisé pour construire un nombre relativement restreint d'applications de fonction anonyme. C'est, vous permet de construire une fonction sans nom.

syntaxe de base des fonctions Lambda est la suivante:

arguments lambda: expression

Fonction ordinaire peut faire, les fonctions Lambda sont également en mesure de le faire, aussi longtemps que possible en une seule ligne. Les exemples et vidéo simples suivants peuvent vous faire mieux comprendre la puissance de la fonction Lambda.

double-lambda = x: x * 2

impression (double (5))

10

Carte des fonctions de fonction et filtre

Lorsque vous avez maîtrisé la fonction Lambda, puis être utilisé avec les fonctions Lambda et plan, les fonctions de filtrage, vous trouverez une puissance énorme. Plus précisément, la carte par utilisation de la fonction de chaque élément dans la liste, la liste dans une nouvelle liste. Dans l'exemple ci-dessous, la fonction de la carte est multiplié par chaque élément 2, en un nouvel élément. Notez que cette liste est tout simplement en fonction du résultat dans le type de liste de sortie.

# Carte

seq =

résultat = liste (carte (lambda var: var * 2, seq))

impression (suite)

Filtre fonction de la carte de fonction est similaire, mais la fonction de filtre en comparant chaque élément est extrait de la liste initiale des sous-ensemble.

# Filtre

seq =

entraîner = liste (filtre (lambda x: x >  2, seq))

impression (suite)

Python: Lambda, Carte, Filtre, moins Fonctions:

https://youtu.be/cKlnR-CB3tk

fonction Arange et la fonction linspace

Créez rapidement simples tableau numpy, l'utilisation et les fonctions de arange linspace le plus approprié. Chacun a sa propre fonction spécifique, mais est utilisé ici (au lieu d'utiliser la gamme) dans son tableau numpy généré, les données sont généralement plus facile à utiliser SCIENCE.

Arange fonction, selon la gamme de longueur d'étape de début spécifiée et l'arrêt et l'étape de réglage, générer une séquence d'intervalles également espacés spécifiés. En plus de la valeur initiale et la valeur finale arrêt et de démarrage, l'étape ou étape peut également être le type de données défini selon les besoins. Il convient de noter que la valeur finale est une « coupure » valeur, il ne sera pas inclus dans le tableau génère.

# Np.arange (démarrage, arrêt, étape)

np.arange (3, 7, 2)

array ()

fonction linspace est très similaire, mais un peu différent. Le démarrage et l'arrêt de sa gamme spécifiée et le nombre num est fixé pour former un numéro de séquence spécifiée d'intervalle uniforme. Ainsi, étant donné un début de valeur de départ STOP et les valeurs de fin, et les valeurs numériques num, linspace fonction de partage dans cette gamme gamme NumPy. Énoncé axe pour la visualisation et des données cartographiques qui est utile.

# Np.linspace (démarrage, arrêt, num)

np.linspace (2.0, 3.0, num = 5)

array ()

Quel est l'axe Axe

Lorsque vous utilisez Pandas supprimer des colonnes ou à somme d'éléments de la matrice NumPy, vous pouvez rencontrer ce problème. Sinon, nous allons certainement rencontrer. Des exemples sont donnés ci-dessous pour colonnes de suppression:

df.drop ( 'Colonne A', axe = 1)

df.drop ( 'Row A', axe = 0)

Je me demande vraiment pourquoi ce besoin de déclarer un axe plusieurs fois avant, j'ai écrit cette ligne de code. À partir du code ci-dessus, vous pouvez travailler si nécessaire pour le fonctionnement de l'axe de la colonne est réglé sur 1, le fonctionnement de la ligne est réglé sur 0. Mais pourquoi? J'aime regarder les raisons, ou du moins je me souviens:

df.shape

(Nombre de lignes, nombre de colonnes)

Voir Pandas trame de données dans les déclarations de propriétés de forme d'un tuple, dans lequel la première valeur représente le nombre de lignes, la deuxième valeur indique le nombre de colonnes. Pensez méthode d'indexation en Python - 0 comportement 1, cette méthode nous est très similaire à déclarer un axe. Très intéressant, non?

Comment puis-je utiliser le paramètre « axe » en pandas géants?:

https://youtu.be/PtO3t6ynH-8

fonction concat, la fonction de fusion et la fonction Regrouper

Si vous êtes familier avec SQL, la méthode de fonction peut être plus facile à comprendre. En fait, ils sont essentiellement des méthodes ne sont que d'une certaine façon de fusion dataframe. En tout cas difficile de dire qui est le mieux, donc récapitulons.

fonction concat peut être combinée à une ou plusieurs sous ou à côté trame de données (en fonction de la façon dont l'arbre).

Fusionner fonction multiple combiné trame de données sur une colonne commune désignée comme la clé primaire.

Joignez-vous à la fusion de deux fonctions fonction de fusion dataframe manière similaire. Cependant, il est basé sur une fusion d'index dataframe, plutôt que certaines colonne spécifiée.

Pandas peuvent voir une excellente documentation pour un usage spécifique et un exemple plus précis, ainsi que certains usages spéciaux que vous pouvez rencontrer.

Youtube:

https://youtu.be/XMjSGGej9y8

Appliquer une fonction de Pandas

Vous pouvez appliquer une fonction de carte de fonction, mais il ne dataframe de Pandas, ou plus précisément la série pour fonctionner. Si vous n'êtes pas familier avec la série, en fait, il est très similaire aux tableaux numpy à bien des égards.

Appliquer la fonction vous dira spécifier une colonne ou la ligne chaque élément du rôle d'une fonction. Vous pouvez imaginer à quel point l'utilité de ce type particulier lorsque vous êtes des valeurs d'éléments normalisés et le fonctionnement des colonnes entières de dataframe sans avoir à cycle.

Python Pandas Youtube vidéos pédagogiques:

https://youtu.be/P_q0tkYqvSk

Pivot Tables de tableau croisé dynamique

Last but not least tableau croisé dynamique. Si vous êtes familier avec Microsoft Excel, vous avez probablement entendu parler d'un tableau croisé dynamique à certains égards. Pandas fonction intégrée pivot_table peut créer un style tableur tableau croisé dynamique est dataframe. Il convient de noter que le niveau des données stockées dans un tableau croisé dynamique et la création d'index dataframe niveau dans la colonne.

épilogue

J'espère que lorsque vous utilisez Python pour les opérations scientifiques Les données peuvent être importantes, mais certaines méthodes délicates, des fonctions et des concepts souvent rencontrés dans ralentir efficacement la mémoire des méthodes ci-dessus. Pour moi personnellement, les écrire et d'essayer d'expliquer en termes simples, ils sont plus d'approfondir ma compréhension de cette connaissance.

Lei Feng réseau compilé groupe de sous-titres.

Lien original:

https://towardsdatascience.com/python-for-data-science-8-concepts-you-may-have-forgotten-i-did-825966908393

surnom n ° ~

Mettre l'accent sur

le développement de la technologie AI AI et la croissance de l'cogniticien communauté de recherche d'emploi

Je suis né!

Bienvenue à visiter les liens ci-dessous le code ou d'analyse Expérience

https://club.leiphone.com/page/home

Liu Lirong franchement le jeu a perdu plus de Saipan 10 millions chute Jin parce que perdre de l'argent à long terme!
Précédent
Jackie humoriste a réuni envoyer la bénédiction de choix pour la fête Carnaval de Nouvel An « Detective Pu »
Prochain
Chongqing zoo a ajouté un nouveau membre, le sauvetage de la faune, a été sur la route!
Xin mouvement VS Fox, comme une voiture familiale choisiriez-vous?
Y-318 comment accrocheur nouvelles chaussures? Fermer le détail de la texture de sorte que vous ne pouvez pas tenir!
Huawei selfie warm nouveaux modèles, a laissé entendre qu'il pourrait être équipé de la conception « écran forage »!
Académie chinoise d'ingénierie Li Jun: Les principaux problèmes et les contre-mesures de développement de véhicules intelligents
« White Snake: Origins » réputation featurette fait le public a salué « la valeur est tout à donner. »
À côté du marché de la consommation à domicile sera la reconnaissance du produit matériel AI?
RNG nouveau single refait surface! Xiao Ming lui a demandé personnellement DGDP: considérant comment?
Les communications vocales sont contraints de mettre à niveau le réseau 4G, China Telecom ce mois d'essai technique d'appel VoLTE commercial!
dividendes ont gagné 2,9 milliards de fierté de 2,4 milliards! Le bonus de compagnie montrer leur richesse « cash Wall » est venu!
Cet accident 5 étoiles plusieurs VUS indépendants, un coffre-fort assez bas?
Meizu 16 séries problème production résolution, les utilisateurs concernés sur le navire amiral de l'année prochaine, le chapitre de divulguer des informations pertinentes!