Pourquoi programmeur SQL devrait savoir Python?

Les analystes de plus en plus sont à la recherche de nouvelles façons d'utiliser le traitement numérique Python et comprendre les données.

Auteur | Lipei Wang

Traducteur | Union soviétique, comme cela, Zebian | Guo Rui

Produit | RPSC ( ID: CSDNnews)

Ce qui suit est la traduction:

Python, l'un de l'outil préféré comme l'un des plus populaire langage de script, il est également l'analyse des données et la visualisation des données. En plus de la vaste gamme de la communauté des développeurs Python, il y a une équipe importante utilisée Python pour analyser les données, proposer des idées viables, et donc de prendre des décisions.

Python a un grand nombre de bibliothèques et la plate-forme d'aide, car les données peuvent être un outil d'exploration rapide et itérative. collection de la bibliothèque Python comprend tout de la visualisation à l'analyse statistique, ce qui peut aider les utilisateurs facilement accès aux données et commencer à identifier les tendances.

En plus de l'itération rapide dans les données et l'analyse statistique en dehors, Python, il y a beaucoup de tuyaux utilisés pour gérer les données et flux de travail des outils open source. Les analystes de plus en plus sont à la recherche de nouvelles façons d'utiliser le traitement numérique Python et comprendre les données.

Python quel est l'utilisation?

Python et SQL le même: il est en mesure de répondre à toutes les questions. Python est une grande communauté, et son taux d'adoption a augmenté.

Il y a beaucoup de bibliothèque Python facile à utiliser, vous pouvez effectuer rapidement et facilement l'exploration de données. Cela permet à l'analyse des données itérative possible. Avec Python, vous pouvez vraiment explorer votre curiosité vous amène au fond du trou mystérieux lapin (ce qui signifie que vous pouvez aller au fond, voir itinérance Alice au pays des merveilles).

Enfin, l'aspect pratique Python et flexibilité permet une variété de tâches dans la pile de données scientifiques. Par exemple, Luigi et Airflow permettent des tuyaux et des données de gestion de workflow en Python. En remplissant une analyse exploratoire en Python, ce travail peut parfois être mis en production pour continuer.

Par rapport à Python, SQL ce que le cas le plus d'usage populaire?

SQL est utilisé pour les données de requête et d'extraire de la base de données. Ceci est une première étape nécessaire pour convertir les données dans un format utilisable. Par exemple, SQL vous permet de facilement connecter plusieurs ensembles de données pour créer une table pour d'autres recherches.

SQL n'est pas conçu pour fonctionner d'une manière ou des données de convertir et de design. Les données scientifiques commune manipulation de données avancées (telles que l'analyse statistique, la régression, les lignes de tendance, et les données de séries chronologiques) dans SQL n'est pas facile à réaliser.

En dépit de ces limites, mais parce que SQL est nécessaire pour extraire les données, il est encore souvent utilisé pour les opérations complexes. La requête suivante est utilisée pour calculer les données de quantiles de séquences différentes:

Avec des détails AS ( SELECT série, valeur, ROW_NUMBER OVER (PARTITION PAR ORDRE série en valeur) AS row_number, SUM (1) sur (PARTITION BY série) AS totale DE ensemble_données ), quartiles AS ( SELECT série, valeur, AVG (CAS QUAND row_number > = (FLOOR (total / 2.0) /2.0) ET row_number < = (FLOOR (total / 2,0) /2.0) + 1 La valeur THEN / 1,0 END AUTRE ) OVER (PARTITION BY série) AS q1, AVG (CAS QUAND row_number > = (Total / 2.0) ET row_number < = (Total / 2,0) + 1 La valeur THEN / 1,0 END AUTRE ) OVER (PARTITION BY série) AS médiane, AVG (CAS QUAND row_number > = (CEIL (total / 2,0) + (FLOOR (total / 2.0) /2.0)) ET row_number < = (CEIL (total / 2,0) + (FLOOR (total / 2,0) /2.0) + 1) La valeur THEN / 1,0 END AUTRE ) OVER (PARTITION BY série) AS q3 à partir de détails ) SELECT série, MIN (CAS lorsque la valeur > = Q1 - ((q3-q1) * 1,5) Valeur THEN END ELSE) AS minimum, AVG (q1) q1 AS, AVG (médiane) AS médiane, AVG (q3) AS q3, MAX (CASE lorsque la valeur < = Q3 + ((q3-q1) * 1,5) Valeur THEN END ELSE) AS ma xi maman DE quartiles GROUP BY 1

Quand utiliser Python?

Python a un grand nombre de bibliothèques (comme Pandas, StatsModel et SciPy), qui est l'analyse statistique et mathématique et la conception. Ces bibliothèques font aussi très bien dans les détails abstraits, ce qui élimine la nécessité de calculer manuellement toutes les mathématiques sous-jacentes. De plus, vous pouvez obtenir des résultats immédiats, il peut être une donnée de recherche itérative en utilisant Python.

Ne pas besoin de dire: « Je veux être une régression, » et passer une demi-heure pour asseoir et où commencer requêtes SQL, Python bibliothèque peut exécuter une analyse, voir les résultats. En Python, il n'y a pas beaucoup lag entre l'inspiration et l'action.

Par exemple, si je vraiment besoin de montrer sait ensemble de données quantile, je vais écrire sur Requête. Parce que la chose peut être fait dans la ligne suivante de code Python, donc je vais terminer le travail plus tôt dans le processus d'analyse, et peut-être que quelques-uns des résultats que je ne veux pas.

dataset.describe

Une autre façon de considérer la différence entre Python et SQL est, Python vous permet de démarrer avec une grande table, en commençant par la grande table, peut faire différentes analyses sur les différentes branches. Un chemin d'inspiration peut vous emmener à l'inverse, ce qui rend la vitesse d'analyse et flexibilité pour explorer les nombreux sentiers plus faciles.

SQL et Python ont leurs avantages et leurs inconvénients, les deux langues combiner Ensemble, permettant aux analystes dans les deux monde ont été le meilleur résultat.

Pour l'analyste SQL, ce qui a besoin d'apprendre Python?

Comme beaucoup de compétences, apprendre à utiliser Python est la meilleure façon de procéder à une analyse minutieuse de la recherche d'intérêt, a été attention Et des problèmes un peu familiers.

Lorsque vous faites quelque chose qui vous intéresse, vous avez tendance à faire plus en profondeur. Cette curiosité peut vous pousser à aller plus loin, mais il est la source de beaucoup d'apprentissage réel.

Vous devez également faire face à certains d'entre vous sont familiers avec les données, vous savez ce que vous avez tort. Vous aurez une meilleure intuition pour savoir ce qui est arrivé et ce qu'il faut attendre. Cependant, lorsque les données que vous traitez quelque chose quand vous ne savez rien, par exemple, le traitement des pétales taille données (qui est présent dans de nombreux ensembles de données exemple Python populaires). Si votre analyse a conclu que « tous les pétales de ces fleurs sont la taille de deux centimètres de long, » mais vous ne savez pas si elle est raisonnable, vous pourriez supposer qu'il est à droite, puis passer à autre chose.

L'apprentissage Python peut certainement améliorer les compétences des analystes de données.

Les analystes ont besoin de communiquer la valeur commerciale des données. Une partie de leur travail consiste à essayer de trouver un aperçu de l'entreprise à partir des données, le travail plus efficace comprend également autour de qui peut prendre des mesures pour forcer vos idées coéquipiers, y compris le bon contexte et la présentation. De plus, l'utilisation des données et des analyses pour prendre des décisions dans le lieu de travail devient de plus en plus importante, par conséquent, que les analystes fournissent une analyse complète du rôle est plus important que jamais.

Original: https: // secteur .com / Blog / sql-vs-Python /

Cet article traduction RPSC, s'il vous plaît indiquer la source de la source.

[FIN]

Le monde est si grand, pourquoi ne pas aller étudier en Thaïlande voir?
Précédent
Prêt à étudier? Les Thaïlandais pour étudier somme
Prochain
Ne prenez pas la serviette sur l'équipement de chauffage électrique, alimentation Qufu clients chauffage propre sur la sécurité
Chi Heng 1 début de l'année prochaine! Pour prouver la sécurité des plus grands prix automobiles du monde
réponse Lynx à la « double 11 fraude de données »: commencer une procédure judiciaire; pliage exposition au brevet de téléphone mil, ASP.NET infecté par ransomware | Geeks titres
regarder dortoir d'université nationale, la Thaïlande dortoir vraiment
« Grain Qilu » magasin phare à double onze ouvert 27 entreprises, 200 types de produits réglés par livraison
Le déclin de Nokia
A Pékin, le Beijing International messages d'intérêt public de l'Assemblée ouvre
Thaïlande a récemment comment chaud? Multi-carte photo
La technologie multimédia pour inaugurer la nouvelle norme
Pétoncles sont morts soudainement et inexplicablement collective, Zhangzidao drame suspense dans le rideau du troisième trimestre! Ne paniquez pas, ils « revenir » l'année prochaine
Votre code, pour « sauver » Combien de personnes?
Dans l'Université Stanford International, le professionnel ace ne peut pas être ignoré