Data Analyst vs algorithme ing�nieur, Python programmeurs comment choisir la naissance?

Auteur | Liu pour se lever t�t pour se lever t�t

Zebian | Tu Min

�pid�mie dispers�e bient�t, est all� � la saison de recherche d'emploi. Comment apprendre Python vous qui choisissent leur orientation de carri�re, algorithme ing�nieur ou analyste de donn�es? Suivez le long de la voir!

acquisition et traitement des donn�es

Les donn�es d'�chantillons recueillis dans le filet de crochet de traction, parce que l'objectif de cet article est l'analyse des donn�es de recrutement, alors que dans l'article pr�c�dent, nous avons expliqu� � plusieurs reprises comment utiliser les requ�tes de donn�es exploration du Web, ne pas les r�p�ter ici, regardez les rampants du site une partie du code:

url_html = 'https://www.lagou.com/jobs/list_' + job_position + '? labelWords = & fromSearch = true & suginput =' params = { 'City': job_address, � Premi�re �: � true � si je == 1 autre � faux �, 'Pn': i, 'Kd': job_position} # Cr�ation d'un objet de la session s = requests.Session # L'envoi d'une demande pour obtenir les cookies s.get (url_html, les en-t�tes des en-t�tes =, data = params, timeout = 4) biscuit = s.cookies res = s.post (url_request, data = params, t�tes = en-t�tes, les cookies = cookies, timeout = 4) # Note Analyse acquisition de donn�es de format de page res.encoding = res.apparent_encoding text = json.loads (res.text)

Cet article s�lectionne les donn�es originales � Beijing, Shanghai, Guangzhou, Shenzhen, Hangzhou, cinq villes, respectivement, les analystes de donn�es, les ing�nieurs algorithme de filtrage des crit�res � recueillir des �chantillons recueillis apr�s les travaux net crochet de traction dans:

Bien s�r, il ne faut pas besoin d'une analyse multivari�e figure nous acheminant des donn�es, les donn�es apr�s le nettoyage taille de l'�chantillon final �tait 1979, et s�lectionner ont �t� analys�es les variables suivantes:

salaires

Tout d'abord, nous examinons les niveaux de salaires et r�partition de la densit� des analystes de donn�es algorithme ing�nieurs paient repr�sent�s graphiquement sur la densit� de distribution figure de ces deux positions et marquer le salaire moyen (ligne bris�e sur la figure).

La partie rouge de la densit� de distribution des ing�nieurs algorithme de paie, la partie bleue de la densit� de distribution salaire analyste de donn�es, on peut voir Que les ing�nieurs analyste de donn�es ou d'un algorithme, leurs salaires sont relativement �lev�s, Mais les ing�nieurs algorithme de salaire sera plus �lev� un peu, de la position des deux lignes en pointill�s peut �tre vu L'ing�nieur de l'algorithme de salaire moyen � 29,619 yuans de plus que 18,841 analystes de donn�es de yuans! Il est � noter que ces deux salaires de postes a montr� beaucoup plus en forme de pointe, ce qui indique qu'il ya une classe de salaire consid�rable des positions d'�lite.

Entreprises Analyse de l'industrie

En faisant cette section le nuage de mot � publier dans le domaine des soci�t�s de recrutement appartenant / analyse des secteurs:

Le chiffre pour le champ de texte nuage de mot d'entreprise d'information appartient de communiquer les renseignements de recrutement / industrie tir�e de la figure peut �tre vu de l'algorithme des analystes et ing�nieurs donn�es a une section plus grande industrie, appartiennent principalement � l'Internet mobile, li�e au financement l'entreprise, mais les services de donn�es des analystes de donn�es, les fournisseurs d'�lectricit�, la vie des consommateurs plus d'affaires et plus des algorithmes intelligence artificielle ing�nieur entreprises connexes ont repr�sent�, afin que les �l�ves veulent se livrer � des algorithmes d'intelligence artificielle emplois li�s vont dans la direction pour le pr�parer.

L'impact de l'�ducation sur les salaires

Dans cette section, nous utilisons une parcelle de case pour analyser l'impact de l'�ducation sur le salaire:

La largeur de chaque bo�te repr�sente le nombre des travaux de l'enseignement dispens� par l'axe vertical repr�sente le niveau des salaires, on peut le voir sur la figure, � la fois l'analyste de donn�es ou d'un algorithme ing�nieur, La plupart des emplois orient�s objet pour �tudiants de premier cycle. Et il est clair que les exigences de l'enseignement sup�rieur des ing�nieurs de l'algorithme, les analystes de donn�es il y a 33 postes n�cessaires qualifications minimales pour les ma�tres et les algorithmes requis par le Master ing�nieur a 389 positions, et � noter: Pr�s de 1000 emplois analyste de donn�es avait pas d'exigences de doctorat et exigences de l'emploi algorithme ing�nieur Dr. proportion sup�rieure � l'universit� junior. Donc, nous voulons engager dans des emplois connexes ou les premiers ing�nieurs de l'algorithme s'efforcer d'am�liorer l'�ducation de celui-ci.

analyse des besoins en comp�tences

Nous avons extrait les donn�es des analystes et ing�nieurs algorithme de travail requis comp�tences / informations relatives � la langue (non seulement les besoins d'�tiquettes pour extraire les exigences d�taill�es pour les comp�tences de la demande), de le visualiser

Vous pouvez voir l'analyste de donn�es, la plus forte demande est SQL, suivi par le logiciel BI et SPSS li�s aux donn�es Hive et Hadoop et d'autres grands, bien qu'il existe Java, etc., mais la demande globale pour les langages de programmation n'est pas �lev�, il convient de noter que seulement une entreprise a besoin des candidats utiliseront python (avec un seul a vraiment besoin d'une garantie amie contient Python). Regardez les ing�nieurs de l'algorithme de droite, la plus forte demande pour la PNL, suivi de C / C ++, Python, JAVA, GO et d'autres langages de programmation ont, il convient de noter que certaines entreprises ont �galement besoin de comprendre quelques-uns des demandeurs d'emploi de connaissances li�es au transport Linux dimensions.

un mod�le de r�gression

L'analyse ci-dessus est � seulement quelques degr�s par rapport � l'analyse descriptive, dans cette section, nous mod�le de r�gression des divers facteurs qui influencent les salaires � quantifier, parce que l'original trop de variables multicolin�arit�, donc nous avons choisi le mod�le de r�gression composantes principales: extraction des composants principaux de chaque variable, le centre du traitement logarithmique variable, mod�le de r�gression, et, enfin, la conversion de l'�quation de r�gression composante principale de la premi�re composante principale des variables initiales.

Analyste de donn�es facteurs qui influent sur les coefficients de r�gression

Algorithme des facteurs de g�nie affectant les coefficients de r�gression

En comparant deux chiffres sont disponibles, que ce soit il est un analyste de donn�es ou d'un algorithme d'ing�nieurs ont des exigences �lev�es pour une exp�rience de travail, les ing�nieurs de l'algorithme ont 3--5 ann�es d'une exp�rience de travail consid�r� comme un � positif � pour les salaires des impact. D'autre part, les analystes de donn�es SQL et Hive des exigences plus �lev�es requises par l'ing�nieur algorithmique est Python et C / C ++, bien s�r, ce sont seulement des facteurs personnels qui affectent le niveau de r�mun�ration de l'analyse, les facteurs de niveau de l'entreprise est laiss�e au lecteur int�ress� faire.

L'analyse typologique

Dans cette section, nous Pour une compr�hension plus d�taill�e de la r�partition des deux postes au sein de l'industrie, notre algorithme de facteur d'impact pour les analystes et les ing�nieurs donn�es analyse typologique, les r�sultats de clustering sont r�sum�s concluent que ces deux positions trois emplois typiques

Analyste de donn�es trois positions typiques:

Statut Elite: Niveau besoin ma�tre ou au-dessus, plus de cinq ans d'exp�rience professionnelle, � ma�triser une vari�t� de langages de programmation, des salaires plus �lev�s
poste sup�rieur: Baccalaur�at ou au-dessus, avec une certaine exp�rience de travail, � ma�triser un langage de programmation
Courrier ordinaire: comprendre les m�thodes d'analyse de base pour comprendre le logiciel de base

Ing�nieur algorithme de trois positions typiques:

Statut Elite: Niveau besoin ma�tre ou au-dessus, plus de cinq ans d'exp�rience professionnelle, la PNL ma�tre, Python, GO et d'autres, des salaires plus �lev�s
poste principal: ma�trise, plus de cinq ans d'exp�rience professionnelle, la ma�trise de la PNL avec un langage de programmation
Courrier ordinaire: baccalaur�at ou plus, plus d'un an d'exp�rience de travail, le salaire est faible

analyse discriminante Fisher

Au-dessus ont fait beaucoup et est la mod�lisation de r�gression composante principale est le regroupement de cette section est � l'analyse discriminante, nous pouvons utiliser la m�thode discriminante Fisher (avant que l'article a parl� oh) selon les conditions des demandeurs d'emploi sur l'un des un trois types de positions discriminent et substitu�s dans notre mod�le peut estimer le salaire du demandeur, par exemple,

Demandeurs d'emploi:

Je veux appliquer l'analyste de donn�es
Undergraduates
Il utilise SPSS, Mysql et comprendre quelques-unes des m�thodes d'analyse des donn�es

Utilisez ensuite la m�thode discriminante Fisher peut d�terminer si les candidats appartiennent � l'analyste de donn�es d'emplois ordinaires, et peuvent tirer profit du mod�le pr�c�demment �tabli pour pr�dire le salaire est d'environ 5247 yuans, mais si le demandeur d'emploi peut apprendre Hadoop Hive et le salaire passera � 7144 yuans.

conclusion

D'apr�s les r�sultats, les algorithmes des analystes et ing�nieurs donn�es sont tous des emplois relativement bien r�mun�r�s, ce qui explique pourquoi ces deux positions de feu, bien qu'il existe quelques deux positions transversales, mais encore quelques diff�rences, comme les deux positions langage de programmation besoin est pas la m�me chose. Et les ing�nieurs de l'algorithme de mesure ont besoin d'un peu plus haut, mais la demande de l'exp�rience des analystes de donn�es de travail ne demande pas des ing�nieurs de l'algorithme. Donc, les demandeurs d'emploi peuvent aller � leur propre situation en compte.

Sur le python est utilis� ici (reptiles (demandes) Nettoyage de donn�es (PANDAS) Mod�lisation (sklearn)) Echarts (dessin) R (plot (ggplot2) Densit� de la figure, boxplots, mod�lisation) le SPSS (Mod�le: analyse en composantes principales) il est �galement mentionn� dans l'article pr�c�dent, d'apprendre l'utilisation int�gr�e d'une vari�t� de langages de programmation.

Ce sont des mines et auteur analyse des rampants aux donn�es de recrutement, bien s�r, en raison de la capacit� limit�e de l'auteur, et dans la mod�lisation du mod�le pr�c�dent peuvent ignorer certaines variables cl�s ont conduit ne sont pas tr�s pr�cis, l'int�r�t les lecteurs peuvent obtenir les donn�es reconnaissants de r�pondre Job utilis� ici, une analyse plus approfondie -

Avertissement: Cet article est pour les �changes techniques d'interdire commerciale.

Route de la soie

Apprenez � conna�tre la Chine

Data Analyst vs algorithme ing�nieur, Python programmeurs comment choisir la naissance?