Exclusif | astronomes aux données des scientifiques au designer de visualisation des données, elle fait

Traduction: crème Han

Relecture: Ding Nanya

Editeur: Hu Die

thèse 5373 mots , Je vous suggère de lire 18 minutes

Cet article est de développer le contenu d'astronomes à enregistrer expert de la visualisation des données.

Je reçois souvent beaucoup de gens e-mail, me demandant toutes sortes de questions sur les routes de visualisation de données. Après avoir écrit l'histoire neuf fois moi-même, je veux exposer cette histoire peut être un peu plus facile sur le blog. De cette façon, je suis en mesure d'obtenir une description plus détaillée, et même ajouter des photos.

(Quand j'appris R) aux astronomes de données scientifiques alors concepteur de visualisation des données en soi, la plus grande partie de ce processus, le temps que je l'ai fait beaucoup de travail de visualisation des données, j'ai aussi passé beaucoup de réseau d'apprentissage du temps libre langue et D3, lisez les meilleures pratiques des livres connexes, participent à une communauté de visualisation de données en ligne, et d'expliquer leur amour pour le sujet à diverses conférences académiques ou congrégation se rencontrent. Maintenant, alors que je travaille pour Adyen, la visualisation de données est également un des pigistes à temps partiel.

Pour tous les détails, regardez la photo il y a quelques années, je l'ai fait une variété de formes, puis lu le .........

2015--2011 | Astronomie a commencé en tant que travailleur

Après le lycée je suis entré dans l'astronomie étude de l'Université de Leiden. Je non seulement avoir un intérêt dans ce domaine, alors que les mathématiques et la physique a aussi un grand enthousiasme. Première année de collège, j'ai pris un programme C ++, ce qui est mon cours de programmation d'introduction. (Avant conception de site Web animal de compagnie Neopets quelques années j'ai vraiment appris HTML simple et CSS, mais j'ai oublié essentiellement à nettoyer). Je aime la programmation défis posés: en définissant les variables, les boucles, en utilisant l'if-else déclaration peut faire beaucoup de choses, comme la fourniture de votre anniversaire, vous pouvez calculer le jour de la semaine. Mais même si je vraiment ce cours (peut-être pas spécifique à C ++), au cours des trois prochaines années, je ne l'ai pas la programmation de quoi que ce soit lié.

Lorsque l'année dernière pour faire mon diplôme d'université, et ceci est mon premier projet de recherche dans le vrai sens. Pour préparer un ensemble complet, mon année entière junior dans l'étude IDL, un langage de programmation est souvent utilisé domaine de l'astronomie (dans le passé) (et non utilisé dans d'autres domaines ......). Après une longue période, j'ai découvert, IDL et le langage R est très similaire, je l'aime beaucoup, maîtrisé mieux que C ++. cours de maîtrise en astronomie les six prochains mois et les deux années suivantes, je choisis de faire de la recherche théorique, donc plus utiliser IDL. Pour compléter la thèse de maîtrise, j'ai même passé tout programme de jour, par des résultats de simulation. J'ai aussi appris un peu SQL, parce que je besoin pour obtenir les bonnes données de la base de données de modèle. Mais faites mal, ça ne me laissez pas le développement d'experts programmation, IDL est un simple outil d'analyse de données. Je ne suis pas écrire APP ou un outil, je vais écrire quelques scripts peuvent analyser les données et générer des données et de l'image (comme il utilise maintenant le même R) est.

J'ai découvert que je devais obtenir leur diplôme et de premier cycle et des cycles supérieurs a écrit trois documents. Voici quelques photos de quelques-uns des résultats sur le papier. Ne me souviens pas des détails, mais ces deux diagramme de dispersion du cercle extrême droite et la rangée inférieure de la figure graphique ci-dessus ceux de l'extrême droite est un graphique des résultats de l'analyse de ma génération, d'autres chiffres sont basés sur une méthode standard pour l'affichage les données spécifiques de la série.

2012 | En tant que consultant / chercheur de données

Je pense qu'il ne veut pas poursuivre leurs études à poursuivre un doctorat. Bien que je tiens à faire de la recherche, mais je déteste tout à fait les papiers d'écriture. Je veux aussi atteindre quelques-uns des plus concrètes, des choses plus diverses, de sorte que plus de gens connaissent dans le monde ce que je fais. Alors j'ai commencé à chercher du travail. équipe de consultants Deloitte était dans leur département d'analyse du renseignement d'affaires a mis en place une équipe, et je donc dans l'équipe d'analyse a trouvé un emploi très approprié.

Dans Deloitte, mon travail ou analyser de grandes quantités de données, mais ces données sont des gens, ou ils achètent des biens ou leur hypothèque, et vivre très proche de toutes les choses. Parce qu'ils ne peuvent pas réutiliser IDL, et je devais apprendre un nouvel outil d'analyse de données. Dans ma première année de travail chez Deloitte appris six langues différentes, principalement parce que je dois faire face aux besoins des clients, tels que la version QlikView qui vient avec SQL, SAS (ce n'est pas mon préféré), VBA (encore pire ), et a appris plus tard R.

R et rstudio immédiatement devenus mes outils indispensables. IDL et il a un des principes de conception similaires. Vous pouvez exécuter la ligne de code en ligne sans la nécessité de compiler le script entier ou exécuter tout le code unique. Je l'ai trouvé pratique pour exécuter la ligne de code en ligne pour debug ou comprendre le code écrit par d'autres. R et ceci est utilisé comme un outil d'analyse de données. Il a un certain nombre de paquets à vous aider à atteindre certaines des caractéristiques, de la préparation de grandes quantités de données, l'exploration de texte, dessin (en utilisant ggplot2) à des fonctions plus complexes telles que la distance d'arc abstraite entre deux emplacements sur le calcul de la Terre, ou Google API tendances de connexion.

Ggplot2 veulent maîtriser l'essentiel de « liens » idée prend un certain temps, il peut définir l'apparence du graphe d'une pile d'options différentes à des degrés divers. Mais avec le recul, nous pouvons comprendre plus profondément, et il offre plus de possibilités pour nous. Vous devez trouver des exemples de référence multiples Stackoverflow réaliser certaines fonctions spécifiques. D'autre part, vous pouvez également enregistrer les images générées au format PDF et le télécharger sur Illustrator pour faire quelques ajustements finaux. Cependant, je suis également après chance après chance de trois ans ont commencé à le faire.

Supérieure et inférieure est la figure de ma première année de la Tableau R. Je pense que ces cartes sont une valeur sur mon garde PC, ha, ha. Bien sûr, je l'ai fait des centaines de simples Zhangjuhe et laid tableau géant, ceux-ci ne sont pas enregistrés. Bar, ligne, des diagrammes de dispersion, qui peuvent tous nous aider à mieux comprendre les données.

2013 | d3 au courant de l'existence de

Février 2013, je suis allé à la baie de San Francisco a participé à la conférence de données Strata sur la science. Là, je rejoint un « d3 Mise en route » groupe de discussion. Jamais entendu d3, j'ai été immédiatement attiré. Retour à la maison, j'ai passé une semaine la prochaine essayer de construire mon propre diagramme de dispersion interactif peut être commuté entre différentes variables et peut être transformé en fonction de clics de souris. Oui, j'ai passé toute une semaine de repos à partir de zéro pour construire ce chiffre. Parce que je ne comprends pas JavaScript, HTML et CSS à saisir est limitée. En même temps, saisir la chaîne logique et d3 + Mises à jour + Entrée façon de sortie de la pensée est aussi une autre difficulté majeure (je pense que j'ai passé au moins un an pour comprendre pleinement). Ceci est très difficile à apprendre, bien longtemps que je peux obtenir un peu de progrès, mais je peux être l'obsession infinie et sans fin d3 peut être créé.

Après cela, il était rude épreuve, je l'ai appris à essayer de l'exemple, ajuste constamment d'appliquer à leurs propres données. Parfois, juste à ses propres données affichées, il sera très compliqué. Je parfois coincé une question très simple, parce qu'ils ne savent pas ce qui a mal à la fin. Enfin, je compris que, dans un tableau imbriqué d'objets JavaScript restent dans l'état peut être connecté à la nouvelle variable ...... fou.

L'année prochaine, je ne l'utilise pas souvent d3. Afin de travailler rapidement pour compléter la tâche a trop de choses à apprendre. Après la découverte plus rapide du graphique R.

Notre département BI utilise un autre outil est plus QlikView, c'est un programme que vous pouvez créer des tableaux de bord interactifs, que vous pouvez télécharger et installer d'autres extensions de visualisation basées sur JavaScript. Printemps 2013, QlikView a organisé un concours à rendre le programme d'expansion optimale. I et deux autres collègues trouve intéressant de participer. Je recommande d'utiliser d3, d3 acquis du format graphique et utilisé dans un environnement QlikView. Ici, je laisse de côté les détails, mais les résultats montrent que le diagramme d3 réseau dans l'option QlikView est très difficile. Malheureusement, nous laissons tomber enfin par 3 voix à la deuxième place, mais cela est un pas de géant dans les connaissances liées I-d3.

2014 | cheveux Maintenant leurs intérêts

Un tel apprentissage continu jusqu'en Novembre ici 2014. Au cours des grands projets qui, parce qu'il ya assez de temps pour créer (ou ajuster certaines de mes choses préférées), je l'ai fait quelques travaux visuels basés sur d3. Les résultats sont applicables à un tel algorithme de carte auto-organisation carte hexagonale de la chaleur, je l'utilise souvent, ainsi que d'établir la relation entre les éléments d'achat populaires de carte du réseau visuel et une analyse relationnelle (le travail de visualisation est basée principalement sur les travaux de Raphaël Velt). Mais je me considère toujours comme un scientifique de données. Le problème est, je ne sais pas si je l'aime ce travail comme ça avant. Afin d'augmenter la précision des modèles prédictifs de 1%, je pense que la frustration est plus un sentiment d'accomplissement.

Mais en Novembre 2014, je une nouvelle fois pris part à la conférence Strata à Barcelone. Je me souviens encore de mon cur un peu à perte, incertaine l'année prochaine leur recherche. Après cela, j'ai écouté Mike Freeman de la parole. Son sujet est « expert de la visualisation des données. » Je suis tout à coup l'idée: « Ceci est le travail indépendant que nous faisons peut devenir un expert de visualisation de données ?? » A ce moment-là, je savais que je reprenais la passion. Ce discours impressionnant de transmettre des données complexes et des vues à travers l'histoire, je crois que vous avez aussi une grande aide :)

Au cours du prochain mois, je mets tout son temps pour se reposer, soirées, week-ends sont consacrés à transformer la façon dont je l'ai fait dans les graphiques complexes Deloitte, graphiques rayonnement de téléphone est transformé en une histoire de transformation de la marque à partir d'images visuelles. Permettez-moi de vous expliquer comment le point de vue lentement abstraite du graphique. Je l'ai envoyé à Mike Freeman, a demandé son avis. D'autres super bon, sont également très intéressés, plein d'éloges compliqués d'un point pousser, pousser ce même attiré l'attention du d3 fondateur de Mike Bostock (j'ai toujours mon transmettre ses oeuvres visuelles de photos, que Je sautais dans ma chambre).

Je suis très encouragé. Alors j'ai commencé à lire beaucoup de livres sur les meilleures pratiques, est, je l'ai créé la chose la plus importante plusieurs de ses uvres, des chansons de TOP2000 sur les planètes extrasolaires, sur le système solaire. Ceci est mon temps privé à faire, mais il n'a pas d'importance, il est devenu mon intérêt, je jouissais.

2015 | Devenir concepteur de la visualisation des données

Le temps de travail moi et mon mentor eu une longue conversation avec le patron, ce que je veux me spécialiser dans la visualisation des données. Heureusement, ils sont très favorables, ils recommandent même je besoin projet de visualisation des données à d'autres gestionnaires. Bien sûr, ce genre de travail n'a pas été toujours là, donc je fais encore du travail d'analyse des données, mais au fil du temps, je commence lentement à faire des projets plus intéressants (par exemple, état de la nation), ces projets impliquent généralement l'utilisation visualisation d3 pour créer des données clients.

Le temps libre, je continue à apprendre à faire leurs propres projets. J'ai aussi commencé à écrire blog. 2014, j'ai créé un blog en quelques choses simples, partager quelques petites choses, mais pas beaucoup de contenu substantiel. Jusqu'à présent! Je veux un nom: la cannelle visuelle, commencer à ajouter certains de mes propres projets, de partager les difficultés que je rencontrais un problème intéressant rencontré, ainsi que le résultat final. Je en ai créé moi-même un contenu très spécifique appris (généralement liée à d3) bien sûr, le désir d'aider plus de gens. Mars 2015, j'ai même déplacé vers un blog gratuit WordPress ci-dessus. Pour que je puisse publier plus de contenu, tels que les représentants d'un certain nombre de la liste et le portefeuille de mes ressources de visualisation des données favorites pour l'apprentissage.

J'ai également participé à deux concours. Ceci est une bonne façon de nettoyer des données et un thème visuel. Il vous permet d'enrichir en permanence votre portefeuille, mais vous permet également de voir l'écart entre eux et d'autres personnes (bien qu'il existe quelques raisons de ne pas participer à la compétition, peut-être l'entreprise ne veut pas payer pour beaucoup à choisir des uvres visuelles , alors soyez prudent). Le travail est le premier à fournir des renseignements est belle sur une image visuelle statique d'intoxication alimentaire (malheureusement, c'est la dernière fois ils ont fait le défi), le second est sur les travaux d'urbanisation au Moyen-Orient fourni à Visualizing.org et la Banque mondiale l'image interactive.

2016 | être Emploi concepteur de visualisation des données

Décembre 2015, pour des raisons non liées à un certain nombre de domaines et la visualisation des données, j'ai changé un emploi, joignez-vous Adyen devenir un concepteur de visualisation de données à temps plein. Ils se sont arrangés pour moi à l'analyse des données post, mais je leur ai dit que j'ai changé les conditions de travail veulent juste se spécialiser dans la visualisation des données. Après avoir lu mon site, ils sont très friands de ce qui précède, je peux enfin accepté de se joindre à la visualisation de certaines données (donc, je pris le temps de mettre à jour mon site web récompensant enfin)! Ils ont commencé à utiliser le tableau de bord de d3 pour les clients à faire et veulent faire une optimisation plus poussée.

Je Adyen la plupart du temps, la mise à jour soit l'ancien tableau de bord, ou en créer un nouveau. données de recherche doit comprendre la fin utilisateur disponibles et faire (rugueux) concevoir, déployer parfois à l'environnement Adyen (2-3-end avant d'atteindre la plupart de mes collègues conception du tableau de bord).

Ce fut là que je commençais à comprendre que je suis plus d'un concepteur de prototype. Mon niveau de compréhension du développement web ne suffit pas de me faire et mes collègues responsables de côté développement web côte à côte. Cependant, la visualisation des données, quand ils ne font rien, je peux concevoir et construire une instance distincte. Donc, quelques mois plus tard, je ne suis plus responsable du déploiement efficace de l'environnement Adyen contenu, et plus concentré sur la conception et proposer des idées nouvelles.

2016 | sa D'autres échanges plus approfondis

2016 Je trouve que je vraiment à montrer mes années de visualisation des données d'amour (bien que toujours super serré, hein, hein). Avril OpenVis est la première fois de participer à une conférence internationale, mais d'ici la fin de 2016, je fait juste fini de parler à la réunion de Melbourne CSS et rentrer à la maison! (Ce que je ne pensais pas au début de 2016). Les deux réunions auxquelles j'ai demandé la parole d'admissibilité, mais je pense (pas sûr) est de partager l'expérience sur mon projet de blog, et plus important encore, des tutoriels, ce qui rend la communauté OpenVis pour me donner cette occasion :) Bien sûr, ont de bonnes idées, il est le plus important, même si vous bloguez pas. Le choix des participants était complètement anonyme, peu importe qui ils pensaient est-a été sélectionné base. Ceci est une bonne façon de classe recrue de personnes impliquées.

2016, je commence à travailler avec shirley Wu, il est un excellent données à partir des données San Francisco croquis concepteur visuel dans le vecteur de données, pour créer une visualisation de données mensuelles plus en profondeur pour le même sujet et écriture collecte, la préparation des données, concept et processus de programmation. Comme je l'écris cet article, nous avons fait pendant neuf mois, au cours de laquelle je gagne beaucoup. Il est non seulement techniquement, mais aussi la pensée novatrice. Si vous voulez vraiment apprendre la visualisation des données, alors rien ne peut vous battre.

2017 | devenir free-lance

En Adyen pendant un an après le tableau de bord, je trouve que je perdais la diversité en tant que consultant. Toutes les quelques semaines à une variété d'industries, responsables d'une clientèle complètement différentes, des données différentes et des problèmes de traitement. J'ai donc décidé de faire quelque chose au moins un an pour se rendre compte que dans mon esprit l'idée du disque interactif depuis longtemps. Donc, je commence à partir de Janvier 2017 pour devenir une visualisation Freelancer des données.

Cependant, il y a encore beaucoup de contenu parce que je veux explorer Adyen, alors que je ne suis pas sûr d'avoir assez de projets favorisés par un bon marché, donc la façon dont je l'habitude de travailler à temps partiel. En Adyen 3 jours ouvrables, ne laissant que deux jours (si l'on compte le week-end il y a deux jours) des travailleurs indépendants.

Soit dit en passant, À propos de moi « type de projet favorisé », se référant à la visualisation de données plus créatif. J'ai décidé de ne pas faire la conception du tableau de bord ou de construction, parce que je l'ai fait assez.

Pour l'instant, tout va bien. Ignorer la gestion des contrats pour apporter des problèmes, mon travail est très intéressant et diversifié à nouveau. Mais seulement parce que je pige trois mois, je l'espère, être élargi l'an dernier après une section.

résumé

Eh bien, cela est de ma visualisation de données de la route assez longue d'une déclaration, je devais apprendre quand et comment maîtriser les outils pour construire tableau des uvres visuelles, ainsi que certains de chaque étape (gênant). Et certains semblent terribles ou une perte de temps, mais je saisis l'occasion de profiter. J'espère que mon histoire peut pour en profondeur vous visualisation des données de recherche inspirer, si cela est quelque chose que vous voulez dire. Ou va connaître quelqu'un d'autre est une étape par étape comment explorer il a été formidable pour moi, ce n'est pas un chemin clair, l'effort et la passion - c'est tout le monde a quelque chose - alors finalement je me atteint maintenant lieu: Le travail principal transformé en travail de visualisation des données.

Introduction Traducteur

crème Han Maître de génie biomédical, Université de Melbourne élèves en lecture. Il y a un grand intérêt pour la recherche sur le génome et l'apprentissage en profondeur, en essayant constamment faire face à un grand nombre de données génétiques à travers le système d'apprentissage en profondeur, dans l'espoir d'accomplir quelque chose dans la précision du domaine médical. Envoyer groupe de traduction de données de bénévoles.

La propagande officielle! Âgé de 24 ans a rejoint Barcelone équipe japonaise de talent, il peut jouer ensemble avec le légendaire 2
Précédent
Chengdu Shu Wen phrase One Response to "couple fou" de 331 jours: à travers l'Asie et l'Europe seulement pour trouver la voiture et rencontre (sur)
Prochain
Créé en Xiasha attente RAPATRIES spéciale Capital Connection, Hangzhou Salle bonne politique initiée dans le cadre du boom économique
« Après l'ombre des fleurs » Chen Jin a remporté un très discret et la coopération avec toisant nouveau film « Route renversé »
Reporters grand entraîneur de football Cannavaro chaud: si le recrutement se concentrer Wulei Cheng!
Exclusive | subvertir le traditionnel, vous dire un système informatique est différent de la base de données
Exclusif | langage profane, puis AI: Intelligence artificielle détaillée des définitions et des méthodes de recherche
le personnel de l'intelligence artificielle était fou furieux, d'une valeur comparable au sport de première ligne étoiles
ExclusifMicrosoft Zheng Yu : conférence Essence of Big Data Driven Smart City (avec PPT)
Gan Zhe (Gantzer) la création de la campagne « parisienne » pour les premiers horizons de temps bien au-delà de l'énoncé précédent
Mex première colonne de trains de voyageurs exprès de la chaîne du froid départ Sichuan ingrédients hot pot 27 heures est arrivé à Beijing
Physiciens secret il y a cent millions d'années des profondeurs de la montagne du manteau de l'océan
Ligue des Champions coupé à la scène du cur! 41 ans Buffon vente super erreurs amateurs, tout le jeu a été classé le score le plus bas
Remarque! Demain, Wuhan la ligne de métro 2 et la ligne 7 a un nouveau look! Wuhan Matin