ère Big Data Microsoft® Excel, regard

Le texte intégral 3047 Les mots, lorsque l'apprentissage tout au long attendu 6 minute

Source: Pexels

Ceci est un outil bien connu et fréquemment utilisés dans la vie quotidienne. Est l'un des trois grands logiciels Microsoft Office, créer des rapports, et même générer une forme de planification du projet, nous pouvons l'utiliser pour faire quoi que ce soit.

Oui, il est Microsoft® Excel.

Bien qu'il soit largement connu, mais en fait ils ont appris jamais vraiment à l'utiliser.

Alors que pour la plupart des gens, ce n'est pas un problème majeur, mais pour ceux qui ont besoin de gérer les systèmes de traitement de données complexes et pipelines, il a commencé à devenir un problème.

Si vous comprenez comment construire une feuilles de calcul efficaces et cohérentes, les choses vont se passer?

Non seulement dans les tâches d'ingénierie, les tâches quotidiennes, il y a de nombreux avantages qui peuvent améliorer l'efficacité, la cohérence et la reproductibilité conçu pour améliorer ces fichiers.

Erreur commune avec Microsoft Excel

Lorsque la firme de Redmond a publié Microsoft Excel 1985, il a été un grand succès. Le marché des ordinateurs personnels émergents est tout à fait ouvert, avec l'introduction de Windows3.0, les ventes Excel devancent son principal concurrent --IBM de Lotus 1-2-3.

Depuis lors, la part de marché de Windows sur le marché global du PC, plus de 85%. Par conséquent, Excel et toute la suite de logiciels bureautiques les plus couramment utilisés.

Ce succès n'est pas surprenant: facile à utiliser Microsoft® Excel, un certain nombre de fonctionnalités et dispose d'une interface utilisateur simple. Tout le monde peut l'utiliser, il est partout. Qu'est-ce que les gens veulent?

En fait, presque tout le monde peut faire une utilisation du produit apportera une partie du produit correspondant.

Excel ne sont pas à l'école. Tout le monde peut l'utiliser, afin que chacun puisse utiliser Excel de différentes façons. Il n'y a pas de définition claire de consensus ou de bonnes pratiques. En fait, nous ne comprenons pas ce type d'outil dès l'école primaire, ce qui entraîne un manque de professionnels réalisé qu'une fois atteint le champ de la connaissance.

Excel ne peut pas être automatisée. Bien que Excel est incorporé dans un langage de programmation (Visual Basic), mais il est encore difficile d'automatiser la tâche onéreuse, ne peut pas communiquer avec d'autres logiciels. Et il est encore pour le personnel interne.

Excel ne peut pas être prolongée. L'humanité est à l'époque des grandes données, le processus ne peut pas charger des fichiers volumineux dans Excel est très courante. Tout cela dépend de la puissance individuelle de calcul. Sur un serveur dédié exécutant le logiciel Microsoft semble être très difficile. De même, il n'a pas été conçu pour une telle utilisation.

Excel ne peut pas être copié. Enfin, je dois mentionner, lors de la réception d'une grande quantité de fichier Excel de données agrégées, la couleur, les initiales ou une formule contenant, difficile de comprendre comment toutes ces choses sont établies et perçues. Excel n'enregistre pas état de flux de travail pour créer de tels fichiers impliqués.

Source: Pexels

Équipe d'internes

Au cours des deux dernières décennies, ces quatre points ne sont pas un gros problème.

En même temps, une des zones « nouveaux » ont commencé. Avec le développement des ressources informatiques, la société a constaté qu'ils ont maintenant beaucoup de données, mais ne savent pas comment gérer.

Une série de nouveaux emplois a émergé: les scientifiques de données, les analystes de données, les ingénieurs de données, les ingénieurs, l'apprentissage machine, ingénieur de développement de données, et ainsi de suite. Le mot le plus important est DATA, l'objectif principal est de trouver une nouvelle valeur de l'emploi à partir des données massives.

Avec ces nouvelles fonctionnalités, vous pouvez créer un grand nombre d'outils pour construire pipeline de données, de meilleures données ou créer des modèles Visualize mathématiques pour prédire les valeurs futures.

Mais la plupart des données sont toujours stockées dans le fichier Excel. De plus, les outils développés sont parfois très compliqués à utiliser, seuls ingénieurs bien formés pour les faire fonctionner.

Par conséquent, il y a encore des lacunes. D'une part, il y a beaucoup de gens utilisent encore des feuilles de calcul comme l'un de leurs principaux outils, d'autre part doivent faire face à l'ingénieur complexe de tuyauterie, mais nous devons traiter ces dossiers de désordre.

Par conséquent, pour nettoyer ces fichiers et de les intégrer dans le pipeline d'ensemble de données va perdre beaucoup de temps et d'argent. Les données de l'apprentissage des mathématiques, l'équipe de l'informatique et d'autres disciplines de la composition des talents exceptionnels.

En fait, les ingénieurs ne savent pas apprendre Excel, ils ne leurs ordinateurs et tuyaux de données, afin qu'ils puissent négocier. Cependant, par rapport avec eux pendant ce temps peut le faire, il n'ajoute pas beaucoup de valeur.

Si, dès le début pour apprendre à créer et maintenir un fichier propre, plutôt que de permettre aux ingénieurs de gérer le chaos des documents, que ce qui se passera? En suivant des règles simples, vous pouvez créer un fichier efficace, reproductible et automatisé, et cesser de créer une feuille de calcul de la confusion.

tableur simple, finition

Voici un exemple courant d'une feuille de calcul:

Une feuille de calcul commune

Bien qu'il semble bien conçu, mais pas du point de vue peut être répétée.

A travers cet exemple simple, nous allons décrire quelles sont les meilleures pratiques pour construire un fichier informatique facile à comprendre.

La première ligne ne correspond pas à un domaine particulier. Ici, il devrait être remplacé par "Année" (année), "type" (type), "produit" (produit), "Numéro" (quantité). Ceci est appelé « titre ».

Couleurs de police et les cellules de format formes. Tout en ajoutant la couleur et le texte en gras / italique pour faciliter la visualisation, mais sans utiliser beaucoup d'ordinateur. De plus, ces paramètres ne sont pas objectifs, et la compréhension du fichier peuvent varier entre les utilisateurs.

La nature différente des données sur la même ligne. Comme décrit ci-dessus, il semble pratique, mais en fait, chaque ligne doit contenir seulement une observation de l'information. De même, la valeur globale de valeur globale (par exemple, totale ou moyenne) de l'autre est généralement pas une bonne façon dans la même ligne. Cela est incompatible, l'ordinateur ne peut pas comprendre.

Fusionner les cellules. La même chose: Chaque ligne doit contenir uniquement des informations sur une visualisation de données.

Dans les tableaux séparés dans la même feuille de calcul ou l'étiquette. Année de faire la distinction entre les différentes étiquettes est de rendre la forme plus facile à lire une pratique courante, mais seulement si l'ordinateur lit une table, la table ne sera pas lu.

Ce sont des règles simples, non? Ce qui suit est le résultat de l'application de ces lignes directrices.

tableur propre

Le meilleur des deux mondes

Si le lecteur ne fonctionne pas dans le secteur de la technologie, une feuille de calcul pourrait dire que ce n'est pas très utile. En partie droite. Cette conception ne peut pas être traitée ou somme valeur moyenne de la polymérisation et similaires, et n'est pas très pratique pour trouver une valeur spécifique.

Néanmoins, il existe des moyens pour traiter ces dossiers, et même d'améliorer la conception précédente.

Enregistrer un tableau complet des données. Tout d'abord, il doit être comme la démo ci-dessus, un formulaire de réservation avec le format de données. Ainsi, le scientifique de données ou toute personne utilisant un logiciel spécifique sera en mesure de charger le fichier sans avoir à traiter dans l'avenir.

Et le traitement de la feuille polymère ou une autre application de données. En résumé, ajouter des filtres, pour créer un dessin ou tout autre traitement de données, et une autre feuille il suffit d'ouvrir l'action souhaitée. Cet espace comme un laboratoire, les données peuvent être testées ici et générer un rapport. Cela permettra de protéger les données d'origine.

En outre, certaines personnes peuvent vouloir utiliser ou apprendre d'autres outils. Maintenant, il existe de nombreux outils conviviaux pour créer un tableau de bord ou d'un rapport. Ils offrent un bon choix de conception, et comprend de nombreuses fonctionnalités pour construire et exporter des rapports.

Si vous voulez aller plus loin, vous pouvez utiliser ces outils les gens utilisent les données chaque jour. Ceux-ci sont la plupart du temps programment la langue tels que Python ou R, qui a apporté une plus grande liberté et réplicabilité. Parce que ce code est en fait, créer des graphiques et des rapports de l'ensemble du flux de travail sont enregistrés. Ainsi, vous pouvez partager le code, tout le monde peut le modifier en fonction de vos besoins.

Bien qu'il soit plus complexe que Excel, mais un haut degré de liberté permet aux utilisateurs de quoi que ce soit que vous voulez construire. Enfin, il faut mentionner: il est gratuit.

Ceci est juste une petite adaptation

Source: Pexels

Amélioration de la conception de ces fichiers a deux principaux avantages:

Tout d'abord, il y a de l'aide pour les techniciens. Non seulement l'altruisme, il peut accélérer les ingénieurs façon de construire pipeline de données, augmentant ainsi un aperçu, pour apporter plus de valeur à l'entreprise.

En second lieu, par l'application de ces règles dans l'équipe même de la taille de l'entreprise, vous pouvez vous retrouver avec un « langage » plus semblable à traiter ces dossiers, afin de mieux comprendre et à manipuler des données d'entreprise.

Il est 2020, les oreilles des gens remplis de mots à la mode sur l'intelligence artificielle, les grandes données, l'apprentissage machine, etc., mais ne savent pas ce qu'elle est.

En fait, il commence avec des données présentes dans les mains et les ordinateurs de tout le monde.

pouces Message attention

Ensemble, nous partageons l'apprentissage et le développement de l'IA sec

Tels que réimprimer, s'il vous plaît laisser un message dans les coulisses, se conformer aux normes de réimpression

Chrome, Edge, Firefox, Opera et Safari: Quel navigateur appelé le plus?
Précédent
3 bonnes pratiques Python pour les débutants, à découvrir
Prochain
La transition d'un robot à un être humain? "Voice Changer Tour" de Siri
À ne pas manquer! dix idées créatives du projet de 2020 Données Science
Photos | nuages de pluie Zhangjiajie beau que le paradis
Google vient de publier 25 millions d'ensembles de données libres, venez découvrir
Attention! Votre souris a été site Web de cheminement
"Code de propreté": 5 points de base
La communauté internationale préoccupée par la guerre de la Chine « la peste »: la Chine est le monde pendant un certain temps
JS n'utilise pas ===
Comment les spectateurs les grandes entreprises utilisent l'intelligence artificielle, et l'utilisation de la pratique?
Sous en ligne et hors ligne intégré, à la fois derrière la guerre médecin avant Yuanjiang Jinhua « peste » jeu
Jeunesse Technologie | Académie chinoise des sciences Zhang Shifeng: début tard pour rattraper son retard, et nous nous efforçons de faire une personne utile
Pour les enfants à partir d'un nom, de créer un générateur de nom de bébé avec une technologie d'apprentissage en profondeur