Analyse | 49 cas typiques d'entreprises de mégadonnées qui exploitent la valeur des données (qui valent la peine d'être collectées)

Guide: Cet article est un résumé de quelques cas classiques d'entreprises de big data dans différents secteurs et domaines ces dernières années. Bien que certains cas remontent à des années, la logique sous-jacente est toujours instructive pour l'avenir.

Cet article tente de trier les règles générales pour explorer la valeur des mégadonnées du point de vue de l'exploitation et de la gestion de l'entreprise : premièrement, la prise de décision basée sur les données, principalement en améliorant la probabilité de prédiction, pour améliorer le taux de réussite de la décision- fabrication ; deuxièmement, processus axé sur les données, principalement Former une stratégie de marketing en boucle fermée pour améliorer le taux de conversion de l'entonnoir de vente ; le troisième est des produits axés sur les données, mettant l'accent sur la personnalisation au stade de la conception du produit ; et l'innovation itérative dans le fonctionnement du produit organiser.

01 Partie 1 : Divers forfaits d'entreprises de big data naturel

De Google, Amazon, Facebook, LinkedIn à Ali, Baidu et Tencent, tous sont devenus des entreprises naturelles de mégadonnées car ils disposent d'une grande quantité d'informations d'enregistrement et d'exploitation des utilisateurs. Les grandes entreprises technologiques telles qu'IBM, Oracle, EMC, Hewlett-Packard se sont tour à tour consacrées au big data.En intégrant les informations et les applications du big data, elles offrent aux autres entreprises une solution globale de "données matérielles et logicielles". . Nous nous concentrons sur la valeur des mégadonnées, les entreprises de premier ordre en supportant le poids.

Voici des exemples typiques de la valeur minière de ces sociétés de mégadonnées naturelles.

1. La "société d'information" d'Amazon

Si une entreprise dans le monde tire le meilleur parti du big data, jusqu'à présent, la réponse pourrait être Amazon. Amazon doit également gérer des quantités massives de données, et la valeur directe de ces données de transaction est encore plus grande.

En tant qu'"entreprise d'information", Amazon obtient non seulement des informations sur le comportement d'achat de chaque utilisateur, mais aussi Enregistrez toutes les actions de chaque utilisateur sur leur site Web : Temps passé sur la page, si les utilisateurs consultent les avis, les mots-clés pour chaque recherche, les éléments consultés, etc. Cette sensibilité élevée et l'accent mis sur la valeur des données, ainsi que ses puissantes capacités d'extraction, ont fait d'Amazon bien au-delà de ses méthodes de fonctionnement traditionnelles.

Werner Vogels, CTO d'Amazon, a prononcé un discours sur le big data au CeBIT, décrivant aux participants le plan d'affaires d'Amazon à l'ère du big data. Pendant longtemps, Amazon a essayé de localiser les clients et d'obtenir les commentaires des clients grâce à l'analyse de données volumineuses.

"Dans le processus, vous constaterez que plus les données sont volumineuses, meilleurs sont les résultats. Pourquoi certaines entreprises continuent-elles à faire des erreurs en affaires ? C'est parce qu'elles ne disposent pas de suffisamment de données pour soutenir leurs opérations et leur prise de décision", a déclaré Vogels. Dans un monde de données, les possibilités sont infinies. » De l'infrastructure qui prend en charge les entreprises technologiques émergentes aux appareils mobiles qui consomment du contenu, les tentacules d'Amazon ont atteint un champ plus large.

Amazon recommande : Tous les aspects de l'activité d'Amazon sont indissociables de la figure "data-driven". Les amis qui ont acheté des choses sur Amazon connaissent peut-être sa fonction de recommandation. La fonction de recommandation "les personnes qui ont acheté X produits ont également acheté des produits Y" semble très simple, mais elle est très efficace. En même temps, ces résultats de recommandation précis Le processus de dérivation est également très compliqué.

Amazon prédit : La prévision de la demande des utilisateurs consiste à prévoir les besoins futurs des utilisateurs grâce à des données historiques. Pour des choses comme les livres, les téléphones portables et les appareils électroménagers - des produits appelés à forte demande au sein d'Amazon, vous pouvez les considérer comme des «produits standard» - la prédiction est relativement précise, et même la demande d'attributs de produits connexes peut être prédite. Cependant, pour les produits à faible demande comme les vêtements, Amazon n'a pas été en mesure de bien le prédire pendant plus de dix ans, car il existe trop de facteurs d'interférence pour de telles choses, telles que : les préférences des utilisateurs pour la couleur et le style, qu'ils soient bien ajustés ou non, les amoureux et les amis aiment ou pas... Ce genre de chose est trop volatil, et si beaucoup de gens l'achètent, il ne se vendra pas bien, donc un modèle de prédiction plus complexe est nécessaire.

Essai Amazon : Pensez-vous qu'un certain morceau de texte de page sur le site Web d'Amazon vient d'apparaître ? En fait, Amazon testera en permanence de nouvelles options de conception sur le site Web pour trouver celle avec le taux de conversion le plus élevé. La mise en page, la taille de la police, les couleurs, les boutons et tout le reste de l'ensemble du site Web sont en fait les meilleurs résultats après de nombreux tests minutieux.

Amazon enregistre : Les applications mobiles d'Amazon permettent aux utilisateurs d'avoir une expérience fluide et omniprésente, et en même temps, ils acquièrent également une compréhension approfondie des préférences de chaque utilisateur en collectant des données sur leurs téléphones mobiles ; il convient de mentionner que le Kindle Fire, le Navigation Silk L'appareil peut enregistrer une par une les données de comportement de l'utilisateur.

L'approche basée sur les données ne se limite pas aux domaines ci-dessus, la culture d'entreprise d'Amazon est une culture basée sur les données froides. Pour Amazon, Big data signifie grosses ventes. Les données montrent ce qui fonctionne et ce qui ne fonctionne pas, et les nouveaux projets d'investissement des entreprises doivent être étayés par des données. Une concentration à long terme sur les données a permis à Amazon d'offrir un meilleur service à un prix inférieur.

2. L'intention de Google

S'il y a une entreprise technologique qui a défini avec précision le concept de "big data", c'est bien Google. Au cours du seul mois de mars 2012, Google a traité 12,2 milliards de termes de recherche, selon la société de recherche comScore. La taille et l'échelle de Google lui donnent plus d'accès au Big Data que la plupart des autres entreprises.

Le moteur de recherche Google lui-même est conçu pour relier de manière transparente des milliers de serveurs. Si plus de traitement ou de stockage doit survenir, ou si un serveur tombe en panne, les ingénieurs de Google peuvent facilement le gérer en ajoutant simplement plus de serveurs. Le résultat de la réunion de toutes ces données est : Les entreprises bénéficient non seulement de la meilleure technologie, mais aussi des meilleures informations. Voici une sélection de trois des points positifs de Google.

Intention de Google : Google stocke non seulement les connexions réseau qui apparaissent dans les résultats de recherche, mais stocke également le comportement de l'utilisateur en matière de recherche de mots-clés. Il peut enregistrer avec précision l'heure, le contenu et la méthode du comportement de recherche des personnes. Une grande quantité de données machine générées par le réseau . Ces données permettent à Google d'optimiser le classement des annonces et de convertir le trafic de recherche en un modèle de monétisation. Non seulement Google peut suivre le comportement de recherche des gens, mais il peut également prédire ce que les chercheurs vont faire ensuite. Chaque demande de recherche saisie par un utilisateur indiquera à Google ce qu'il recherche, et tout comportement humain laissera une trace sur Internet, et Google occupe une excellente place pour capturer et analyser ce chemin. En d'autres termes, Google peut prédire vos intentions avant même que vous ne réalisiez ce que vous recherchez. Cette capacité à capturer, stocker et analyser des données homme-machine massives, puis à faire des prédictions basées sur celles-ci, est un produit basé sur les données.

Google Analytics: Google a plus de moyens pour obtenir des données qu'une simple recherche. Les entreprises installent des produits comme "Google Analytics" pour suivre les pas des visiteurs sur leurs sites, et Google a également accès à ces données. Le site utilise également le "Google Ad Network" pour afficher les annonces du réseau d'annonceurs de Google sur son site, afin que Google puisse non seulement avoir un aperçu des performances des annonces sur son propre site, mais également des performances d'autres sites publicitaires en un coup d'il. .

Tendances Google: Étant donné que la recherche elle-même est la "base de données d'intentions" des internautes, il est bien sûr possible de prédire la prochaine tendance en fonction de la montée et de la chute du volume de recherche d'un certain sujet. Google Trends peut prédire les voyages, l'immobilier et les ventes de voitures. La prédiction la plus connue est Google Flu Trends, qui suit la propagation de la grippe et d'autres maladies dans le monde, et analyse la propagation de la grippe et d'autres maladies dans le monde sur la base des recherches des internautes.

3. Plateforme d'analyse d'eBay

Dès 2006, eBay a mis en place une plateforme d'analyse de données volumineuses. Afin d'analyser avec précision le comportement d'achat des utilisateurs, eBay définit plus de 500 types de données pour suivre et analyser le comportement des clients. Oliver Ratzesberger, directeur principal de la plate-forme d'analyse d'eBay, a déclaré : "Cette plate-forme rassemble des données structurées et non structurées pour stimuler l'innovation commerciale et la croissance des bénéfices d'eBay grâce à l'analyse."

Analyse du comportement d'eBay : Au début, les modifications apportées à chaque fonctionnalité d'une page eBay étaient généralement décidées par un chef de produit qui connaissait très bien la fonctionnalité, sur la base de l'expérience personnelle du chef de produit. Et grâce à l'analyse des données de comportement des utilisateurs, la modification de toute fonction sur la page Web est laissée à l'utilisateur pour décider. "Chaque fois qu'il y a une bonne idée ou idée, nous sélectionnerons un certain nombre d'utilisateurs sur le site Web pour les tester. En analysant le comportement de ces utilisateurs, nous pouvons voir si l'idée a produit l'effet escompté."

Analyse de la publicité eBay : Des changements plus spectaculaires se reflètent dans les frais de publicité. eBay a beaucoup investi dans la publicité sur Internet, en achetant des mots-clés pour les recherches sur le Web afin d'amener des clients potentiels sur le site eBay.

4. "Data Association Mining" de la cible

À l'aide de méthodes statistiques avancées, les marchands peuvent créer des modèles grâce à l'analyse de l'historique d'achat des utilisateurs, Prédire le comportement d'achat futur , puis concevoir des promotions et des services personnalisés pour éviter de perdre des utilisateurs au profit d'autres concurrents.

Target, le troisième plus grand détaillant aux États-Unis, peut "deviner" qui sont les femmes enceintes en analysant les enregistrements d'achat de toutes les clientes. Il a constaté que les clientes achetaient des lotions non parfumées en vrac vers le quatrième mois de grossesse. À partir de là, 25 éléments fortement liés à la grossesse ont été extraits pour créer un indice de "prédiction de grossesse". Une fois la date d'échéance calculée, il peut avoir une longueur d'avance et envoyer des coupons de réduction tels que des vêtements de maternité et des berceaux aux clients.

Target a également créé un modèle de la façon dont le comportement d'achat des femmes change pendant la grossesse, et pas seulement cela, mais si les utilisateurs achètent des produits pour bébés dans leur magasin, ils les donneront régulièrement au cours des prochaines années en fonction du cycle de croissance du bébé. pousser des produits pertinents, afin que ces clients soient fidélisés à long terme.

5. Opérations numériques de China Mobile

Grâce à l'analyse des mégadonnées, China Mobile peut effectuer une surveillance ciblée, une alerte précoce et un suivi de l'ensemble des activités de l'entreprise. Le système Big Data peut capturer automatiquement les changements du marché dans un premier temps, puis le transmettre au responsable désigné de la manière la plus rapide, afin qu'il puisse connaître la situation du marché dans les plus brefs délais.

Avertissement de désabonnement client : Un client utilise le dernier téléphone mobile Nokia, paie ses factures à temps tous les mois, appelle le service clientèle trois fois par an en moyenne et utilise les services WEP et MMS. Selon l'analyse traditionnelle des données, il peut s'agir d'un client avec une satisfaction client très élevée et une très faible probabilité de désabonnement. En effet, après avoir collecté des données clients auprès de nouvelles sources dont Weibo, les réseaux sociaux, etc., la situation réelle de ce client peut être la suivante : le téléphone mobile acheté par le client à l'étranger, certaines fonctions du téléphone mobile ne sont pas utilisables en Chine Dans un endroit fixe, le téléphone mobile est souvent déconnecté et le MMS ne peut pas être utilisé. Son expérience est extrêmement médiocre et il fait face à un risque de perte. Il s'agit d'un scénario d'application de l'analyse des mégadonnées de China Mobile. En obtenant de manière exhaustive des informations commerciales, il est possible de renverser les conclusions tirées des idées d'analyse conventionnelles, de briser les limites des sources de données traditionnelles, de se concentrer sur de nouvelles sources de données telles que les médias sociaux et d'obtenir autant de commentaires des clients que possible via divers canaux, et à partir de ces données Découvrez plus de valeur.

Applications à valeur ajoutée des données : Pour les opérateurs, l'analyse des données est très prometteuse sur le marché des services gouvernementaux. Les opérateurs peuvent également faire en sorte que la technologie des mégadonnées joue un rôle plus important dans les transports, en répondant aux catastrophes soudaines et en maintenant la stabilité. Les opérateurs sont dans la position d'un centre d'échange de données et ont des avantages inhérents à appréhender le comportement des utilisateurs. Autre changement dans les technologies de l'information, l'émergence des mégadonnées donne une nouvelle direction au progrès technologique et au développement social, et quiconque maîtrise cette direction peut réussir. Pour les opérateurs, en termes de traitement et d'analyse des données, ce ne sont pas seulement les questions techniques et juridiques qui doivent être transformées, mais aussi la façon de penser pour penser le marketing du big data dans une perspective commerciale.

6. Intérêt et sentiment sur Twitter

Regroupement d'intérêts Twitter : En filtrant l'attribution des utilisateurs, l'emplacement des tweets et les mots-clés associés, Twitter crée une série de flux de données client personnalisés. Par exemple, vous pouvez voir quels films sont les plus populaires dans des villes comme Los Angeles, New York et Londres en filtrant les titres de films, les lieux et les balises de sentiment. Vous pouvez même rechercher des touristes japonais faisant du ski au Canada, en fonction des descriptions comportementales personnelles publiées par les utilisateurs. De ce point de vue, le graphe d'intérêt de Twitter est plus efficace que le graphe social de Facebook. La valeur potentielle des données des utilisateurs de Twitter est tout aussi stupéfiante. À une époque où les sites de médias sociaux collectent de plus en plus de données, ils peuvent être en mesure de trouver de meilleurs moyens de monétiser ces données et d'en faire leur principal moyen d'augmenter leurs revenus en remplaçant la publicité. La valeur réelle de ces sites de réseaux sociaux peut résider dans les données elles-mêmes. On pense que dans un avenir proche, si nous trouvons un moyen d'utiliser pleinement les données des utilisateurs et d'éviter raisonnablement les menaces à la vie privée des utilisateurs, l'énorme énergie contenue dans les données sociales sera complètement débloquée.

Analyse des sentiments sur Twitter : Twitter n'exploite pas tous les produits de données lui-même, mais il concède les données à des sociétés de services de données comme DataSift, qui ont utilisé les données sociales de Twitter pour créer toutes sortes d'applications étonnantes, de la surveillance sociale aux applications médicales, même pour suivre les épidémies de grippe, et La plateforme de surveillance des médias sociaux DataSift a créé un produit de données financières. L'une des tâches quotidiennes du PDG de "Derwent Capital Markets" de Wall Street, Paul Hoting, consiste à utiliser un programme informatique pour analyser les messages des 340 millions de comptes Weibo dans le monde, puis à juger du sentiment du public, puis à utiliser un score de "1" à "50". . Sur la base des scores, Hotting décide ensuite quoi faire de ses millions de dollars en stock. La règle d'or de Hoting est simple : si tout le monde semble heureux, achetez ; si l'anxiété monte, vendez. Certaines entreprises de médias regroupent les données d'audience dans des produits qu'elles revendent aux producteurs de chaînes et aux créateurs de contenu.

Lorsque des données précises sont combinées avec des données de médias sociaux, les prévisions futures peuvent être très précises.

7. Ciblage précis chez Tesco

Les commerçants intelligents créent des modèles grâce à l'analyse de l'historique d'achat des utilisateurs, prédisent pour eux les futures listes de courses, puis conçoivent des promotions et des services personnalisés pour qu'ils continuent à payer.

Tesco est le deuxième détaillant le plus rentable au monde, et le géant britannique des supermarchés a énormément profité de l'analyse du comportement des utilisateurs. À partir de l'historique d'achat de sa carte de membre par l'utilisateur, Tesco peut savoir quelle « catégorie » d'invités appartient à un utilisateur, comme les mangeurs rapides, les célibataires, les familles avec des enfants scolarisés, etc.

Une telle classification peut fournir de grands retours sur le marché.Par exemple, les promotions envoyées aux utilisateurs par courrier ou par courrier peuvent devenir très personnalisées, et les promotions en magasin peuvent également être plus ciblées en fonction des préférences des personnes environnantes et du moment de la consommation. le flux de marchandises. Une telle approche a porté ses fruits pour Tesco, économisant 350 millions de livres sterling par an en une seule campagne de marketing.

Les coupons de Tesco : Tesco adaptera 6 coupons pour les clients chaque saison. 4 d'entre eux sont des articles que les clients achètent souvent, et les 2 autres sont des produits susceptibles d'être achetés à l'avenir sur la base de l'analyse des données de comportement de consommation passées du client. Rien qu'en 1999, Tesco a envoyé 145000 magazines de guides d'achat et combinaisons de coupons ciblant différents segments de clientèle. Mieux encore, des prix aussi bas ne nuisent pas à la rentabilité globale de l'entreprise. En suivant le taux de retour de ces coupons à court terme et en sachant comment les clients dépensent dans tous les magasins, Tesco peut également calculer avec précision le retour sur investissement. Donner des coupons pour attirer les clients est une pratique démodée, et de nombreuses promotions ne sont en réalité qu'un moyen de priver une entreprise de ventes futures. Cependant, Tesco, qui s'appuie sur une analyse de données solide pour cibler les coupons, a été en mesure de maintenir une croissance des ventes de plus de 100 millions de livres sterling par an.

Tesco dispose également d'une base de données sur les membres.Avec les données existantes, il peut trouver ces clients sensibles au prix, puis fixer un prix minimum pour les articles que ces clients ont tendance à acheter au niveau de coût le plus bas acceptable pour l'entreprise. L'avantage est que cela attire cette partie du client, et le second est que vous n'avez pas à gaspiller de l'argent sur d'autres produits pour réduire les prix.

Les opérations de précision de Tesco : la chaîne de supermarchés collecte des données sur 7 millions de réfrigérateurs dans son entrepôt de données. L'analyse de ces données permet une surveillance plus complète et une maintenance proactive pour réduire la consommation globale d'énergie.

8. Parrainage d'amis Facebook

Facebook est un géant des réseaux sociaux, mais il semble qu'il n'y ait pas beaucoup de façons d'exploiter la valeur des mégadonnées. Il convient de mentionner cette recommandation d'un ami.

Facebook utilise les mégadonnées pour suivre le comportement des utilisateurs sur son réseau. En identifiant vos amis sur son réseau, il peut recommander de nouveaux amis. Plus un utilisateur a d'amis, plus le lien entre eux et Facebook est élevé. . Plus d'amis signifie que les utilisateurs partagent plus de photos, publient plus de mises à jour de statut et jouent à plus de jeux.

9. Valeur de chasse aux têtes de LinkedIn

Le site Web de LinkedIn utilise le Big Data pour établir des corrélations entre les candidats et les offres d'emploi. Avec LinkedIn, les chasseurs de têtes n'ont plus besoin de passer des appels téléphoniques inconnus à des recrues potentielles pour tenter leur chance, mais peuvent trouver des recrues potentielles et les contacter par une simple recherche.

De même, les demandeurs d'emploi peuvent naturellement se vendre à des employeurs potentiels en se connectant avec d'autres sur le site. Ont deux exemples Donner vie à la valeur des données de LinkedIn : il y a quelques années, LinkedIn a soudainement découvert que la récente Lehman Brothers Le nombre de visiteurs a augmenté, mais il n'a pas attiré l'attention à l'époque.Au bout d'un moment, Lehman Brothers a annoncé sa faillite; Google annonce son retrait de Chine C'est la même raison pour laquelle j'ai trouvé des chefs de produit Google rarement vus en ligne sur LinkedIn le mois précédent.

10. Le gène des données de Walmart

Dès 1969, Wal-Mart a commencé à utiliser des ordinateurs pour suivre les stocks et, en 1974, ses centres de distribution et divers magasins ont utilisé des ordinateurs pour le contrôle des stocks. En 1983, tous les magasins Walmart ont commencé à adopter des systèmes de lecture de codes-barres.

En 1987, Walmart a achevé l'installation d'un système satellite interne qui permettait la transmission bidirectionnelle en temps réel de données et de voix entre le siège social, les centres de distribution et les magasins individuels. L'utilisation de ces technologies de l'information, encore niches et avancées à l'époque, pour collecter des données opérationnelles a jeté les bases solides de l'essor de Wal-Mart au cours des 20 dernières années, découvrant ainsi "Bière et couches" association.

Aujourd'hui, Walmart possède le plus grand entrepôt de données au monde, où il stocke des enregistrements détaillés de chaque vente effectuée dans les milliers de magasins Walmart sur une période de 65 semaines, permettant aux hommes d'affaires de mieux comprendre leurs clients en analysant le comportement d'achat.

Grâce à ces données, le vendeur peut analyser le comportement d'achat des clients , afin de fournir le meilleur service de vente. Walmart a travaillé pour améliorer sa technologie de collecte de données, de la lecture de codes-barres à l'installation de systèmes satellites pour la transmission de données bidirectionnelle, toute l'entreprise regorge de gènes de données.

En avril 2012, Walmart a acquis Kosmix, une société qui étudie les gènes sociaux de réseau, et a ajouté des gènes sociaux aux gènes de données.

11. Ali petit prêt et Jushita

Bien que Yu'ebao d'Ali bat son plein, en fait, les petits prêts d'Ali reflètent vraiment la valeur des mégadonnées. Dès 2010, Ali avait créé le "petit prêt Taobao". Grâce à une évaluation complète des commandes en aval, des fournisseurs en amont et du crédit commercial des clients prêteurs, il peut prêter de l'argent aux clients sans se rencontrer. Bien sûr, c'est vrai. Big data mining sur la plateforme Alibaba.

Les données proviennent de "Jushita", une plateforme de partage de données à grande échelle, qui crée de la valeur commerciale en partageant les ressources de données de diverses filiales d'Alibaba. Ce produit est le résultat de l'équipe Big Data qui intègre et interconnecte les données de tous les aspects du processus de transaction de Taobao, puis classe, stocke, analyse et traite les informations en fonction de la compréhension de l'entreprise et les relie au comportement décisionnel.

12. Intégration des données de Sears

Dans le passé, le géant américain de la vente au détail Sears Holdings Co. prenait huit semaines pour développer un plan de vente personnalisé, mais souvent, ce n'était plus le meilleur plan.

Après beaucoup de peine, a décidé d'intégrer les données sur les clients, les produits et les ventes des trois marques qu'elle vend exclusivement - Sears, Craftsman, Lands'End, d'utiliser le cluster pour collecter les données de différentes marques et d'analyser les données directement sur le cluster, pas comme avant Stockez d'abord dans l'entrepôt de données pour éviter de perdre du temps - combinez les données de différentes sources avant de procéder à l'analyse.

Cet ajustement rend le plan de vente de l'entreprise plus rapide et plus précis, et peut extraire de la valeur d'informations massives, mais la valeur est énorme et la difficulté est énorme : ces données Analyse à grande échelle requise , et dispersés dans des bases de données et des entrepôts de données de différentes marques, qui sont non seulement énormes mais fragmentés.

La situation difficile de Sears est très courante dans les entreprises traditionnelles.Ces entrepreneurs se demandent pourquoi leurs entreprises ne peuvent pas faire de même lorsque le détaillant en ligne Amazon peut recommander des livres à lire, des films et des produits à acheter.

Phil Shelley, directeur de la technologie de Sears, a déclaré : « Si une série de recommandations complexes doivent être formulées avec une meilleure qualité et nécessitent des données plus opportunes, détaillées et personnalisées, l'architecture informatique d'entreprise traditionnelle ne peut tout simplement pas accomplir ces tâches, Il faut une détermination minutieuse pour mener à bien la transformation.

02 Médium : Light Company Data Entrepreneurship Carnival

Dans la "fête des données", n'y a-t-il que le carnaval des grandes entreprises ? Non, les entreprises légères engagées dans l'industrie du big data seront partout. Les startups émergentes sont plus ciblées pour proposer des solutions individuelles en vendant des données et des services, La commercialisation et la commercialisation des mégadonnées est un modèle digne de notre attention. Cela apportera une nouvelle vague d'entrepreneuriat et de révolution industrielle suivant les portails, les moteurs de recherche et les médias sociaux, et aura un fort impact sur les cabinets de conseil traditionnels.

13. Prédiction du crime par PredPol

Travaillant avec la police de Los Angeles et de Santa Cruz et une équipe de chercheurs, PredPol prédit les probabilités d'un crime à moins de 500 pieds carrés sur la base d'une variante d'un algorithme de prédiction des tremblements de terre et de données sur la criminalité. La répartition des vols et des crimes violents a chuté de 33 % et de 21 % dans les régions de Los Angeles où l'algorithme a été utilisé.

14. Prédiction du comportement des joueurs de Tipp24 AG

Tipp24 AG est une plateforme de paris et de pronostics conçue pour l'industrie européenne des jeux. La société utilise le logiciel KXEN pour analyser des milliards de transactions et les caractéristiques des clients, puis utilise des modèles prédictifs pour créer des campagnes de marketing dynamiques pour des utilisateurs spécifiques. Cette décision a réduit le temps de construction du modèle prédictif de 90 %. SAP tente d'acquérir KXEN, "SAP veut inverser son désavantage de longue date dans l'analyse prédictive grâce à cette acquisition."

15. La prophétie d'embouteillage d'Inrix

Les acteurs du transport sont variés et c'est le domaine où les mégadonnées peuvent exercer le plus de valeur. La société de données sur le trafic Inrix s'appuie sur l'analyse des données de trafic historiques et en temps réel pour fournir des rapports de trafic en temps opportun afin d'aider les conducteurs à éviter les embouteillages et à planifier leurs trajets à l'avance. Les constructeurs automobiles, les développeurs d'applications mobiles, les sociétés de transport et toutes sortes de sociétés Internet ont tous besoin de rapports routiers d'Inrix. Audi, Ford, Nissan, Microsoft et d'autres géants sont tous des clients d'Inrix.

16. Les prédictions de mode de Panjwa

Les consommateurs recherchent le style de vie d'un leader d'opinion. Panjiwa utilise l'analyse des données pour prédire les tendances de la mode et même tirer parti du commerce mondial sur cette base. Par exemple, ils ont suivi le transport des badges et des chaussettes de "Twilight" 41 fois, analysé le taux d'influence des vêtements du protagoniste sur les tendances de la mode dans ce film et informé les utilisateurs des résultats de l'analyse, leur suggérant d'effectuer les ajustements appropriés.

17. Recommandations musicales de Pandora

Pandora, un site américain de musique en ligne, a embauché des experts en musique et a demandé à chacun d'eux de passer en moyenne 20 minutes à analyser une chanson et à attribuer 400 attributs différents à chaque chanson. Si vous dites que vous aimez une chanson, le programme trouvera automatiquement des chansons avec le même "gène" que la chanson, devinant que vous l'aimerez et vous la recommanderez en utilisant la technologie du moteur de recommandation. Avec cette tactique de foule, Pandora a analysé 740000 chansons.

18. Solutions médicales par Futrix Health

Futrix Health est une entreprise axée sur l'utilisation des données pour créer des solutions médicales pour les patients, des applications de santé personnelles installées sur les smartphones, aux dossiers de santé électroniques utilisés par les médecins dans les cliniques et les hôpitaux, et même des données génomiques numérisées révolutionnaires, sont connectés au back-end. entrepôt de données. Afin de formuler le meilleur choix hospitalier et médical pour le patient.

Comment collecter une grande quantité d'informations opérationnelles auprès des établissements de santé, analyser les conditions des patients ou les effets des traitements, et mettre en uvre toutes les mesures efficaces pour les rendre plus significatives - l'opportunité offerte par l'ère du big data, Il ne s'agit plus simplement de collecter ces données, mais comment utiliser les données pour mieux comprendre le monde.

19. Adhésion des utilisateurs à la science de la rétention

Dans le domaine de la vente au détail, la startup Retention Science a lancé une plate-forme pour les entreprises de commerce électronique afin de fournir une analyse des données et une conception de stratégie de marché pour améliorer la fidélité des utilisateurs. Son moteur de modélisation des utilisateurs est auto-apprenant, utilisant des algorithmes et des modèles statistiques pour concevoir des stratégies visant à optimiser l'adhésion des utilisateurs.

L'analyse des données utilisateur de la plate-forme est effectuée en temps réel pour garantir que la prédiction du comportement de l'utilisateur est toujours conforme à la mise à jour réelle du comportement de l'utilisateur ; en même temps, certaines stratégies de promotion sont conçues de manière dynamique en fonction de ces prédictions de comportement. RS a maintenant reçu 1,3 million de dollars d'investissement de Baroda Ventures, Mohr Davidow Ventures, Double M Partners et de certains investisseurs providentiels bien connus.

20. La recommandation post-mariage de Zhongying

Jiangsu Zhongying United Data Technology Co., Ltd. a construit une telle plate-forme de données volumineuses - en prenant les couples nouvellement mariés comme consommateurs cibles et en incluant les entreprises liées aux achats de mariage.

Un couple de jeunes mariés a pris des photos de mariage dans le Weiwei Bridal Wedding Studio. Après avoir enregistré leurs informations en vrais noms, ils seront téléchargés sur la plate-forme de données volumineuses. La plateforme de big data peut analyser et déterminer grossièrement les besoins de consommation de suivi des nouveaux arrivants en fonction de la situation de consommation et du style préféré des nouveaux arrivants dans le studio photo de mariage, et envoyer des récompenses et des SMS promotionnels en temps réel.

Par exemple, invitez-les à acheter des meubles chez Red Star Macalline, achetez de la literie chez Red Bean Home Textile, achetez des appareils électroménagers chez Gome, et organisez un banquet à l'hôtel Hilton... Si les nouveaux arrivants achètent des meubles de style chinois chez Red Star Macalline, cela signifie qu'ils préfèrent la culture traditionnelle chinoise, il est recommandé qu'ils achètent des articles ménagers de style chinois à partir de textiles de maison à base de haricots rouges.

21. L'apprivoisement numérique de l'eau par Takadu

L'eau a toujours été une chose difficile à gérer : la compagnie des eaux trouve un problème avec un manomètre d'eau, et cela peut prendre beaucoup de temps pour dépanner plusieurs conduites d'eau qui partagent un manomètre d'eau. Au moment où il a été découvert, beaucoup d'eau avait été gaspillée. Un service d'alerte précoce du système d'eau israélien appelé Takadu a résolu le problème.

Takadu collecte des données de détection telles que les manomètres d'eau, la consommation d'eau et les conditions météorologiques enfouies dans le sol, et les retransmet à l'ordinateur de Takadu via le service cloud d'Amazon pour une analyse d'algorithme. S'il s'avère qu'il existe des conditions anormales telles que des conduites d'eau éclatées, des infiltrations d'eau et une pression d'eau insuffisante dans une conduite d'eau souterraine dans une ville, il faudra environ 10 minutes pour terminer l'analyse et générer un rapport, qui sera renvoyé au service de maintenance de cette conduite d'eau.

Dans le rapport, en plus de fournir le type de condition anormale et l'état des dommages des conduites d'eau - combien de mètres cubes d'eau fuient par seconde, il peut également indiquer l'emplacement exact des conduites d'eau problématiques avec une précision relative. Takadu facture 10000 dollars par mois pour tester chaque kilomètre de "voies navigables".

22. Matchmaking de Lily.com

Les revenus en espèces de l'industrie du commerce électronique proviennent des données, et le modèle commercial des sites de rencontres est ancré dans l'étude des données. Par exemple, en tant que site Web de mariage et de rencontres, Lily.com a non seulement besoin de faire fréquemment des rapports de recherche, mais analyse également des données telles que l'âge, la région, l'éducation, le revenu économique et d'autres données des utilisateurs enregistrés. chaque utilisateur enregistré a beaucoup à creuser derrière lui.

Li Qi du département de recherche et de planification de Lily.com a déjà analysé les informations d'avatar d'un grand nombre d'utilisateurs enregistrés de Lily.com à Shanghai. On constate que ces photos de tête populaires ne sont pas seulement liées à l'apparence du propriétaire, mais également aux expressions faciales, aux proportions du visage, à la netteté et à d'autres facteurs des personnes sur les photos qui déterminent également dans une large mesure la popularité du propriétaire de la photo.

Par exemple, pour les membres féminins, sourire, regarder droit devant et un maquillage léger peuvent augmenter la probabilité d'être populaire, tandis que les hommes dont les visages représentent la moitié de la photo, portent des vêtements formels et regardent droit sans poses inutiles sont plus susceptibles être populaire, plus susceptible de devenir la coqueluche des sites de rencontre.

23. Manteau de presse de Prismatic

Prismatic est une application d'information personnalisée avec seulement 4 employés fondateurs. S'appuyant sur les données d'un crawler de données Internet et d'une plate-forme de développement de réseaux sociaux, et s'appuyant sur la plate-forme de cloud computing d'Amazon, elle a réalisé le lean start-up du big data.

Prismatic ne fournit pas d'interface d'abonnement ou de recommandation d'actualités unifiée et bien conçue, mais effectue une analyse de données individuelle et des recommandations pour les utilisateurs en fonction de l'analyse de leurs profils Facebook ou Twitter.

Du point de vue du modèle de profit, Prismatic ne dépend pas des frais de publicité pour survivre, ni d'un média d'information traditionnel, mais d'une entreprise de commerce électronique déguisée en application d'information. Nominalement, afin de recommander des nouvelles personnalisées aux utilisateurs, les informations personnelles des utilisateurs sont obtenues pour l'analyse des données, et les produits recommandés sont lancés de manière ciblée, tirant ainsi des bénéfices du commerce électronique.

24. Incitations contrastives d'Opower

Les humains ont une tendance naturelle à se comparer à leurs pairs. Par exemple, une agence gouvernementale collecte des données sur des groupes d'employés dans différents endroits exerçant des fonctions similaires, et le simple fait de rendre ces informations publiques peut conduire à de meilleures performances parmi les retardataires.

Dans le secteur de l'énergie, Opower utilise la comparaison de données pour améliorer l'efficacité énergétique de l'électricité grand public avec un succès remarquable. En tant qu'entreprise d'innovation SaaS, Opower coopère avec un certain nombre de compagnies d'électricité pour analyser la consommation d'électricité des ménages américains et les comparer avec la consommation d'électricité des voisins environnants.Les ménages desservis reçoivent un rapport de comparaison mensuel, montrant Le niveau des appareils ménagers à des niveaux similaires niveaux des ménages dans la région ou aux États-Unis pour encourager la conservation de l'électricité.

Les services d'Opower ont couvert des millions de foyers aux États-Unis, Il devrait permettre d'économiser 500 millions de dollars par an sur l'électricité des consommateurs américains. Opower signale des enveloppes, qui ressemblent à des factures, et utilise des techniques comportementales pour convaincre en douceur les clients des services publics de réduire leur consommation.

Opower a lancé sa plateforme de big data Opower4, en analysant divers compteurs intelligents et le comportement de consommation d'électricité, les services publics tels que les compagnies d'électricité deviennent une source de profit pour Opower. Pour les utilisateurs ordinaires, Opower est entièrement gratuit.

25. Consommation de clics par Chango et Uniqlick

En utilisant de nouvelles technologies de données, des entreprises telles que Chango aux États-Unis et Uniqlick en Chine explorent un nouveau modèle commercial dans l'industrie de la publicité numérique : les enchères en temps réel pour les publicités numériques.

En comprenant les comportements des internautes sur Internet, tels que la recherche et la navigation, ces entreprises peuvent fournir aux annonceurs les groupes d'utilisateurs les plus susceptibles d'être intéressés par leurs produits, afin d'effectuer un marketing précis ; une tendance à plus long terme est de placer des publicités sur le groupe d'utilisateurs acheté le plus probable.

Une telle approche peut atteindre des taux de conversion plus élevés pour les annonceurs, et pour les sites Web qui publient des publicités, elle augmente également la valeur de l'espace publicitaire.

26. Analyse du comportement de l'intérêt public

Zhongqu est la première plate-forme de gestion de données de médias sociaux en Chine. À l'heure actuelle, les principales plates-formes ouvertes sociales en Chine sont encore relativement conservatrices en termes d'ouverture des données des utilisateurs. En tant que société tierce d'analyse de données, les données des utilisateurs qui peuvent être obtenues sont encore très limitées.Ces données utilisateur nécessitent l'autorisation de l'utilisateur.

Zhongqu filtre les données des utilisateurs à l'aide de statistiques opérationnelles et d'autres principes d'analyse de données connexes, et complète enfin la description du comportement, des actions et d'autres caractéristiques individuelles d'un utilisateur. Ces descriptions peuvent aider les spécialistes du marketing des marques à comprendre les habitudes de consommation et les besoins des consommateurs ; elles peuvent également aider les chefs d'entreprise à mieux comprendre leurs employés. En plus de la description des caractéristiques comportementales individuelles et collectives, ces résultats d'analyse de données peuvent également être utilisés pour prédire le comportement des groupes d'utilisateurs, afin de fournir aux spécialistes du marketing une analyse prospective du marché.

Les résultats de l'analyse des données de Zhongqu ne peuvent être précis que pour des groupes mais pas pour des individus. En plus d'avoir un certain prix de référence dans le domaine du marketing, ce type de recherche de données utilisateur est principalement utilisé pour coopérer avec quelques petites enquêtes. De plus, ces données peuvent également permettre d'obtenir des cotes de crédit pour les utilisateurs et même les entreprises, et sont également utilisées dans une certaine mesure dans le domaine financier.

27. La conjecture de demain pour les dragues

Le coup de filet du guide d'achat e-commerce a réalisé l'application "What to Wear Tomorrow". Dans cette application, de nombreuses personnalités faisant autorité dans l'industrie de la mode proposent des collocations de mode et des articles de style, qui sont notés arbitrairement par les utilisateurs. Selon les préférences de notation de l'utilisateur, le filet peut deviner ce qu'il veut porter demain, puis acheter pour elle sur des centaines de milliers d'articles en ligne. Recommander des produits uniques à la mode et réaliser des commandes d'achat directes. Après l'acquisition des données clients, l'analyse back-end montre également sa magie.

Dragnet a ajouté plus de variables pour évaluer son propre mode de recommandation. Par exemple, une consommatrice se rend à une soirée demain, ne sait pas quel style porter et ne consulte pas la météo. Elle espère que le site Web du guide d'achat pourra l'aider à combiner ces scénarios avec ses propres informations. et fournir un ensemble complet de solutions.

alors date, région, occasion, style , celles-ci sont devenues les variables de la solution d'habillage et d'appariement, qui sont présentées aux utilisateurs par le biais de combinaisons continues. Selon les données de dragnet, lorsque l'utilisateur voit un appariement de relativement haute qualité et est guidé par la scène, cliquez jusqu'au dernier page pour finaliser l'achat. Le taux de conversion sera supérieur de 40 % à la recommandation d'un seul produit.

28. Santé génétique chez SeeChange

La possibilité de sérialiser les profils génétiques humains permet désormais aux médecins et aux scientifiques de prédire la sensibilité d'un patient à certaines maladies et autres conditions défavorables, réduisant ainsi le temps et le coût du traitement.

SeeChange, basé à San Francisco, a créé un nouveau modèle d'assurance maladie. La société analyse les dossiers de santé personnels, les dossiers de remboursement médical et les données de la pharmacie d'un client pour déterminer la sensibilité d'un client aux maladies chroniques et déterminer si le client est susceptible de bénéficier de certains forfaits de récupération personnalisés.

SeeChange conçoit également un plan de santé et met en place un mécanisme de récompense pour encourager les clients à prendre l'initiative d'actions de santé.L'ensemble du processus est suivi grâce à son moteur d'analyse de données.

29. Diagnostic d'image de Given Imaging

La société israélienne Given Imaging a inventé une capsule avec une caméra intégrée.Une fois que le patient a pris la capsule, la capsule peut prendre des photos de la situation dans le tube digestif à une fréquence d'environ 14 images par seconde, et en même temps transmettre au récepteur d'image externe.Le logiciel est entré dans la base de données, et dans les 4 à 6 heures, la caméra capsule sera excrétée par le corps.

D'une manière générale, les médecins se fient à leur propre expérience personnelle pour porter des jugements sur les symptômes.Il est inévitable que certaines ombres suspectes soient inexactes ou même retardent le traitement des patients. Désormais, grâce à la base de données de Given Imaging, lorsqu'un médecin trouve une tumeur suspecte, après avoir double-cliqué sur l'image actuelle, des images similaires prises par d'autres médecins dans le passé et leurs résultats de diagnostic seront tous extraits.

On peut le dire, Le problème d'un patient n'est plus vu par un seul médecin, mais par des milliers de médecins donnant des avis en même temps, corroborés par les images d'un grand nombre d'autres patients. Une telle comparaison de données améliore non seulement l'efficacité du diagnostic des médecins, mais améliore également la précision.

30. "Ancien chasseur de têtes" par Entelo

Les vrais talents techniques sont toujours recherchés par les grandes entreprises, n'attendez jamais qu'elles vous envoient un CV, car elles ont peut-être été arrachées par d'autres entreprises avant d'avoir la possibilité de rédiger un CV. Entelo peut orienter les entrepreneurs vers des talents techniques de haut niveau qui commencent tout juste à changer de métier, afin qu'ils puissent se lancer en premier.

Il y a actuellement 300 millions de CV dans la base de données d'Entelo. Et comment juger de la tendance des talents seniors à changer d'emploi, Entelo dispose d'un ensemble d'algorithmes en instance de brevet. Cet algorithme a plus de 70 indicateurs utilisés pour déterminer la tendance à changer d'emploi. Le cours de l'action d'une entreprise a chuté, un changement de haut niveau s'est produit et elle vient d'être rachetée par une autre grande entreprise, autant d'éléments considérés par Entelo comme des facteurs possibles qui conduisent au saut de talents de l'entreprise.

Ainsi, Entelo transmettra immédiatement les informations des talents seniors de l'entreprise aux entrepreneurs qui s'abonnent à son service. Les entrepreneurs reçoivent un CV différent du CV moyen. Entelo capte les informations de ces talents sur les principaux réseaux sociaux. Cela permet aux entrepreneurs de voir quel code la personne a soumis, quelles questions ont été répondues en ligne et quelles informations ont été publiées sur Twitter.

Bref, ces entrepreneurs qui sont prêts à « débaucher » peuvent voir une cible vivante de talents se dresser devant eux.

31. Prévisions de retard de FlightCaster et Passur

Chaque seconde compte dans l'industrie aéronautique, surtout à l'arrivée d'un vol. Si un vol arrive tôt et que l'équipe au sol n'est pas prête, les passagers et les agents de bord seront coincés dans l'avion pour perdre du temps ; si un vol est retardé, l'équipe au sol ne peut que s'asseoir et attendre, ce qui coûte en vain.

Une grande compagnie aérienne américaine a découvert dans son rapport interne, Environ 10 % des vols ont des heures d'arrivée réelles qui diffèrent des heures d'arrivée estimées de plus de 10 minutes, et 30 % des vols diffèrent de plus de 5 minutes. FlightCaster est une société qui fournit des prévisions d'informations sur les retards de vol, principalement basées sur les opérations de vol des compagnies aériennes.

À l'instar des informations exclusives dont disposent les compagnies aériennes sur des opérations de vol similaires, la société dispose d'une multitude de données historiques sur les opérations de vol intérieur et les performances de vol en temps réel. Le secret de Flightcaster est son utilisation efficace de l'analyse de données volumineuses et la gestion en temps réel des données de sortie à l'aide d'outils logiciels appropriés.

Passur Aerospace est une entreprise technologique spécialisée dans l'aide à la décision pour l'industrie aéronautique. En collectant des données publiques telles que la météo et les horaires de vol, combinées à d'autres données non publiques qui affectent les facteurs de vol collectés indépendamment, l'heure d'arrivée du vol est prédite de manière exhaustive. Depuis 2012, Passur compte plus de 155 stations de réception radar, collectant une série d'informations sur chaque avion sur le radar toutes les 4,6 secondes, ce qui apportera en continu une énorme quantité de données.

Non seulement cela, mais après une collecte de données à long terme, Passur dispose d'un énorme support d'informations multidimensionnelles depuis plus de dix ans, ce qui offre la possibilité d'une analyse approfondie et d'un modèle de données approprié. Passur pense que les compagnies aériennes peuvent économiser des millions de dollars par an à chaque aéroport en planifiant en fonction des heures d'arrivée qu'elles proposent.

32. L'assurance agricole du climat

Une startup appelée The Climate Corporation effectue chaque jour plus de 10000 simulations de conditions météorologiques au cours des deux prochaines années dans plus d'un million d'emplacements à travers les États-Unis, avec des données massives, dynamiques et en temps réel. L'entreprise combine ensuite des données sur la structure racinaire et la porosité du sol avec des résultats de simulation pour fournir une assurance-récolte à des milliers d'agriculteurs.

L'obtention de données sur le sol par télédétection n'est pas la même chose que l'obtention de données sur le comportement du réseau des utilisateurs par le biais de services réseau que nous connaissons dans le passé, et le concept de données a été considérablement élargi. Afin de fournir des services d'assurance précis pour chaque domaine, des données sur l'avenir des produits agricoles, la prévision climatique, le commerce international, la sécurité politique et militaire internationale, l'économie nationale, la concurrence industrielle, etc.

Le modèle économique lancé sur la base de données aussi complexes est innovant, très compétitif avec les méthodes d'assurance récolte existantes, durable et évolutif. Ce qui est encore mieux, c'est que les opérations de cette société sont basées sur le Big Data, et qu'il n'y a pas du tout d'investissements importants dans les installations de réseau, mais ne loue les services de cloud public d'Amazon que pour des dizaines de milliers de dollars par mois.

33. Lecture record de Hiptype

Presque tous les ebooks payants proposent des chapitres aux lecteurs, mais les éditeurs doivent savoir où les gens lisent, s'ils l'achètent après l'avoir lu et diverses autres expériences afin de vendre plus d'ebooks.

La startup américaine Hiptype a développé un ensemble d'outils d'analyse de lecture de livres électroniques, et son modèle économique tente de résoudre ce problème. Hiptype se présente comme "Google Analytics pour les livres électroniques" et fournit des données riches sur les livres électroniques. Il peut non seulement compter le nombre de lectures d'essai et d'achats d'e-books, mais aussi dessiner une « carte des lecteurs », comprenant l'âge, le revenu et la situation géographique de l'utilisateur.

De plus, il peut indiquer à l'éditeur si les lecteurs ont effectué un achat après avoir regardé le chapitre gratuit, Combien de lecteurs ont lu le livre en entier, et combien de pages les lecteurs lisent en moyenne, quels chapitres les lecteurs aiment le plus commencer, où ils s'arrêtent à mi-chemin, etc.

Hiptype peut être intégré aux livres électroniques, de sorte que les éditeurs ont toujours accès aux données des utilisateurs, quel que soit le canal qu'ils choisissent. Toutes les données collectées par Hiptype sont anonymes. Lorsque les utilisateurs téléchargent un ebook avec le service Hiptype intégré, ils reçoivent une invite avec la possibilité de le bloquer.

34. "Intégration des personnes et des réseaux" d'Acxiom

Il y a un énorme problème dans le marketing de réseau. Comment savoir si les personnes qui utilisent plusieurs noms différents en ligne sont la même personne ? Anchengke a introduit une solution technique appelée "système d'exploitation d'audience" pour résoudre ce problème. Il permet aux spécialistes du marketing de se lier à votre "personne numérique", même si vous avez changé de nom en raison d'un mariage, ou utilisez un surnom, ou utilisez occasionnellement un deuxième prénom, il peut toujours répondre si la personne qui a changé d'adresse ou de numéro de téléphone est la même problème de personne.

AOS peut regrouper des informations provenant de différentes bases de données, hors ligne ou en ligne, que les entreprises peuvent collecter auprès d'individus à différentes occasions. En utilisant AbiliTec - une technologie d'"identification" numérique dont Acxiom est également propriétaire - AOS simplifie l'information client, ce qui se traduit par un résultat simple et unique. AOS aide les annonceurs d'Anchengke à utiliser leurs données pour trouver des utilisateurs ciblés sur Facebook.

03 Partie 2 : Corrélation des données, épuisement des données et dark data

Les mégadonnées ne font généralement pas de jugements de causalité et conviennent principalement à l'analyse d'association. Une grande partie de l'analyse relationnelle ne nécessite pas de modèles complexes, juste un sens du Big Data.

De nombreuses organisations ont des déchets de données. Les données sont soit utilisées, soit jetées. Vous ne connaissez peut-être pas la valeur de leur réutilisation maintenant, mais à un certain moment dans le futur, elles éclateront et peuvent transformer les déchets en trésor.

Les dark data sont des données collectées pour une cible unique, généralement archivées après utilisation, et dont la vraie valeur n'a pas été pleinement exploitée. Si les données sombres sont utilisées au bon endroit, elles peuvent également rendre la carrière d'une entreprise plus brillante.

35. Analyse des associations de données

Une équipe d'une entreprise a déjà utilisé les données de localisation des téléphones portables pour déduire le nombre de personnes garées dans le parking d'un Macy's au début de la saison des achats de Noël aux États-Unis, puis a prédit ses ventes pour ce jour-là, bien avant Macy's. propres dossiers de vente. Qu'il s'agisse d'analystes de Wall Street ou de dirigeants d'industries traditionnelles, ils obtiendront un grand avantage concurrentiel grâce à cette perspicacité.

La tromperie fiscale est une préoccupation croissante pour les autorités fiscales, lorsque les mégadonnées peuvent être utilisées pour renforcer le processus gouvernemental d'identification de la fraude. Lorsque la confidentialité le permet, les ministères peuvent intégrer divers aspects des données telles que l'immatriculation des véhicules et les données sur les voyages à l'étranger pour découvrir les habitudes de dépenses individuelles, de sorte que les contributions fiscales ne se superposent pas. En même temps, une question douteuse se pose, il n'y a aucune preuve directe de fraude, ces conclusions ne peuvent pas être utilisées pour accuser des individus. Mais il peut aider les ministères à clarifier leurs audits et autres audits et certains processus.

36. Épuisement des données

Les données des entreprises de logistique ne répondaient à l'origine qu'à des besoins opérationnels, mais une fois réutilisées, les entreprises de logistique se sont transformées en sociétés financières. Les données sont utilisées pour évaluer le crédit des clients, fournir des prêts non garantis ou accorder des prêts avec des marchandises en transit comme garantie ; la logistique peut même être transformée en une société de services d'information financière pour juger du fonctionnement et de l'évolution de divers segments économiques.

Certaines entreprises ont le sentiment d'être proches de "Dieu regardant vers le bas" dans le domaine du big data. Une entreprise de Los Angeles, aux États-Unis, a déclaré : Ils ont construit un modèle des données historiques de la scène nocturne mondiale, et après avoir filtré les fluctuations, ont fait un rapport de recherche sur l'investissement dans l'immobilier et la consommation.

McDonald's, par le biais de son service de livraison, obtient les adresses précises des utilisateurs lors de la vente de hamburgers. Une fois les données d'adresse collectées, elles deviennent une merveilleuse donnée interne de l'industrie immobilière.

37. Données sombres

Dans certaines circonstances, les données obscures peuvent être utilisées à d'autres fins. Infinity Property and Casualty a utilisé les rapports accumulés des experts en sinistres pour analyser les cas de fraude et a récupéré de manière algorithmique 12 millions de dollars en subrogation. Une société de vente d'électricité, grâce à l'accumulation de 10 ans d'analyse des données de vente ERP, a visité les anciens clients il y a cinq ans un par un en fonction du cycle de vie des équipements électriques, a obtenu des commandes de maintenance d'équipements électriques de plus de 10 millions de yuans et a réussi entré sur le marché MRO.

38. Analyse du taux de désabonnement des clients

American Express ne pouvait réaliser que des rapports rétrospectifs et des prévisions décalées auparavant, et la BI traditionnelle ne pouvait plus répondre aux besoins de son développement commercial.

En conséquence, AmEx a commencé à construire un modèle qui peut véritablement prédire la fidélité des clients, en utilisant 115 variables pour analyser et prédire sur la base des données de transaction historiques. La société a déclaré qu'elle avait été en mesure d'identifier 24% des clients en Australie qui se désabonneraient au cours des quatre prochains mois. Une telle analyse de l'attrition des clients peut bien sûr être utilisée pour fidéliser les clients.

L'industrie hôtelière peut personnaliser les chambres personnalisées uniques correspondantes pour les consommateurs, et même mettre l'humeur de voyage Weibo des consommateurs sur le papier peint et ainsi de suite. Basée sur les mégadonnées, l'industrie du tourisme peut offrir aux consommateurs des produits spéciaux locaux, des activités, de petites et belles attractions de niche, etc. qu'ils aimeraient gagner le cur des touristes.

39. Analyse vidéo pour l'industrie de la restauration rapide

Les entreprises du secteur de la restauration rapide peuvent analyser la longueur des files d'attente grâce à la vidéo, puis modifier automatiquement le contenu affiché sur le menu électronique. Si la file d'attente est longue, montrez les aliments qui peuvent être servis rapidement ; si la file d'attente est courte, montrez ceux qui sont plus rentables mais qui prennent un temps de préparation relativement long.

40. Campagne Big Data

En 2012, l'équipe d'Obama qui a participé à la campagne a identifié trois objectifs fondamentaux : amener plus de gens à dépenser plus d'argent, amener plus d'électeurs à voter pour Obama et impliquer plus de gens !

Cela nécessite une compréhension au niveau « micro » : par quels facteurs chaque électeur est-il le plus susceptible d'être convaincu ? Dans quelles circonstances chaque électeur est-il le plus susceptible de payer de sa poche ? Quel type de canaux publicitaires peut le plus efficacement acquérir des électeurs cibles ? Comme l'a dit le directeur de campagne Jim Messina, Tout au long de la campagne, les hypothèses ne peuvent exister sans données pour les étayer.

Pour lever 1 milliard de dollars en fonds de campagne, L'équipe d'exploration de données d'Obama a collecté, stocké et analysé de grandes quantités de données au cours des deux dernières années. Ils ont remarqué que la star de cinéma George Clooney était très attirante pour les femmes de 40 à 49 ans de la côte ouest : elles étaient sans aucun doute le groupe le plus susceptible de payer un dîner avec Clooney et Obama à Hollywood. Clooney a levé des millions de dollars en fonds de campagne pour Obama lors d'un dîner de collecte de fonds dans son manoir.

Plus tard, lorsque l'équipe d'Obama a décidé de trouver une star de cinéma sur la côte Est avec le même attrait pour ce groupe féminin, l'équipe de données a découvert que les fans de Sarah Jessica Parker aimaient aussi les compétitions, les petites fêtes et les célébrités. L '«effet Cloney» a été reproduit avec succès sur la côte est.

Au cours de toute la campagne, l'équipe d'Obama a dépensé moins de 300 millions de dollars en publicité, tandis que l'équipe de Romney a dépensé près de 400 millions de dollars et a perdu.L'une des raisons importantes est que les achats d'annonces de l'équipe de données d'Obama Les décisions sont prises après une analyse minutieuse des données. Un sondage a montré que 80 % des électeurs américains pensaient qu'Obama les faisait se sentir plus importants que Romney.

En conséquence, 98 % des premiers 100 millions de dollars levés par l'équipe d'Obama provenaient de petits dons de moins de 250 $, contre 31 % du même montant levé par l'équipe de Romney.

41. Surveillance des modifications illégales

La "construction privée" est une chose gênante dans n'importe quel pays, et il est facile de provoquer un incendie. Les bâtiments avec des cloisons intérieures illégales sont beaucoup plus susceptibles de prendre feu que les autres bâtiments. La ville de New York reçoit 25000 plaintes par an concernant des logements surpeuplés, mais la ville ne compte que 200 inspecteurs pour traiter les plaintes.

Une équipe d'experts en analyse du bureau du maire a estimé que les mégadonnées pourraient aider à combler cet écart en matière de demande et de ressources. L'équipe a créé une base de données de l'ensemble des 900000 bâtiments de la ville et a ajouté des données collectées par 19 services de la ville : enregistrements de saisies fiscales, consommations anormales d'eau et d'électricité, arriérés de paiement, coupures de services, utilisation des ambulances, taux de criminalité locale, plaintes de rongeurs, etc.

Ensuite, ils ont comparé cette base de données avec des enregistrements d'incendies de bâtiments classés par gravité au cours des cinq dernières années, dans l'espoir de trouver des corrélations. Effectivement, le type de bâtiment et l'année de construction étaient des facteurs liés à l'incendie. Un résultat moins attendu, cependant, était une corrélation entre les bâtiments avec des permis pour la maçonnerie extérieure et des taux plus faibles d'incendies graves.

En utilisant toutes ces données, l'équipe a construit un système qui pourrait les aider à déterminer quelles plaintes de surpeuplement nécessitent une attention urgente. Les différentes caractéristiques des bâtiments qu'ils ont enregistrées n'étaient pas la cause de l'incendie, mais corrélées à une augmentation ou une diminution du risque d'incendie. Ces connaissances se sont avérées extrêmement précieuses : Seuls 13 % des inspecteurs du logement émettaient des ordres d'évacuation lorsqu'ils étaient sur les lieux, mais avec la nouvelle approche, ce chiffre est passé à 70 %.

42. Indice de moutarde

Les responsables de la Direction de la Planification de la Commission Nationale du Développement et de la Réforme, chargés de l'élaboration du Plan National de Promotion d'un Développement Sain de l'Urbanisation (2011-2020) (ci-après dénommé le « Plan d'Urbanisation »), doivent connaître précisément les flux de population, et comment compter ces populations flottantes devient un problème difficile.

La moutarde est un produit consommable de mauvaise qualité et la croissance des revenus a peu d'impact sur la consommation de moutarde. Dans des circonstances normales, la consommation de nouilles instantanées, de moutarde et d'autres plats cuisinés par la population résidente de la ville est pratiquement constante. La variation du volume des ventes est principalement causée par la population flottante.

Selon un responsable de la Commission nationale du développement et de la réforme, l'évolution de la part des ventes de moutarde Fuling dans diverses régions du pays ces dernières années peut refléter la tendance des mouvements de population, et un indicateur macroéconomique appelé "indice de moutarde" est né . Des responsables du Département de la planification de la Commission nationale du développement et de la réforme ont constaté que la part des ventes de moutarde Fuling dans le sud de la Chine était passée de 49 % en 2007, 48 % en 2008, 47,58 % en 2009 et 38,50 % en 2010 à 29,99 % en 2011. .

Ces données montrent que, L'exode de la population dans le sud de la Chine est très rapide. Ils ont divisé le pays en deux parties, la zone d'entrée de population et la zone de sortie de population, selon "l'indice de moutarde", et la formulation de la politique sera différente pour les différentes structures de population des deux zones.

43. Facture météo

Comme le dit le dicton, « Le ciel est imprévisible ». Avez-vous déjà été confronté à une situation où vous avez été malmené ou même causé des pertes économiques à des moments importants comme un voyage, un important road show en plein air ou un mariage ?

La première compagnie d'assurance climatique au monde "Weather Bill" peut fournir aux utilisateurs différents types de garanties climatiques. Les clients se connectent au site Web de la société Weather Billing et donnent une plage de températures ou de précipitations qu'ils ne souhaitent pas connaître au cours d'une période donnée. Le site Web "Weather Bill" interrogera les prévisions météorologiques pour la zone spécifiée par le client dans les 100 millisecondes, ainsi que les données météorologiques enregistrées par le National Weather Service dans la zone au cours des 30 dernières années. En calculant et en analysant les données météorologiques, le site Web donnera le prix de la police en tant que souscripteur. Ce service n'est pas seulement requis par les utilisateurs individuels, certaines entreprises, telles que les agences de voyages, sont également disposées à participer.

Une entreprise mondiale de boissons intègre des informations de prévisions météorologiques quotidiennes provenant de partenaires externes dans son processus de planification de la demande et des stocks. En analysant 3 points de données de température, de précipitations et de durée d'ensoleillement un jour donné, l'entreprise a réduit ses stocks sur un marché européen clé tout en améliorant la précision des prévisions d'environ 5 %.

44. Réapparition de scénarios historiques

Des chercheurs de Microsoft et du Technion-Israel Institute of Technology ont développé un logiciel capable de prédire quand et où une maladie infectieuse ou un autre problème social est susceptible de se déclarer, sur la base d'articles du New York Times des 20 dernières années et d'autres données en ligne.

Lorsqu'il a été testé avec des données historiques, le système a fonctionné de manière étonnante. Par exemple, le système a prédit une forte probabilité de choléra en Angola, sur la base d'un rapport de 2006 sur la sécheresse en Angola. En effet, grâce à des événements antérieurs, le système a appris que la probabilité d'une épidémie de choléra augmenterait dans les années suivant la sécheresse.

En outre, le système a de nouveau émis une alerte au choléra pour l'Angola sur la base de rapports faisant état d'un cyclone majeur en Afrique au début de 2007. Moins d'une semaine plus tard, des rapports indiquaient que le choléra s'était effectivement produit en Angola. Dans d'autres épreuves, Pour prédire les maladies, la violence et les victimes, par exemple, le système est précis à 70 à 90 %.

Les informations du système proviennent des archives des rapports du New York Times des 22 dernières années, de 1986 à 2007. Cependant, le système s'appuie également sur d'autres données sur le Web pour comprendre quels types d'événements provoquent des problèmes sociaux spécifiques. Ces sources d'information fournissent un contenu précieux qui n'existe pas dans les articles de presse et peuvent aider à déterminer les relations causales ou contextuelles entre différents événements.

Par exemple, le système a pu déduire la relation des événements entre les villes du Rwanda et de l'Angola, puisque les deux pays sont situés en Afrique, ont des PIB similaires et que certains autres facteurs sont similaires. Selon cette méthode, le système estime que pour prédire les épidémies de choléra, il convient de prendre en compte l'emplacement du pays ou de la ville, la quantité d'eau sur la superficie du pays, la densité de population et le PIB, et s'il y a eu une sécheresse. au cours des dernières années.

Horvitz, qui a dirigé la recherche et le développement, a déclaré que de nombreux aspects du monde ont changé au cours des dernières décennies, mais De nombreux aspects de la nature humaine et de l'environnement restent les mêmes, de sorte que les logiciels peuvent apprendre des modèles à partir de données passées pour prédire ce qui se passera dans le futur. "Je suis personnellement intéressé à remonter plus loin dans les données", a-t-il déclaré.

Un marché pour de tels outils de prévision est en train d'émerger. Par exemple, une startup appelée RecordedFuture prédit les événements futurs sur la base de rapports prospectifs et d'autres sources d'informations en ligne, et ses clients comprennent des agences de renseignement gouvernementales. Le PDG de la société, Christopher Ahlberg, a déclaré qu'il était possible d'utiliser des "données concrètes" pour faire des prédictions, mais qu'il reste encore un long chemin à parcourir pour passer d'un système prototype à un produit commercial.

45. Chaussure de détection Nike+

Nike est devenu un innovateur dans le marketing des mégadonnées avec un nouveau produit appelé Nike+. Le soi-disant Nike+ est un produit basé sur "des chaussures de course Nike ou des bracelets + des capteurs". Tant que l'athlète porte des chaussures de course Nike+ pour l'exercice, l'iPod peut stocker et afficher la date, l'heure, la distance, la consommation de calories et d'autres Les données. Les utilisateurs téléchargent des données dans la communauté Nike et peuvent partager des discussions avec leurs pairs.

Nike et Facebook ont conclu un accord pour que les statistiques de course téléchargées par l'utilisateur soient mises à jour sur le compte en temps réel, et les amis peuvent commenter et cliquer sur un bouton "clapp" - si magiquement, vous pouvez entendre vos amis dans la musique pendant que vous êtes exécutant des applaudissements.

Alors que les coureurs continuent de télécharger leurs itinéraires de course, Nike dispose ainsi d'une base de données des meilleurs parcours de running dans les grandes villes. Avec Nike+, les événements de course urbaine organisés par Nike sont encore meilleurs. Les concurrents téléchargent leurs données de course dans le délai spécifié pour voir quelle ville a accumulé la plus longue distance.

Grâce aux données téléchargées par les athlètes, Nike a construit avec succès la plus grande communauté sportive en ligne au monde , avec plus de 5 millions d'utilisateurs actifs, téléchargeant des données sans interruption chaque jour, Nike a établi des relations solides sans précédent avec les consommateurs. Les données massives ont joué un rôle irremplaçable dans la compréhension de Nike des habitudes des utilisateurs, de l'amélioration des produits, de la livraison précise et du marketing précis.

46. L'Internet industriel de Volvo

Dans le groupe Volvo, les informations sur l'utilisation des véhicules, des freins aux systèmes de verrouillage centralisé des portes, sont transmises en continu au siège du groupe Volvo en installant des capteurs et des processeurs intégrés dans les produits pour camions.

"L'analyse de ces données nous aide non seulement à construire de meilleures voitures, mais aide également nos clients à vivre une meilleure expérience", a déclaré Volvo Group CIORichStrader. Ces données sont utilisées pour optimiser les processus de production afin d'améliorer l'expérience client et d'améliorer la sécurité.

L'analyse des données d'utilisation de différents clients permet aux départements produits d'identifier rapidement les problèmes potentiels des produits et d'avertir les clients avant que ces problèmes ne surviennent. « Les défauts de conception des produits, qui nécessitaient auparavant la vente de 500 000 unités, sont seulement exposés, et maintenant, il suffit de 1 000 unités pour trouver des défauts potentiels. »

47. La chaîne d'approvisionnement dynamique de McKesson

Chez McKesson, le plus grand négociant pharmaceutique aux États-Unis, l'application du Big Data est loin devant la plupart des entreprises, intégrant des capacités d'analyse avancées dans une entreprise de chaîne d'approvisionnement qui traite 2 millions de commandes par jour et supervise l'inventaire de plus de 8 milliards de dollars.

Pour la gestion des stocks en transit, McKesson a développé un modèle de chaîne d'approvisionnement qui Fournit une vue extrêmement précise des coûts de maintenance par gamme de produits, des frais d'expédition et même de l'empreinte carbone. Selon Robert Gooby, vice-président de la transformation des processus de l'entreprise, ces détails donnent à l'entreprise une vision plus réaliste des opérations à tout moment.

Un autre domaine dans lequel McKesson tire parti des analyses avancées est la simulation et l'automatisation de la configuration de l'inventaire physique dans les centres de distribution. La capacité d'évaluer les changements de politique et de chaîne d'approvisionnement a aidé les entreprises à accroître leur réactivité vis-à-vis des clients tout en réduisant les liquidités. Dans l'ensemble, la transformation de la chaîne d'approvisionnement de McKesson a permis à l'entreprise d'économiser plus de 100 millions de dollars en liquidités.

48. Château de cartes et l'industrie du cinéma

La plus grande caractéristique de "House of Cards" est que, contrairement au processus de production des séries télévisées précédentes, il s'agit d'un "drame en réseau". En bref, non seulement le canal de communication est la visualisation d'Internet, Depuis sa création, ce drame est un produit conçu en fonction du "big data", c'est-à-dire des goûts des internautes.

Le succès de Netflix réside dans son puissant système de recommandation Cinematch, Le système se base sur les données de base de la vidéo à la demande de l'utilisateur, telles que le classement, la lecture, l'avance rapide, l'heure, l'emplacement, le terminal, etc., et les stocke dans la base de données. Après analyse des données, il calcule la des vidéos susceptibles d'intéresser l'utilisateur et lui fournit des recommandations personnalisées. À cette fin, ils ont ouvert les Netflix Awards annuels (cliquez pour voir l'algorithme gagnant), avec une récompense d'un million de dollars, récompensant les personnes qui peuvent améliorer la précision de leur algorithme de recommandation de films d'au moins 10 %.

À l'avenir, le coût de production des films sera considérablement réduit et un millier de fans suffiront à faire le succès du film. Ou comme il est dit dans "Éléments techniques": "Là où les yeux se rassemblent, l'argent suivra."

49. Avis et restaurants

De nombreux gouvernements d'État aux États-Unis coopèrent avec lep, un réseau d'examen de la restauration, pour surveiller l'hygiène de l'industrie de la restauration, et l'effet est très bon. Les gens ne regardent plus le restaurant depuis la fenêtre comme avant, mais depuis les avis de l'application mobile ! Dans les revues O2O localisées en Chine, telles que Dianping, Tomato Point, etc., les consommateurs peuvent porter des jugements sur n'importe quel commerçant, et les commerçants peuvent également utiliser ces jugements pour améliorer leurs capacités de service et optimiser l'efficacité des liens.

À l'avenir, l'industrie de la restauration sera profondément guidée par les données générées et diffusées sur Internet et les médias sociaux.De plus en plus de personnes rejoindront les avis et la vitesse de survie des plus aptes sera considérablement accélérée.

Réimpression : mégadonnées
Forgeron et comment! George a fait 16 de 173 peine était folle, mais grosse faute dunk + Dingsheng Ju Yin Zhengyi
Précédent
Les médias étrangers: gros avions ou deviendra le train à grande vitesse, la prochaine carte nationale de la Chine
Prochain
Le pays de retraite le plus approprié, Hepburn reclus dans ses dernières années à 30 ans, épuisé toute la beauté dans le monde
Vision | 60 Figure secret géant industriel mondial
Wa Version Kanda de la réalité, ouverte au monde touristes chinois sans visa, ultra-romantique est seulement sous-marine bureau de poste
Cours: Comment la technologie de processus avancé conception de circuits intégrés de circuit ESD?
petite ville du Shaanxi millénaire spécial: connu sous le nom de Little Hong Kong et ressemble à Chongqing, est allé jusqu'à dire dialecte du Sichuan
Une petite minorité de type ancienne céramique, élégant
Corps civil de guerre! Les Pacers sont encore sept double avec 3 mode Crash papier combat unique piston 04
Prenez-vous mieux comprendre les journaux de base: SCI, assurance-emploi, ISTP, SSCI, INSPEC, SCIE, IEEE, CDCV, CSSCI
Ne pas leave'll à voyager chaque mois, comment les gens ne me dit plus tôt? ! (Huh!)
La première dans l'histoire de l'équipe! 1 données sur les apparitions éliminatoires Lowry gagnantes volant ultra DeRozan 7 à rebondir gagner
Après la 13e plus grande économie épée au dollar américain, européen ou est déclenché une nouvelle vague de pétrodollars aller
Un autre hôtel cinq étoiles en difficulté! Passager a effectivement eu une telle chose dans un peignoir en ...... hôtel a répondu