Cercles | BigData 2018 avant-garde: laisser l'intelligence artificielle pour trouver le opérable de décision optimale pour prévenir le mal

Technologie AI Revue de presse : L'auteur Zhao Tong, un étudiant au doctorat de l'Université du système informatique de laboratoire Notre Dame DM2. Cet article est écrit par lui comme AI Technology Review basée sur la norme IEEE 2018 BigData communications acceptées « Actionable objective pour une détection sur le comportement suspect Grande bipartites graphiques » interprétation exclusive du manuscrit, ne doit pas être reproduit sans autorisation.

avant-propos

Le mal est terrible. disparitions d'enlèvement de Zhang Ying Ying plus de 500 jours se sont écoulés, il n'y a pas de réels progrès. Avril 2017, sous le degré de maîtrise de 27 ans Zhang Ying Ying Université de Pékin diplômés en tant que chercheur invité est allé à l'Université de l'Illinois à Urbana-Champaign échange de l'apprentissage. A 14 heures, le 9 Juin, Chapitre prendre le bus pour aller à l'appartement hors campus signé station de transfert dans la voiture, inopinement un homme étrange dans une voiture noire, alors personne ne l'a vue. Cette nuit-là son ami et professeur alarme, jusqu'au 30 Juin, la police américaine a arrêté un homme blanc, elle a dit Zhang peut-être mort. 12 juillet un grand jury fédéral suspects mis en accusation formellement à ce jour, l'affaire est toujours devant les tribunaux d'entre eux. Une situation similaire a également eu lieu dans le pays, « Didi ride » assassiner sanglante est une tragédie. Apparaissent souvent dans les titres, « une autre fille » ou « deuxième passager dans les trois mois », ces mots font les gens se demandent, ce qui rend ce type de nouveau et à nouveau l'événement de se produire. Le mal apparaît non seulement dans la vie réelle, il est partout dans le réseau, car il est acheteur « l'intimidation » comportement des vendeurs sur Taobao et eBay: les acheteurs achètent uniquement les vendeurs d'un produit pas cher, pour obtenir critique sur ce produit, notation droite. Si les acheteurs ne pas tenir compte de la qualité des produits, a frappé de faibles scores, le score moyen du vendeur sera réduit, tandis que les systèmes de recommandation de la plate-forme sont souvent classées en fonction de marquer, marquer un peu plus bas, se traduira par le vendeur et le reste de la concurrence commerciale ne semblent recommander Tout d'abord, afin de perdre des affaires, et finalement l'effondrement. Ainsi, les acheteurs profitent de la faiblesse du vendeur, vous pouvez demander des rabais ou même de l'argent, ce qui est à l'origine de « l'intimidation acheteurs » de.

Conduire à des problèmes

Préoccupée par les différents cas en même temps, nous devons penser: quand nous sommes confrontés au mal à venir, si nous pouvons prévenir l'apparition d'incidents graves à l'avance? Plus penser, plus froid dans le dos - que la vie solitaire, encore plus effrayant est stérile et à l'environnement complexe.

Les parents d'une « mise en garde » se sont réunis « ont signé un bail », « raté le bus », « les retards tardifs », « côté école de la route », « voiture noire », « hommes blancs », « invité dans le train » et tout autre environnement peu familier scénarios complexes sous, faibles. le jugement des victimes rapidement « ponctuelle », « honnête et digne de confiance », « Civilization développé », « utile », provoquant l'effondrement. Si ces conditions sont réunies dans sa ville natale de Nanping, dans la province du Fujian, sûrement elle calmerait beaucoup: trop d'accidents, ainsi que la connaissance de l'histoire autour de sorte qu'elle a plus assez d'informations pour faire face à un environnement complexe. Il suffit de penser, pour le « au cas où elle pourrait » retard d'exécution « Si Ying Ying avait vu la carte du crime campus de l'Université de l'Illinois, a entendu certains incidents dangereux ont été signalés, y compris le cur et construire un garde contre le mal » pare-feu », étrangers voiture noire « ce choix plus approprié, afin d'éviter l'apparition de cette tragédie. Un simple « d'attention à la sécurité, » la quantité d'information est vraiment trop petite.

Figure 1: de CampusCrime.net: Campus des incidents graves de la criminalité, le vol et une autre distribution

Bien que le gouvernement et les partis plate-forme a été très difficile de fournir la meilleure qualité, plus service sécurisé aux personnes avec un utilisateur, ils sont difficiles à faire à l'avance du mal préventive efficace. Erreur judiciaire puisque les bonnes personnes au détriment des méchants est énorme. Il suffit de penser, lorsque des messages importants à tort jeté dans la poubelle, quand un groupe d'utilisateurs Taobao normaux sont le titre, lorsque la police l'arrestation par erreur « personnes suspectes », celles-ci conduisent à une mauvaise qualité de service, se plaignent partout, des dommages sur les gains de la plate-forme, la responsabilité difficile à supporter, et bien d'autres effets négatifs. Voilà pourquoi le gouvernement est assis sur la plate-forme, bien que d'importantes ressources de calcul et de données, mais il semble lent, timide. Mais en même temps, accusant la plate-forme, les utilisateurs eux-mêmes ont négligé de mettre en place et sensibilisation à la sécurité oublier qu'il est le plus puissant des gens d'exécution de dire « non » est.

notre idée

Quand nous regardons l'existence de ce très long manque d'information profonde entre la plate-forme et l'utilisateur, Département d'informatique, Université des données de laboratoire décisions Notre Dame (DM2 Lab, Université de Notre-Dame) essayer d'utiliser une nouvelle méthode pour compenser cette diviser. Afin d'unifier le titre, nous appelons émis des actes de « côté actif », y compris approché, les fans, les pilotes et ainsi de suite, d'accepter des actes de « côté passif », y compris être accosté qui sont partisans de passagers, dont « partie active » Il peut y avoir un comportement vicieux. algorithme classique de détection de mal (suspect de détection de comportement) ont tendance à « si l'attaquant côté actif » étiquette comme une variable optimisée pour que la plate-forme peut être manuellement enquête prédit les patients positifs qui ont ensuite prendre des décisions, processus chronophage d'enquête laborieux. proposé DM2, laisser sous forme de « côté passif » en fonction des observations de « partie active » caractéristique ou l'histoire du comportement de la conscience, le choix score de défense, comme passagères peuvent l'âge du conducteur, le sexe, l'expérience de conduite, évaluations passées et commentaires et d'autres informations pour le dépistage. Il y a un compromis ici le problème: Evaluation de la défense est trop élevé, la portée résultante et la rapidité des services seront réduits, le score de défense est trop faible, sûr et difficile d'être assuré. Les utilisateurs individuels est très difficile de choisir le bon niveau, tandis que la plate-forme, mais a d'énormes quantités de données et des algorithmes intelligents, nous recommandons un niveau approprié de défense pour les utilisateurs et d'estimer le résultat de la sélection, ce qui permet aux utilisateurs de choisir. Alors que les utilisateurs ont un sentiment de sécurité, la plate-forme peut également faire partie de « chirk » de la responsabilité, le manque d'information pour compenser, pour prévenir les comportements malveillants devient opérationnel, l'exécutable.

En fait, par l'utilisateur individuel pour protéger contre les idées du mal est pas la première fois, comme Taobao ont des plug-ins peuvent être utilisés pour protéger la division mauvaise évaluation (taux favorable en dessous d'un certain pourcentage d'acheteurs).

Figure 2: Une mauvaise répartition de blocage des plug-ins

Cependant, cette pratique semble sûr, mais il n'y a pas non plus petit impact négatif. Quand est trop élevé cote de défense des vendeurs », mais il a joué beaucoup de bas scores acheteur honnête ne peut pas acheter des biens, ce qui entraîne la perte de commandes pour le vendeur. Dans l'exemple ci-dessous:

Figure III: taux favorable de 85 pour cent des acheteurs honnêtes ne peuvent pas acheter ce magasins de marchandises

DM2 algorithme proposé Actionable d'optimisation Objectif (ZO) sera le côté passif de la notation de la défense en tant que variables d'optimisation, le facteur global de la sécurité et la qualité du service que l'objectif d'optimisation, sur des données comportementales dans le plus graphique biparti commun (graphe biparti) sous forme de, et obtenu de bons résultats. L'algorithme a été IEEE BigData 2018 ( recevant un paquets longs. Le premier auteur est Université de Notre Dame étudiant de première année de doctorat Zhao Tong, l'instructeur, professeur adjoint Jiang tromper.

méthodologie

Beaucoup de littérature sur la prévention des algorithmes malins se trouvent dans la représentation biparti des données de comportement graphique, deux sous-graphes intensifs anormaux (noyau) est dense biparti très méfiant. Lorsque nous utilisons le diagramme matrice A pour représenter les deux, le sous-graphe dense d'origine devient une matrice dense A en sous-matrices. La plupart des méthodes classiques par divers moyens conventionnels pour finalement marqués d'un côté de chacune de la fraction active d'un degré de suspicion, ces scores ensemble est une longueur totale du côté actif du vecteur p. Ensuite, allez à sous-optimize ces moments le parti actif plus méfiant formé

Densité J, de sorte que la cible peut être exprimée par l'équation:

Et traditionnellement différentes façons d'optimiser parti actif soupçonnaient l'étendue de cette variable, idée ZO est d'optimiser le niveau de côté de la défense passive, de sorte que l'acte final soit bloqué devenir une densité sous-matrice est beaucoup plus grande que les données normales. AOO va donner à chaque partie passive un ou seuil de notation de défense pour certaines caractéristiques de la face active, ils ont mis ensemble est un vecteur de longueur c de la face passive totale. Lorsque les caractéristiques de conduite de l'entité i ne peut pas atteindre le seuil de la j latérale passive, j peut bloquer ce comportement et i est. Ensuite, optimiser cet objectif est l'équation sous-matrice est masqué libellé de la forme:

Ces deux formules peuvent sembler similaires, mais en fait très différent. Parce qu'ils sont complètement coupés cette question de recherche du côté actif et le côté passif des deux angles. Et en fait seulement être juste des acteurs passifs à l'avance peuvent empêcher les comportements malveillants.

Dans la plate-forme d'achats en ligne, le côté actif (acheteurs) peut être considérée comme les acheteurs de taux moyen historique. côté Taobao fiche passif (vendeur) de la notation de la défense naturelle comme mentionné ci-dessus, l'acheteur est le seuil de note moyenne dans ce magasin pour acheter une boîte de marchandises. Alors, depuis quand les acheteurs scores moyens historiques au-dessous du seuil du vendeur, l'acheteur ne sera pas dans le magasin.

Quand on se donne un ensemble de données, la longueur d'un produit en générant un seuil pour chaque vendeur au vendeur après nombre v, v, et on peut utiliser pour calculer une matrice A 0/1 B. Pour chaque valeur de B

Si le vendeur j va bloquer les transactions avec les acheteurs i, la valeur est 1 et 0 ne pas blindé. Bien sûr, que la transaction a déjà les acheteurs et les vendeurs seront pris en compte, nous utilisons donc la matrice I pour indiquer la présence ou l'absence de transaction qui n'a pas de transaction entre le vendeur si l'acheteur i et j

La nature est 0, sinon il est 1.

Figure 4: Les échantillons démontrent les données matrice notation simple A et B

Si exprimé en quelques mots de formule mathématique. Tout d'abord, on peut facilement obtenir l'acheteur moyen historique représentant chaque vecteur de notation u: (m est le nombre d'acheteurs, n est le nombre de vendeurs)

Ensuite, nous pouvons obtenir la matrice B:

Ensuite, nous avons juste besoin de trouver une matrice B, a été bloqué certain nombre de fois (

) Acheteurs et un protecteur certain nombre (

) Vendeurs acheteurs. Nous avons deux vecteurs 0/1

et

Pour indiquer les acheteurs et les vendeurs appropriés si l'intimidateur et la brute:

Ces acheteurs et les vendeurs pour former une sous-matrice, notre objectif est de maximiser la densité sous-matrice. Avant de chercher sa densité, nous devons d'abord trouver la taille (longueur Matrices

largeur

) Et le contenu de son et (e):

Donc, notre équation objectif peut être exprimée comme suit:

En fonction d'une matrice dérivée partielle variables, on peut déterminer que la cible sur la première équation dérivée de v. Parce que notre objectif est l'équation plus complexe, nous avons d'abord être simple décomposition:

Donc, nous avons seulement besoin de trois exigences importantes des dérivées partielles de la formule peuvent être obtenus dans le but ultime de l'équation dérivée. Les trois dérivées partielles, comme suit:

(Ce qui est une équation sigmoïde, paramètre équation sigmoïde, s'il vous plaît se référer à la dérivation d'origine des papiers spécifiques.)

Avec le poteau de but sur le dérivé de l'équation v, nous ne pouvons optimiser un bon vecteur v par descente de gradient, et dont chacun contient exactement les vendeurs doivent fixer le seuil. Optimisée grâce à l'utilisation de la grande plate-forme de données sur le seuil de chaque vendeur, le vendeur sera naturellement beaucoup plus qu'une petite quantité d'expérience avec leur propre ensemble de efficace et ne pas « tir ami » Les acheteurs trop honnêtes et garde donc plus les ventes.

Analyse expérimentale

Dans l'expérience, le papier tout en utilisant les données artificielles et des données réelles pour soutenir son effet. Le texte des données artificiels mis dix complexes afin d'essayer de couvrir une variété de situations qui peuvent se produire dans la réalité. Dans les données artificielles, présentées dans ce algorithmes ZO de papier le plus populaire avec l'algorithme de détection de comportement plus anormales et de détection de la fraude faire une comparaison, et obtenir les mêmes ou de meilleurs résultats.

Figure 5: quand il y a un ou plusieurs groupes acheteur intimidation, le procédé pour rendre un effet de rétroaction négative sur l'intimidation différent nombre d'acheteurs. Détecter un comportement anormal avec plusieurs algorithmes populaires (KDD'14, KDD'16) à titre de comparaison, l'effet de ZO presque parfait.

En données réelles expérimentales, car la plate-forme n'a pas publique quant à savoir si les données sont intimide acheteurs avec une étiquette, le papier utilise l'Amazone US (Amazon.com) de données critiques pour ce produit et ZO détecté critique sur ce produit soupçonnés commentaires malveillants d'autres acheteurs en faire une comparaison. Les résultats sont très intéressants:

Figure 6: US d'Amazon nuage de mots

Dans la figure VI, figure VI (a) est affiché l'ensemble des données de tous les mots de nuage de mots fréquence des examens de ce produit peut être vu de l'ensemble des données est incliné par rapport à la louange, l'utilisateur utilise aussi beaucoup de vocabulaire très positif Par exemple: bon, l'amour, comme, grand, etc. Figure VI (b), l'affichage est détecté mot douteux nuage pauvre ZO, et la figure VI (c) est affiché mauvaise ZO nuage de mots qui ne sont pas suspectes dans les commentaires. Comme on peut le voir sur la figure, tout comme les commentaires négatifs, les mêmes mots semblent mauvais négatifs à haute fréquence, ennuyeux et d'autres situations: la figure VI (c) est un vocabulaire plus modeste, comme décevant, problème, malheureusement; et à la figure VI (b) même vocabulaire insultant est très violent, comme aussi terrible, stupide, horrible, l'enfer. Bien que les données ne sont pas un label officiel pour vérifier les résultats du résultat ZO est correct, mais les données en termes de commentaires illustrent ces utilisateurs avec plus malveillants.

résumé

Dans cet article, nous avons simplement introduit BigData2018 cet article pour éviter les comportements malveillants. Cet article propose une idée nouvelle du point de vue de l'utilisateur, les victimes de l'avant contre les comportements vont malveillants. Bien que le texte du modèle ZO a obtenu de bons résultats dans la notation des données, mais d'amener les gens dans une variété de milieu de vie complexe pour se prémunir contre toutes sortes de comportements malveillants, la nécessité d'un plus érudits dans ce domaine étude approfondie. Je crois que bientôt il y aura de plus en plus de préoccupations du point de vue des articles connexes de l'utilisateur est apparu, les sujets de recherche plus axée sur la population ont été proposées. Attendons de voir!

Cliquez pour lire le texte, voir autre lecture du papier: 2018 KDD meilleur papier « Plongements à Airbnb »

En TVB, jamais acteur médiocre partie de bits
Précédent
« Monument Valley 2 » sur la ligne supérieure à l'agence de rémunération du conseil d'administration ou Tencent costume national ciblera Android Market
Prochain
Académie des Sciences de Chine Lu Ruqian Wu Wenjun a gagné l'intelligence artificielle de Achievement Award le plus élevé, l'intelligence artificielle Baidu Wu Wenjun Wang Haifeng a remporté le prix
Richard Li, les mots « me marier » Isabelle ne peux pas attendre, Miss Hong Kong peut faire?
la libération d'Aston Martin Vanquish Zagato
Trois générations de police de dix 30 ans ont pas mangé un dîner de fête
Une table de marée en mesure d'éliminer le « moment gêné »? Donc, vous ne refroidissent le style en ligne!
mise à jour merveilleux! Novembre 6 Nouveau mil conférence, riz rouge Note6 / nouveau ventilateur
« Femme au foyer Formoe » applaudissements populaires, elle a joué dans le drame costume n'a jamais perdu!
PyTorch 1.0 version stable à venir
2018 argent Skoda Xin Rui ou la fin d'Octobre sur le marché intérieur et à l'extérieur de la mise à niveau
Coming Soon | "Aiot + Smart City Summit" Agenda 1.0 est sorti, les invités spoilers
Fondateur de « Karoshi » pour réclamer 150 millions! Une performance boursière derrière le jeu « Crime et châtiment »
Le nouveau Prado sera listé dans Novembre: l'apparition de beaucoup plus jeune