Cercles | BigData 2018 avant-garde: laisser l'intelligence artificielle pour trouver le op�rable de d�cision optimale pour pr�venir le mal

Technologie AI Revue de presse : L'auteur Zhao Tong, un �tudiant au doctorat de l'Universit� du syst�me informatique de laboratoire Notre Dame DM2. Cet article est �crit par lui comme AI Technology Review bas�e sur la norme IEEE 2018 BigData communications accept�es � Actionable objective pour une d�tection sur le comportement suspect Grande bipartites graphiques � interpr�tation exclusive du manuscrit, ne doit pas �tre reproduit sans autorisation.

avant-propos

Le mal est terrible. disparitions d'enl�vement de Zhang Ying Ying plus de 500 jours se sont �coul�s, il n'y a pas de r�els progr�s. Avril 2017, sous le degr� de ma�trise de 27 ans Zhang Ying Ying Universit� de P�kin dipl�m�s en tant que chercheur invit� est all� � l'Universit� de l'Illinois � Urbana-Champaign �change de l'apprentissage. A 14 heures, le 9 Juin, Chapitre prendre le bus pour aller � l'appartement hors campus sign� station de transfert dans la voiture, inopinement un homme �trange dans une voiture noire, alors personne ne l'a vue. Cette nuit-l� son ami et professeur alarme, jusqu'au 30 Juin, la police am�ricaine a arr�t� un homme blanc, elle a dit Zhang peut-�tre mort. 12 juillet un grand jury f�d�ral suspects mis en accusation formellement � ce jour, l'affaire est toujours devant les tribunaux d'entre eux. Une situation similaire a �galement eu lieu dans le pays, � Didi ride � assassiner sanglante est une trag�die. Apparaissent souvent dans les titres, � une autre fille � ou � deuxi�me passager dans les trois mois �, ces mots font les gens se demandent, ce qui rend ce type de nouveau et � nouveau l'�v�nement de se produire. Le mal appara�t non seulement dans la vie r�elle, il est partout dans le r�seau, car il est acheteur � l'intimidation � comportement des vendeurs sur Taobao et eBay: les acheteurs ach�tent uniquement les vendeurs d'un produit pas cher, pour obtenir critique sur ce produit, notation droite. Si les acheteurs ne pas tenir compte de la qualit� des produits, a frapp� de faibles scores, le score moyen du vendeur sera r�duit, tandis que les syst�mes de recommandation de la plate-forme sont souvent class�es en fonction de marquer, marquer un peu plus bas, se traduira par le vendeur et le reste de la concurrence commerciale ne semblent recommander Tout d'abord, afin de perdre des affaires, et finalement l'effondrement. Ainsi, les acheteurs profitent de la faiblesse du vendeur, vous pouvez demander des rabais ou m�me de l'argent, ce qui est � l'origine de � l'intimidation acheteurs � de.

Conduire � des probl�mes

Pr�occup�e par les diff�rents cas en m�me temps, nous devons penser: quand nous sommes confront�s au mal � venir, si nous pouvons pr�venir l'apparition d'incidents graves � l'avance? Plus penser, plus froid dans le dos - que la vie solitaire, encore plus effrayant est st�rile et � l'environnement complexe.

Les parents d'une � mise en garde � se sont r�unis � ont sign� un bail �, � rat� le bus �, � les retards tardifs �, � c�t� �cole de la route �, � voiture noire �, � hommes blancs �, � invit� dans le train � et tout autre environnement peu familier sc�narios complexes sous, faibles. le jugement des victimes rapidement � ponctuelle �, � honn�te et digne de confiance �, � Civilization d�velopp� �, � utile �, provoquant l'effondrement. Si ces conditions sont r�unies dans sa ville natale de Nanping, dans la province du Fujian, s�rement elle calmerait beaucoup: trop d'accidents, ainsi que la connaissance de l'histoire autour de sorte qu'elle a plus assez d'informations pour faire face � un environnement complexe. Il suffit de penser, pour le � au cas o� elle pourrait � retard d'ex�cution � Si Ying Ying avait vu la carte du crime campus de l'Universit� de l'Illinois, a entendu certains incidents dangereux ont �t� signal�s, y compris le cur et construire un garde contre le mal � pare-feu �, �trangers voiture noire � ce choix plus appropri�, afin d'�viter l'apparition de cette trag�die. Un simple � d'attention � la s�curit�, � la quantit� d'information est vraiment trop petite.

Figure 1: de CampusCrime.net: Campus des incidents graves de la criminalit�, le vol et une autre distribution

Bien que le gouvernement et les partis plate-forme a �t� tr�s difficile de fournir la meilleure qualit�, plus service s�curis� aux personnes avec un utilisateur, ils sont difficiles � faire � l'avance du mal pr�ventive efficace. Erreur judiciaire puisque les bonnes personnes au d�triment des m�chants est �norme. Il suffit de penser, lorsque des messages importants � tort jet� dans la poubelle, quand un groupe d'utilisateurs Taobao normaux sont le titre, lorsque la police l'arrestation par erreur � personnes suspectes �, celles-ci conduisent � une mauvaise qualit� de service, se plaignent partout, des dommages sur les gains de la plate-forme, la responsabilit� difficile � supporter, et bien d'autres effets n�gatifs. Voil� pourquoi le gouvernement est assis sur la plate-forme, bien que d'importantes ressources de calcul et de donn�es, mais il semble lent, timide. Mais en m�me temps, accusant la plate-forme, les utilisateurs eux-m�mes ont n�glig� de mettre en place et sensibilisation � la s�curit� oublier qu'il est le plus puissant des gens d'ex�cution de dire � non � est.

notre id�e

Quand nous regardons l'existence de ce tr�s long manque d'information profonde entre la plate-forme et l'utilisateur, D�partement d'informatique, Universit� des donn�es de laboratoire d�cisions Notre Dame (DM2 Lab, Universit� de Notre-Dame) essayer d'utiliser une nouvelle m�thode pour compenser cette diviser. Afin d'unifier le titre, nous appelons �mis des actes de � c�t� actif �, y compris approch�, les fans, les pilotes et ainsi de suite, d'accepter des actes de � c�t� passif �, y compris �tre accost� qui sont partisans de passagers, dont � partie active � Il peut y avoir un comportement vicieux. algorithme classique de d�tection de mal (suspect de d�tection de comportement) ont tendance � � si l'attaquant c�t� actif � �tiquette comme une variable optimis�e pour que la plate-forme peut �tre manuellement enqu�te pr�dit les patients positifs qui ont ensuite prendre des d�cisions, processus chronophage d'enqu�te laborieux. propos� DM2, laisser sous forme de � c�t� passif � en fonction des observations de � partie active � caract�ristique ou l'histoire du comportement de la conscience, le choix score de d�fense, comme passag�res peuvent l'�ge du conducteur, le sexe, l'exp�rience de conduite, �valuations pass�es et commentaires et d'autres informations pour le d�pistage. Il y a un compromis ici le probl�me: Evaluation de la d�fense est trop �lev�, la port�e r�sultante et la rapidit� des services seront r�duits, le score de d�fense est trop faible, s�r et difficile d'�tre assur�. Les utilisateurs individuels est tr�s difficile de choisir le bon niveau, tandis que la plate-forme, mais a d'�normes quantit�s de donn�es et des algorithmes intelligents, nous recommandons un niveau appropri� de d�fense pour les utilisateurs et d'estimer le r�sultat de la s�lection, ce qui permet aux utilisateurs de choisir. Alors que les utilisateurs ont un sentiment de s�curit�, la plate-forme peut �galement faire partie de � chirk � de la responsabilit�, le manque d'information pour compenser, pour pr�venir les comportements malveillants devient op�rationnel, l'ex�cutable.

En fait, par l'utilisateur individuel pour prot�ger contre les id�es du mal est pas la premi�re fois, comme Taobao ont des plug-ins peuvent �tre utilis�s pour prot�ger la division mauvaise �valuation (taux favorable en dessous d'un certain pourcentage d'acheteurs).

Figure 2: Une mauvaise r�partition de blocage des plug-ins

Cependant, cette pratique semble s�r, mais il n'y a pas non plus petit impact n�gatif. Quand est trop �lev� cote de d�fense des vendeurs �, mais il a jou� beaucoup de bas scores acheteur honn�te ne peut pas acheter des biens, ce qui entra�ne la perte de commandes pour le vendeur. Dans l'exemple ci-dessous:

Figure III: taux favorable de 85 pour cent des acheteurs honn�tes ne peuvent pas acheter ce magasins de marchandises

DM2 algorithme propos� Actionable d'optimisation Objectif (ZO) sera le c�t� passif de la notation de la d�fense en tant que variables d'optimisation, le facteur global de la s�curit� et la qualit� du service que l'objectif d'optimisation, sur des donn�es comportementales dans le plus graphique biparti commun (graphe biparti) sous forme de, et obtenu de bons r�sultats. L'algorithme a �t� IEEE BigData 2018 ( recevant un paquets longs. Le premier auteur est Universit� de Notre Dame �tudiant de premi�re ann�e de doctorat Zhao Tong, l'instructeur, professeur adjoint Jiang tromper.

m�thodologie

Beaucoup de litt�rature sur la pr�vention des algorithmes malins se trouvent dans la repr�sentation biparti des donn�es de comportement graphique, deux sous-graphes intensifs anormaux (noyau) est dense biparti tr�s m�fiant. Lorsque nous utilisons le diagramme matrice A pour repr�senter les deux, le sous-graphe dense d'origine devient une matrice dense A en sous-matrices. La plupart des m�thodes classiques par divers moyens conventionnels pour finalement marqu�s d'un c�t� de chacune de la fraction active d'un degr� de suspicion, ces scores ensemble est une longueur totale du c�t� actif du vecteur p. Ensuite, allez � sous-optimize ces moments le parti actif plus m�fiant form�

Densit� J, de sorte que la cible peut �tre exprim�e par l'�quation:

Et traditionnellement diff�rentes fa�ons d'optimiser parti actif soup�onnaient l'�tendue de cette variable, id�e ZO est d'optimiser le niveau de c�t� de la d�fense passive, de sorte que l'acte final soit bloqu� devenir une densit� sous-matrice est beaucoup plus grande que les donn�es normales. AOO va donner � chaque partie passive un ou seuil de notation de d�fense pour certaines caract�ristiques de la face active, ils ont mis ensemble est un vecteur de longueur c de la face passive totale. Lorsque les caract�ristiques de conduite de l'entit� i ne peut pas atteindre le seuil de la j lat�rale passive, j peut bloquer ce comportement et i est. Ensuite, optimiser cet objectif est l'�quation sous-matrice est masqu� libell� de la forme:

Ces deux formules peuvent sembler similaires, mais en fait tr�s diff�rent. Parce qu'ils sont compl�tement coup�s cette question de recherche du c�t� actif et le c�t� passif des deux angles. Et en fait seulement �tre juste des acteurs passifs � l'avance peuvent emp�cher les comportements malveillants.

Dans la plate-forme d'achats en ligne, le c�t� actif (acheteurs) peut �tre consid�r�e comme les acheteurs de taux moyen historique. c�t� Taobao fiche passif (vendeur) de la notation de la d�fense naturelle comme mentionn� ci-dessus, l'acheteur est le seuil de note moyenne dans ce magasin pour acheter une bo�te de marchandises. Alors, depuis quand les acheteurs scores moyens historiques au-dessous du seuil du vendeur, l'acheteur ne sera pas dans le magasin.

Quand on se donne un ensemble de donn�es, la longueur d'un produit en g�n�rant un seuil pour chaque vendeur au vendeur apr�s nombre v, v, et on peut utiliser pour calculer une matrice A 0/1 B. Pour chaque valeur de B

Si le vendeur j va bloquer les transactions avec les acheteurs i, la valeur est 1 et 0 ne pas blind�. Bien s�r, que la transaction a d�j� les acheteurs et les vendeurs seront pris en compte, nous utilisons donc la matrice I pour indiquer la pr�sence ou l'absence de transaction qui n'a pas de transaction entre le vendeur si l'acheteur i et j

La nature est 0, sinon il est 1.

Figure 4: Les �chantillons d�montrent les donn�es matrice notation simple A et B

Si exprim� en quelques mots de formule math�matique. Tout d'abord, on peut facilement obtenir l'acheteur moyen historique repr�sentant chaque vecteur de notation u: (m est le nombre d'acheteurs, n est le nombre de vendeurs)

Ensuite, nous pouvons obtenir la matrice B:

Ensuite, nous avons juste besoin de trouver une matrice B, a �t� bloqu� certain nombre de fois (

) Acheteurs et un protecteur certain nombre (

) Vendeurs acheteurs. Nous avons deux vecteurs 0/1

Pour indiquer les acheteurs et les vendeurs appropri�s si l'intimidateur et la brute:

Ces acheteurs et les vendeurs pour former une sous-matrice, notre objectif est de maximiser la densit� sous-matrice. Avant de chercher sa densit�, nous devons d'abord trouver la taille (longueur Matrices

largeur

) Et le contenu de son et (e):

Donc, notre �quation objectif peut �tre exprim�e comme suit:

En fonction d'une matrice d�riv�e partielle variables, on peut d�terminer que la cible sur la premi�re �quation d�riv�e de v. Parce que notre objectif est l'�quation plus complexe, nous avons d'abord �tre simple d�composition:

Donc, nous avons seulement besoin de trois exigences importantes des d�riv�es partielles de la formule peuvent �tre obtenus dans le but ultime de l'�quation d�riv�e. Les trois d�riv�es partielles, comme suit:

(Ce qui est une �quation sigmo�de, param�tre �quation sigmo�de, s'il vous pla�t se r�f�rer � la d�rivation d'origine des papiers sp�cifiques.)

Avec le poteau de but sur le d�riv� de l'�quation v, nous ne pouvons optimiser un bon vecteur v par descente de gradient, et dont chacun contient exactement les vendeurs doivent fixer le seuil. Optimis�e gr�ce � l'utilisation de la grande plate-forme de donn�es sur le seuil de chaque vendeur, le vendeur sera naturellement beaucoup plus qu'une petite quantit� d'exp�rience avec leur propre ensemble de efficace et ne pas � tir ami � Les acheteurs trop honn�tes et garde donc plus les ventes.

Analyse exp�rimentale

Dans l'exp�rience, le papier tout en utilisant les donn�es artificielles et des donn�es r�elles pour soutenir son effet. Le texte des donn�es artificiels mis dix complexes afin d'essayer de couvrir une vari�t� de situations qui peuvent se produire dans la r�alit�. Dans les donn�es artificielles, pr�sent�es dans ce algorithmes ZO de papier le plus populaire avec l'algorithme de d�tection de comportement plus anormales et de d�tection de la fraude faire une comparaison, et obtenir les m�mes ou de meilleurs r�sultats.

Figure 5: quand il y a un ou plusieurs groupes acheteur intimidation, le proc�d� pour rendre un effet de r�troaction n�gative sur l'intimidation diff�rent nombre d'acheteurs. D�tecter un comportement anormal avec plusieurs algorithmes populaires (KDD'14, KDD'16) � titre de comparaison, l'effet de ZO presque parfait.

En donn�es r�elles exp�rimentales, car la plate-forme n'a pas publique quant � savoir si les donn�es sont intimide acheteurs avec une �tiquette, le papier utilise l'Amazone US (Amazon.com) de donn�es critiques pour ce produit et ZO d�tect� critique sur ce produit soup�onn�s commentaires malveillants d'autres acheteurs en faire une comparaison. Les r�sultats sont tr�s int�ressants:

Figure 6: US d'Amazon nuage de mots

Dans la figure VI, figure VI (a) est affich� l'ensemble des donn�es de tous les mots de nuage de mots fr�quence des examens de ce produit peut �tre vu de l'ensemble des donn�es est inclin� par rapport � la louange, l'utilisateur utilise aussi beaucoup de vocabulaire tr�s positif Par exemple: bon, l'amour, comme, grand, etc. Figure VI (b), l'affichage est d�tect� mot douteux nuage pauvre ZO, et la figure VI (c) est affich� mauvaise ZO nuage de mots qui ne sont pas suspectes dans les commentaires. Comme on peut le voir sur la figure, tout comme les commentaires n�gatifs, les m�mes mots semblent mauvais n�gatifs � haute fr�quence, ennuyeux et d'autres situations: la figure VI (c) est un vocabulaire plus modeste, comme d�cevant, probl�me, malheureusement; et � la figure VI (b) m�me vocabulaire insultant est tr�s violent, comme aussi terrible, stupide, horrible, l'enfer. Bien que les donn�es ne sont pas un label officiel pour v�rifier les r�sultats du r�sultat ZO est correct, mais les donn�es en termes de commentaires illustrent ces utilisateurs avec plus malveillants.

r�sum�

Dans cet article, nous avons simplement introduit BigData2018 cet article pour �viter les comportements malveillants. Cet article propose une id�e nouvelle du point de vue de l'utilisateur, les victimes de l'avant contre les comportements vont malveillants. Bien que le texte du mod�le ZO a obtenu de bons r�sultats dans la notation des donn�es, mais d'amener les gens dans une vari�t� de milieu de vie complexe pour se pr�munir contre toutes sortes de comportements malveillants, la n�cessit� d'un plus �rudits dans ce domaine �tude approfondie. Je crois que bient�t il y aura de plus en plus de pr�occupations du point de vue des articles connexes de l'utilisateur est apparu, les sujets de recherche plus ax�e sur la population ont �t� propos�es. Attendons de voir!

Cliquez pour lire le texte, voir autre lecture du papier: 2018 KDD meilleur papier � Plongements � Airbnb �

Route de la soie