Un début de collecte de données d'infection malware « sans précédent ».
Cette série de données de Microsoft, après tout, ils sont un produit important de Windows, probablement le monde souffrent le plus souvent des parasites et des logiciels.
En outre introduit, ainsi qu'un concours Kaggle: vous permet de former un algorithme d'apprentissage machine pour prédire un ordinateur est pas infecté par des logiciels malveillants, communément appelé « empoisonnement encore. »
Jetons un coup d'oeil à cette Dataset À quel point « sans précédent ».
Il contient des informations assez complètes, il y a plus de 60.
Chaque ligne correspond à un MachineIdentifier de données, soit Device ID , Sont également inclus un représentant du La valeur réelle de l'étiquette HasDetections, cet affichage Il existe pas infecté par des logiciels malveillants.
En même temps, contient également beaucoup d'informations ne peut pas être utilisé pour déterminer l'empoisonnement, les indicateurs de la santé tels que les équipements, ainsi que l'environnement matériel et logiciel lui-même, tels que: le système, la version pare-feu, plusieurs logiciels antivirus installés, dont l'un est le navigateur par défaut , est un ordinateur ou un téléphone cellulaire, le nombre de la résolution d'affichage, quelques architecture de processeur quoi, la quantité de mémoire, les disques SSD utilisation n'est pas ......
Et inclut même cette machine ne sert pas à jouer le jeu, n'est pas un écran tactile, avec ou sans le stylet, ainsi que des représentants de code numérique national et de la ville et ainsi de suite.
Ces données, un total de combien de faire? La réponse est en ensemble la formation, il y a près de 9 millions , Test Suite de près de 8 millions . En d'autres termes, Microsoft fournit des informations de 16 millions de pièces d'équipement, vous donner l'algorithme de formation.
Si vous n'êtes pas un gros chiffre pour notre sensible ...... une autre façon de mesurer la taille. Les données stockées fixés pour former csv, au total 8.47GB .
Ces données proviennent d'utilisateurs de Windows, le système de Windows par le disque lui-même et le pare-feu par défaut Windows Defender collectés à partir. Bien sûr, les données nettoyées, ne comprend pas les informations de la vie privée.
Les grandes données prêt, faites concours Aussi logique. Ainsi, nous aurons sur le Kaggle Concours de prédiction Microsoft Malware .
Le concours de Microsoft, Northeastern University, Georgia Institute of Technology co-parrainé.
Les participants doivent faire est de former un algorithme pour l'ensemble de test dans chaque ordinateur pour prédire la probabilité d'une infection des logiciels malveillants, allant de gamme.
Concurrence a 25000 $ (environ 170000 yuans) prize pool. Parmi eux, 12000 dollars américains le premier prix, la deuxième place de 7000 $, troisième quarante-cinq 3000,2000,1000 dollars respectivement.
Ce bonus est défini, le secteur de la sécurité peut être le point trop faible. sécurité Intel chercheur Marco Figueroa vient d'être dit sur Twitter:
Microsoft Êtes-vous sérieux? Un logiciel malveillant pour prédire le concours a été 25000 $ en prix en argent? Vous devez jouer au moins 30000 $!Cependant, les participants sont encore très chaud.
Depuis le début de la semaine dernière lorsque le temps de presse qubit, il y a eu 551 équipes ont participé. Il est maintenant la fin du concours, il y a plus de trois mois. Étant donné que le nom de l'équipe à un style de milliers d'entrées, complètes dans le temps.
Bien intéressé?
Adresse de la concurrence:
https://www.kaggle.com/c/microsoft-malware-prediction/
- complet -
recrutement sincère
Qubits recrutent éditeur / journaliste, basé à Zhongguancun de Beijing. Nous attendons de talent, des étudiants enthousiastes de nous rejoindre! Détails, s'il vous plaît interface de dialogue qubit numéro public (QbitAI), réponse mot "recrutement".
qubit QbitAI · manchettes sur la signature de
' « suivre les nouvelles technologies AI dynamiques et de produits