Google a publié le plus grand à ce jour annoté des ensembles de données d'image, 1,9 million détection de cible d'image début Défi

 Ji-won nouvelle compilation

Source: research.googleblog.com

Compile: Pen

[New Ji-won EXAMEN Aujourd'hui, Google a annoncé l'ouverture de jeu de données ouvert images V4 contient 1,9 millions d'images, un total de 600 catégories, soit un total de 15,4 millions a marqué le cadre de sélection, qui est de loin les commentaires ont des ensembles de données de position maximale de l'objet. Sur la base de cet ensemble de données, Google détiendra une image à grande échelle Challenge ECCV 2018.

2016, Google a lancé une publication conjointe contient la base de données de 9 millions d'image: Ouvrir des images, qui a marqué les milliers de catégories d'objets. Depuis sa sortie, les ingénieurs de Google ont travaillé à mettre à jour et réarranger les ensembles de données qui fournissent un champ de ressources utiles de la recherche sur la vision par ordinateur pour développer de nouveaux modèles.

Aujourd'hui, Google a annoncé l'ouverture de l'Open Images V4, qui Il contient 1,9 millions d'images, un total de 600 catégories, soit un total de 15,4 millions a marqué le cadre de délimitation . L'intégration des données existantes pour annotation jeu de données maximum avec la position de l'objet . La plupart de ces boîte englobante commentaire par le personnel professionnel dessiné à la main, pour assurer l'exactitude et la cohérence. Ces images sont très diverses, généralement il contient plusieurs objets dans des scènes complexes (image moyenne contient huit boîte englobante).

Google a lancé un grand défi d'image ouverte

Dans le même temps, Google a lancé Open Challenge image (Ouvrir l'image Challenge), qui est un nouveau défi dans la détection d'objet, aura lieu à la Conférence européenne 2018 sur l'ordinateur Vision (ECCV 2018) sur. Ouvrir une image Défi suit les COV PASCAL, IMAGEnet COCO et de la tradition, mais à une échelle sans précédent:

  • 1,7 million dans l'image de la formation, il y a 12,2 millions de boîtes ont un commentaire, un total de 500 catégories.

  • Plus vaste que jamais les défis de détection, y compris les nouveaux objets comme un « chapeau mou » et « bonhomme de neige » de.

  • En plus de cette tâche que la détection d'objets, les défis comprennent l'appariement d'une détection de relation visuelle est suivi qui détecte les objets dans une relation particulière, comme « une femme jouer de la guitare. »

ensemble La formation est maintenant prêt à l'emploi. Ensemble de test contient un ensemble de 100.000 images sera le 1er Juillet, 2018 émis par Kaggle. La date limite pour la présentation des résultats sur 1 Septembre, ici 2018. Nous espérons que ces jeu de formation à grande échelle pour stimuler la recherche sur la détection des modèles plus sophistiqués, ces modèles dépassent les performances des plus avancées et 500 catégories seront en mesure d'évaluer avec plus de précision les différents détecteurs où la performance était le meilleur. De plus, un grand nombre d'images et commentaires de nombreux objets qui nous a permis d'explorer la relation entre l'inspection visuelle, qui est un sujet brûlant dans le domaine d'une branche en cours d'élaboration.

De plus, Open Images V4 inclut également la vérification manuelle de l'étiquette niveau d'image de 30,1 millions, un total de 19794 classe, ce ne fait pas partie du défi. L'ensemble de données comprend 5,5 millions d'étiquettes de niveau d'image, générés par des milliers d'utilisateurs du monde entier sur crowdsource.google.com.

Ouvrir des images de jeux de données V4

Ouvrir des images est un ensemble de données composé de neuf millions d'images de ces images sont étiquetés comme boîte de délimitation de l'étiquette et de l'objet au niveau de l'image. V4 contient de formation d'image 60014600000 ensemble de la classe d'objet, dans lequel le co-marqué 1740000 cible de marquage, ce qui en fait des ensembles de données maximal disponible comprenant des commentaires de position d'objet. La plupart de ces objets par un rectangle englobant interprète professionnel est dessiné à la main, pour assurer l'exactitude et la cohérence. Ces images sont très diverses, comprend typiquement une pluralité d'objets dans des scènes complexes (moyenne de 8,4 marqueurs par image). En outre, avec l'ensemble de données d'image est aussi une étiquette de classe des milliers de classe.

Organisation des données

ensemble de données est divisé en un ensemble de formation (9,011,219 images), un ensemble de validation (41,620 images) et un ensemble de test (125,436 images). Ces images sont étiquetés et le niveau d'étiquette cadre de sélection d'image, tel que décrit ci-dessous.

Tableau 1

Le Tableau 1 présente un résumé de tous les sous-ensemble des données d'image une étiquette de classe set. Toutes les images sont les balises de niveau d'image générées par une machine qui sont automatiquement générées par le modèle de vision par ordinateur est similaire à l'API Google Cloud Vision. Ces étiquettes générées automatiquement ont beaucoup de taux de faux positifs.

En outre, la validation et des jeux de tests, et une partie de l'ensemble de la formation contient artificiellement vérifié l'étiquette de niveau d'image. La plupart sont vérifiés par Google pour compléter le commentaire interne. Les pièces plus petites jusqu'à complète balise image logiciel, telles que l'application Crowdsource, g.co/imagelabeler. Ce processus de validation élimine pratiquement les faux positifs (faux négatifs, mais pas dans le sens traditionnel du terme, cette approche peut conduire à des étiquettes peuvent être perdues dans l'image). L'étiquette résultante est en grande partie correcte, nous recommandons l'utilisation de ces étiquettes pour former le modèle de vision par ordinateur. L'utilisation de plusieurs modèles de vision par ordinateur pour générer un échantillon, est de veiller à ce que non seulement les données de la machine d'étiquettes générées pendant l'entraînement, ce qui explique pourquoi le vocabulaire est étendu de manière significative, comme indiqué dans un tableau.

En général, il y a 19,995 différentes classes de niveau, et une balise d'image. Notez que le numéro de la table d'étiquettes vérification manuelle de ce chiffre est légèrement plus élevé que sur. La raison en est que l'ensemble de données générées par la machine a un petit nombre de balises dans l'ensemble ne figure pas dans la vérification manuelle. les classes Personnalisable sont celles qui mettent l'accent sur la formation d'au moins 100 V4 vérification manuelle mode positif. Sur la base de cette définition, la classe 7186 est considéré comme trainable.

boîte englobante

Tableau 2

Le tableau 2 montre une vue d'ensemble de la zone de délimitation de tout l'ensemble de données d'annotation divisé, qui contient la classe d'objet 600. Ces services offrent une gamme plus large que ILSVRC et la gamme de détection COCO des défis, y compris les nouveaux objets tels que « fedora » et « bonhomme de neige » et autres.

Pour l'ensemble de la formation, nous marquons la boîte dans les 1,74 millions d'images, disponibles pour l'étiquette de marquage manuel de niveau d'image positive. Nous nous concentrons sur la plus étiquette spécifique. Par exemple, si une image contient la voiture, limousine, tournevis, nous offrons la case annotée comme les voitures de luxe et d'un tournevis. Pour chaque image dans une étiquette, l'image que nous annotés de manière exhaustive dans chaque cas d'une classe d'objet. Ensemble de données contient un total de 14,6 millions de la boîte de sélection. Chaque image a une moyenne de 8,4 objets marqueurs.

Pour la vérification et le jeu de test pour toutes les étiquettes de classe image positive disponible, nous avons fourni toutes les instances d'objet boîte englobante détaillées commentaire. Toutes les boîtes englobantes sont peints à la main. Nous essayons délibérément d'être aussi détaillée que possible dans la zone de commentaires marquée hiérarchie sémantique. En moyenne, la vérification et un ensemble test, chaque image a marqué 5 boîte englobante.

Dans tous les sous-ensembles, y compris ensemble de la formation et de jeu ensemble de validation de test, d'autres commentaires pour chaque cadre de sélection étiquette un ensemble de propriétés, par exemple pour indiquer si l'objet est obturée.

classe définie (définitions de classe)

Catégories identifiées par MIDs (id généré machine), se trouvent dans l'API Freebase ou dans Google Knowledge Graph. Une brève description de chaque classe se trouve dans la classe au format CSV.

Statistiques et analyse des données

Hiérarchie 600 peut être classe étiquetée

Ouvrir des images et ensemble de données Défi Adresse:

https://storage.googleapis.com/openimages/web/index.html

[] Joignez-vous à la communauté

Ji-won nouvelles technologies AI + industrie du recrutement communautaire, a accueilli les étudiants + industrie de la technologie AI a atterri intérêt, plus Little Helper Micro Signal: aiera2015_1 dans le groupe, si elle est approuvée seront invités dans le groupe, assurez-vous de modifier le groupe après avoir rejoint la communauté remarques (nom - société - emploi, groupe professionnel d'examen plus rigoureux, s'il vous plaît comprendre).

A remporté le personnage de jeu perdu! Chang Lin a débuté Il Xining tête expulsion directement, la peur d'être soumis à de lourdes peines
Précédent
du Nouvel An attention Hoard! Ne pas acheter ces en-cas
Prochain
Lourd, mais aussi un rapport coût-efficacité des pays européens ultra haut sans visa! Les gens qui ont moins de 1%
les mises à pied NetEase soigneusement sélectionnés, l'obsession fournisseur d'électricité Ding
« Cent vingt E cur un avenir meilleur » scientifique et de l'innovation technologique anciens de l'Université de Pékin Forum Inscription amis ~
Chang Fei zone familiale réforme de l'industrie de l'aviation « Paige » dans une bonne humeur
Chine ce morceau de cerise feu de la mer! Belle ne perd pas au Japon, aussi libre ~
Jingdezhen maire adjoint, chef de la police et visite ménages pauvres Il Junwei Fête du Printemps, les difficultés de la police, du personnel expert, PUC a pris sa retraite des cadres et de leur fami
classement ABC, manoirs occupent les 20 premières victoires, quatre équipes avec 19 victoires, suivi de quatre équipes 16 victoires
Dix grands crimes contre les biens fugitifs recherchés par le ministère de la Sécurité publique a arrêté sept personnes (pas pendant la Fête du Printemps vacances Interpol, s'il vous plaît, livrer de
Et donc manqué une année! Ce Mars va voyager, l'entrepreneur des plus romantiques au printemps
La technologie de prévention et de lutte contre la pollution du Guangxi Citrus
Journée internationale contre l'abus des drogues Hanchuan Héroïne en action
J'étais dans le poste Nouvel An chinois | fenêtre d'enregistrement des ménages de la sécurité publique de la ville de Jingdezhen pendant le calendrier de service pratique Fête du Printemps