�Ji-won nouvelle compilation

Source: research.googleblog.com

Compile: Pen

[New Ji-won EXAMEN Aujourd'hui, Google a annonc� l'ouverture de jeu de donn�es ouvert images V4 contient 1,9 millions d'images, un total de 600 cat�gories, soit un total de 15,4 millions a marqu� le cadre de s�lection, qui est de loin les commentaires ont des ensembles de donn�es de position maximale de l'objet. Sur la base de cet ensemble de donn�es, Google d�tiendra une image � grande �chelle Challenge ECCV 2018.

2016, Google a lanc� une publication conjointe contient la base de donn�es de 9 millions d'image: Ouvrir des images, qui a marqu� les milliers de cat�gories d'objets. Depuis sa sortie, les ing�nieurs de Google ont travaill� � mettre � jour et r�arranger les ensembles de donn�es qui fournissent un champ de ressources utiles de la recherche sur la vision par ordinateur pour d�velopper de nouveaux mod�les.

Aujourd'hui, Google a annonc� l'ouverture de l'Open Images V4, qui Il contient 1,9 millions d'images, un total de 600 cat�gories, soit un total de 15,4 millions a marqu� le cadre de d�limitation . L'int�gration des donn�es existantes pour annotation jeu de donn�es maximum avec la position de l'objet . La plupart de ces bo�te englobante commentaire par le personnel professionnel dessin� � la main, pour assurer l'exactitude et la coh�rence. Ces images sont tr�s diverses, g�n�ralement il contient plusieurs objets dans des sc�nes complexes (image moyenne contient huit bo�te englobante).

Google a lanc� un grand d�fi d'image ouverte

Dans le m�me temps, Google a lanc� Open Challenge image (Ouvrir l'image Challenge), qui est un nouveau d�fi dans la d�tection d'objet, aura lieu � la Conf�rence europ�enne 2018 sur l'ordinateur Vision (ECCV 2018) sur. Ouvrir une image D�fi suit les COV PASCAL, IMAGEnet COCO et de la tradition, mais � une �chelle sans pr�c�dent:

1,7 million dans l'image de la formation, il y a 12,2 millions de bo�tes ont un commentaire, un total de 500 cat�gories.
Plus vaste que jamais les d�fis de d�tection, y compris les nouveaux objets comme un � chapeau mou � et � bonhomme de neige � de.
En plus de cette t�che que la d�tection d'objets, les d�fis comprennent l'appariement d'une d�tection de relation visuelle est suivi qui d�tecte les objets dans une relation particuli�re, comme � une femme jouer de la guitare. �

ensemble La formation est maintenant pr�t � l'emploi. Ensemble de test contient un ensemble de 100.000 images sera le 1er Juillet, 2018 �mis par Kaggle. La date limite pour la pr�sentation des r�sultats sur 1 Septembre, ici 2018. Nous esp�rons que ces jeu de formation � grande �chelle pour stimuler la recherche sur la d�tection des mod�les plus sophistiqu�s, ces mod�les d�passent les performances des plus avanc�es et 500 cat�gories seront en mesure d'�valuer avec plus de pr�cision les diff�rents d�tecteurs o� la performance �tait le meilleur. De plus, un grand nombre d'images et commentaires de nombreux objets qui nous a permis d'explorer la relation entre l'inspection visuelle, qui est un sujet br�lant dans le domaine d'une branche en cours d'�laboration.

De plus, Open Images V4 inclut �galement la v�rification manuelle de l'�tiquette niveau d'image de 30,1 millions, un total de 19794 classe, ce ne fait pas partie du d�fi. L'ensemble de donn�es comprend 5,5 millions d'�tiquettes de niveau d'image, g�n�r�s par des milliers d'utilisateurs du monde entier sur crowdsource.google.com.

Ouvrir des images de jeux de donn�es V4

Ouvrir des images est un ensemble de donn�es compos� de neuf millions d'images de ces images sont �tiquet�s comme bo�te de d�limitation de l'�tiquette et de l'objet au niveau de l'image. V4 contient de formation d'image 60014600000 ensemble de la classe d'objet, dans lequel le co-marqu� 1740000 cible de marquage, ce qui en fait des ensembles de donn�es maximal disponible comprenant des commentaires de position d'objet. La plupart de ces objets par un rectangle englobant interpr�te professionnel est dessin� � la main, pour assurer l'exactitude et la coh�rence. Ces images sont tr�s diverses, comprend typiquement une pluralit� d'objets dans des sc�nes complexes (moyenne de 8,4 marqueurs par image). En outre, avec l'ensemble de donn�es d'image est aussi une �tiquette de classe des milliers de classe.

Organisation des donn�es

ensemble de donn�es est divis� en un ensemble de formation (9,011,219 images), un ensemble de validation (41,620 images) et un ensemble de test (125,436 images). Ces images sont �tiquet�s et le niveau d'�tiquette cadre de s�lection d'image, tel que d�crit ci-dessous.

Tableau 1

Le Tableau 1 pr�sente un r�sum� de tous les sous-ensemble des donn�es d'image une �tiquette de classe set. Toutes les images sont les balises de niveau d'image g�n�r�es par une machine qui sont automatiquement g�n�r�es par le mod�le de vision par ordinateur est similaire � l'API Google Cloud Vision. Ces �tiquettes g�n�r�es automatiquement ont beaucoup de taux de faux positifs.

En outre, la validation et des jeux de tests, et une partie de l'ensemble de la formation contient artificiellement v�rifi� l'�tiquette de niveau d'image. La plupart sont v�rifi�s par Google pour compl�ter le commentaire interne. Les pi�ces plus petites jusqu'� compl�te balise image logiciel, telles que l'application Crowdsource, g.co/imagelabeler. Ce processus de validation �limine pratiquement les faux positifs (faux n�gatifs, mais pas dans le sens traditionnel du terme, cette approche peut conduire � des �tiquettes peuvent �tre perdues dans l'image). L'�tiquette r�sultante est en grande partie correcte, nous recommandons l'utilisation de ces �tiquettes pour former le mod�le de vision par ordinateur. L'utilisation de plusieurs mod�les de vision par ordinateur pour g�n�rer un �chantillon, est de veiller � ce que non seulement les donn�es de la machine d'�tiquettes g�n�r�es pendant l'entra�nement, ce qui explique pourquoi le vocabulaire est �tendu de mani�re significative, comme indiqu� dans un tableau.

En g�n�ral, il y a 19,995 diff�rentes classes de niveau, et une balise d'image. Notez que le num�ro de la table d'�tiquettes v�rification manuelle de ce chiffre est l�g�rement plus �lev� que sur. La raison en est que l'ensemble de donn�es g�n�r�es par la machine a un petit nombre de balises dans l'ensemble ne figure pas dans la v�rification manuelle. les classes Personnalisable sont celles qui mettent l'accent sur la formation d'au moins 100 V4 v�rification manuelle mode positif. Sur la base de cette d�finition, la classe 7186 est consid�r� comme trainable.

bo�te englobante

Tableau 2

Le tableau 2 montre une vue d'ensemble de la zone de d�limitation de tout l'ensemble de donn�es d'annotation divis�, qui contient la classe d'objet 600. Ces services offrent une gamme plus large que ILSVRC et la gamme de d�tection COCO des d�fis, y compris les nouveaux objets tels que � fedora � et � bonhomme de neige � et autres.

Pour l'ensemble de la formation, nous marquons la bo�te dans les 1,74 millions d'images, disponibles pour l'�tiquette de marquage manuel de niveau d'image positive. Nous nous concentrons sur la plus �tiquette sp�cifique. Par exemple, si une image contient la voiture, limousine, tournevis, nous offrons la case annot�e comme les voitures de luxe et d'un tournevis. Pour chaque image dans une �tiquette, l'image que nous annot�s de mani�re exhaustive dans chaque cas d'une classe d'objet. Ensemble de donn�es contient un total de 14,6 millions de la bo�te de s�lection. Chaque image a une moyenne de 8,4 objets marqueurs.

Pour la v�rification et le jeu de test pour toutes les �tiquettes de classe image positive disponible, nous avons fourni toutes les instances d'objet bo�te englobante d�taill�es commentaire. Toutes les bo�tes englobantes sont peints � la main. Nous essayons d�lib�r�ment d'�tre aussi d�taill�e que possible dans la zone de commentaires marqu�e hi�rarchie s�mantique. En moyenne, la v�rification et un ensemble test, chaque image a marqu� 5 bo�te englobante.

Dans tous les sous-ensembles, y compris ensemble de la formation et de jeu ensemble de validation de test, d'autres commentaires pour chaque cadre de s�lection �tiquette un ensemble de propri�t�s, par exemple pour indiquer si l'objet est obtur�e.

classe d�finie (d�finitions de classe)

Cat�gories identifi�es par MIDs (id g�n�r� machine), se trouvent dans l'API Freebase ou dans Google Knowledge Graph. Une br�ve description de chaque classe se trouve dans la classe au format CSV.

Statistiques et analyse des donn�es

Hi�rarchie 600 peut �tre classe �tiquet�e

Ouvrir des images et ensemble de donn�es D�fi Adresse:

https://storage.googleapis.com/openimages/web/index.html

[] Joignez-vous � la communaut�

Ji-won nouvelles technologies AI + industrie du recrutement communautaire, a accueilli les �tudiants + industrie de la technologie AI a atterri int�r�t, plus Little Helper Micro Signal: aiera2015_1 dans le groupe, si elle est approuv�e seront invit�s dans le groupe, assurez-vous de modifier le groupe apr�s avoir rejoint la communaut� remarques (nom - soci�t� - emploi, groupe professionnel d'examen plus rigoureux, s'il vous pla�t comprendre).

Route de la soie

Apprenez � conna�tre la Chine

Google a publi� le plus grand � ce jour annot� des ensembles de donn�es d'image, 1,9 million d�tection de cible d'image d�but D�fi

Google a lanc� un grand d�fi d'image ouverte

Ouvrir des images de jeux de donn�es V4