Article concentre 20 ans: vous prenez à travers l'histoire du développement des données de formation

thèse 1536 Les mots, lorsque l'apprentissage tout au long attendu 3 minute

Source: pexels.com/@markusspiske

Aujourd'hui, des milliers d'apprentissage de la machine par l'attention, mais la direction actuelle dans les entreprises technologiques, mais très peu de gens ont à la fois les modèles d'apprentissage machine de construction de compétences professionnelles, et ils ont conçu peuvent grandement contribuer à mettre dans le système d'apprentissage de la machine d'apprentissage machine pratique.

Beaucoup grand café commercial conviennent que les données et les algorithmes, car ils sont la clé du succès personnel. Alors, quelles sont les données de formation à travers le processus de développement?

Un bref historique des données de formation

données Formation Histoire 1,20 ans

Les données de la formation historique en présence de circulation d'amusement. Années 1990, l'apprentissage de la machine n'a pas été l'industrie dominante AI, les programmeurs sont difficiles à écrire du code en fonction du comportement de modèle afin d'améliorer le système. 20 ans plus tard, l'industrie de l'IA menant l'apprentissage de la machine, est similaire au système « boucle-homme machine » est devenu populaire, mais ce modèle est basé sur le comportement de la construction des annotateurs de données de formation non professionnels.

Dans les années 1990 au début de ce siècle, cette période de 20 ans, les données de formation étiquetés requis coûteux, ce qui limite considérablement le développement de l'apprentissage de la machine. Cela conduit à la communauté universitaire a effectué des tests sur des algorithmes différents ensembles de données relativement peu normalisées, mais aujourd'hui cette tendance n'a pas eu beaucoup de changement.

La dernière partie de ce siècle il y a 10 ans, les données de formation MTurk Amazon a déclenché une tendance maintenant sur le revenu des salaires, ce qui a changé la façon dont les gens pensent à la construction des données de formation. À ce stade, l'élévation du monde universitaire d'une campagne de petite échelle, augmentation de l'apprentissage actif en tant que stratégie d'annotation manuelle pour annotateurs aider à choisir les données correctes.

Mais le plus grand changement ne réside pas dans le milieu universitaire au cours de cette période, mais dans l'industrie. Depuis cette époque où les gens construisent des modèles d'apprentissage machines dans le monde réel, les données de formation et les algorithmes sont devenus tout aussi importants.

Au cours des cinq années avant le 21ème siècle est également apparu dans un autre cycle - modèle de neurone temps nécessite également beaucoup de données de formation, ce qui tend à produire des coûts élevés. Cela conduit à la méthode neuronale est très lent dans la popularisation et l'application industrie de démarrage, à l'exception de quelques projets de vision par ordinateur. Cependant, cette méthode est suffisante pour améliorer considérablement la précision de l'apprentissage de la machine, et même aider à créer un nouveau cas pratique.

Aujourd'hui, le modèle de neurone d'apprentissage adaptatif et la migration a été mis au point, ce qui signifie plus petits ensembles de données peuvent également afficher les applications de performance à forte intensité de pointe en matière d'apprentissage de la machine.

2. Architecture de données de formation

actuellement face au problème des données de formation

Face à divers exemples d'application des données de formation, souvent utilisé une stratégie similaire, par exemple, le volume de données dont nous avons besoin? Qui marquera plus approprié? Comment mesurer la marque de qualité? Puis-je utiliser des données synthétiques ou des modèles pré-formés aux données de marque afin de réduire les coûts salariaux artificiellement des commentaires? En termes de l'algorithme, comment adapter rapidement au nouveau modèle des données de l'étiquette? Comment expliquer l'incertitude du modèle, afin d'aider les gens à un échantillonnage correct des données non marquées en échec?

La construction de algorithmiquement au cours des 20 dernières années a une énorme évolution, la méthode de construction de données de formation aussi subi d'énormes changements. Lors du séminaire de partager ces très intéressant, parce que le cercle est actuellement dans l'apprentissage de la machine, la discussion est loin d'être les données de formation est une discussion plus approfondie de l'algorithme.

3. La formation de la diversité AI sur la façon d'adapter les données?

Aujourd'hui, l'un des plus grande question ouverte est: Comment AI adapter aux données de formation sur la diversité?

Dans la « discrimination systématique: égalité entre les AI, la race et le pouvoir, » l'article, MyersWest, Whittaker et Crawford concepteur AI sur l'importance de la diversité ethnique sont discutés, ils se concentrent principalement sur des algorithmes d'apprentissage machine et le créateur du modèle.

Article Portal: https: //ainowinstitute.org/discriminatingsystems.pdf

Si vous souhaitez poursuivre cette discussion, en fait, l'apprentissage automatique, les différences ethniques des zones plus évidentes de données de formation. Une technologie centrée sur l'algorithme est souvent plus propice à une vie riche, le programmeur, le modèle mis en application une fois créé, le revenu est susceptible d'augmenter. Mais avec des données centrées sur la formation de la technologie est presser souvent la valeur de ceux relativement moins bien lotis les gens, si vous construisez un modèle pour les données de formation, il est susceptible de recevoir seulement un paiement, mais la construction d'algorithmes pour les données, mais les programmeurs vous pouvez avoir un flux régulier de revenus.

1990, les algorithmes de construct construisent également les données (ou des règles) doivent donc être égale mesure leur contribution dans ces deux domaines. J'espère qu'il formera une boucle, afin de revenir à un système industriel plus équitable qui permet aux gens de créer de la valeur dans le domaine des données de formation peuvent obtenir une indemnisation appropriée.

pouces Message attention

Ensemble, nous partageons l'apprentissage et le développement de l'IA sec

Amnesty International salue l'attention de la pendaison toute la plate-forme de la classe médiatique « lecture technique de base »

écosystème Big Data mis à jour à nouveau! Cartouche dans la tendance
Précédent
La Chine est d'abord! premier zoo ouvert la nuit de Shanghai, les Raiders vous aider à faire un bon travail
Prochain
Fujian Putian: « Nostalgie rivière longue » Dongzhuang complexe
FLOURISHES « Alipay koi » La jeune fille, maintenant atteint la limite des cartes de crédit, et parfois tomber dans l'anxiété
Suning achat des sorts 808 Jour: total d'une journée de 26 millions de commandes individuelles
LSTM découvrir le mystère de la structure, donc RNN parfait
Jupyter Notebooks trois __gVirt_NP_NNS_NNPS<__ fonctionnalités supplémentaires facile à piloter
Puissants arrière-plan « Pokémon » et des tours étranges animaux, bataille aussi pour l'imposer?
« Pokémon » la température la plus élevée des cinq elfes, la plupart de la destruction du monde sont seuls
département ver « Pokémon » cricket haut-parleurs interprète, bataille nette que lorsque la main sans défense?
explosion d'une mine Gélatine! Lvpi enfin crevé
viande artificielle, un morceau de 345 yuans
Aujourd'hui, le son de base | lourd! 2019 liste préliminaire des candidats publiés académicien de l'Académie chinoise des sciences a coopté
Effrayant! A seulement 20 heures pour passer 18 dollars, 11 millions de mots de passe instantanément pouvez Decipher