Aujourd'hui Papier | reconstruction pure image du monde, série de réseaux hiérarchiques récursives, une attention réseau de neurones, la reconnaissance d'entités nommées

annuaire

  • séquence récurrente au niveau du réseau a marqué le transfert de l'apprentissage

  • Attention modèle réseau de neurones caractéristique marqueur de séquence

  • reconnaissance d'entité sur la base de nommage LSTM-CNNs bidirectionnelle

  • étiquette de séquence à extrémité par un bi-directionnel LSTM-CNNs-CRF

  • Caractérisation meilleure de l'objet, une meilleure reconstruction du monde de pure image

séquence récurrente au niveau du réseau a marqué le transfert de l'apprentissage

Titre de la thèse: L'APPRENTISSAGE DE TRANSFERT POUR SEQUENCE AVEC MARQUAGE HIERARCHIQUE RÉPÉTITION DES RÉSEAUX

Auteur: Yang Zhilin / Ruslan Salakhutdinov

Publié: 18/03/2017

Documents lien: https: //arxiv.org/pdf/1703.06345.pdf

Le problème de base: le problème de l'étiquetage de la séquence afin de résoudre le problème de la construction manuelle dispose d'exist d'apprentissage machine traditionnelle, où l'utilisation des réseaux de neurones est souvent la voie, mais les réseaux de neurones nécessitent souvent de grandes quantités de données peuvent, est maintenant confronté à une situation lorsqu'une quantité insuffisante de données, comment nous pouvons résoudre ce problème?

Innovation: en vision par ordinateur, lorsqu'ils sont confrontés à des données insuffisantes, nous utilisons souvent l'étude de la migration, ce document sera également étudier les moyens de mobilité pour l'apprentissage, dans lequel une tâche possède une vaste source de annotée a pour objectif d'améliorer les moins de commentaires disponibles la performance tâche

Faisabilité des paramètres du modèle et de la structure de la formation peuvent être migrés de cette façon plus, et obtenu de bons résultats, en fait, maintenant la montée de TAL un important modèle de pré-formation, qui a également prouvé cette direction dans une certaine mesure: l'importance .

Attention modèle réseau de neurones caractéristique marqueur de séquence

Titre de la thèse: Assister à des personnages dans les modèles Neural séquence étiquetage

Auteur: Marek Rei / Gamal K.O. Crichton / Sampo Pyysalo

Publié: 14/11/2016

Documents lien: https: //www.aclweb.org/anthology/C16-1030.pdf

raison recommandée

Le problème de base: les questions d'étiquetage de séquence pour faire face à un problème, le problème est que quand un mot est un mot qui apparaît dans mot inconnu, le temps sera un problème. Ce mot est appelé problème MHV

Innovation: l'innovation est de résoudre ce problème, le premier mot a un problème MHV, mais pas de problème de MHV de caractère, introduit ici une information de niveau de caractère. Ensuite, la mise en place d'un mécanisme d'attention, en utilisant l'attention classique + combinaisons + RNN CEF, donc en combinant le niveau des mots et vecteur caractère niveau, de manière à atteindre mot de caractère non OVV vecteur et son vecteur des mots similaires.

Signification: Dans de nombreux ensembles de données pour obtenir de bons résultats, et quelques paramètres de ce modèle.

reconnaissance d'entité sur la base de nommage LSTM-CNNs bidirectionnelle

Nom de papier: Entité nommé reconnaissance avec LSTM-Bidirectionnelle CNNs

Auteur: Jason Chiu P. C. / Eric Nichols

Publié: 19/07/2016

Documents lien: https: //arxiv.org/pdf/1511.08308.pdf

raison recommandée

Le problème de base: résolu ici est appelé tâche de reconnaissance de l'entité, qui est NLP un travail très difficile, une des méthodes d'apprentissage machine traditionnelle besoin d'utiliser le mode manuel, mais cette façon est pas bon.

L'innovation: Le papier utilisé est la façon dont la profondeur de l'apprentissage, et la méthode d'apprentissage profond traditionnel est différent, ici pour construire une nouvelle architecture de réseau de neurones qui peut détecter automatiquement mot-niveau et le caractère niveau caractéristiques LSTM dans les deux sens et l'architecture hybride CNN, éliminant ainsi la nécessité pour la plupart des caractéristiques du projet. En plus du papier propose également une nouvelle méthode, en utilisant cette méthode de la part du correspondant du dictionnaire est codé dans un réseau de neurones, vous pouvez obtenir de meilleurs résultats.

Implications pour la recherche: Les expériences montrent que l'effet de ce modèle que le modèle actuel, et mise au point est les meilleurs résultats en plus de données.

étiquette de séquence à extrémité par un bi-directionnel LSTM-CNNs-CRF

Titre de la thèse: de bout en bout séquence étiquetage via bidirectionnelle LSTM-CNNs-CRF

Auteur: Xuezhe Ma / Eduard Hovy

Publié: 29/05/2016

Documents lien: https: //arxiv.org/pdf/1603.01354.pdf

Le problème principal: le noyau de cet article est de résoudre le champ NLP problème nommé reconnaissance d'entités

Innovation: cet ensemble de papier modèles couramment utilisés avant est LSRM + CRF, jusqu'à une fin à la fin du modèle de réseau de neurones, mis en place la structure CNN, qui peut être une bonne partie de l'information locale

Signification: Cet effet effet modèle que le modèle précédent.

Caractérisation meilleure de l'objet, une meilleure reconstruction du monde de pure image

Titre de la thèse: contrastive apprentissage des modèles structurés du monde

Auteur: Thomas Kipf / Elise van der Pol / Max Welling

Publié: 26/09/2019

Documents lien: https: //openreview.net/forum id = H1gax6VtDB?

Comprendre les signaux visuels humains peuvent être observés de l'il pour restaurer le monde des objets, les relations entre les objets, niveaux, etc., ce qui est un élément important des capacités cognitives humaines, ainsi que l'apprentissage de la machine, l'apprentissage en profondeur, la vision par ordinateur est toujours confronté un défi majeur (réduction entrée de la structure de pixel d'origine du modèle avec le monde).

Université de Virginie auteurs proposent un modèle C-SWM un monde fondé sur le contraste de la formation structurée dans ce document, qui utilise une méthode de contraste pour caractériser la structure de l'environnement d'apprentissage combiné à l'utilisation. Il ne peut pas exiger une supervision directe, juste en regardant l'environnement d'extraction d'objet trouvé pixel d'origine.

Les auteurs contenant plusieurs indépendants, des objets d'environnement interactif peuvent être contrôlés évaluation du modèle de performance, y compris les simples jeux Atari, y compris les objets de l'environnement de simulation multi-physique. Les expériences montrent que ce modèle peut surmonter les nombreuses lacunes de la reconstruction basée sur un modèle précédent de pixels, également joué mieux que des modèles similaires pour caractériser les performances dans un environnement très structuré, alors qu'il a appris à caractériser une base objet ou interprétables nature.

La méthode actuelle de cet article, d'excellents résultats, a été très apprécié examinateurs, a reçu ICLR2020 comme communications orales.

# Auteurs équipe de recrutement

Afin de mieux servir notre section jeunesse AI, AI Yanxishe officiellement lancé un nouveau « papiers » dans l'espoir que « point d'intérêt », comme une jeunesse étudiante papier de polymérisation AI, recommandé par des documents de tri, critiques interprètent le code à reproduire. Pour devenir l'apprentissage de pointe à la maison et à l'étranger pour discuter des résultats de recherche et a publié un lieu de rassemblement, mais aussi à l'excellente recherche plus largement répandue et reconnue.

Nous espérons que vous aimez les milieux universitaires, les auteurs peuvent se joindre à notre équipe.

Adhérez auteurs équipe, vous pouvez obtenir

1. Département de l'article avec votre nom, vous combattrez la plus brillante étoile académique

2. Les droits lucratifs

Interpoler 3.ai entreprises célèbres, le bien-être des billets Assemblée, souvenirs, etc., etc. exclusivité dans.

Joignez-vous à l'équipe des auteurs dont vous avez besoin:

1. Est-ce que vous aimez le papier recommandé à la majorité des Rotariens Yanxishe

2. Compose documents de lecture

Si vous êtes prêt à rejoindre l'équipe à temps partiel AI Yanxishe des auteurs du papier, vous pouvez ajouter la petite soeur des opérations de micro-canaux, notes « partie de la thèse »

L'introduction de l'opération de déclenchement supplémentaire, LSTM légèrement modifié, la performance sera transformateur XL comparable
Précédent
Du général à la connaissance spécifique de la migration, Tencent AI Lab fait dans différents domaines en fonction du domaine de la transformation du réseau de traduction automatique
Prochain
Sur la base de distillation à couplage de connaissances, 200 fois plus rapide, une détection de zone d'affichage vidéo algorithme
Reproductibilité du papier, si l'analyse quantitative?
Recrutement Ordre: affaires ici, « truc du printemps » ne pas paniquer
Source et déclaration cible n'est plus indépendant, représentent conjointement plus pour améliorer la performance de la traduction automatique
Juste et exacte est tout aussi important! CMU a proposé l'apprentissage des méthodes de caractérisation juste pour obtenir algorithme d'équité
Les données ne peuvent être utilisées sans discernement, la nouvelle décennie, pourquoi les entreprises devraient utiliser le partage de données nouveau paradigme?
Tencent AI Lab fait « forêt entièrement dépendante » atténuer de manière significative l'erreur est passé extraction de relations
Hinton AAAI2020 Discours: Le réseau a finalement fait la capsule droite chose
Aujourd'hui papier | gradient de cisaillement, NER, traitement du langage naturel, la fonction de l'intensité de l'apprentissage libre
Sloan Research Award 2020 a annoncé que 16 scientifiques chinois ont été sélectionnés, quatre du numéro de l'hôpital l'Université de Pékin
Une vue de texte intégral, les connaissances AAAI sur la carte 2020
Livre d'aujourd'hui | apprentissage petit échantillon, l'apprentissage machine, une seule image désembuage, détection de cible zéro échantillon