annuaire
-
séquence récurrente au niveau du réseau a marqué le transfert de l'apprentissage
-
Attention modèle réseau de neurones caractéristique marqueur de séquence
-
reconnaissance d'entité sur la base de nommage LSTM-CNNs bidirectionnelle
-
étiquette de séquence à extrémité par un bi-directionnel LSTM-CNNs-CRF
-
Caractérisation meilleure de l'objet, une meilleure reconstruction du monde de pure image
séquence récurrente au niveau du réseau a marqué le transfert de l'apprentissage
Titre de la thèse: L'APPRENTISSAGE DE TRANSFERT POUR SEQUENCE AVEC MARQUAGE HIERARCHIQUE RÉPÉTITION DES RÉSEAUX
Auteur: Yang Zhilin / Ruslan Salakhutdinov
Publié: 18/03/2017
Documents lien: https: //arxiv.org/pdf/1703.06345.pdf
Le problème de base: le problème de l'étiquetage de la séquence afin de résoudre le problème de la construction manuelle dispose d'exist d'apprentissage machine traditionnelle, où l'utilisation des réseaux de neurones est souvent la voie, mais les réseaux de neurones nécessitent souvent de grandes quantités de données peuvent, est maintenant confronté à une situation lorsqu'une quantité insuffisante de données, comment nous pouvons résoudre ce problème?
Innovation: en vision par ordinateur, lorsqu'ils sont confrontés à des données insuffisantes, nous utilisons souvent l'étude de la migration, ce document sera également étudier les moyens de mobilité pour l'apprentissage, dans lequel une tâche possède une vaste source de annotée a pour objectif d'améliorer les moins de commentaires disponibles la performance tâche
Faisabilité des paramètres du modèle et de la structure de la formation peuvent être migrés de cette façon plus, et obtenu de bons résultats, en fait, maintenant la montée de TAL un important modèle de pré-formation, qui a également prouvé cette direction dans une certaine mesure: l'importance .
Attention modèle réseau de neurones caractéristique marqueur de séquence
Titre de la thèse: Assister à des personnages dans les modèles Neural séquence étiquetage
Auteur: Marek Rei / Gamal K.O. Crichton / Sampo Pyysalo
Publié: 14/11/2016
Documents lien: https: //www.aclweb.org/anthology/C16-1030.pdf
raison recommandée
Le problème de base: les questions d'étiquetage de séquence pour faire face à un problème, le problème est que quand un mot est un mot qui apparaît dans mot inconnu, le temps sera un problème. Ce mot est appelé problème MHV
Innovation: l'innovation est de résoudre ce problème, le premier mot a un problème MHV, mais pas de problème de MHV de caractère, introduit ici une information de niveau de caractère. Ensuite, la mise en place d'un mécanisme d'attention, en utilisant l'attention classique + combinaisons + RNN CEF, donc en combinant le niveau des mots et vecteur caractère niveau, de manière à atteindre mot de caractère non OVV vecteur et son vecteur des mots similaires.
Signification: Dans de nombreux ensembles de données pour obtenir de bons résultats, et quelques paramètres de ce modèle.
reconnaissance d'entité sur la base de nommage LSTM-CNNs bidirectionnelle
Nom de papier: Entité nommé reconnaissance avec LSTM-Bidirectionnelle CNNs
Auteur: Jason Chiu P. C. / Eric Nichols
Publié: 19/07/2016
Documents lien: https: //arxiv.org/pdf/1511.08308.pdf
raison recommandée
Le problème de base: résolu ici est appelé tâche de reconnaissance de l'entité, qui est NLP un travail très difficile, une des méthodes d'apprentissage machine traditionnelle besoin d'utiliser le mode manuel, mais cette façon est pas bon.
L'innovation: Le papier utilisé est la façon dont la profondeur de l'apprentissage, et la méthode d'apprentissage profond traditionnel est différent, ici pour construire une nouvelle architecture de réseau de neurones qui peut détecter automatiquement mot-niveau et le caractère niveau caractéristiques LSTM dans les deux sens et l'architecture hybride CNN, éliminant ainsi la nécessité pour la plupart des caractéristiques du projet. En plus du papier propose également une nouvelle méthode, en utilisant cette méthode de la part du correspondant du dictionnaire est codé dans un réseau de neurones, vous pouvez obtenir de meilleurs résultats.
Implications pour la recherche: Les expériences montrent que l'effet de ce modèle que le modèle actuel, et mise au point est les meilleurs résultats en plus de données.
étiquette de séquence à extrémité par un bi-directionnel LSTM-CNNs-CRF
Titre de la thèse: de bout en bout séquence étiquetage via bidirectionnelle LSTM-CNNs-CRF
Auteur: Xuezhe Ma / Eduard Hovy
Publié: 29/05/2016
Documents lien: https: //arxiv.org/pdf/1603.01354.pdf
Le problème principal: le noyau de cet article est de résoudre le champ NLP problème nommé reconnaissance d'entités
Innovation: cet ensemble de papier modèles couramment utilisés avant est LSRM + CRF, jusqu'à une fin à la fin du modèle de réseau de neurones, mis en place la structure CNN, qui peut être une bonne partie de l'information locale
Signification: Cet effet effet modèle que le modèle précédent.
Caractérisation meilleure de l'objet, une meilleure reconstruction du monde de pure image
Titre de la thèse: contrastive apprentissage des modèles structurés du monde
Auteur: Thomas Kipf / Elise van der Pol / Max Welling
Publié: 26/09/2019
Documents lien: https: //openreview.net/forum id = H1gax6VtDB?
Comprendre les signaux visuels humains peuvent être observés de l'il pour restaurer le monde des objets, les relations entre les objets, niveaux, etc., ce qui est un élément important des capacités cognitives humaines, ainsi que l'apprentissage de la machine, l'apprentissage en profondeur, la vision par ordinateur est toujours confronté un défi majeur (réduction entrée de la structure de pixel d'origine du modèle avec le monde).
Université de Virginie auteurs proposent un modèle C-SWM un monde fondé sur le contraste de la formation structurée dans ce document, qui utilise une méthode de contraste pour caractériser la structure de l'environnement d'apprentissage combiné à l'utilisation. Il ne peut pas exiger une supervision directe, juste en regardant l'environnement d'extraction d'objet trouvé pixel d'origine.
Les auteurs contenant plusieurs indépendants, des objets d'environnement interactif peuvent être contrôlés évaluation du modèle de performance, y compris les simples jeux Atari, y compris les objets de l'environnement de simulation multi-physique. Les expériences montrent que ce modèle peut surmonter les nombreuses lacunes de la reconstruction basée sur un modèle précédent de pixels, également joué mieux que des modèles similaires pour caractériser les performances dans un environnement très structuré, alors qu'il a appris à caractériser une base objet ou interprétables nature.
La méthode actuelle de cet article, d'excellents résultats, a été très apprécié examinateurs, a reçu ICLR2020 comme communications orales.
# Auteurs équipe de recrutement
Afin de mieux servir notre section jeunesse AI, AI Yanxishe officiellement lancé un nouveau « papiers » dans l'espoir que « point d'intérêt », comme une jeunesse étudiante papier de polymérisation AI, recommandé par des documents de tri, critiques interprètent le code à reproduire. Pour devenir l'apprentissage de pointe à la maison et à l'étranger pour discuter des résultats de recherche et a publié un lieu de rassemblement, mais aussi à l'excellente recherche plus largement répandue et reconnue.
Nous espérons que vous aimez les milieux universitaires, les auteurs peuvent se joindre à notre équipe.
Adhérez auteurs équipe, vous pouvez obtenir
1. Département de l'article avec votre nom, vous combattrez la plus brillante étoile académique
2. Les droits lucratifs
Interpoler 3.ai entreprises célèbres, le bien-être des billets Assemblée, souvenirs, etc., etc. exclusivité dans.
Joignez-vous à l'équipe des auteurs dont vous avez besoin:
1. Est-ce que vous aimez le papier recommandé à la majorité des Rotariens Yanxishe
2. Compose documents de lecture
Si vous êtes prêt à rejoindre l'équipe à temps partiel AI Yanxishe des auteurs du papier, vous pouvez ajouter la petite soeur des opérations de micro-canaux, notes « partie de la thèse »