annuaire
méthode d'apprentissage adaptative sous-gradient en ligne et l'optimisation stochastique
décrochage: la prévention de surajustement de réseau neuronal
L'analyse sémantique basée sur le cadre commun pour les deux sens multi-domaines RNN-LSTM
Aucune analyse sémantique à grande échelle des questions et des réponses
Parlant revue systématique: terrain ATIS
méthode d'apprentissage adaptative sous-gradient en ligne et l'optimisation stochastique
Titre de la thèse: Méthodes adaptatives pour l'apprentissage en ligne sous-gradient et Stochastique Optimisation
Auteur: John Duchi / Elad Hazan / Yoram Chanteur
Publié: 11/07/2011
Documents lien: http: //jmlr.org/papers/volume12/duchi11a/duchi11a.pdf
raison recommandée
La question de base: Comment les utilisateurs nerveux apprendre l'optimisation est un élément très important quand vous apprenez la profondeur de l'apprentissage, vous devez d'abord apprendre l'algorithme de descente de gradient, mais il y a des problèmes dans cette méthode, après la naissance de tant d'algorithmes excellents.
Innovation: les auteurs proposent une nouvelle famille de méthode sous-gradient, les données d'information peuvent être vus dynamiquement absorbé, il peut être trouvé sur les caractéristiques d'apprentissage en fonction de gradient des informations utiles.
Implications pour la recherche: algorithme d'optimisation a été un apprentissage en profondeur de point important.
décrochage: la prévention de surajustement de réseau neuronal
Titre de la thèse: Dropout: Une simple façon de prévenir les réseaux de neurones de surapprentissage
Auteur: Nitish Srivastava / Geoffrey Hinton / Alex Krizhevsky / Ilya Sutskever / Ruslan Salakhutdinov
Publié: 12/11/2014
Documents lien: http: //www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf
raison recommandée
La question de base: dans un réseau de neurones sont souvent confrontés à un problème de problème surajustement est, il y a beaucoup résolu méthode d'ajustement, décrit l'un d'entre eux ici.
Innovations: Cet article présente une des méthodes de décrochage scolaire, ce qui est le moyen le plus populaire pour résoudre le overfitting réseau de neurones
Les implications pour la recherche: overfitting est un problème sérieux. Les grands réseaux utilisent aussi lent, difficile à traiter réseau de neurones à grande échelle à l'aide d'un test différent à travers une combinaison de surajustement quand beaucoup de gens ont prédit.
L'analyse sémantique basée sur le cadre commun pour les deux sens multi-domaines RNN-LSTM
Titre de la thèse: Cadre commun multi-domaine sémantique à l'aide liée au traitement bi-directionnel RNN-LSTM
Auteur: Dilek Hakkani-Tur / Gokhan Tur / Asli Celikyilmaz / Yun-Chen Nung / Gao Jianfeng / Li Deng / Ye-Yi Wang
Publié: 12/02/2016
Documents lien: https: //www.microsoft.com/en-us/research/wp-content/uploads/2016/06/IS16_MultiJoint.pdf
raison recommandée
Le problème de base: Ce système de dialogue pour faire l'article, le système de dialogue actuel trois plus important est le domaine de la classification, la reconnaissance de l'intention, remplissage solide, sous-problèmes ces trois tâches sont NLP, de nombreux modèles sont basés sur pipeline forme, indépendante à faire, ce document porte sur un modèle commun
innovations:
Les auteurs suggèrent une architecture RNN-LSTM pour combler les postes vacants, afin de déterminer l'intention de la modélisation conjointe et le classement sur le terrain.
La mise en place d'un modèle multi-domaine commun, afin de soutenir l'apprentissage en profondeur multi-tâches, des données complémentaires pour chaque champ.
Auteur de l'étude du vocabulaire de modélisation du contexte d'architecture alternative compréhension de la langue parlée.
Signification: Les résultats ont montré que, par rapport à un seul domaine alternatif / apprentissage basé sur des tâches approfondies, qui sont plus capables sur des données réelles de l'utilisateur Microsoft Cortana.
Aucune analyse sémantique à grande échelle des questions et des réponses
Nom de papier: à grande échelle sémantique Parsing sans paires de questions-réponses
Auteur: Siva Reddy / Mirella Lapata / Mark Steedman
Publié: 15/02/2014
Documents lien: https: //sivareddy.in/papers/reddy2014semanticparsing.pdf
raison recommandée
Le problème de base: système de réponse, nous avons souvent une connaissance préalable des questions et des réponses est, faire la tâche en faisant correspondre les questions et les réponses, mais s'il n'y a pas de problème lorsque la réponse à cette question? Comment apprendre la réponse à partir des données?
Innovations: Q & modèle de cet article n'a pas besoin de droit, en utilisant la méthode d'analyse de requête Freebase langage naturel, l'analyse sémantique conceptualisé comme un problème d'appariement de graphes.
Les implications pour la recherche: évaluation expérimentale et la collecte des données de base FREE917 WEBQUESTIONS sous-ensemble montre notre analyseur sémantique est plus avancée que la technologie la plus avancée.
Parlant revue systématique: terrain ATIS
Titre de la thèse: Évaluation de la Langue des systèmes: le domaine ATIS
Auteur: P J. Price.
Publié: 24/06/1990
Documents lien: https: //www.aclweb.org/anthology/H90-1020.pdf
raison recommandée
Cet article daté, la raison pour laquelle est parce que vous voulez partager avec vous sur l'enregistrement.
Cet article décrit une partie du fond de la question, le problème décrit dans l'expérience préliminaire et le système « public » de l'évaluation des tâches de langue parlée dans le domaine, connu sous le nom ATIS
Il traite de la reconnaissance automatique de la parole, ainsi que tous les aspects de la compréhension du langage naturel. Évaluation du système de la langue parlée est un grand pas en avant au-delà du mécanisme d'évaluation décrit précédemment.