Aujourd'hui Papier | méthode de gradient adaptatif secondaire, le cadre sémantique multidomaine combiné, l'évaluation du système de la langue parlée

annuaire

méthode d'apprentissage adaptative sous-gradient en ligne et l'optimisation stochastique

décrochage: la prévention de surajustement de réseau neuronal

L'analyse sémantique basée sur le cadre commun pour les deux sens multi-domaines RNN-LSTM

Aucune analyse sémantique à grande échelle des questions et des réponses

Parlant revue systématique: terrain ATIS

méthode d'apprentissage adaptative sous-gradient en ligne et l'optimisation stochastique

Titre de la thèse: Méthodes adaptatives pour l'apprentissage en ligne sous-gradient et Stochastique Optimisation

Auteur: John Duchi / Elad Hazan / Yoram Chanteur

Publié: 11/07/2011

Documents lien: http: //jmlr.org/papers/volume12/duchi11a/duchi11a.pdf

raison recommandée

La question de base: Comment les utilisateurs nerveux apprendre l'optimisation est un élément très important quand vous apprenez la profondeur de l'apprentissage, vous devez d'abord apprendre l'algorithme de descente de gradient, mais il y a des problèmes dans cette méthode, après la naissance de tant d'algorithmes excellents.

Innovation: les auteurs proposent une nouvelle famille de méthode sous-gradient, les données d'information peuvent être vus dynamiquement absorbé, il peut être trouvé sur les caractéristiques d'apprentissage en fonction de gradient des informations utiles.

Implications pour la recherche: algorithme d'optimisation a été un apprentissage en profondeur de point important.

décrochage: la prévention de surajustement de réseau neuronal

Titre de la thèse: Dropout: Une simple façon de prévenir les réseaux de neurones de surapprentissage

Auteur: Nitish Srivastava / Geoffrey Hinton / Alex Krizhevsky / Ilya Sutskever / Ruslan Salakhutdinov

Publié: 12/11/2014

Documents lien: http: //www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf

raison recommandée

La question de base: dans un réseau de neurones sont souvent confrontés à un problème de problème surajustement est, il y a beaucoup résolu méthode d'ajustement, décrit l'un d'entre eux ici.

Innovations: Cet article présente une des méthodes de décrochage scolaire, ce qui est le moyen le plus populaire pour résoudre le overfitting réseau de neurones

Les implications pour la recherche: overfitting est un problème sérieux. Les grands réseaux utilisent aussi lent, difficile à traiter réseau de neurones à grande échelle à l'aide d'un test différent à travers une combinaison de surajustement quand beaucoup de gens ont prédit.

L'analyse sémantique basée sur le cadre commun pour les deux sens multi-domaines RNN-LSTM

Titre de la thèse: Cadre commun multi-domaine sémantique à l'aide liée au traitement bi-directionnel RNN-LSTM

Auteur: Dilek Hakkani-Tur / Gokhan Tur / Asli Celikyilmaz / Yun-Chen Nung / Gao Jianfeng / Li Deng / Ye-Yi Wang

Publié: 12/02/2016

Documents lien: https: //www.microsoft.com/en-us/research/wp-content/uploads/2016/06/IS16_MultiJoint.pdf

raison recommandée

Le problème de base: Ce système de dialogue pour faire l'article, le système de dialogue actuel trois plus important est le domaine de la classification, la reconnaissance de l'intention, remplissage solide, sous-problèmes ces trois tâches sont NLP, de nombreux modèles sont basés sur pipeline forme, indépendante à faire, ce document porte sur un modèle commun

innovations:

Les auteurs suggèrent une architecture RNN-LSTM pour combler les postes vacants, afin de déterminer l'intention de la modélisation conjointe et le classement sur le terrain.

La mise en place d'un modèle multi-domaine commun, afin de soutenir l'apprentissage en profondeur multi-tâches, des données complémentaires pour chaque champ.

Auteur de l'étude du vocabulaire de modélisation du contexte d'architecture alternative compréhension de la langue parlée.

Signification: Les résultats ont montré que, par rapport à un seul domaine alternatif / apprentissage basé sur des tâches approfondies, qui sont plus capables sur des données réelles de l'utilisateur Microsoft Cortana.

Aucune analyse sémantique à grande échelle des questions et des réponses

Nom de papier: à grande échelle sémantique Parsing sans paires de questions-réponses

Auteur: Siva Reddy / Mirella Lapata / Mark Steedman

Publié: 15/02/2014

Documents lien: https: //sivareddy.in/papers/reddy2014semanticparsing.pdf

raison recommandée

Le problème de base: système de réponse, nous avons souvent une connaissance préalable des questions et des réponses est, faire la tâche en faisant correspondre les questions et les réponses, mais s'il n'y a pas de problème lorsque la réponse à cette question? Comment apprendre la réponse à partir des données?

Innovations: Q & modèle de cet article n'a pas besoin de droit, en utilisant la méthode d'analyse de requête Freebase langage naturel, l'analyse sémantique conceptualisé comme un problème d'appariement de graphes.

Les implications pour la recherche: évaluation expérimentale et la collecte des données de base FREE917 WEBQUESTIONS sous-ensemble montre notre analyseur sémantique est plus avancée que la technologie la plus avancée.

Parlant revue systématique: terrain ATIS

Titre de la thèse: Évaluation de la Langue des systèmes: le domaine ATIS

Auteur: P J. Price.

Publié: 24/06/1990

Documents lien: https: //www.aclweb.org/anthology/H90-1020.pdf

raison recommandée

Cet article daté, la raison pour laquelle est parce que vous voulez partager avec vous sur l'enregistrement.

Cet article décrit une partie du fond de la question, le problème décrit dans l'expérience préliminaire et le système « public » de l'évaluation des tâches de langue parlée dans le domaine, connu sous le nom ATIS

Il traite de la reconnaissance automatique de la parole, ainsi que tous les aspects de la compréhension du langage naturel. Évaluation du système de la langue parlée est un grand pas en avant au-delà du mécanisme d'évaluation décrit précédemment.

Sous épidémie, Apple en difficulté
Précédent
Journal modèle de prévision autorité épidémique pour retourner notre pays! Zhong Nanshan et autres débat humain « de détection précoce et l'isolement. »
Prochain
Aujourd'hui, papier | reconstruction de la structure et débruitage GAN, cycle visuel intégré, les méthodes d'optimisation stochastique, bande Xiaobing, etc.
Facebook une nouvelle étude: version améliorée de CNN, des photographies 2D peuvent également simuler l'effet 3D
CIF: identifier un nouveau mécanisme de neurones intègrent le paiement basées sur la voix
Livre d'aujourd'hui | modèle commun multi-tâche, la reconstruction 3D du corps humain, la compréhension visuelle de la traduction automatique, étude approfondie Redresseurs
Et les scènes d'action ne doivent pas lier étroitement, de réduire l'écart de la scène, sera en mesure d'identifier facilement le centre commercial chant danse Stade
l'équipe de Tsinghua re-break! Mis au point le premier système de stockage de résistances intégré mémoire multi-réseau de l'opérateur mondial
Entendu! App sera en mesure de surveiller les appels téléphoniques non autorisés, le taux de succès aussi élevé que 90%
Relisant les classiques de Turing, neuf réfutations incitent à la réflexion
Livre d'aujourd'hui | prévision de l'état de la maladie, la taille technique réseau, car les nouvelles titre de production, etc.
Regardez la scène | domestique et internationale température corporelle de mesure multi-sortie de l'aéroport, tous les masques portant sur le plan
Des livres sur le virus et la maladie: l'histoire de la civilisation humaine et la lutte changé
20 autres reconnaissances de dette, il a huit ans