Tu dors encore? Pas aussi bon que cela vous donne une sorte de sommeil il!

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Mes Sweet Dreams sur Automatique Sleep-scène Classification

Auteur | Dindin Meryll

Traduction | RaydonLiu, éternelle comme la nouvelle routine, Yu Yu ne peu de soleil

Relecture | sauce poire examen Fan | finale Pita | Wang Li poisson

Lien original:

https://towardsdatascience.com/my-sweet-dreams-about-automatic-sleep-stage-classification-414128441728

Remerciements: Intéressant M. Beaver

Récemment, cinq mois, j'ai passé un certain temps à perfectionner leurs compétences dans l'apprentissage de la machine, pour terminer le projet à partir d'une nuit de sommeil afin d'améliorer la qualité de chacun des entreprises françaises, ils ont mis en avant un nouveau défi. Nous n'avons pas accordé suffisamment d'attention pour dormir, maintenant dans notre population ont produit des conséquences quantifiées. la performance en chute libre, déficit de l'attention, troubles de la mémoire ...... tous sont les conséquences d'un manque de sommeil. Solutions en médecine est la tête avec une bande, il est activement stimuler votre cerveau la nuit, surveiller votre sommeil et de fournir un projet différent peut rendre les gens tombent facilement endormir. Si vous êtes curieux et que vous voulez dormir plus étude approfondie d'une réelle importance dans la vie que nous avons, je recommande maintenant professeur à l'Université de Californie à Berkeley Matthew Walker « Pourquoi avons-nous besoin de dormir? ". Ce livre est à bien des égards j'ai été surpris, de fournir aux lecteurs un certain nombre de principes et recommandations, pour comprendre et améliorer le sommeil, et donc également affecté la vie quotidienne.

Sur mon Github ont fourni tout le code utilisé dans le concours, les lecteurs sont libres de vérifier et me donner des commentaires. Je vais vous expliquer en détail la méthode peut atteindre la deuxième place du concours, même si la probabilité de faire face à ce problème est limité. Les lecteurs peuvent également être observés, ce code peut être appliqué à un des problèmes liés à temps plus larges, on est donc principalement destiné à l'intelligibilité. Les plus curieux lecteurs trouveront plus: cadre d'apprentissage profond, du codeur, l'analyse des données de topologie « oeufs de Pâques », profiter!

endormi

En entrant dans les problèmes ensemble d'apprentissage de la machine, nous allons prendre un certain temps pour comprendre notre expérience, et nous pouvons utiliser les ressources de traitement d'images médicales multimodalités au problème. Maintenant, sur le site des outils de mesure de l'environnement de formation médicale, ils headband instrument peut l'analyse quantitative de votre activité cérébrale (électrodes EEG six, F7, F8, O1, O2, Fpz, et une électrode de référence), la tête les activités et les voies respiratoires d'un accélérateur (3D) et une votre fréquence cardiaque (un oxymètre de pouls).

site dreem

Pendant le sommeil, il bascule le cerveau à différentes étapes, appelée phase de sommeil (comme le montre la. Figure). Chaque étape a ses propres modèles d'onde électrique du cerveau unique et spécifique image. La figure concerne le changement au fil du temps, les changements de phase de sommeil, le temps de sommeil appelé un diagramme de séquence.

Dans la dernière décennie, les gens ont toujours voulu compter sur un spécialiste pour remplacer le processus d'annotation manuelle grâce à l'automatisation. Lorsque nous passons en revue la littérature du temps, vous constaterez que les gens du moment sont le contenu et le battage associé à ce sujet, ce qui est le contenu de la recherche sur l'apprentissage de la machine.

Je ne vais pas entrer dans les détails de, mais chaque étape a une fonction spécifique de notre cerveau et liées à la santé. étiqueter correctement ces étapes, le domaine médical pourrait être plus grande étude des troubles pathologiques et sommeil sur l'étendue de la gamme. Grand (et statistiquement plus précis) des études épidémiologiques merci probablement la robustesse de bonnes données pour la recherche en fonction. Enfin, les gens peuvent être en mesure d'améliorer leur sommeil sur une base quotidienne par la vraie mesure et le moniteur. C'est ce que DEEM veut vraiment fournir. De plus, étant donné que la Société se propose de simuler le cerveau en phase de sommeil profond (3 & 4), ils doivent, dans la mesure du possible de détecter avec précision onde delta, afin de suivre correctement les.

Explorer l'analyse des données

données extrait concentré de la formation réelle

Fournir des couvre-chef Dreem d'intégration multi-capteurs, pour recueillir les données de séries chronologiques. Les signaux sont des fréquences différentes, chaque période de 30 secondes. problème d'apprentissage supervisé machine est que les données sont divisées en un ensemble de formation est marqué des étapes du sommeil (sommeil théoriquement sujet spécialiste) et un ensemble de test. Un coup d'il sur l'étiquette de proportion, nous constatons que c'est un problème multi-classification disproportionnée. distribution du signal de valeur extrême met également en évidence un problème dans l'ensemble de données reflète un produit artificiel (basé sur les fluctuations du signal EEG classique est -500 à 500 microvolts hypothèse).

Notes proportion marquée de la cinquième étape après un examen minutieux

les données d'exploration, avant l'inattendu se produisit, l'étiquette est effectivement ordonné! Cela signifie que les données de la collection personnelle de données continues, qui ont l'avantage de la rapidité. Bien sûr, nous ouvrons de nouveaux domaines de la construction de modèles (GRU, LSTM ....). Selon ma compréhension, Dreem semble récemment commencé à utiliser ces modèles (LSMC généralement toutes les 30 secondes, 30 fois par groupe). Cependant, en raison de la puissance limitée (modèle d'apprentissage en général « flak » profond utilisé dans ce domaine) informatique et je veux aussi avoir un meilleur modèle explicatif, alors j'ai décidé de me limiter à utiliser l'ancienne, une bonne robustesse façons de faire fonctionne cette fonctionnalité.

La séquence de côté, après avoir observé les données avant, j'extrait les données pour chaque personne, et selon une longue période d'abstinence (label 0), l'indice séparément. La figure ci-dessous montre un exemple typique d'un diagramme de séquence lorsqu'ils sont présentés avec le sommeil. Une fois extrait, ces personnes se réunissent pour un sous-ensemble de la mise en place d'un ensemble robuste de bien validé, le modèle a la capacité de faire ma généralisation. J'ai passé les 88 derniers sous-ensembles de différentes longueurs, ce qui devrait surestimer le fait que les données de chacun (ce qui équivaut à un stade de sommeil moyen est inférieur à l'étape de 4,5 heures)

Un exemple d'un diagramme de séquence lorsque la phase du sommeil Extrait

Caractéristiques descriptives du projet: Chaos Theory

Suivant est intéressant (et plus longue) partie! La meilleure façon de décrire le signal EEG pour la classification de stade de sommeil? Après avoir visionné ces documents, je collectionnais des idées plus descriptives sont dans le pipeline. En conséquence, l'intervalle de toutes les 30 secondes est converti en un vecteur caractéristique 1200. Je ne serai pas présenté un par un pour chaque propriété (comme la plupart des fonctionnalités sont classiques), mais se concentrera sur les caractéristiques de fournir les meilleures performances pour le classement de l'étape du sommeil.

L'importance des caractéristiques pertinentes (plus de 30 propriétés XGBoost)

En règle générale, dans les chiffres ci-dessus, j'estime l'importance du modèle 30 caractéristiques les plus importantes XGBoost, et les a comparés avec l'utilisation de l'importance relative des LigthGBM, et ExtraTrees obtenu forêt d'arbres décisionnels. Dans la validation croisée 5 fois, le modèle XGB a les meilleures performances. (L'importance ici est la moyenne des cinq résultats du modèle plié.)

Pas étonnant que la théorie du chaos a fini par devenir l'une des théories les plus importantes. Pourquoi Parce que nous essayons de vague et d'événements se déroulant dans le classement: « faible » Le chaos est aux fins d'événements périodiques et prévisibles, et les événements chaotiques « plus élevés » correspondent généralement à l'imprévisible (comme les broches, k-complexe, qui est un motif spécifique à certains stades du sommeil). Jusqu'à présent, ces fonctionnalités sont utiles dans plusieurs de mes projets, je vais donc garder quelques lignes pour introduire ces caractéristiques.

indice de Lyapunov est le taux de séparation (typiquement la distance) entre une infinitésimale en circuit fermé. Ils quantifiés le système dynamique (ici des électroencéphalogrammes non stationnaires) de prévisibilité, il doit être considéré comme un spectre.

Hurst est un indicateur de dépendance à long terme, ce qui à quantifier la mémoire à long terme par une série de temps de spécifiques qui leur sont associés.

La dimension fractale correspondant à la complexité de l'indicateur statistique, qui décrit les détails de la façon dont le changement de mode varie selon l'échelle de mesure.

Source: PyEEG

Ce sont des caractéristiques étranges. Je aussi utilisé des coefficients autorégressifs du raccord de modèle, la distance entre les électroencéphalogrammes, décomposition en ondelettes Debauchies, la décomposition et de l'évolution du spectre résiduel pour trouver la dépendance de fréquence (parce que chaque mode d'onde Nous avons une fréquence spécifique et importante). Cela fournit la base pour moi d'entrer dans le processus de construction du modèle.

niveau de la structure et l'empilage

Ingénierie et dispose désormais de données pré-traitement est terminé. Je suis en mesure de distinguer un sous-ensemble de certains individus pour construire ma formation et validation des ensembles. Pour construire chaque modèle, j'utilisé une validation croisée de 5 fois (à savoir, pour le sous-ensemble individuel particulier I de plus généralisation).

Enfin, afin d'obtenir le résultat de prédiction finale, je considère les points suivants: La polymérisation est réalisée par empilement de la base de la différence et le niveau de bruit.

Des exemples de couverture des cent premiers exemples

En général, le modèle statistique, la présence de bruit. La méthode que je propose est un sous-ensemble de l'ensemble de test et construit en fonction d'indicateurs spécifiques de l'ensemble de la formation. En règle générale, afin de « niveau de bruit » pour une définition, nous avons conçu trois caractéristiques de chaque signal EEG: la zone en dessous du maximum, minimum et courbes. Vers le milieu des trois distribution associée (via une valeur intermédiaire), je peux nous définir un rapport simple d'une distance correspondant au niveau de bruit en tant que mesure de l'écart type réel. Cette approche m'a permis de définir cinq niveaux de bruit, le niveau de couverture comme représenté figure 1.0. Si un signal ne figure pas sur la pluralité de niveaux de bruit, il est susceptible de contenir des artefacts. Ces limites sont représentées par cinq phase de formation différents, représentant chaque sous-ensemble. Toutefois, en prenant en considération une variété de sortie qui m'a donné beaucoup de confiance. Enfin, par itération avec des prévisions plus précises pour couvrir la valeur de leur prévision initiale.

Une fois ces cinq niveaux sont séparés, je me suis entraîné quatre modèles différents (mentionné dans l'étape précédente lors du franchissement des caractéristiques techniques) :. XGBoost, LightGBM, forêt d'arbres décisionnels et ExtraTrees hyperparametric ces modèles sont ma propre conception UHF apporter des ajustements. index optimisé est le score kappa (peut être comprise comme l'accord entre l'indice), comme une référence dans ce domaine.

définition des scores Kappa

Le score de vérification croisée de cinq bruit (ensemble de validation de la fraction Kappa)

Sur chaque jeu validation croisée, les quatre modèles sont donnés ensemble de la formation, ensemble de validation des échantillons de test ensemble de probabilité. En outre, faire attention au déséquilibre des données et des données à limiter au stade de la formation et de la notation en poids.

Source: Non gratuit Hunch

En conséquence, je suis venu à la probabilité de quatre modèles de ce qui m'a amené à utiliser la conception de superposition. Cette méthode est par, comme indiqué ci-dessous entre les résultats prévus du modèle proposé diversité entraîné une telle corrélation. La méthode de base illustré sur la figure comprend essentiellement la probabilité et une fonction de celle-ci comme un ensemble d'entraînement, ensemble de validation, l'ensemble de test. Dans cet exemple, j'utilise un modèle linéaire (algorithme du gradient stochastique) et par validation croisée basée sur les mesures individuelles Kappa optimisé.

La corrélation entre le modèle et la probabilité réelle de stades du sommeil

Four matrice de confusion des modèles (5 Noise)

Nous regardons la matrice de la relation: Parce que (XGBoost, LightGBM) et (forêt d'arbres décisionnels, ExtraTrees) sont similaires dans leur structure, voir intuitivement leurs prédictions sont fortement corrélées. Cependant, il y a vaut deux points prenant note:

  • Catégorie 1 (une première phase minoritaire) est le plus difficile à prévoir, et il a montré peu de corrélation entre les arbres d'amplification;

  • Catégorie 3 (étape 3 et 4) est le plus facile à prédire ( pour la stimulation de l'onde est une bonne chose). Une analyse plus poussée a montré que la catégorie 1 et de la catégorie générale 4 (sommeil paradoxal) confus, compte tenu de l'étendue et de la forme de telle sorte que la similitude des EEG qui est à prévoir.

lissage de sortie

D'après les résultats précédents, ma méthode présente des avantages et des inconvénients. Il a deux faiblesses particulières: Le modèle ne tient pas compte de la relation temporelle entre les échantillons, mais il y a des difficultés à prévoir le sommeil de stade 1. La première phase est une phase de transition, de veille à l'étape de sommeil réel. Mon objectif est d'améliorer en construisant un filtre sur le modèle précédent. Ma première considération est la sortie classique lisse, comme un passe-bande (pour maintenir les stades micro-sommeil et éveil continu à fréquence élevée) ou méthode de la moyenne (par exemple, Savitsky Golay) identiques. Ensuite, je me suis tourné vers le modèle de Markov caché, parce que ce que je suis à la recherche: matrice de transition. Cependant, les meilleurs résultats de son approximation, par pas de temps 20 à base overfitting LSTM. LSTM en fonction de la probabilité de sortie (la probabilité de ma collection pour former et jeu de test), et compte tenu des contraintes de temps. Je peux l'utiliser pour construire une matrice de transition (le même que HMM), en plus de l'entrée continue (probabilité).

Enfin, je me suis amélioré la continuité des phases du sommeil, le micro conservais événement de réveil, a souligné l'importance de la phase de transition 1.

Sous la pensée des cerveaux

Cela fait partie de mon travail dans le jeu. Beaucoup de choses peuvent être améliorées, et les possibilités sont infinies. J'ai finalement deuxième place revient dans le jeu de test privé score final kappa de 70,7. Comme prévu, la politique n'éviter complètement l'utilisation de surajustement, entre mon score interne et le score leaderboard a trouvé un écart important. Dans un tel contexte médical, lié à la situation personnelle soulève irréversiblement la question du transfert de covariables. Ce problème a toujours existé, mais mes résultats montrent un grand potentiel de généralisation. Je remercie mon amour pour le livre de Matthew Walker soumis! Il y a beaucoup de projets similaires! Restez à l'écoute pour un prochain article, si vous voulez plus, s'il vous plaît me donner la louange! )

ressources

  • dépôt Github

  • Site de la concurrence

  • site dreem

Je veux continuer à voir les articles liens et références connexes?

Cliquez sur le lien pour ouvrir la presse ou cliquez sur [Dormez-vous? Pas aussi bon que cela vous donne une sorte de sommeil il! ]:

https://ai.yanxishe.com/page/TextTranslation/1444

AI Yanxishe contenu passionnant mis à jour quotidiennement, la visualisation de contenu plus excitant: Lei Feng Lei Feng Lei réseau de réseau de réseau Feng

CVPR 2018 Best of papiers dix

Objectifs d'apprentissage en profondeur de l'algorithme de détection

Mini véhicules autonomes étude en profondeur de la fonction visuelle des cartes

En 2018 avec l'expérience d'apprentissage « maladroit » de partager des données scientifiques

En attendant vous interprétez:

Comment la structure sémantique référencé dans le traitement PNL nerveux

(Python) en détectant les espaces inactifs Masque R-CNN

DQNs Senior: Tirer profit de la profondeur de l'apprentissage de renforcement pour jouer au jeu Pac-Man

La profondeur des nouvelles tendances d'apprentissage de renforcement: Google curiosité comment l'introduction de l'agent d'apprentissage par renforcement

Voir | Venez ici rencontrer des fleurs « d'acres Taolin » pour les médias, au printemps comme une occasion
Précédent
Travailler trop, et aux heures supplémentaires de travail? matériel de bureau efficace pour vous sauver
Prochain
« Gang noir »: comment riez-vous, comment pleurer vous laisser
Cloud Technology et Université Jiaotong de Shanghai AAAI de documents sélectionnés lire: annotation rôle sémantique de nouvelles idées
Chic télétravail, routeur d'entreprise peut aussi être très Skr
équipe « Tongue » poussé nouveau travail, la lecture donne immédiatement à perdre du poids!
Momoyama Forêt « tour Lin Tour » tour du monde coloré
Samsung Série S10 a officiellement publié les preuves de photos viennent voir
Peu importe combien vous « étrange », de croire en ce monde, il y a toujours une personne sera avec vous à l'écoute
ordinateur cassé, utilisez-le pour être réellement en mesure de réinstaller le système à distance
Créer d'innombrables chaussures en cuir de luxe Hender Scheme, submergé par une fois que vous voyez tout changement au fil des ans en cuir!
Le véhicule commun automobile domestique de risque est également plus sûr que le secret, en fait cela!
Automne à pied Longjiang | projet d'introduire la première puissance
Heureusement, j'ai le contrôle de tournesol contrôle A2, je veux que le week-end pour faire des heures supplémentaires? Pas moyen!