Tu dors encore? Pas aussi bon que cela vous donne une sorte de sommeil il!

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Mes Sweet Dreams sur Automatique Sleep-sc�ne Classification

Auteur | Dindin Meryll

Traduction | RaydonLiu, �ternelle comme la nouvelle routine, Yu Yu ne peu de soleil

Relecture | sauce poire examen Fan | finale Pita | Wang Li poisson

Lien original:

https://towardsdatascience.com/my-sweet-dreams-about-automatic-sleep-stage-classification-414128441728

Remerciements: Int�ressant M. Beaver

R�cemment, cinq mois, j'ai pass� un certain temps � perfectionner leurs comp�tences dans l'apprentissage de la machine, pour terminer le projet � partir d'une nuit de sommeil afin d'am�liorer la qualit� de chacun des entreprises fran�aises, ils ont mis en avant un nouveau d�fi. Nous n'avons pas accord� suffisamment d'attention pour dormir, maintenant dans notre population ont produit des cons�quences quantifi�es. la performance en chute libre, d�ficit de l'attention, troubles de la m�moire ...... tous sont les cons�quences d'un manque de sommeil. Solutions en m�decine est la t�te avec une bande, il est activement stimuler votre cerveau la nuit, surveiller votre sommeil et de fournir un projet diff�rent peut rendre les gens tombent facilement endormir. Si vous �tes curieux et que vous voulez dormir plus �tude approfondie d'une r�elle importance dans la vie que nous avons, je recommande maintenant professeur � l'Universit� de Californie � Berkeley Matthew Walker � Pourquoi avons-nous besoin de dormir? ". Ce livre est � bien des �gards j'ai �t� surpris, de fournir aux lecteurs un certain nombre de principes et recommandations, pour comprendre et am�liorer le sommeil, et donc �galement affect� la vie quotidienne.

Sur mon Github ont fourni tout le code utilis� dans le concours, les lecteurs sont libres de v�rifier et me donner des commentaires. Je vais vous expliquer en d�tail la m�thode peut atteindre la deuxi�me place du concours, m�me si la probabilit� de faire face � ce probl�me est limit�. Les lecteurs peuvent �galement �tre observ�s, ce code peut �tre appliqu� � un des probl�mes li�s � temps plus larges, on est donc principalement destin� � l'intelligibilit�. Les plus curieux lecteurs trouveront plus: cadre d'apprentissage profond, du codeur, l'analyse des donn�es de topologie � oeufs de P�ques �, profiter!

endormi

En entrant dans les probl�mes ensemble d'apprentissage de la machine, nous allons prendre un certain temps pour comprendre notre exp�rience, et nous pouvons utiliser les ressources de traitement d'images m�dicales multimodalit�s au probl�me. Maintenant, sur le site des outils de mesure de l'environnement de formation m�dicale, ils headband instrument peut l'analyse quantitative de votre activit� c�r�brale (�lectrodes EEG six, F7, F8, O1, O2, Fpz, et une �lectrode de r�f�rence), la t�te les activit�s et les voies respiratoires d'un acc�l�rateur (3D) et une votre fr�quence cardiaque (un oxym�tre de pouls).

site dreem

Pendant le sommeil, il bascule le cerveau � diff�rentes �tapes, appel�e phase de sommeil (comme le montre la. Figure). Chaque �tape a ses propres mod�les d'onde �lectrique du cerveau unique et sp�cifique image. La figure concerne le changement au fil du temps, les changements de phase de sommeil, le temps de sommeil appel� un diagramme de s�quence.

Dans la derni�re d�cennie, les gens ont toujours voulu compter sur un sp�cialiste pour remplacer le processus d'annotation manuelle gr�ce � l'automatisation. Lorsque nous passons en revue la litt�rature du temps, vous constaterez que les gens du moment sont le contenu et le battage associ� � ce sujet, ce qui est le contenu de la recherche sur l'apprentissage de la machine.

Je ne vais pas entrer dans les d�tails de, mais chaque �tape a une fonction sp�cifique de notre cerveau et li�es � la sant�. �tiqueter correctement ces �tapes, le domaine m�dical pourrait �tre plus grande �tude des troubles pathologiques et sommeil sur l'�tendue de la gamme. Grand (et statistiquement plus pr�cis) des �tudes �pid�miologiques merci probablement la robustesse de bonnes donn�es pour la recherche en fonction. Enfin, les gens peuvent �tre en mesure d'am�liorer leur sommeil sur une base quotidienne par la vraie mesure et le moniteur. C'est ce que DEEM veut vraiment fournir. De plus, �tant donn� que la Soci�t� se propose de simuler le cerveau en phase de sommeil profond (3 & 4), ils doivent, dans la mesure du possible de d�tecter avec pr�cision onde delta, afin de suivre correctement les.

Explorer l'analyse des donn�es

donn�es extrait concentr� de la formation r�elle

Fournir des couvre-chef Dreem d'int�gration multi-capteurs, pour recueillir les donn�es de s�ries chronologiques. Les signaux sont des fr�quences diff�rentes, chaque p�riode de 30 secondes. probl�me d'apprentissage supervis� machine est que les donn�es sont divis�es en un ensemble de formation est marqu� des �tapes du sommeil (sommeil th�oriquement sujet sp�cialiste) et un ensemble de test. Un coup d'il sur l'�tiquette de proportion, nous constatons que c'est un probl�me multi-classification disproportionn�e. distribution du signal de valeur extr�me met �galement en �vidence un probl�me dans l'ensemble de donn�es refl�te un produit artificiel (bas� sur les fluctuations du signal EEG classique est -500 � 500 microvolts hypoth�se).

Notes proportion marqu�e de la cinqui�me �tape apr�s un examen minutieux

les donn�es d'exploration, avant l'inattendu se produisit, l'�tiquette est effectivement ordonn�! Cela signifie que les donn�es de la collection personnelle de donn�es continues, qui ont l'avantage de la rapidit�. Bien s�r, nous ouvrons de nouveaux domaines de la construction de mod�les (GRU, LSTM ....). Selon ma compr�hension, Dreem semble r�cemment commenc� � utiliser ces mod�les (LSMC g�n�ralement toutes les 30 secondes, 30 fois par groupe). Cependant, en raison de la puissance limit�e (mod�le d'apprentissage en g�n�ral � flak � profond utilis� dans ce domaine) informatique et je veux aussi avoir un meilleur mod�le explicatif, alors j'ai d�cid� de me limiter � utiliser l'ancienne, une bonne robustesse fa�ons de faire fonctionne cette fonctionnalit�.

La s�quence de c�t�, apr�s avoir observ� les donn�es avant, j'extrait les donn�es pour chaque personne, et selon une longue p�riode d'abstinence (label 0), l'indice s�par�ment. La figure ci-dessous montre un exemple typique d'un diagramme de s�quence lorsqu'ils sont pr�sent�s avec le sommeil. Une fois extrait, ces personnes se r�unissent pour un sous-ensemble de la mise en place d'un ensemble robuste de bien valid�, le mod�le a la capacit� de faire ma g�n�ralisation. J'ai pass� les 88 derniers sous-ensembles de diff�rentes longueurs, ce qui devrait surestimer le fait que les donn�es de chacun (ce qui �quivaut � un stade de sommeil moyen est inf�rieur � l'�tape de 4,5 heures)

Un exemple d'un diagramme de s�quence lorsque la phase du sommeil Extrait

Caract�ristiques descriptives du projet: Chaos Theory

Suivant est int�ressant (et plus longue) partie! La meilleure fa�on de d�crire le signal EEG pour la classification de stade de sommeil? Apr�s avoir visionn� ces documents, je collectionnais des id�es plus descriptives sont dans le pipeline. En cons�quence, l'intervalle de toutes les 30 secondes est converti en un vecteur caract�ristique 1200. Je ne serai pas pr�sent� un par un pour chaque propri�t� (comme la plupart des fonctionnalit�s sont classiques), mais se concentrera sur les caract�ristiques de fournir les meilleures performances pour le classement de l'�tape du sommeil.

L'importance des caract�ristiques pertinentes (plus de 30 propri�t�s XGBoost)

En r�gle g�n�rale, dans les chiffres ci-dessus, j'estime l'importance du mod�le 30 caract�ristiques les plus importantes XGBoost, et les a compar�s avec l'utilisation de l'importance relative des LigthGBM, et ExtraTrees obtenu for�t d'arbres d�cisionnels. Dans la validation crois�e 5 fois, le mod�le XGB a les meilleures performances. (L'importance ici est la moyenne des cinq r�sultats du mod�le pli�.)

Pas �tonnant que la th�orie du chaos a fini par devenir l'une des th�ories les plus importantes. Pourquoi Parce que nous essayons de vague et d'�v�nements se d�roulant dans le classement: � faible � Le chaos est aux fins d'�v�nements p�riodiques et pr�visibles, et les �v�nements chaotiques � plus �lev�s � correspondent g�n�ralement � l'impr�visible (comme les broches, k-complexe, qui est un motif sp�cifique � certains stades du sommeil). Jusqu'� pr�sent, ces fonctionnalit�s sont utiles dans plusieurs de mes projets, je vais donc garder quelques lignes pour introduire ces caract�ristiques.

indice de Lyapunov est le taux de s�paration (typiquement la distance) entre une infinit�simale en circuit ferm�. Ils quantifi�s le syst�me dynamique (ici des �lectroenc�phalogrammes non stationnaires) de pr�visibilit�, il doit �tre consid�r� comme un spectre.

Hurst est un indicateur de d�pendance � long terme, ce qui � quantifier la m�moire � long terme par une s�rie de temps de sp�cifiques qui leur sont associ�s.

La dimension fractale correspondant � la complexit� de l'indicateur statistique, qui d�crit les d�tails de la fa�on dont le changement de mode varie selon l'�chelle de mesure.

Source: PyEEG

Ce sont des caract�ristiques �tranges. Je aussi utilis� des coefficients autor�gressifs du raccord de mod�le, la distance entre les �lectroenc�phalogrammes, d�composition en ondelettes Debauchies, la d�composition et de l'�volution du spectre r�siduel pour trouver la d�pendance de fr�quence (parce que chaque mode d'onde Nous avons une fr�quence sp�cifique et importante). Cela fournit la base pour moi d'entrer dans le processus de construction du mod�le.

niveau de la structure et l'empilage

Ing�nierie et dispose d�sormais de donn�es pr�-traitement est termin�. Je suis en mesure de distinguer un sous-ensemble de certains individus pour construire ma formation et validation des ensembles. Pour construire chaque mod�le, j'utilis� une validation crois�e de 5 fois (� savoir, pour le sous-ensemble individuel particulier I de plus g�n�ralisation).

Enfin, afin d'obtenir le r�sultat de pr�diction finale, je consid�re les points suivants: La polym�risation est r�alis�e par empilement de la base de la diff�rence et le niveau de bruit.

Des exemples de couverture des cent premiers exemples

En g�n�ral, le mod�le statistique, la pr�sence de bruit. La m�thode que je propose est un sous-ensemble de l'ensemble de test et construit en fonction d'indicateurs sp�cifiques de l'ensemble de la formation. En r�gle g�n�rale, afin de � niveau de bruit � pour une d�finition, nous avons con�u trois caract�ristiques de chaque signal EEG: la zone en dessous du maximum, minimum et courbes. Vers le milieu des trois distribution associ�e (via une valeur interm�diaire), je peux nous d�finir un rapport simple d'une distance correspondant au niveau de bruit en tant que mesure de l'�cart type r�el. Cette approche m'a permis de d�finir cinq niveaux de bruit, le niveau de couverture comme repr�sent� figure 1.0. Si un signal ne figure pas sur la pluralit� de niveaux de bruit, il est susceptible de contenir des artefacts. Ces limites sont repr�sent�es par cinq phase de formation diff�rents, repr�sentant chaque sous-ensemble. Toutefois, en prenant en consid�ration une vari�t� de sortie qui m'a donn� beaucoup de confiance. Enfin, par it�ration avec des pr�visions plus pr�cises pour couvrir la valeur de leur pr�vision initiale.

Une fois ces cinq niveaux sont s�par�s, je me suis entra�n� quatre mod�les diff�rents (mentionn� dans l'�tape pr�c�dente lors du franchissement des caract�ristiques techniques) :. XGBoost, LightGBM, for�t d'arbres d�cisionnels et ExtraTrees hyperparametric ces mod�les sont ma propre conception UHF apporter des ajustements. index optimis� est le score kappa (peut �tre comprise comme l'accord entre l'indice), comme une r�f�rence dans ce domaine.

d�finition des scores Kappa

Le score de v�rification crois�e de cinq bruit (ensemble de validation de la fraction Kappa)

Sur chaque jeu validation crois�e, les quatre mod�les sont donn�s ensemble de la formation, ensemble de validation des �chantillons de test ensemble de probabilit�. En outre, faire attention au d�s�quilibre des donn�es et des donn�es � limiter au stade de la formation et de la notation en poids.

Source: Non gratuit Hunch

En cons�quence, je suis venu � la probabilit� de quatre mod�les de ce qui m'a amen� � utiliser la conception de superposition. Cette m�thode est par, comme indiqu� ci-dessous entre les r�sultats pr�vus du mod�le propos� diversit� entra�n� une telle corr�lation. La m�thode de base illustr� sur la figure comprend essentiellement la probabilit� et une fonction de celle-ci comme un ensemble d'entra�nement, ensemble de validation, l'ensemble de test. Dans cet exemple, j'utilise un mod�le lin�aire (algorithme du gradient stochastique) et par validation crois�e bas�e sur les mesures individuelles Kappa optimis�.

La corr�lation entre le mod�le et la probabilit� r�elle de stades du sommeil

Four matrice de confusion des mod�les (5 Noise)

Nous regardons la matrice de la relation: Parce que (XGBoost, LightGBM) et (for�t d'arbres d�cisionnels, ExtraTrees) sont similaires dans leur structure, voir intuitivement leurs pr�dictions sont fortement corr�l�es. Cependant, il y a vaut deux points prenant note:

Cat�gorie 1 (une premi�re phase minoritaire) est le plus difficile � pr�voir, et il a montr� peu de corr�lation entre les arbres d'amplification;
Cat�gorie 3 (�tape 3 et 4) est le plus facile � pr�dire ( pour la stimulation de l'onde est une bonne chose). Une analyse plus pouss�e a montr� que la cat�gorie 1 et de la cat�gorie g�n�rale 4 (sommeil paradoxal) confus, compte tenu de l'�tendue et de la forme de telle sorte que la similitude des EEG qui est � pr�voir.

lissage de sortie

D'apr�s les r�sultats pr�c�dents, ma m�thode pr�sente des avantages et des inconv�nients. Il a deux faiblesses particuli�res: Le mod�le ne tient pas compte de la relation temporelle entre les �chantillons, mais il y a des difficult�s � pr�voir le sommeil de stade 1. La premi�re phase est une phase de transition, de veille � l'�tape de sommeil r�el. Mon objectif est d'am�liorer en construisant un filtre sur le mod�le pr�c�dent. Ma premi�re consid�ration est la sortie classique lisse, comme un passe-bande (pour maintenir les stades micro-sommeil et �veil continu � fr�quence �lev�e) ou m�thode de la moyenne (par exemple, Savitsky Golay) identiques. Ensuite, je me suis tourn� vers le mod�le de Markov cach�, parce que ce que je suis � la recherche: matrice de transition. Cependant, les meilleurs r�sultats de son approximation, par pas de temps 20 � base overfitting LSTM. LSTM en fonction de la probabilit� de sortie (la probabilit� de ma collection pour former et jeu de test), et compte tenu des contraintes de temps. Je peux l'utiliser pour construire une matrice de transition (le m�me que HMM), en plus de l'entr�e continue (probabilit�).

Enfin, je me suis am�lior� la continuit� des phases du sommeil, le micro conservais �v�nement de r�veil, a soulign� l'importance de la phase de transition 1.

Sous la pens�e des cerveaux

Cela fait partie de mon travail dans le jeu. Beaucoup de choses peuvent �tre am�lior�es, et les possibilit�s sont infinies. J'ai finalement deuxi�me place revient dans le jeu de test priv� score final kappa de 70,7. Comme pr�vu, la politique n'�viter compl�tement l'utilisation de surajustement, entre mon score interne et le score leaderboard a trouv� un �cart important. Dans un tel contexte m�dical, li� � la situation personnelle soul�ve irr�versiblement la question du transfert de covariables. Ce probl�me a toujours exist�, mais mes r�sultats montrent un grand potentiel de g�n�ralisation. Je remercie mon amour pour le livre de Matthew Walker soumis! Il y a beaucoup de projets similaires! Restez � l'�coute pour un prochain article, si vous voulez plus, s'il vous pla�t me donner la louange! )

ressources

d�p�t Github
Site de la concurrence
site dreem

Je veux continuer � voir les articles liens et r�f�rences connexes?

Cliquez sur le lien pour ouvrir la presse ou cliquez sur [Dormez-vous? Pas aussi bon que cela vous donne une sorte de sommeil il! ]:

https://ai.yanxishe.com/page/TextTranslation/1444

AI Yanxishe contenu passionnant mis � jour quotidiennement, la visualisation de contenu plus excitant: Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

CVPR 2018 Best of papiers dix

Objectifs d'apprentissage en profondeur de l'algorithme de d�tection

Mini v�hicules autonomes �tude en profondeur de la fonction visuelle des cartes

En 2018 avec l'exp�rience d'apprentissage � maladroit � de partager des donn�es scientifiques

En attendant vous interpr�tez:

Comment la structure s�mantique r�f�renc� dans le traitement PNL nerveux

(Python) en d�tectant les espaces inactifs Masque R-CNN

DQNs Senior: Tirer profit de la profondeur de l'apprentissage de renforcement pour jouer au jeu Pac-Man

La profondeur des nouvelles tendances d'apprentissage de renforcement: Google curiosit� comment l'introduction de l'agent d'apprentissage par renforcement

Route de la soie

Apprenez � conna�tre la Chine