papier ICLR19: sifflets devient une symphonie, une cl� de r�seau de neurones pour changer le style de musique

Tongling non Temple du fond de l'�videment

Qubit produit | Num�ro public QbitAI

nouveau projet froid AI open-source de Facebook, donne la note "habiller".

Les quatuors � cordes de Haydn, il converti en Cantate de Bach, le piano de Beethoven. Laissez la guitare classique, transform� en une symphonie �l�gante Mozart.

M�me vous siffler en passant hum, apr�s le traitement AI et de transformation, peut devenir une symphonie de Mozart.

C'est le ma�tre du son de l'industrie de la musique P de celui-ci.

� l'heure actuelle, la th�se de ce projet a �t� re�u ICLR19, a �galement re�u le laur�at du prix Turing, a pr�s de 600 �tude approfondie sur Daniel Chan Yann retweet, tweets LeCun de.

Cette fois-ci, qui peut dire que vous n'avez pas le talent musical?

changer la musique secr�te Whistle

Dans le document A Universal Music Network Translation, les quatre chercheurs FaceBook Institut AI d�taille les principes sous-jacents.

Laissez le changement de style de la musique, et m�me devenir une symphonie secret de sifflets, cach� dans une conversion de musique g�n�rique dans le r�seau.

Ceci est une m�thode de conversion de la musique couvrant instrument de musique, le genre et le style, sur la base de la transformation multi-domaine � partir Wavenet du codeur. Ce mod�le est un g�n�rateur de formes d'ondes audio d'origine pr�c�demment d�velopp� Google, et la g�n�ration de forme d'onde vitesse rapide, et l'effet r�aliste.

En plus de la structure au moyen d'un Wavenet, le r�seau de commutation comporte �galement un codeur de forme d'onde partag�e commune et � la fin de train d'extr�mit� d�baller espace latent (espace latent d�m�l�).

�architecture mod�le FaceBook Universal Music Converter

Ceci est un r�seau de codeur de convolution complet, qui se compose de trois blocs, chaque bloc contenant une couche r�siduelle 10 peut �tre appliqu� � toute la longueur de la s�quence.

Ensuite, chaque couche contient une augmentation de la taille de base r�siduelles avec l'augmentation de l'expansion de convolution, un RELU d'�l�ment non lin�aire, il y a une convolution de 1 � 1, la largeur fixe de 128 canaux.

En d�ployant plusieurs ensembles de donn�es de formation et une grande capacit� du r�seau, la musique support du codeur de domaine ind�pendant converti dans le domaine musical pas vu pendant la formation. Cette m�thode d'apprentissage non supervis� ne repose pas sur inter-domaine ou la transcription de surveillance de la mise en correspondance de la musique sur les �chantillons.

Les chercheurs ont utilis� un synth�tiseur vocal DeepMind pr�c�demment publi� NSynth et les m�thodes d'�valuation de ces donn�es sur les musiciens professionnels de l'homme de l'ensemble de donn�es.

Les chercheurs ont enregistr� les scores factoids MOS audio (Score Mean Opinion), les r�sultats montrent, les �missions de mod�le de qualit� audio l�g�rement le bas de la qualit� audio du lecteur humain.

Les chercheurs ont ensuite �valu� la corr�lation normalis�e entre la musique et la lecture de la musique de g�n�ration de mod�le humain dans des conditions diff�rentes.

Les r�sultats montrent, plus que l'IA partition d'origine humaine.

portail

papier:

https://arxiv.org/abs/1805.07848

Open Source Adresse:

https://github.com/facebookresearch/music-translation

Facebook Blog officiel:

https://research.fb.com/publications/a-universal-music-translation-network/

- FIN -

recrutement sinc�re

Qubits recrutent �diteur / journaliste, bas� � Zhongguancun de Beijing. Nous attendons de talent, des �tudiants enthousiastes de nous rejoindre! D�tails, s'il vous pla�t interface de dialogue qubit num�ro public (QbitAI), r�ponse mot "recrutement".

Qubit QbitAI � manchettes sur la signature de

' � suivre les nouvelles technologies AI dynamiques et de produits

Route de la soie

Apprenez � conna�tre la Chine

papier ICLR19: sifflets devient une symphonie, une cl� de r�seau de neurones pour changer le style de musique | open source