papier ICLR19: sifflets devient une symphonie, une clé de réseau de neurones pour changer le style de musique | open source

Tongling non Temple du fond de l'évidement

Qubit produit | Numéro public QbitAI

nouveau projet froid AI open-source de Facebook, donne la note "habiller".

Les quatuors à cordes de Haydn, il converti en Cantate de Bach, le piano de Beethoven. Laissez la guitare classique, transformé en une symphonie élégante Mozart.

Même vous siffler en passant hum, après le traitement AI et de transformation, peut devenir une symphonie de Mozart.

C'est le maître du son de l'industrie de la musique P de celui-ci.

À l'heure actuelle, la thèse de ce projet a été reçu ICLR19, a également reçu le lauréat du prix Turing, a près de 600 étude approfondie sur Daniel Chan Yann retweet, tweets LeCun de.

Cette fois-ci, qui peut dire que vous n'avez pas le talent musical?

changer la musique secrète Whistle

Dans le document A Universal Music Network Translation, les quatre chercheurs FaceBook Institut AI détaille les principes sous-jacents.

Laissez le changement de style de la musique, et même devenir une symphonie secret de sifflets, caché dans une conversion de musique générique dans le réseau.

Ceci est une méthode de conversion de la musique couvrant instrument de musique, le genre et le style, sur la base de la transformation multi-domaine à partir Wavenet du codeur. Ce modèle est un générateur de formes d'ondes audio d'origine précédemment développé Google, et la génération de forme d'onde vitesse rapide, et l'effet réaliste.

En plus de la structure au moyen d'un Wavenet, le réseau de commutation comporte également un codeur de forme d'onde partagée commune et à la fin de train d'extrémité déballer espace latent (espace latent démêlé).

 architecture modèle FaceBook Universal Music Converter

Ceci est un réseau de codeur de convolution complet, qui se compose de trois blocs, chaque bloc contenant une couche résiduelle 10 peut être appliqué à toute la longueur de la séquence.

Ensuite, chaque couche contient une augmentation de la taille de base résiduelles avec l'augmentation de l'expansion de convolution, un RELU d'élément non linéaire, il y a une convolution de 1 × 1, la largeur fixe de 128 canaux.

En déployant plusieurs ensembles de données de formation et une grande capacité du réseau, la musique support du codeur de domaine indépendant converti dans le domaine musical pas vu pendant la formation. Cette méthode d'apprentissage non supervisé ne repose pas sur inter-domaine ou la transcription de surveillance de la mise en correspondance de la musique sur les échantillons.

Les chercheurs ont utilisé un synthétiseur vocal DeepMind précédemment publié NSynth et les méthodes d'évaluation de ces données sur les musiciens professionnels de l'homme de l'ensemble de données.

Les chercheurs ont enregistré les scores factoids MOS audio (Score Mean Opinion), les résultats montrent, les émissions de modèle de qualité audio légèrement le bas de la qualité audio du lecteur humain.

Les chercheurs ont ensuite évalué la corrélation normalisée entre la musique et la lecture de la musique de génération de modèle humain dans des conditions différentes.

Les résultats montrent, plus que l'IA partition d'origine humaine.

portail

papier:

https://arxiv.org/abs/1805.07848

Open Source Adresse:

https://github.com/facebookresearch/music-translation

Facebook Blog officiel:

https://research.fb.com/publications/a-universal-music-translation-network/

- FIN -

recrutement sincère

Qubits recrutent éditeur / journaliste, basé à Zhongguancun de Beijing. Nous attendons de talent, des étudiants enthousiastes de nous rejoindre! Détails, s'il vous plaît interface de dialogue qubit numéro public (QbitAI), réponse mot "recrutement".

Qubit QbitAI · manchettes sur la signature de

' « suivre les nouvelles technologies AI dynamiques et de produits

Le nouveau poulet a augmenté l'entrée recharge, la paix profitera du premier mois de l'élite 1,5 milliard! TX appelé vache argent!
Précédent
Essai: ils ont utilisé 40 ans pour prouver quoi?
Prochain
Harden voulait attraper Jordan Bryant? Vous devez dépasser cet homme, pas super-héros de données de fantaisie
Si la maison Thompson cet été, celui qui est la maison à côté le plus probable? Lakers 20% classé troisième possibilité
la mode Oscar Met Gala jeu exagéré: l'évolution de la mode spectacle sur LadyGaga, Li Liu Wen froid oeil d'aspiration
fond Ze Yuan a subi un autre tube du fond, à un âge précoce et le dîner étoiles? Bien plus que la force de l'ex-petit ami gel
Procédé de fabrication de circuit intégré entrée au maître
Quel est le vrai génie! balle frère de 10 ans pratiquant des lettres dans le niveau de MVP, il a joué deux ans dans l'équipe nationale
MLXG dans le jeu puis réglez Man? Sur stérile contrôle de chasse avant sa petite amie, de trouver un athlète professionnel quand son petit ami?
AI marine zone de commentaires, vous avez été très difficile à détecter | Démo jouable
Jiang Jin Xie mille ans « Lotus » Légende du témoin paysage humain
Ternaires logique est plus proche de la pensée du cerveau humain, pourquoi ne pas vous? Technologie secret noir une fois: ordinateur ternaire
Cinq hommes marée robe NBA: Harden est la fusée la plus belle Aberdeen, Wade est tout simplement une marée de costume
Discussion course DGDP répression, YM a joué périphérie dix fois! Les joueurs interrogés Fanzao, pas étonnant que tyran local?