Tongling non Temple du fond de l'évidement
Qubit produit | Numéro public QbitAI
nouveau projet froid AI open-source de Facebook, donne la note "habiller".
Les quatuors à cordes de Haydn, il converti en Cantate de Bach, le piano de Beethoven. Laissez la guitare classique, transformé en une symphonie élégante Mozart.
Même vous siffler en passant hum, après le traitement AI et de transformation, peut devenir une symphonie de Mozart.
C'est le maître du son de l'industrie de la musique P de celui-ci.
À l'heure actuelle, la thèse de ce projet a été reçu ICLR19, a également reçu le lauréat du prix Turing, a près de 600 étude approfondie sur Daniel Chan Yann retweet, tweets LeCun de.
Cette fois-ci, qui peut dire que vous n'avez pas le talent musical?
changer la musique secrète Whistle
Dans le document A Universal Music Network Translation, les quatre chercheurs FaceBook Institut AI détaille les principes sous-jacents.
Laissez le changement de style de la musique, et même devenir une symphonie secret de sifflets, caché dans une conversion de musique générique dans le réseau.
Ceci est une méthode de conversion de la musique couvrant instrument de musique, le genre et le style, sur la base de la transformation multi-domaine à partir Wavenet du codeur. Ce modèle est un générateur de formes d'ondes audio d'origine précédemment développé Google, et la génération de forme d'onde vitesse rapide, et l'effet réaliste.
En plus de la structure au moyen d'un Wavenet, le réseau de commutation comporte également un codeur de forme d'onde partagée commune et à la fin de train d'extrémité déballer espace latent (espace latent démêlé).
architecture modèle FaceBook Universal Music ConverterCeci est un réseau de codeur de convolution complet, qui se compose de trois blocs, chaque bloc contenant une couche résiduelle 10 peut être appliqué à toute la longueur de la séquence.
Ensuite, chaque couche contient une augmentation de la taille de base résiduelles avec l'augmentation de l'expansion de convolution, un RELU d'élément non linéaire, il y a une convolution de 1 × 1, la largeur fixe de 128 canaux.
En déployant plusieurs ensembles de données de formation et une grande capacité du réseau, la musique support du codeur de domaine indépendant converti dans le domaine musical pas vu pendant la formation. Cette méthode d'apprentissage non supervisé ne repose pas sur inter-domaine ou la transcription de surveillance de la mise en correspondance de la musique sur les échantillons.
Les chercheurs ont utilisé un synthétiseur vocal DeepMind précédemment publié NSynth et les méthodes d'évaluation de ces données sur les musiciens professionnels de l'homme de l'ensemble de données.
Les chercheurs ont enregistré les scores factoids MOS audio (Score Mean Opinion), les résultats montrent, les émissions de modèle de qualité audio légèrement le bas de la qualité audio du lecteur humain.
Les chercheurs ont ensuite évalué la corrélation normalisée entre la musique et la lecture de la musique de génération de modèle humain dans des conditions différentes.
Les résultats montrent, plus que l'IA partition d'origine humaine.
portail
papier:
https://arxiv.org/abs/1805.07848
Open Source Adresse:
https://github.com/facebookresearch/music-translation
Facebook Blog officiel:
https://research.fb.com/publications/a-universal-music-translation-network/
- FIN -
recrutement sincère
Qubits recrutent éditeur / journaliste, basé à Zhongguancun de Beijing. Nous attendons de talent, des étudiants enthousiastes de nous rejoindre! Détails, s'il vous plaît interface de dialogue qubit numéro public (QbitAI), réponse mot "recrutement".
Qubit QbitAI · manchettes sur la signature de
' « suivre les nouvelles technologies AI dynamiques et de produits