Xiao Guo Yipu Chagan � partir du bas de la non-Temple encastr� qubit produit | Num�ro public QbitAI

Avant le d�but du contenu d'aujourd'hui, vous pouvez d'abord �couter la voix de tampon ci-dessous, peu de temps, seulement 18 secondes, est une soeur bien connue chanter la chanson de Adele Rolling in the Deep.

Il sont familiers avec le double monde des Amis du bassin peuvent les �couter, ce sons de la chanson comme Sato Shasha La, elle est un logiciel d'�dition sonore Cevio le d�veloppement de Virtual Diva.

Cependant, la voix de Shasha La divinit� semble sonner plus � �lectronique � pour certains, mais le paragraphe ci-dessus dans les sons de roulement profonds comme un bruit comme une personne r�elle et Shasha La sing.

Il n'est pas.

En fait, c'est la derni�re perc�e dans la technologie de la parole au Japon, aussi longtemps que la dur�e d'une des donn�es vocales de chant chanteur de 2 heures, gr�ce � la profondeur de la technologie d'apprentissage, il peut �tre synth�tis� avec cette personne exactement la m�me chanson.

La Shasha son si r�el, de sorte que le deuxi�me �l�ment de fans sur le microblogging �cri�: ma femme � na�tre � nouveau!

Certaines personnes ont m�me pr�vu, qui subvertir cercle Kichiku.

Ah, les futurs propri�taires de stations UP B peuvent faire le premier ministre tr�s naturel de chanter une mal�diction roi Stuart.

Dans l'industrie de la musique, cette nouvelle technologie nous permet d'appr�cier des chansons plus diff�rentes.

Par exemple, tant que AI �couter trois albums de JJ, AI peut utiliser la voix de JJ, chantant Jay, Mayday, Stefanie une de leur chanson.

Et vous ne serez pas entendre la synth�se compl�te des traces �lectroniques.

Ci-dessous, nous devons appr�cier les diff�rentes manifestations de l'intelligence artificielle dans le chant en japonais, anglais, chinois chanson il:

japonais

Respectivement avant et arri�re, � Diamonds � et � �l�ve � deux chansons, vous pouvez tourner pour entendre l'ancienne version de la version compl�te de chaque chanson avec accompagnement, une version a cappella de la g�n�ration pr�c�dente de la technologie.

(Vid�o pris du dernier article "qubits" Num�ro public: https: //mp.weixin.qq.com/s/xziFQRlbn2vQCNBEsdRd_g)

Peut �couter clairement � eux, la nouvelle g�n�ration de la technologie et le chant en direct presque exactement la m�me version, l'ancienne version est aucune sorte de son �lectronique profond.

en anglais

L'anglais est la chanson "Rolling In The Deep" et "Everytime" deux, dans le m�me ordre et les trois versions ci-dessus de la version japonaise.

(Vid�o pris du dernier article "qubits" Num�ro public: https: //mp.weixin.qq.com/s/xziFQRlbn2vQCNBEsdRd_g)

Anglais chant a cappella a �t� sonn� humain normal sans diff�rence, il y aura un accompagnement de bande et la moindre violation, mais la prononciation du mot a �t� clairement plus que la version de la technologie plus.

Cependant, si vous �coutiez attentivement les versions avec accompagnement, trouveront que par rapport au remake d'un Japonais, cette fois pour chanter en anglais en IA se sentant encore la moindre musique �lectronique.

version chinoise

Et enfin aux chansons chinoises, chansons chinoises � Love the transfert. � Eason Chan

(Vid�o pris du dernier article "qubits" Num�ro public: https: //mp.weixin.qq.com/s/xziFQRlbn2vQCNBEsdRd_g)

L'IA Chantez caract�ristique des chansons chinoises, qui est un mot un mot a saut�, les Japonais peuvent apprendre le chinois est si bon.

Mais �coutez attentivement, vous pouvez encore entendre son potentiel, au moins maintenant, � erreur pr�c�dente r�fl�chir sur mon � dernier mot � penser �, le son est encore assez longtemps adouci.

Apr�s un � bouc �missaire d'amour faire des Agneaux, � une voix rauque juste sentir r�el, il semble que Amnesty International a appris que cette voix soudaine �lev�, les humains ordinaires ne peuvent pas faire chanter.

Il semble, afin d'apprendre comme, devraient apprendre des lacunes humaines ah, au moins que l'ancienne technologie qui Biao aigus forc� synchronisation labiale �coute plus confortable.

Qui est derri�re tout cela?

le d�veloppement de Cevio Techno discours est l'un des investissements par la soci�t� Nagoya Institute of Technology de risque, cr��e en Novembre 2009, l'activit� principale est de fournir des logiciels multim�dia et de mat�riel vers le monde ext�rieur.

En plus des niveaux de capital, la soci�t� et l'�cole aussi inextricablement li�s, Techno discours fond� pour diffuser les technologies audio les plus avanc�es du monde d�velopp� � l'Universit� de Nagoya.

Professeur Keiichi Tokuda Speech Technology Research Center de Nagoya Institute of Technology a dirig� le d�veloppement des �l�ments ci-dessus, le Dr Keiichiro Oura hors de son laboratoire est le directeur par int�rim de Techno discours.

Techno Discours Pr�sident Keiichiro Oura

La voix synth�tis�e en utilisant un logiciel Techno discours de synth�se de la parole Cevio.

En outre, la soci�t� a �galement d�velopp� un certain nombre d'autres produits bien connus.

Techno discours et les entreprises japonaises Joysound coop�ration Kara OK, AI espoir non seulement d'apprendre � chanter, mais chanter aussi l'humanit� de l'�glise � l'avenir. Il est diff�rent de la musique originale du son ouvert, mais en temps r�el la langue compositing, prend d�sormais en charge presque toutes les chansons japonaises.

Softbank Pepper robot c�l�bre aussi utilisaient leur technologie, ils ont gagn� le 2017 � Sain Uni Pepper � Les applications robotiques Challenge Award.

Apr�s robot de Pepper install� sur leurs applications, la machine peut �tre r�alis� avec chur humain, mais aussi apr�s la chanson encore et de commenter.

Techno discours esp�re r�soudre le probl�me des installations de soins infirmiers � domicile en utilisant cette technologie.

Quelle technologie est utilis�e?

Les d�tails techniques derri�re ces progr�s, Nagoya Institute de l'�quipe de recherche de la technologie n'a pas r�v�l�, mais a d�clar� en Mars l'ann�e prochaine, l'�quipe Keiichi Tokuda publiera les r�sultats de la recherche dans les r�unions de printemps de la Acoustical Society du Japon.

Cependant, dans une interview avec le site de musique num�rique station DTM, Keiichi Tokuda a �galement r�v�l� quelques d�tails: Ce syst�me utilise le r�seau de neurones profond (DNN).

Professeur Keiichi Tokuda

Keiichi Tokuda dans leur propre maison, il y a beaucoup de dossiers de papier de voix. R�cemment, un article, juste pour faire avec DNN.

Se r�f�rant � la comparaison avec la version japonaise de Microsoft chiendent � Reina � et Keiichi Tokuda dit � Reina � de Microsoft de � paroles et chansons � � � chanter �, utilise un moyen de chant pour traiter avec les utilisateurs simul�s, et ils sont les paroles compl�tes et de la musique se combinent pour chanter synth�tisent.

En outre, il a �t� introduit cette technologie dans l'avenir peut �tre appliqu� aux huit domaines suivants:

Reproduire chanteurs de musique (y compris son d�c�d�)
la production musicale et le d�veloppement de jeux
Accueilli par le streaming vid�o virtuel YouTubers / live
Acteur virtuel syst�me de post-enregistrement
AI ou un syst�me de dialogue vocal de modules de sons
Generated la voix de r�f�rence flexible pour le chant ou l'apprentissage d'une �ducation en langue �trang�re
Comme la SLA (Scl�rose de la maladie de la scl�rose lat�rale) ou divertissez patients atteints de cancer laryng� �quipement vocal
�tablissements de soins font l'affichage num�rique

Interpr�tation d'experts � chant synth�se AI �

A ce sujet, qubits a aussi demand� quelques experts de l'industrie grand Dieu.

Xiaobing, voix chef scientifique �p�e Luan Il a dit qu'il a entendu la version de concert Cevio, et la prononciation japonaise de l'anglais est �galement bon, relativement chaud, mais plus pr�occup� par le temps de formation.

Luan Jian a �galement vu le cas Cevio dans la station B, mais qui ne peut pas �tre deux heures de r�sultats de la formation. En g�n�ral, la quantit� de donn�es est plus petite, plus la difficult� de la synth�se de haute qualit�.

Cette ann�e, six g�n�rations de conf�rence chiendent, Microsoft a publi� le mod�le apr�s quatre heures de formation, l'effet �tait bonne r�ponse.

Mais la voix Xiaobing, directeur scientifique a soulign� que, pour l'�valuation du chant de biais subjectif plus, diff�rentes personnes ont une �valuation diff�rente, les crit�res d'�valuation ne sont pas uniformes.

Si le Comment simuler les �motions humaines � l'extr�me Voir, Jian Luan estime que des d�fis techniques �motion .

� Chanter parler avec des exigences diff�rentes pour l'expression �motionnelle tr�s forte, la voix, le souffle aura une incidence sur les r�sultats finaux, alors comment est plus de difficult� �motionnelle de synth�se de chant. �

En plus de chiendent, de la parole AI l'an dernier, la soci�t� pensera Chi �galement le programme de t�l�vision en circuit ferm� � d'esprit � � travers le projet d�buts de chant AI.

Penserai Chi co-fondateur et directeur scientifique Yu Kai A cette �poque, on a synth�tis� l'interpr�tation chant du syst�me AI.

Chanter la synth�se vocale est une branche de la synth�se de la parole de l'art, un texte donn� et de la musique, la voix de chant du processus de g�n�ration.

La principale m�thode est la base du texte � la synth�se de la parole, � travers la musique donn�e � caract�re � de chaque ton et le � caract�re � de la longueur de la prononciation des caract�res chinois dans diff�rents tons de synth�se est devenu le chant.

Le chant est le mod�le bas� sur un mod�le de lecture � r�aliser avec le texte et la m�lodie en changeant le ton, et l'utilisation ult�rieure de l'apprentissage en profondeur pour apprendre la diff�rence entre les caract�ristiques spectrales du m�me chant du haut-parleur et les paroles de lecture.

La technologie standard CTO Tony Li Xiulin Tell qubits, sur le point de vue du d�veloppement actuel, synth�tique AI chantant des d�fis.

Daniel, le champ TTS, �tait Baidu T9, synth�se vocale en raison d'obtenir la r�compense annuelle Baidu les plus �lev�s, et il a servi dans la voix gouttes chef d'�quipe CV hehe dans la synth�se de la parole.

Li Xiulin croire qu'il ya deux d�fis:

D'une part, il est de limiter la port�e de chaque chanteur a sa propre gamme sonore, si hors de port�e de chansons, l'effet de synth�se peut �tre affect�e � un certain degr�.

En outre, ce qui limite les donn�es de formation, il aura une incidence sur les r�sultats du mod�le bas� sur le r�seau de neurones.

Mais l'effet du nouveau syst�me par rapport � la pr�c�dente, a �videmment am�lior�, sentant le bruit de la machine a consid�rablement diminu�, plus proche de la voix d'une personne r�elle.

One More Thing

� l'heure actuelle, l'IA est toujours le chant le plus connu de Microsoft chiendent.

Depuis 2016, chiendent d�buts en tant que chanteur, a publi� pr�s d'une douzaine de premiers singles de qualit� humaine. La fin de Septembre 2017, la cinqui�me g�n�ration de chanteur intelligence artificielle chiendent d�verrouiller mod�le d'apprentissage profond, mis �galement en baisse implacable:

Je ne suis pas un impact humain, mais le chanteur virtuel traditionnel. Les humains, oublient la longue main-tune dur il.

r�ponse parfois f�roce.

Cette fois-ci, les parties ont �galement fait r�f�rence aux commentaires Microsoft chiendent.

Mais Xiaobing, voix chef scientifique Jian Luan a �galement dit que parce Cevio pas une version chinoise, donc avec la derni�re est difficile chiendent six g�n�rations � la concurrence directe.

Mais l'�quipe Xiaobing sur leur propre � fille � tr�s confiant, ils veulent faire directement chiendent chanter pour tout le monde.

Comme le nombre de limite vid�o graphique public sur le nombre, ne peut pas �tre pr�sent� ici.

Dans l'interface qubit dialogue public n � r�ponse � chiendent chanter � vous apr�s quatre heures de formation chiendent six g�n�rations de chant.

- complet �-

recrutement sinc�re

Qubits recrutent �diteur / journaliste, bas� � Zhongguancun de Beijing. Nous attendons de talent, des �tudiants enthousiastes de nous rejoindre! D�tails, s'il vous pla�t interface de dialogue qubit num�ro public (QbitAI), r�ponse mot "recrutement".

qubit QbitAI � manchettes sur la signature de

' � suivre les nouvelles technologies AI dynamiques et de produits

Route de la soie

Apprenez � conna�tre la Chine

Vous ne pouvez pas tout � fait AI chanter! Nagoya University Industry Virtual Diva, balay� en trois langues, anglais et japonais

Qui est derri�re tout cela?

Quelle technologie est utilis�e?

Interpr�tation d'experts � chant synth�se AI �

One More Thing