premier syst�me de g�n�ration d'humour sans supervision au monde est n�, la prochaine grande bataille apprentissage en profondeur: parler pi�ce!

Ji-won nouvelle compilation

r�sum�

Humour Generation est une question tr�s complexe. Difficile � dire exactement ce qui fait une blague devient dr�le. Pour r�soudre ce probl�me est g�n�ralement admis que la compr�hension s�mantique profonde, ainsi que des indices culturels et autres contextuels. Des travaux ant�rieurs dans ce domaine est d'essayer d'utiliser la base de donn�es et des exemples de formation �tiquet�s artificiellement cr��s sp�cifiquement pour servir cette mod�lisation des connaissances. Nous ne le faisions pas, mais a propos� un mod�le pour g�n�rer un tel je comme je les aime je aime mon X-Y que l'utilisation de grandes quantit�s de donn�es non marqu�es, des blagues Z (je aime mon X comme je les aime mes Y, blagues Z ) un mode, dans lequel X, y et Z sont les variables � combler. Ceci est, � notre connaissance, le premier syst�me de g�n�ration d'humour totalement sans supervision. Notre mod�le de base �tait nettement mieux que la concurrence, et de g�n�rer une blague dr�le dans 16% du temps, les humains sont 33% du temps pour g�n�rer une blague.

contour

blagues g�n�r�es sont g�n�ralement consid�r�s comme une question de langage naturel tr�s difficile, car cela signifie une compr�hension s�mantique profonde du texte, et souvent accompagn� par la compr�hension culturelle. Nous avons g�n�r� un type particulier de blague --- Je aime je aime je aime mon X-Y de la m�me, Z (I comme mon X comme je les aime mon Y, Z) - o� X et Y sont des noms, Z est g�n�ralement d�crit les propri�t�s x et y. Un exemple de ce type de plaisanterie est � Je aime mes joueurs comme je aime mon th�, est chaud, et le style britannique) - ces blagues sont tr�s populaires sur Internet.

Bien que g�n�rer simplement perspective (syst�me syntaxique est fixe), ces blagues ne sont pas tr�s dr�le, mais sa s�lection de contenu est encore tr�s difficile. En effet, pour la plupart des blagues dans le X, Y, Z, ne sera pas consid�r� comme ridicule. Par cons�quent, le principal d�fi de ce travail est de remplir le mod�le blanc dans cette blague, et toute la phrase ridicule.

Humour g�n�r� un travail diff�rent fait avant, nous ne comptons pas sur des donn�es de formation annot�s ou des r�gles de codage manuellement, mais repose sur de grandes quantit�s de donn�es annot�es. Nous proposons un mod�le d'apprentissage de la machine pour exprimer ce que nous sommes sur le point de faire de telles plaisanteries deviennent hypoth�se risible. Nous avons �galement prouv� que, en utilisant ce mod�le tr�s simple et beaucoup de donn�es, nous avons 16% du temps, produite dans le juge humain qui semble blague ridicule.

La principale contribution de cet article est, � notre connaissance, c'est le premier syst�me de g�n�ration de plaisanterie compl�te sans supervision. Juste des donn�es non �tiquet�s, nous avons utilis�, ce qui indique la formation d'une blague n'est pas comme on le croit g�n�ralement, toujours besoin de comprendre la s�mantique de profondeur.

Nous vous proposons un syst�me de g�n�ration de plaisanterie compl�te sans supervision, pour g�n�rer ce type la blague suivante

J'aime mes relations interpersonnelles comme je les aime ma ressource, tr�s ouvert.

Je aime myrelationships comme je les aime ma source

J'aime mon caf� comme je comme ma guerre froide.

Je aime mycoffee comme je les aime ma guerre, le froid

� Je aime mon X comme je l'aime, comme mon Y, Z � (je aime mon X comme je les aime mon Y, Z) est la n�cessit� de remplir le mod�le. � notre connaissance, c'est la premi�re qui ne n�cessite pas d'�tiquetage ou manuelle des donn�es codant pour des blagues syst�me de g�n�ration de r�gles. Nous croyons que nous sommes sur ce qui fait une blague dr�le hypoth�se devient exprim�e sous la forme d'un mod�le d'apprentissage de la machine, et prouv� par le grand nombre de donn�es sur les param�tres sans �tiquette �valuation, nous pouvons g�n�rer sensation humaine blagues. Bien que nos exp�riences montrent que plus d'origine humaine � rire de blagues plus de temps, nous croyons toujours notre syst�me peut produire des blagues dr�les de sensation humaine dans 16% du temps, ce qui en soi est encourageante.

Mod�le math�matique de blagues

Dans le � Je aime mon X comme je l'aime, comme mon Y, Z � (je aime mon X comme je les aime mon Y, Z,) mod�le, nous supposons que X et Y sont des noms, Z est un adjectif.

Sur cette blague, notre mod�le coder les quatre hypoth�ses principales:

1. Tous les biens le plus souvent utilis� pour d�crire deux termes, les blagues plus dr�les;

2. attribut moins commun, la plaisanterie plus amusante;

3. attribuent l'expression plus vague, les blagues plus dr�les;

4. Les plus dissemblables les deux termes, les blagues les plus int�ressantes.

La figure 1 est une repr�sentation graphique du mod�le de facteur. Et les facteurs variables sont repr�sent�s par un cercle repr�sent� par des variables de bloc d�finit les impliqu�es ils sont attach�s fonction de potentiel.

1 est suppos� le plus direct, est repr�sent� par (X, Z) et le facteur (Y, Z). Cette hypoth�se peut �tre exprim�e math�matiquement comme:

O� f (x, z) est une fonction de x et z mesurer la probabilit� jointe d'apparition.

A propos de l'hypoth�se 2, s'il y a des propri�t�s sont tr�s fr�quentes, il peut �tre utilis� pour d�crire presque tout (comme une nouvelle, libre et bien), puis les exporter phrase est susceptible d'�tre une mauvaise blague. attribut Z plus rare, la cause plus probable surprise, cela est une source d'humour de plaisanterie.

Nous avons exprim� cette hypoth�se dans le facteur 1 (Z) dans laquelle:

Sur la base de cette observation 3 est suppos�e, � savoir une propri�t�, dans une description s�mantique des termes X, Y est d�crite en termes d'une autre s�mantique.

Nous utilisons dans 2 (Z), a d�clar�:

Hypoth�se 4 exprim�e entre les deux termes dissemblance conduira � plus d'humour comme une propri�t� des deux en m�me temps � d�crire l'auditeur d�passera les attentes. Nous utilisons (X, Y) pour encourager la dissemblance entre les deux termes:

Et des donn�es exp�rimentales sur

Pour estimer f (x, y) et f (z), on utilise les donn�es Google n-gramme (Michel et al., 2010), en particulier des donn�es Google 2 grammes. Nous utilisons Wordnet (Fellbaum, 1998) avec le mot le plus commun associ� � la partie de l'�tiquette vocale (POS) pour marquer chaque mot dans le 2-gramme. Google 2-gramme dans les donn�es que nous avons marqu� POS on extrait l'ensemble (nom, adjectif) paires et leurs chiffres d'utilisation estim�e f (x, z) et f (y, z).

On notera en particulier, bien que nous utilisons dans le document WordNet Nos m�thodes ne d�pendent pas de lui. Nous utilisons pour faire des informations superficielles.

Nous avons �valu� les deux �tapes de notre mod�le. Tout d'abord, l'�valuation automatis�e de recueillir des blagues de Twitter, puis prendre les blagues d'origine humaine et des blagues avec la fa�on dont nous g�n�rons la comparaison.

Pour en savoir plus sur les mod�les et les donn�es exp�rimentales, s'il vous pla�t cliquer sur le lien pour lire le journal.

� Les candidats �

journalistes � temps plein, compil� et activit�s op�rationnelles

Bienvenue stagiaire

Traduction et b�n�voles de la communaut� d'intelligence artificielle

Pour plus d'informations, s'il vous pla�t cliquer pour entrer le num�ro public � candidats �

Ou par courriel jobs@aiera.com.cn

Ji-won nouveaux emplois Cliquez sur � texte lu �

Route de la soie

Apprenez � conna�tre la Chine

premier syst�me de g�n�ration d'humour sans supervision au monde est n�, la prochaine grande bataille apprentissage en profondeur: parler pi�ce!