Afin de rendre plus intelligent Siri d'Apple est venu avec ces nouveaux trucs

Siri est sur le point de décoller

Hier encore, nous discutons seulement un changement de coaching secteur Siri. Siri est maintenant responsable de l'entreprise n'est plus le directeur de la bibliothèque de contenu original Eddie Irak, mais le directeur de l'ingénierie du logiciel Craig Federighi. Feideliji supervise iOS, macOS comme le système d'exploitation d'Apple. De toute évidence, cela est Siri plus la profondeur d'Apple vous souhaitez intégrer dans le système. Même dans la vision des gens pour l'avenir, Siri pourrait devenir une plate-forme de base.

Siri est sur le point de décoller ne fait aucun doute, tant que la dynamique de peu de compréhension d'Apple, vous trouverez cet assistant vocal a pénétré dans tous les plate-forme d'Apple, iOS, Mac OS, watchos et tvOS semblables. Ces dernières années, qui est, depuis le début, Apple a travaillé sur le déploiement de Siri, son attitude plus évidente.

Mais Siri si vous voulez vraiment devenir un grand potentiel d'assistant vocal, il doit avoir une base plus solide, ce qui est assez intelligent. À ce stade, les gens à penser que traditionnel Apple faible, mais il a prouvé la recherche technologique dans le domaine de l'intelligence artificielle, il n'a pas abandonné, et maintenant plus agressif par rapport aux attitudes passées.

Mais Apple a dit si longtemps à la force, la force n'a pas d'effet? Ceux d'entre nous qui ont encore de réels progrès pour le travail. Heureusement, Apple a récemment mis à jour plusieurs articles sur son apprentissage machine blog, intéressant de noter qu'ils sont tous liés et Siri.

les progrès d'Apple

Dès Juillet de cette année, quand Apple a ouvert un nouveau blog officiel, est consacré à l'avancement de leurs propres techniques d'apprentissage AI et de la machine. Le but de le faire est très simple pomme, d'abord, de promouvoir leur propre force technologique au peuple, et le second est d'attirer du personnel plus techniques. Le premier blog articles techniques majeurs et des images sur la reconnaissance, après tout, il est un contenu lié à Siri, montrant le degré d'attention d'Apple.

Actuellement, ces articles avec Siri Apple blog liés, le plus important est de regarder et dire que ces deux aspects, à savoir l'affichage du texte, de la parole, ainsi que synthétisé. Ces deux aspects, couvrant la majeure partie de l'expérience que nous avons maintenant accès à Siri.

En plus de la voix, Siri sera donné un certain retour de texte pour répondre à nos questions. Quand les gens pourraient penser que ce sont tous les textes stockés donné une bonne Siri, mais en fait vient de montrer la date, l'heure, l'adresse, l'échange d'informations, nécessite un certain contenu technique. Apple a déclaré, Siri a pu ces informations d'une manière qui répond aux spécifications indiquées, grâce à la « normalisation texte inverse (ITN) » technologie appelée. ITN permet à l'application de modèles statistiques deviennent plus simple, compact et facile à former.

Bien que, à notre avis, le texte est affiché et sa voix Siri prononça même, mais en fait parfois encore différent, et qui est le format de la question. Nous donnons un exemple de l'affichage de l'heure, s'il n'y a pas de système ITN, Siri brillera lors de l'affichage du texte de la parole a lu: «Il est aujourd'hui dix cinq » Après Bien que ce n'est pas impossible, mais avec ITN, il sera converti en plus facile à lire, plus normalisé « le temps est maintenant 10h05. »

problème de format standardisé semble résolu, en fait, Apple a déclaré la chaîne d'instruction de presse aller un par un, puis la formation, coûteuse, et nécessite la quantité de données est trop élevé. Par conséquent, il a été proposé le concept de moustiquaires imprégnées pour résoudre les problèmes plus rapidement les normes de format de message. Bref, sous l'emprise du noyau sens de la prémisse de la phrase, ITN sera en mesure de parler message vocal ainsi que l'onglet, puis effectuer la conversion appropriée. Par exemple, lorsque « dix cinq » dire la voix, chacun de ces éléments d'information dans le système, comme « heures dix », « cinq minutes après » ces informations, puis ajoutez l'étiquette correspondant à distinguer, convertit à afficher le texte réel format "10:05".

Ce texte présente les résultats parfois, plus le traitement final, afin de le rendre plus standardisés, tels que l'affichage « 1,00 yuans » quand l'argent, non seulement à la « une heure » dans « 1h00 » symbole « yuan » était devenu « ¥ » à l'avant. Une telle formation équivalente à l'introduction de la loi, afin que nous puissions rendre le système plus rapidement maîtriser la formulation correcte d'un certain format, quelle que soit la valeur et le changement d'unités.

Quant à la « dire » cette partie est d'autant plus important, car comme assistant vocal Siri, est la voix principale et à travers notre interaction. , La technologie de la parole est largement utilisé dans l'industrie sont principalement la sélection des cellules et des paramètres de synthèse de deux options. Parce que le problème est la suppression de la sélection des cellules directement à partir du segment de phonothèque, de sorte que la qualité de la voix sera élevé, mais il peut être rigide et inflexible. Bien sûr, les paramètres de synthèse semblent être plus intelligent, plus souple, mais l'inconvénient est généralement faible qualité de la voix. Siri Dans ceux-ci, choisir une combinaison des deux programmes.

La synthèse vocale d'abord avoir quelqu'un à son enregistrement, le contenu du texte, y compris des livres de texte, des instructions, des blagues et ainsi de suite. Bien sûr, le contenu ne peut pas être directement utilisés, ils doivent être divisés en la base « composant », et après le contenu réel, en utilisant des moyens d'alignement forcé pour former une nouvelle phrase. La parole est alors utilisé pour créer la base de données, telles que des informations de contexte est ajouté, les caractéristiques acoustiques et similaires, voiceprint formant section de celui-ci.

Faire la synthèse vocale devient plus naturel, il y a deux éléments, il est essentiel. Tout d'abord, les sons synthétisés doivent répondre à la prosodie de la langue, d'autre part, la phrase ne peut pas être une combinaison d'un sens clair de l'incongruité à la section de jonction voiceprint. Une fois les valeurs de ces deux éléments, la fonction de coût sont appelés fonctions de coûts cibles et concaténation. Pomme Siri caché derrière la technologie la plus critique est appelée « profondeur du réseau de densité mixte (MDN) », il peut être utilisé pour estimer avec précision ces deux fonctions, la forme d'onde d'allocation valeur caractéristique.

Finalement, Apple a dit qu'il a obtenu le résultat souhaité, et a promis nouvelle Siri voix iOS 11 sera « plus naturel, plus fluide, plus que l'éclat de la personnalité de Siri. »

Quel avenir

A partir de ces résultats du point de vue d'Apple, il fonctionne vraiment à faire Siri obtenir évolution réelle, et ce sont la technologie d'apprentissage automatique a une relation étroite. Comment Siri combiné avec la technologie AI, Apple a présenté leurs propres points de vue uniques.

Nous ne savons pas l'avenir Siri dans quelle mesure, mais au moins maintenant il est allé très robuste. Ces notes techniques, vous pouvez voir que Apple est une étape par étape pour améliorer ses capacités. Plus important encore, la réalisation de ces technologies ne sont pas loin, avec l'arrivée d'iOS 11 de cette expérience viendra.

Ensuite, l'avenir sera ce qu'il? L'activité de Siri a été transféré à une main de candidats plus appropriés, tandis que le blog de la technologie d'Apple va certainement continuer à le mettre à jour, que les gens voient plus de choses. Au moins à partir de maintenant, nous en tant qu'utilisateur ordinaire, vous pouvez vous attendre à vraiment changer leur vie.

Chengdu trois martyrs maison de feu d'adhésion! Doublé dans les rues pour saluer les masses « bon fils de gens de Chengdu. »
Précédent
NBA souhait officiel Hart, Smart and Jenkins et al joyeux anniversaire
Prochain
10 toiles rares! spéculation argent chaud bien connu se réunissent ce grand monstre, à la fin qui pari
Deux étudiants font l'entrée de conception kanjis App: « Explication du mot »
Li Keqiang rencontre Vincent Siew et son parti
guerre roi celtique, la guerre Lakers Nuggets, demain vous voyez terrain de jeu?
Choix de l'espace de configuration contraste Acura RDX Cadillac XT5
Comment interpréter l'échelle du camion de carrière Ming Benz de nouveaux sommets
Fond d'écran de la semaine: nouvelle invitation à la conférence d'automne d'Apple
Jouer partout Chengdu Shu petite vacances sur la première excursion d'une journée autour de la voiture de tourisme populaire représentant Liu Cheng
Google, Apple, Amazon, Samsung: Bataille de l'assistant virtuel
GIF: gazage Norwich fait le point frappé Tadic, la Serbie avance
village Jiuzhaigou panda géant "Tour" comment faire? Villagers: cercle vite fait d'amis yo!
Pour la robe à venir! Tour de main "My World" 15 Septembre étagères