Remodelage "Smart City-Smart Vision" modalités techniques et commerciales Rétrospective

Note de l'éditeur: 12 au 14 juillet Juillet, 2019 Quatrième Sommet mondial sur l'intelligence artificielle et robotique (CCF-GAIR 2019) convoquée à Shenzhen. Sommet organisé par la Fédération chinoise Computer (CCF), Lei Feng réseau, Université chinoise (Shenzhen) entrepreneurs Hong Kong, Shenzhen Institut de l'intelligence artificielle et la robotique Co a été la direction forte du gouvernement municipal de Shenzhen, est l'intelligence artificielle et la robotique du monde universitaire, de l'industrie trois principaux secteurs de l'industrie et de l'investissement de l'événement Expo AC, les objectifs du pays pour créer l'intelligence artificielle grande force de la plate-forme d'échange et de coopération transfrontalière.

14 juillet "Smart City-Smart Vision" concert a officiellement lancé. Cette attention particulière complète sur « la direction future de la vision de la ville-AI, » les thèmes.

Parmi eux, Tencent Jia Jia Asie, Kuang selon Sun Jian Shang Wang Xiaogang, de Wen Hao Yun, province Peng Shen Si Mei, UCLA Demetri Terzopoulos, mille Vision Hu Dapeng, du point de vue de la Croix-université de l'industrie, une nouvelle vision la recherche technologique intelligente et de la méthodologie axée sur les produits.

Ce qui suit est un examen merveilleux de la conférence:

Tencent Jia Jia Asie: "Le développement multimodal Intelligence artificielle"

Tencent excellente co-directeur du laboratoire de carte Professeur Jia Jia Asie

L'application ultime de l'intelligence artificielle de nous combien de temps?

Jia Jia Asie a soulevé la question dans son discours, la réponse qu'il donne est peut aussi besoin 50--100 années de chemin de développement.

Le développement du sujet de l'intelligence artificielle et l'écart de l'intelligence humaine qui est l'une « compréhension de l'information multimodale intelligente. »

quantité artificielle de l'information a apporté une plus grande diversité, la vue, le son, le langage des signes, l'odorat et le toucher et d'autres informations, a une infinie variété.

Et base multimodaux AI il y a encore de nombreuses difficultés: une première donnée de modalité est modifiée, y compris 2D images, modèles 3D, les informations de structure, du texte, du son et des données supplémentaires ne peuvent être quantifiés, d'autre part multimodes état ne correspond pas aux données, telles que de l'image au texte, le texte pour traiter l'image, sont « beaucoup », il y aura plus désignés et présentés, troisième fusion multimodale données ou un algorithme logiciel progresser plus facile, mais en même temps, la difficulté augmentera les algorithmes de façon exponentielle plus, comme « dire au robot de prendre une bouteille à gauche du bureau, » passera par le modèle de langage, modélisation 3D, trouver automatiquement son chemin, l'analyse d'image de ces étapes, le quatrième est plus la surveillance modale «comment dire au robot de se tromper », « qui prennent le pas mal, » il est actuellement difficile.

Pour résoudre ces problèmes d'information multimodale, Jia Jia pour mieux étudier le signal Yati difficile à quantifier l'odorat, le goût, le toucher, la psychologie, par des données multimodale permet de calculer, pour l'apprentissage collaboratif, avec riche en ressources pauvres en ressources d'information modale autre modalité auxiliaire.

Multimodales résoudre le problème de l'intelligence artificielle, l'intelligence artificielle serait atterrissage plus à l'avenir.

Shang Wang Xiaogang: « De l'enseignement à l'industrialisation de l'intelligence artificielle »

Shang Dynasty Technology co-fondateur, Dean Wang Xiaogang

Wang Xiaogang est passée en revue, ainsi que la reconnaissance de l'application de l'universitaire au secteur industriel et progresse peu à peu, en reconnaissance de visage ville intelligente, l'accès intelligent, téléphones, AR, jeux et autres scène spécifique.

proposé Wang Xiaogang recherche de vision par ordinateur a plusieurs niveaux importants:

Tout d'abord, la couche de base, y compris l'étude des puces de base, la plate-forme AI supercalculateur, plate-forme d'apprentissage en profondeur, la plate-forme AI, actuellement en tête de l'Ouest en particulier aux États-Unis, la seconde est la couche d'application, où les Chinois ont beaucoup de scène riche, peut donner des commentaires, il est nos domaines d'expertise, le troisième est la couche de chaîne d'outils, les besoins de sujet pour faire face à l'avenir est de savoir comment laisser les développeurs, la bêta de développer rapidement des solutions basées sur la chaîne d'outils d'intelligence artificielle, de sorte que la productivité est libérée.

La dynastie des Shang dans le passé, maintenant et à l'avenir continuera à faire est, en vertu du principe de la précision de l'algorithme et d'améliorer et d'élargir les frontières intelligentes d'affaires de la ville de 1 à N, et de promouvoir la perception du 2D au sol du monde 3D et la réalité à la réalité virtuelle l'intégration.

2014 équipe Shang publié série DeepID de l'algorithme de reconnaissance faciale, ce qui en fait de premier ordre du monde que la reconnaissance de l'oeil humain, la reconnaissance du visage au-delà de la percée à l'il nu dans les applications industrielles, la ligne rouge, puis avec les progrès continus de la technologie, des affaires continue de briser les frontières, de relativement simple 1: 1 d'identification, le 1: N en mouvement.

Wang Xiaogang données citées dans le contrôle d'accès, portes et autres lieux de la circulation, un bâtiment ou des bases de données d'entreprise 1, 2 millions de personnes, la sagesse de la base de données de la ville peut atteindre l'ordre de centaines de milliers. Shang Dynasty ont fait est d'identifier et d'analyser les required're à la recherche des personnes et des choses de dizaines de milliers à des centaines de milliers dans. Avec l'expansion continue de la scène, Wang Xiaogang pense visage deviendra progressivement l'identité de la marque.

De plus, l'application 3D, le système de reconnaissance de visage Shang Dynasty 3D a également été utilisé dans de nombreux téléphones mobiles. Wang Xiaogang démonstration en direct de la caméra 3D pour prendre les gens par téléphone sur le visage, le corps et l'image corporelle reconstruction 3D, mais aussi d'étendre à l'album suivant 2D album photo 3D. La piste s'étend également le corps humain de la 2D à la 3D, actuellement Shang Tang a appliqué jeu somatosensoriel.

Wen Hao du nuage: « Pan dans la plate-forme de collaboration de l'intelligence humaine de la ville »

La technologie co-fondateur du nuage de Wan Ho

Comment l'intelligence artificielle étage?

Wen Hao fait en sorte de construire une « perception, la cognition, la prise de décision » économie de boucle fermée IA intelligente. Les entreprises en démarrage doit être la perception, la cognition, la décision des liens sont impliqués.

Et la scène, la scène peut être divisée en un bord et des scènes nuage, la scène et le bord du nuage à être attribués en fonction de la scène intelligent.

Et les bords d'extrémité portant les besoins de réponse en temps réel locales de raisonnement tâches et aux données indépendamment, la détection de l'environnement à frais virés, l'interaction homme-ordinateur et la section de contrôle de la décision. La scène de fin de bord de conduite automatique, indépendamment du traitement local hors du réseau, la sécurité intelligente, une grande quantité de traitement local des données, le scénario de l'Internet mobile, pour assurer la sécurité des données et une faible consommation d'énergie, la maison intelligente et des scénarios de fabrication intelligents, les exigences hétérogène et réponse en temps réel.

Cloud est responsable de la réalisation d'analyse intelligente des données, la formation de modèle et une partie de la bande passante de transmission moins exigeant des tâches de raisonnement.

Wen Hao estime que l'IA actuelle toujours pas mature, de nombreuses industries exigent beaucoup comme. Pour résoudre ce problème, il devrait être mis en uvre « la coopération homme-machine. »

la coopération homme-machine a plusieurs phases, la première interaction homme-ordinateur doit être fait, que la machine sache qui vous êtes, ce qui est la raison pour laquelle vous voulez faire la première cause de reconnaissance faciale.

Deuxième étape l'intégration de la machine à l'homme, comme le chef de produit de la banque, seule une conception douzaine de produits, mais sur la base des grandes données et AI, il peut concevoir des centaines de produits financiers d'Amnesty International pour tous les micro et petites entreprises.

Ensuite, créez un avenir meilleur humain peut créer de nouvelles scènes, de nouvelles entreprises, de nouveaux services, de nouveaux procédés. Tels que les magasins de détail peuvent être affichage secondaire, et le drainage précis, ce qui est de créer un être humain.

Kuang, comme Sun Jian: « révolution apprentissage en profondeur dans l'informatique visuelle. »

Kuang Jian Sun, comme expert scientifique en chef

Kuang Sun Jian, directeur scientifique de vue en termes d'intelligence visuelle, la photographie informatique et l'informatique visuelle entraîne des changements dans le domaine de la vision par ordinateur.

Sun Jian a également rappelé la profondeur historique de l'apprentissage et le développement. Il a fait référence, il est aujourd'hui facile de développer l'apprentissage en profondeur, a rencontré deux obstacles:

Tout d'abord, la profondeur du réseau de neurones peut être formé bien avant le succès d'aujourd'hui était soupçonné d'apprentissage profond beaucoup de gens. Par rapport à l'apprentissage de la machine traditionnelle, l'apprentissage en profondeur paramètre de données de réseau de neurones de 10 fois plus ou même une centaine de fois, comment bien apprendre, beaucoup de gens ne croient pas.

En second lieu, lorsque le processus de formation est très instable, même si le papier donne la méthode de formation des réseaux de neurones, mais d'autres chercheurs ont reproduit un résultat de la difficile.

Ces obstacles jusqu'au début de l'année 2012 est libéré lentement.

Sun Jian estime que dans un grand nombre pratique, la profondeur de l'apprentissage et de la machine traditionnelle d'apprentissage plus grande différence est que la quantité croissante de données, avec le réseau de neurones plus est probablement en grande partie au-delà de la performance humaine.

Et spécifique à la plate-forme de calcul, y compris les nuages, à la fin, beaucoup de matériel intelligent de base. Comment la tendance actuelle est une façon de concevoir automatiquement le modèle adaptativement, la dernière est d'utiliser des poids basés sur la plateforme de calcul partagé faire.

À cet égard, vue dégagée, une nouvelle méthode Single Path One-Shot Nas, divisé en deux étapes: La première étape consiste à former un SuperNet, est un super-réseau, y compris les sous-réseaux à rechercher tout d'abord la formation de poids SuperNet ; la deuxième étape consiste à rechercher des sous-réseaux sous-réseau légèrement, la deuxième étape ne nécessite pas bénéficier de formation est très efficace, le temps de formation de temps de formation normale est 1,5-2 fois plus rapide, vous pouvez obtenir de très bons résultats. À l'heure actuelle, nous avons été leader sur les résultats des jeux de tests multiples.

De plus, afin de construire la technologie de base, vue dégagée créer également un cadre de l'intelligence artificielle auto-développé cerveau ++, y compris l'infrastructure du cerveau a un multi-centre, la puissance de calcul puissant, moteur d'apprentissage en profondeur entreprise cerveau ++ Engine utiliser pleinement, ainsi que l'intégration du dernier modèle de recherche AutoML la technologie, en même temps, vue dégagée, ainsi que l'intelligence artificielle, les données de la plate-forme de gestion des données ++, au moyen de données auxiliaires des algorithmes de nettoyage et d'étiquetage.

Si Shen Peng Mei Province: « La technologie de vision intelligente après avoir appris la profondeur des temps d'atterrissage »

Synopsys scientifique en chef Shen Peng Mei province

Comme domaine émergent de la société de l'intelligence artificielle, Shen Mei Jieshao Province Road, Peng Synopsys d'un capteur - traitement d'image à la géométrie 3D, l'apprentissage de la machine à la profondeur de l'apprentissage, pour améliorer l'apprentissage, de l'apprentissage supervisé à semi-supervisé, apprentissage non supervisé a une mise en page équipe avec une pile complète de la technologie de vision par ordinateur et la détection des visages et la reconnaissance, la détection des piétons et le suivi, la reconnaissance re-piétons, identification du véhicule, la conduite automatique, et beaucoup d'autres concours de robot d'exploitation mobile pour gagner le championnat.

La reconnaissance des visages des restrictions a obtenu de bons résultats, mais la façon d'améliorer l'efficacité dans la reconnaissance dynamique des conditions non restreintes, province Shen Mei qui, en plus de l'amélioration continue de la technologie de reconnaissance faciale, mais aussi de la source de procéder, en utilisant des méthodes d'amélioration de l'image pour améliorer l'image AI, en éliminant le flou de mouvement, réduction du bruit, de la gigue, désembuage, à la pluie, et comme le nuage.

De plus, l'atterrissage à vue, Shen Mei croit la province devrait adhérer à la « développement de l'algorithme commercial axé sur la valeur. » Avec « l'algorithme le plus efficace + le plus matériel et logiciel économique » pour résoudre les besoins des clients juste, plus important encore, l'algorithme - les modifications matérielles et logicielles à la vitesse de mise à jour, accueil rapide aux différents besoins des clients, la formation de l'agilité et le modèle d'entreprise de valeur.

Et pour obtenir un bon modèle est pas facile. juge provincial Shen Mei, obtenir le meilleur modèle visuel est la règle la plus simple est que suffisamment de données d'équilibre, l'annotation de suffisamment de données bien, réseau assez profond. Avec la grande quantité de données générées, sous la direction semi-supervisé explorer aucune percée, la vision par ordinateur est très optimiste quant à l'avenir. Alors que l'industrie a continué de favoriser la vision par ordinateur, de nombreuses entreprises seront associées à des scénarios d'application pratique pour optimiser la taille de la migration, et constamment ouvrir de nouveaux domaines d'application, le développement de l'industrie de l'intelligence artificielle est loin du sommet, il y a beaucoup de possibilités pour l'atterrissage.

Royal Academy Demetri Terzopoulos: "l'intelligence visuelle du futur"

Hôpitaux Académicien Demetri Terzopoulos

Demetri Terzopoulos a expliqué la vision de l'application virtuelle, et jouer un rôle dans la sagesse de la ville. Demetri Terzopoulos estime que la vision de la virtualisation contient en fait une variété de combinaisons pour décrire le sentiment, l'infographie, la vision par ordinateur est une informatique visuelle.

Un important travail qu'il a fait est un modèle virtuel de la vie humaine, et basée sur la réalité de monde physique ou virtuelle de l'infographie, ce qui rend ces mondes, la performance visuelle avec la réalité virtuelle.

Demetri Terzopoulos ses expériences antérieures, par exemple, ces expériences comprennent la simulation des muscles du corps et le mouvement, et la simulation de jeu somatosensoriel des personnages de l'environnement et de jeu. Ces simulation visuelle virtuelle peut être appliquée à plusieurs caméras pour suivre les multiples mouvements de l'homme, ce qui reflète l'appareil photo avec quel angle de la caméra pour les gens de prendre des photos, faire entre plusieurs caméras forment une meilleure liaison.

avantage visuel virtuel est que ces systèmes peuvent être appliqués pour accélérer la conception et l'essai des méthodes scientifiques pour démontrer la réalité. Tout au long, les systèmes virtuels sont de plus en plus réaliste. À long terme, devrait réalité virtuelle dans laquelle nous vivons et la réalité physique il n'y a pas de différence.

Demetri Terzopoulos aussi pour les futures perspectives de travail dans l'avenir, ils construiront un réseau de capteurs physiques, sera transplanté dans l'algorithme, les déployer au réseau physique dans le monde réel, bien sûr, besoin aussi mieux caméra virtuelle.

À l'avenir, le réseau de capteur plus grand peut-être dans le ciel, les véhicules aériens sans pilote, et même des villes entières.

Un millier de Vision Hu Dapeng: « Des milliers Vision Aiot la sagesse qui règne aucun sens de la communauté. »

Un millier de Vision, co-fondateur et directeur technique Hu Dapeng

Un autre marché de l'entreprise a complété la sagesse du parc. Auparavant proposé « stratégie de convergence de la scène Aiot » Vision mille Hu Dapeng a présenté les milliers Vision est actuellement spécialisé dans trois catégories dimensions visage humain en face-ID et REID intègrent, pour créer « aucun sens du passage. »

vision bidimensionnelle Quel est le problème? Hu Dapeng fait, face à 2D problèmes majeurs dans une non-contrainte, l'angle est relativement important, le cas de forte baisse de la précision de l'éclairage continuera, comme la lumière latérale, rétro-éclairage, de faible luminosité, et cela provoquera ne sont pas permis à l'algorithme.

Les avantages de l'application de visage 3D tout d'abord est la sécurité, pour la sécurité, les normes de sécurité plus importante industrie, et est léger, différent éclairage du visage, ainsi que des problèmes esthétiques, peuvent avoir une meilleure solution.

Ce qui n'a pas de sens du passage? Huda Peng a exprimé l'espoir que l'utilisation de différentes voitures extraites clé de la caméra, les gens, etc., aura son associé eux. Par exemple, les gens entrent dans le parc à travers les portes, aller là où l'employeur peut faire face + REID intégrer venir. Par trajectoire de chaque période de temps, la décomposition de chaque propriété individuelle, les véhicules, les objets, et peut se faire sans un sentiment d'accès, le temps et la fréquentation n'a aucun sens, aucun sens de suivi, sans un sentiment de surveillance, etc., dans les parcs différents, la communauté, l'école, commerce de détail les scénarios d'application.

"Smart City-Smart Vision" Conclusion spéciale: atterrissage à vue, Quweicunzhen

Vision par ordinateur est sans doute la plus direction de recherche populaire et application d'un champ AI, la technologie de l'intelligence visuelle actuelle a été broyé dans le téléphone mobile, la maison, le transport, la vente au détail, la sécurité et d'autres scènes en plein air dans différentes villes et la vie familiale urbaine.

Mais une vision intelligente, vers la précision en triomphe, d'autre part, bénéficie de la précision de la mesure transformée en applications, il reste un problème.

La vision informatique a commencé, après que les compagnies AI polis qui ont commencé à marcher sur la ligne entre sa tentative de briser le bureau.

entreprises de vision intelligents sont progressivement « marteau à la recherche d'un clou » par l'entreprise axée sur la technologie, prendre la Evolve de l'Etat dans une « entreprise » comme le centre du modèle de développement: « la poésie technique et lointaine » de la main gauche pour étudier plus algorithme de pointe tels que l'IA a plus puissante précision de la reconnaissance et les capacités cognitives, sa main droite « champs d'affaires, » afin que les produits visuels sous la prémisse d'assurer une grande précision, ce qui réduit considérablement pré-développement et les coûts post-exploitation.

À terre, en regardant les étoiles, les entreprises visuelles intelligentes recherchent une orientation plus ambitieuse, AI dig Kim Ji à nouveau se algorithme, le plus d'ingénierie de pointe et des produits, et de promouvoir la connaissance de la mise à niveau de l'industrie.

Nous allons Après le sommet, la ligne du sommet CCF GAIR 2019 vidéo complète avec le thème principal du livre blanc spécial sur « les états de recherche d'investissement AI, » y compris la robotique avant-garde spéciale, le transport intelligent spécial, spécial smart ville, spécial puce AI, Finance spéciale AI , AI soins de santé, une éducation spéciale et d'autre sagesse. « Les États de recherche d'investissement AI, » les membres peuvent regarder pour le contenu vidéo sommet annuel gratuit et rapports de recherche, le code d'analyse pour accéder à la page d'adhésion pour en savoir plus. position exclusive de 399 yuans le bien-être au cours du sommet, peut recevoir directement dans la page, ou un petit assistant lettre privée Mu (micro lettre: moocmm) consultation. (50 derniers un quota de jour, course de vitesse.) Lei Feng Lei Feng Lei réseau de réseau de réseau Feng

principes de base de guide d'ondes optiques secrets, comprendre les défis AR lunettes derrière (sous)
Précédent
Yanqing secrétaire du village fraude contrat présumé de première instance emprisonné pendant 12 ans
Prochain
Un autre objectif du projet a commencé, l'année après mise en service! Décryptage trois Longwan de Chine du Sud développement de la zone de la mer « accélération »
Deux ans des milliers d'heures de formation rigoureuse! Les agents de bord est « Marque » la
Six experts de premier plan pour redéfinir l'avenir de l'AI six types de financiers Shu CCF-GAIR 2019
atterrissage Autopilot pas hésitants, puis un total de 18 grand café Transport Intelligent | CCF-GAIR 2019
Cartes pour les personnes ligne Qinghai-Tibet: après chaque bannière de soie, il est l'histoire de la vie et la mort
Connexion quatre Science City et le plus grand centre d'exposition du monde, canal profond dans l'industrie aura quel effet?
Vous êtes prêt à l'étude, ne croit pas que le ciel de la « tarte »
« Avec mon père est allé étudier à l'étranger » lancement, jouer l'oncle de la graisse, Honglei lutte psychologique pour longtemps
ville Jingdong Zheng Yu: AI et les grandes données seront "remodeler la ville" | CCF-GAIR 2019
Examen Yuan publier des brochures pris ajustement, impliquant trois écoles quatre changements
« La nature pionnière » dans l'Exposition universelle d'horticulture, de montrer la beauté de la mousse
Ponder | ces années, fou anglais