Université de Tsinghua Professeur Deng Zhidong: Depuis la fin du pilote automatique, d'un itinéraire technique pour l'industrialisation pratique d'atterrissage | CCF - GAIR 2017

« Autopilot peut être la plus grande valeur commerciale de l'intelligence artificielle de, et le premier champ d'atterrissage vertical. » 10 juillet sur le organisé par la Fédération chinoise Computer (CCF), Lei Feng réseau et l'Université chinoise (Shenzhen) Hong Kong a accueilli le CCF-GAIR finale mondiale Intelligence artificielle et l'Assemblée robotique de smart conduite journée spéciale, Deng Zhidong dit.

Deng Zhidong actuel professeur Département des sciences informatiques, Université de Tsinghua et de doctorat tuteur. Depuis 2009, Deng Zhidong a dirigé l'équipe qui a développé les trois fonctions et sensitif décisionnelles autonomes des véhicules autonomes, accumulés en profondeur sur le terrain. Maintenant, avec l'évolution et le développement de l'intelligence artificielle, l'intelligence artificielle joue un rôle irremplaçable dans la promotion de l'industrie niveau L4 (SAE) processus d'atterrissage du pilote automatique. discours Deng Zhidong a également lancé autour de ce sujet, Lei Feng lecteur réseau du nouveau contenu intellectuel du discours n'a pas changé l'intention de terminer l'édition.

* Université de Tsinghua Professeur Deng Zhidong

Une région définie d'une fosse

20 septembre 2016, le ministère américain des Transports a récemment publié un nouveau pilote automatique des règlements fédéraux, les voitures driverless ont clairement fait savoir au grade SAE 6 comme les normes de classement (L0-L5). Les intérêts sont maintenant largement sous pilote automatique L3 et L4, L3 conditions définies à savoir L4 à savoir le pilote automatique de la hauteur.

Plus précisément, la première étape est d'aider le pilote automatique et la conduite semi-autonome (L0 et Ll), un deuxième drone de transition de phase (L2 et L3), la troisième étape est une véritable sans pilote (L4 et L5).

En tant que seconde étape de transition, à savoir la personne étape de conduite assistée par co homme-machine, comprenant L2 et L3.

  • L2 est la libération des mains et des pieds, mais l'il humain et le cerveau humain également affecté;

  • L3 est la libération de l'il humain, la clé de la libération de l'oeil humain est capable de machines au lieu des personnes et l'environnement, y compris les situations d'extrême urgence perception sûre et fiable.

L4 et L5 sont vraiment étape sans pilote, la plus caractéristique est la sécurité de l'auto-conduite est entièrement garantie.

  • L4 est la libération du cerveau humain, mais encore à définir la région et de définir la fonction;

  • Local L5 ne nécessite aucune limite, comme tout le monde, les gens peuvent aller, la voiture peut aller, ne peut pas aller là où les voitures ne peuvent pas aller.

Alors, est la libération des mains et des pieds L2, L3 libération de l'il humain, L4 et L5 le cerveau humain aussi libéré, la conduite autonome du véhicule peut être assurée. L5 même pas un volant, des pédales et le rétroviseur.

De L2 à L4, une question centrale à considérer est définie région et une fonction définie.

1, la fermeture de la zone pilote automatique

La vitesse limite, en tenant compte des scénarios de trafic vides, rares visuels comme l'application particulière, le site ci-joint comprend un pilote automatique de suivi, le pilote automatique et comme le long d'une voie fixe. Dans ce cas, nous pouvons utiliser le suivi visuel ou une ligne voie de suivi, plus simple, la détection d'obstacles, il est plus facile d'obtenir le pilote automatique de niveau L3, L4. Tant que réduire les coûts, il est facile d'obtenir le modèle d'affaires, qui est maintenant beaucoup de gens d'affaires de voiture à bas étage, ce qui est relativement facile à réaliser.

2, les limites de la structure et de la fonction pilote automatique de route

Autoroute en fonction définie et le pilote automatique dans une zone de routes urbaines. Une telle structure et le mode semi-structuré est relativement simple, plus limiter les fonctions de conduite autonomes, comme la condition de déclenchement indépendante devient très exigeant dépassement de la route, ne peut avoir besoin d'utiliser la carte de haute précision, ainsi que la prédiction du comportement technologie de détection d'obstacles etc., il est relativement facile à mettre en uvre la capacité automatique de conduite de L3 à L4.

3, Pilote automatique des scènes complexes

Par exemple, une ville plus grande limite pilote automatique et toute la ville ou une variété de conditions routières. Uber pilote automatique maintenant à Pittsburgh, test de lecteur de taxi gratuit et la mise en service est vrai limites de la ville de pilote automatique, qui a atteint un stade très avancé, en raison de la nécessité d'examiner l'ensemble du réseau routier de la carte de haute précision, la détection d'obstacles, la prédiction du comportement, la prise de décision complexe, en dépit de la voiture actuelle conserve également les deux ingénieurs de sécurité. Cette fois-ci pour réaliser L3, L4 difficile, mais sa valeur commerciale est énorme, et maintenant nous parlons sans pilote est d'arriver à ce stade avancé.

Baidu venir ainsi sur le programme Apollo, quel est son but est-il?

En bref, Baidu dans la plate-forme logicielle ouverte Bosch Tier1 (un équipementier automobile) en collaboration avec, si vous voulez devenir un des algorithmes d'intelligence artificielle de pilote automatique de l'entreprise? En même temps, ou si vous voulez mettre l'accent sur la plate-forme de services de données en nuage, battu en retraite vers l'arrière pour faire les marchés de services, y compris des données de haute précision, y compris des cartes et une grande?

En second lieu, la perception de l'environnement et conflit de modélisation environnementale

1, l'environnement de modélisation basée sur la conduite entièrement automatisée

Relativement espace fermé de pilote automatique de suivi de piste fixe et pilote automatique l'ensemble du réseau routier, est un environnement de modélisation basée entièrement sur des solutions techniques.

  • Avantage: TKP centimètre suivi précis, la route à grande vitesse avec une grande précision peut être facilement atteint;

  • Inconvénients: pas de capacité d'adaptation de l'environnement, le manque d'autonomie. Effet dispositif de navigation de précision RTK utilise la plage de communication de la station de base par la différence, le nombre de trajets multiples reçu et d'autres étoiles, et coûteux. Par exemple, le DGPS / IMU importé moins cher de plus de deux cent mille, plus cher à Wuliushiwan, et ne convient que pour la vision de la scène ouverte et fermée. Si nous réduisons le prix des appareils de navigation intégrés, il peut également être mis en uvre le modèle d'affaires.

De plus, la carte peut être utilisée pour obtenir l'appareil de navigation correspondant pilote automatique de haute précision, carte-à-dire la combinaison de navigation pour réduire les coûts de matériel, mais aussi plus favorable au pilote automatique l'ensemble du réseau routier.

La plupart des véhicules autonomes appartiennent à ce type.

2, la conduite entièrement automatisée basée sur la perception

Ce pilote automatique fixe le long de la route ou la voie.

  • Avantages: l'ensemble du réseau routier voyage autonome, avec un haut degré d'autonomie et la capacité d'adaptation de l'environnement, ne comptent que sur un appareil photo ou un radar laser, la carte ne précise, sans TKP, et à faible coût;

  • Inconvénients: plus l'influence de la ligne surlargeur la qualité, à faible vitesse et la fiabilité médiocre.

Cette approche est similaire à la manière humaine de la conduite, repose entièrement sur la perception étaient la route nettement plus extrême de cette technologie, les exigences de la connaissance de la situation est très élevé, un grand défi, il apportera beaucoup d'incertitude.

Conclusion: La perception de l'environnement doit être associé à la modélisation de l'environnement, afin d'obtenir simultanément la capacité de conduire la route haute performance et de l'autonomie locale et ainsi de suite.

Troisièmement, la dominante radar visuel ou laser dominante?

À l'heure actuelle, la technologie de contexte courant automatique conduite, il existe deux voies principales: une est représentée par Tesla programme fusion multi-capteur visuel dirigé, un autre orienté radar laser à faible coût, comme un représentant typique de Google Waymo.

1, visuelle Tesla LED représenté par: millimètre caméra radar à ondes + + + faible coût lidar radar à ultrasons.

Une vision de la caméra de vision passive, fortement influencée par la lumière ambiante, et la détection du SLAM cible moins fiable mais faible coût. À l'heure actuelle, Tesla a sa voiture de production équipé du firmware 2.0 Autopilot, et à faible coût, est seulement d'environ 7000 $, huit caméra monoculaire composé de regarder autour, il y a un radar à ondes millimétriques et radar à ultrasons 12, il est souhaitable le saut de L2 à L4.

Après six mois d'efforts, Tesla a récemment complété les données de test d'entraînement de transition de la technologie à grande vision monoculaire de Mobileye au système logiciel Tesla Vision basé sur la plate-forme de matériel informatique lecteur Nvidia PX2 et version du logiciel 8.1 à la fin de Mars de cette année, la version, les méthodes qu'elle utilise étude approfondie à court terme pour atteindre un niveau de base de la technologie Mobileye, qui était auparavant difficile à imaginer. Tesla se passerait-il technologie de pilote automatique, un point d'observation important est de voir si elle peut à la fin de 2017, devrait ouvrir ses portes de Los Angeles à New York, pour atteindre 4500 km plein et la conduite entièrement autonome, sans intervention humaine.

2, le radar laser conduit à Google Waymo représenté par: faible radar laser radar à ondes millimétriques coût + + + caméra à capteur à ultrasons.

Lidar est la vision active, la détection d'objet et SLAM il est plus fiable, mais a perdu la couleur et la texture et coûteuse. Actuellement Google Waymo leur propre équipe matériel développé radar laser, la réduction des coûts de plus de 90%, essentiellement autour de 7000 $, alors qu'ils ont commencé à 500 véhicules L2-niveau pour la bêta sociale dans la région de Phoenix, beaucoup d'avance un exercice d'atterrissage d'une telle voie technologique.

Lidar leader des solutions à l'avenir peut continuer à avancer dans les deux sens suivant le processus de commercialisation:

  • Le développement d'un appareil photo et des modules de matériel radar laser, de combiner les deux, les deux radars laser, une autre caméra couleur, vous pouvez obtenir des données de nuages de points laser couleur directement.

  • Une autre est de réduire davantage les coûts de matériel du radar laser, telles que la recherche et le développement du radar laser à l'état solide et vraiment réaliser l'industrialisation, le coût baissera à quelques centaines de dollars.

En bref, il y a maintenant trois domaines essentiels des problèmes de pilote automatique pour faire des percées: à savoir l'utilisation de l'intelligence artificielle, en particulier l'utilisation de l'apprentissage en profondeur pour l'identification des cibles, la navigation autonome et l'intégration de l'information, les réalisations technologiques dans ces trois domaines est la véritable valeur commerciale.

  • reconnaissance de la cible: par exemple, zone urbaine dense avec la circulation, la façon de détecter de manière fiable et prédire le comportement des obstacles environnants, en particulier pour l'extrême-perception d'urgence et la prévision.

  • Navigation autonome: laser ou SLAM SLAM visuel et à faible coût avec la fusion de navigation précise;

  • Fusion Information: Comment la fusion d'informations multi-capteurs.

Conclusion: Le pilote automatique devrait utiliser la technologie de l'information pour la voiture comme la plate-forme sous-jacente, qui comprend l'information ou de la technologie de logiciel numérique, ainsi que le bus interne et réseau externe lié, ce qui est à la base intelligente et les conditions. Comme fil, OTA (over the air), SDU (mise à niveau de logiciel défini), devrait devenir la norme de la plate-forme sous-jacente.

Quatrièmement, accélérer la pratique d'atterrissage du pilote automatique de l'industrie AI

Autopilot intelligence artificielle est peut-être la plus grande valeur commerciale, et est le premier champ d'atterrissage vertical.

Autopilot est un marché énorme pour un billion de dollars. Si vous prenez en compte la voiture de la part de driverless est plus important est de fournir des services à valeur ajoutée, y compris le marché des services à valeur ajoutée, et que sa valeur de marché peut être multipliée par 10, qui est, jusqu'au niveau de 10 billions $.

véhicules autonomes est une forme de produit très spécial, doivent être considérés comme la sécurité et à faible coût absolu, mais aussi la solution globale, la formation de l'écologie industrielle, par la suite de trouver son modèle d'affaires.

Apprentissage en profondeur à partir des données grandes réelles d'origine, il a été GPU en temps réel, TPU, FPGA, ASIC et soutenir le développement rapide de la puce du cerveau de classe, est devenu la perception du pilote automatique, la prise de décision et de contrôle de la technologie sous-jacente.

l'apprentissage en profondeur est une perception de l'environnement technologique décisive et la prise de décision autonome, devrait rendre les véhicules autonomes avec les compétences de conduite d'un conducteur similaire aux capacités d'apprentissage humain et d'auto-amélioration, les technologies Big Data et un essai routier clé. Nous, les humains sont en voiture pour aller aux enseignants des écoles de conduite ont été l'apprentissage supervisé, puis d'avoir sortir de l'école de conduite après des centaines de milliers de kilomètres d'expérience de conduite que nous obtenus grâce à une formation intensive type de tâtonnement. Il n'est pas la machine peut avoir la même profondeur et la profondeur de la capacité d'apprentissage de renforcement de l'apprentissage supervisé, comme AlphaoGo les mêmes?

En bref, la profondeur du réseau de neurones de convolution et la profondeur de l'apprentissage de renforcement peut être la perception du pilote automatique largement utilisé et la prise de décision, de contrôle et d'analyse dans des domaines clés de l'apprentissage.

1, la perception de l'environnement et la navigation autonome précise basée sur la carte cognitive

Les progrès révolutionnaires dans la profondeur de convolution réseau de neurones récemment, ce qui porte la détection visuelle et l'identification des niveaux de capacité humaine, couplé avec le radar laser à faible coût, carte de haute précision, 5G Communications, en collaboration avec le réseau intelligent et des systèmes de transport intelligents et la ville intelligente le soutien, il est très probable à la perception de l'environnement et d'extrême urgence et fiable à faible coût, la navigation autonome de haute précision une réalité, stimuler le développement du pilote automatique de L2 à L3.

Cependant, la profondeur de convolution réseau de neurones a l'un des plus gros défaut est qu'il est toujours pas parvenir à une compréhension sémantique. Dans ce dilemme, nous pouvons autres formes de soutien, tels que la haute carte de précision (y compris carte cognitive et raster), et la communication du véhicule et le réseautage avec les choses en mouvement NB-IdO 5G, et notamment sa force comme à aborder cette question difficile.

2, a une capacité d'auto-apprentissage et le contrôle intelligent de prise de décision autonome

Une forte poussée par les derniers développements profondeur AlphaGo de l'apprentissage par renforcement, il est possible de rendre la capacité d'auto-apprentissage des véhicules autonomes ont humain similaires, y compris de bout en obtenir avec une situation d'urgence, y compris la prédiction du comportement des fonctions décisionnelles et autonomes pilotées par les données système de contrôle intelligent , coup de pouce de pilote automatique portées L3 à L4.

3, AI devrait permettre l'atterrissage du pilote automatique

Dans les problèmes de pilote automatique, principalement liés à la faiblesse des algorithmes d'intelligence artificielle (profondeur de convolution de réseau de neurones et la profondeur de l'apprentissage par renforcement), les données (grande cible de données, le comportement comportement cible les grandes données, les grandes données de conduite, etc.), informatique (comme un terminal mobile, nuage, accélérateur d'apprentissage en profondeur de formation hors ligne), scène de subdivision de pilote automatique (objectifs et la perception des intentions comportementales, cognitives et les cartes de navigation, la fusion de l'information, la prise de décision autonome, contrôle intelligent, etc.) et l'intégration verticale et cinq autres dimensions.

Pilote automatique soutien à l'atterrissage d'apprentissage profond algorithme cadre open source

Soutenir le développement de l'algorithme de pilote automatique, y compris la sensibilisation de l'environnement, la détection d'obstacles, la prédiction du comportement, la navigation autonome, la prise de décision autonome et contrôle intelligent.

  • perception de l'environnement: principalement en raison de certains cas extrêmes, comme surface de la route de la pluie et la neige, et la présence de la ligne de voie réfléchissant à haute intensité ou freiner grand nombre de graves lacunes ou l'occlusion.

  • Détection Obstacle: Il peut y avoir plusieurs centaines de réseaux de neurones profondeur convolutionnel pour faire les pixels de détection dans la couche horizontale, la segmentation et la reconnaissance.

  • intentions comportementales prédisent: prédire le comportement de l'obstacle et la détection d'obstacles sont tout aussi importants.

  • Navigation autonome: l'accent sur le faible coût, une grande précision et l'adaptabilité de l'environnement élevé de la méthode, par exemple, des solutions à base de SLAM, pour réduire les coûts.

  • Carte cognitive: l'utilisation humaine pendant la conduite est une carte cognitive, plutôt que d'une carte quadrillée.

  • décision autonome et de contrôle: à savoir la prise de décision basée sur l'étude de bout en profondeur autonome de la prise de décision autonome, une série d'informations d'image vidéo est entrée, la sortie est une décision autonome plutôt que quantité de commande directe de l'actionneur, qui est un aspect de l'extrême en fait, il existe un risque sérieux de sécurité. Basé sur l'algorithme de commande d'apprentissage Renfort provenant des années 1990, des recherches supplémentaires peut être basée sur la technologie de contrôle sans modèle et intelligente basée sur les données de la connaissance.

* Étude approfondie cadre open source

pilote automatique soutien à l'atterrissage gros volumes de données

Autopilote est très important pour les grandes quantités de données. À l'heure actuelle, Google a accumulé plus de 500 millions de kilomètres de gros volumes de données d'essai routier, en 2016, il y a un milliard de miles de grandes quantités de données analogiques générées, Tesla est accumulé 357 millions de kilomètres de gros volumes de données.

Comme indiqué ci-dessus, à partir de maintenant, il y a 36 entreprises en Californie ont approuvé l'essai sur route juridique. Autopilot concurrence commerciale dans le monde entier, est actuellement l'objet de la concurrence de l'industrie axée sur les deux points suivants:

  • Autonome de conduire les grandes données kilométriques;

  • Fréquence d'intervention manuelle d'urgence.

Nouveau classement du niveau actuel du point de vue technologie, Google Waymo faire mieux, à 5 points, son personnel ou de l'équipe R & D est le meilleur, a gagné 4,5 points. Le modèle d'affaires de Uber fait le mieux, car il était un taxi test sans pilote dans toute la ville de Pittsburgh, son modèle d'affaires en marquant 5 points. note technique de Tesla de 3,5, au deuxième rang dans la sophistication de la technologie.

Plus l'acquisition d'apprentissage en profondeur et l'alimentation des gros volumes de données, plus vous pouvez obtenir une intuition meilleure conduite, de sorte que les géants de la technologie pourchassent frénétiquement les grandes données. On peut dire, qui a le plus récent et plus à partir des données de conduite automatique grand, plus la maturité de la technologie qui, ou l'atterrissage d'une utilisation industrielle.

L'utilisation de grandes convolution de données des réseaux de neurones en profondeur, nous devons résoudre le problème de la grande exhaustivité des données. Mais il est très difficile d'atteindre l'exhaustivité, nous devons voulons des situations extrêmes et d'urgence sont en cours d'exécution sur. la situation de la circulation routière en Chine est le plus complexe dans le monde, est sujette à la circulation extrême urgence, donc nous avons probablement la meilleure façon de mesurer les grandes données de conduite sur l'environnement et automatique. Aussi à noter est que, pour conduire automatiquement un taux de reconnaissance d'obstacles de la voiture est passée de 99,999% à 99,99999%, le besoin est à l'échelle de la croissance exponentielle des données importantes, parce qu'il ya ce qu'on appelle l'effet longue queue, ce qui nécessite beaucoup de ressources salaire.

pilote automatique support moteur de calcul d'atterrissage

Etude approfondie des modèles à grande échelle, jusqu'à des centaines de couches, vous pouvez utiliser super formation hors ligne serveur de cluster GPU / TPU. Les géants actuels de puces mondiales sont pleines de mise en page de puce de l'intelligence artificielle, pour le pilote automatique à bord des puces mobiles d'étude terminal et profondeur de nuage en particulier est devenu un champ de bataille. Il semble maintenant que Google semble avoir rejoint l'utilisation mondiale AI sa guerre de puce TPU.

* Camp de puce NVIDIA

Et les constructeurs automobiles et les entreprises de technologie de pilote automatique, avec le Tier1, actuellement chaque puce géant dans la mise en page de leur propre écologie industrielle à puce AI ou camp peut être décrit les manuvres. puce Nvidia actuellement le plus grand camp, de nombreuses entreprises automobiles et les entreprises Internet utilisent la plate-forme matérielle NVIDIA, mais aussi pour une nouvelle génération de Xavier qui plate-forme open source immédiatement. Autre camp de puce AI, y compris l'Union Intel / Intel Mobileye et acquis par Intel et Mobileye composé de puces IA et d'autres camps autour Waymo de Google.

le soutien d'atterrissage Autopilot d'autres conditions de base

Dans d'autres aspects de l'atterrissage du pilote automatique de soutien des conditions de base, la précision et la trame des cartes basées sur une étude approfondie de haute précision de la carte cognitive peut former une énorme industrie. Numérique, réseau de liaison et l'infrastructure de transport intelligent sera construit progressivement.

En outre, étant donné que la profondeur du déficit d'apprentissage existant compréhension sémantique ne peut être atteint, et doit donc recourir à 5G NB-IdO avec d'autres technologies de réseau intelligent comme base (communication de soutien et de l'équipement d'essai routier Drive), les systèmes de transport intelligents, et comme la ville intelligente, formée travailler ensemble pour résoudre le problème perçu de données fiables dans des situations d'extrême et d'urgence.

Le but ultime est d'obtenir le partage de l'intelligence artificielle sans pilote et de services à valeur ajoutée.

épilogue

zone limitée est une fosse, tout peut être installé dans. Niveau technique atteint L3 L4 est même pas comment chose incroyable, la clé est ce niveau est défini pour lequel la région est les ports, les aéroports, les parcs, les routes, ou l'ensemble de la partie de la ville de la ville, ou même pays, , il faut donc considérer la région, en tenant compte bien sûr, définir également sa fonction motrice. A l'inverse, une zone définie du pilote automatique est un véritable reflet de l'évolution progressive du modèle économique du processus, qui est, du simple au complexe étape par étape.

détection de l'environnement doit être combiné avec l'environnement de modélisation (carte de haute précision), formée dans la force de support inférieure communication 5G, NB-IdO et STI véhicule en réseau ville intelligente, fiable dans les environnements extrêmes situation d'urgence perçue, poussée L2 à travers à L3, à la pratique industrie du pilote automatique d'atterrissage, a franchi l'étape la plus importante.

Une fiabilité élevée, à faible coût est une exigence commune dominante route technologie visuelle ou radar laser, fusion de données multi-capteurs est nécessaire de faire des efforts pour résoudre la technologie de base commun.

l'apprentissage en profondeur est une perception de l'environnement technologique décisive et la prise de décision autonome, devrait rendre les véhicules autonomes ont l'homme comme la capacité d'auto-apprentissage de la conduite, qui essai routier avec de grandes données deviennent critiques.

Enfin, l'intelligence artificielle va accélérer la relance d'un nouveau cycle d'atterrissage sans pilote commercial L4 et les industries ci-dessus.

Lei Feng réseau de lecture recommandée: Université de Tsinghua Professeur Deng Zhidong: atmosphère de recherche domestique impétueux, trop peu d'originalité algorithme

Collision algorithme et optimisation basée sur EPC Gen2 contre
Précédent
circuit de découplage d'alimentation photovoltaïque pour le micro-onduleur
Prochain
2019 Chine (Beijing) Salon international des manèges succès
World Top 500 marques liste publiée: Apple 3, Huawei, Tencent et 38 autres marques chinoises cotées à court
Yibin tremblement de terre Xingwen 5.7 a découvert deux blessés ont des routes sont coupées
« Moment sombre » caractère affiches Gary Oldman a fait la réduction définitive Churchill
Combien tragédie, est « voir » out
« Academic » basé sur conjoint source-canal quantification réseau vidéo réseau hétérogène de codage
« Industrie Commentaires » fabricants Intel et les principaux OEM pour créer une nouvelle ère de centre de données informatique au centre de données FPGA applications grand public accéléré
NASA: Mars nous avons assez d'argent pour se connecter
Yibin Xingwen par le tremblement de terre dans le Chengdu-Kunming, Yi Gong, dans le cadre de votre train en retard
2019 Chine (Beijing) Forum du développement culturel de l'industrie touristique Ouverture
Novembre vrai moi
Je passe un navigateur Microsoft Chrome core Edge est vraiment lamentable