A donn�es prennent en charge une vari�t� de sc�narios CarbonData converg� solutions de stockage de donn�es r�v�le la technologie Enregistrement Shu �v�nement

Apache CarbonData est parrain� par Huawei et open source, un format de stockage de donn�es haute performance, gr�ce � l'int�gration de la nouvelle solution de stockage de donn�es pour une vari�t� d'applications, tout en soutenant des sc�narios de donn�es pour r�soudre l'industrie du stockage en raison de l'analyse de sc�nario actuel des besoins r�sultant de redondance et d'autres questions. Pendant ce temps, CarbonData par indexation � plusieurs niveaux, le dictionnaire de codage et d'autres fonctionnalit�s pour am�liorer la m�moire de balayage de la colonne IO et les performances de calcul, atteignant 10000000000 secondes niveau de donn�es de r�ponse, il appara�t comme un gros volumes de donn�es de requ�te faible latence fournit une nouvelle id�e et direction .

Pour les d�veloppeurs d'aide se concentrer CarbonData en profondeur la compr�hension de la technologie, nous avons lanc� une campagne pour Apache CarbonData + Spark de s�minaires techniques sur, et des experts de haut de l'industrie invit�s des �tats-Unis Databricks, Huawei, SAIC, veulent utiliser la sc�ne par Spark SQL, Spark 2.2 caract�ristiques de base des rapports du CBO, part application pratique de l'objet CarbonData +2,0 planification de nouvelles technologies, Utilisons plus facile CarbonData.

Le temps et lieu

Lieu de l'�v�nement : Voiture Shanghai pour profiter du b�timent (plancher de la salle de conf�rence)

Les co�ts d'activit� : Sans limite

Calendrier des �v�nements

Charg�s de cours et sujets de cours

Session I: Spark SQL: Pass�, pr�sent et futur

instructeur profil : Fan Wenchen, de la soci�t� Databricks �tats-Unis, Apache Spark membre PMC, les membres de l'�quipe de d�veloppement Spark SQL. Apr�s avoir �t� dipl�m� en 2013 de l'Universit� du Zhejiang, il a �t� engag� dans les travaux li�s aux syst�mes distribu�s. 2014 est entr� en contact avec Spark, et est devenu l'un des contributeurs les plus actifs. 2015 a officiellement rejoint Databricks, devenir Databricks Division de la Chine (en construction) du premier employ�, responsable des aspects du travail de la communaut� open source, tels que: PR d'autres membres de la communaut� � soumissions d'examen, conduisant Spark SQL quelques-unes des principales caract�ristiques de la conception et du d�veloppement, des v�rifications p�riodiques de la qualit� du code.

R�sum� des sujets : Spark SQL comme cadre de base de Spark, a d�j� une base d'utilisateurs large et a eu une longue histoire de d�veloppement. Le sujet nous m�nera regardons l'�volution de l'histoire Spark SQL, et l'�tat actuel et les perspectives d'avenir de certains, pour vous aider � mieux comprendre certains des sc�narios d�cisions de conception Spark SQL et d'utilisation.

Session II: CarbonData Application de +2,0 introduction du nouveau plan technologique

instructeur profil : Kun Li, Apache CarbonData committers, Huawei Technologies Co., Ltd Big architecte logiciel Data. Huawei a rejoint en 2004, des accords � long terme dans les t�l�communications, l'intelligence d'affaires, visualisation de donn�es, de recherche de syst�me d'analyse de comportement des utilisateurs et de d�veloppement. Ces derni�res ann�es, en travaillant sur les grandes technologies de donn�es, la participation � Hadoop, Spark, Alluxio et d'autres communaut� open source en 2016 en tant que membres CarbonData PMC dans le projet d'incubateur Apache CarbonData, la recherche d'opportunit�s d'innovation et un point unique et la plate-forme d'analyse de donn�es.

R�sum� des sujets : Apache CarbonData est un nouveau stockage de donn�es � haute performance, l'analyse, les exigences de redondance de stockage de diff�rents sc�narios pour le courant provoqu�e par un grand champ de donn�es, CarbonData fournit une nouvelle fusion de solutions de stockage de donn�es pour les donn�es tout en supportant une grande analyse des donn�es provenant de plusieurs sc�narios (par exemple: � une combinaison de l'analyse des donn�es de dimension, balayage rapide, les d�tails d'une seule requ�te, mise � jour ou suppression de donn�es �), et par un indice multi-niveaux, dictionnaire de codage et d'autres caract�ristiques de la colonne pour am�liorer le stockage I / O balayage et le calcul de la performance, la r�alisation 10000000000 secondes niveau de donn�es de r�ponse.

Apr�s CarbonData open source, les donn�es globales par les amateurs de technologie attention, � ce jour, le monde a plus de 100 d�veloppeurs impliqu�s dans les contributions de code, il y a le syst�me de production 10+ entreprises en ligne. Cette pr�sentation se concentre sur les applications pratiques et 2.0 nouveau plan technologique CarbonData pour vous aider � mieux utiliser la technologie CarbonData.

Session III: Spark 2.2 caract�ristiques essentielles introduites CBO

instructeur profil : Wang Zhenhua, Huawei est actuellement ing�nieur de recherche, Apache noyau Spark Contributor, d�veloppeur principal CBO, est engag� � construire une plate-forme haute performance pour la grande analyse des donn�es. Auparavant, il est dipl�m� de Zhejiang University School of Computer Science et de la technologie, la recherche sur des bases de donn�es spatiales, la recherche d'information, l'exploration de donn�es.

R�sum� des sujets : Dans le Spark Catalyst optimiseur SQL, de nombreuses technologies d'optimisation � base de r�gles a �t� atteint, mais l'optimiseur lui-m�me a encore beaucoup de place � l'am�lioration. Par exemple, il existe des statistiques d�taill�es sur la distribution des donn�es, il est difficile d'estimer avec pr�cision la filtration (filtre), la connexion (rejoindre) et la sortie, comme la taille et la base de donn�es de l'op�rateur cardinalit� (cardinalit�). En raison des estimations inexactes, il conduit souvent � suboptimale optimiseur pour g�n�rer requ�te plan d'ex�cution.

Dans Spark 2.2, le moteur Spark SQL int�rieur ajoute un cadre d'optimisation bas�e sur les co�ts, et g�n�re ce calcul taille du cadre de base de chaque op�rateur de base de donn�es. Selon des estimations statistiques fiables et pr�cises, pour prendre de bonnes d�cisions dans ces domaines: le hachage correcte join (jointure de hachage) construction de la fin de l'op�ration (c�t� construction), s�lectionnez l'algorithme de connexion correcte (par exemple, hachage de diffusion se joindre et brass� hachage rejoindre), et ainsi ajuster l'ordre de connexion. Dans cet expos�, nous montrons cadre Spark optimiseur SQL du nouvel impact des co�ts et de la performance sur TPC-DS � base de requ�tes, .

Session IV: CarbonData fonction de partition + SAIC pratique importante CarbonData Partager

instructeur profil : Cao Lu, Apache CarbonData noyau Contributeur, d�veloppeur principal de la partition, le d�veloppement de donn�es SAIC Directeur de Big Data Platform. Principalement ax� sur grande architecture de la plateforme de donn�es, le stockage de donn�es, la compression, et les applications de recherche de l'index et flux en temps r�el le traitement des donn�es. La soci�t� �tait responsable d'un ETL de l'industrie financi�re, le d�veloppement de syst�mes BI, une gestion des capacit�s de l'entrep�t de donn�es de l'entreprise fournisseur d'�lectricit� Internet, l'optimisation des performances et ainsi de suite. Plus d'infos sur les technologies open source, contributeurs de la communaut� Apache CarbonData.

R�sum� des sujets : Propri�t�s de la partition CarbonData seront officiellement lib�r�s dans Apache 1.2.0 CarbonData la version, cette fonctionnalit� permettra d'am�liorer consid�rablement les performances des requ�tes de donn�es volumineuses. SAIC CarbonData grand ensemble de base de donn�es en tant que plate-forme pour r�pondre � la croissance rapide du volume de donn�es, cette question partagera les pratiques et les donn�es de test articles CarbonData SAIC.

Adresse Inscription gratuite

balayage de code � deux dimensions ci-dessous l'image ou cliquez sur Lire l'original , Et remplissez les informations d'enregistrement soumis, apr�s examen par notre personnel vous enverra un SMS participants de confirmation. Que vous soyez Apache CarbonData fans fid�les et les fans qui ont, ou avec des questions et des id�es sur l'utilisation CarbonData, nos experts techniques vous attendent dans le domaine!

Route de la soie

Apprenez � conna�tre la Chine

A donn�es prennent en charge une vari�t� de sc�narios CarbonData converg� solutions de stockage de donn�es r�v�le la technologie Enregistrement Shu �v�nement