200000 serveur complet QQ sur le nuage

Auteur | Hu Weiwei

Oui, vous utilisez maintenant QQ , Il est déjà « sur le nuage QQ « !

Jusqu'à présent, QQ A mis toutes les affaires, nous sommes passés sur le nuage Tencent.

20 ans QQ , Le serveur cloud sur près de 20 millions d'unités, le processus difficile, comparable à « l'éléphant déplacé vers le nuage. »

Alors chose difficile, pourquoi Tencent?

2018 Tencent choses de « 930 ajustement » pour commencer.

Si vous êtes familier avec les outils de développement de Tencent, vous trouverez sa maison cadre Super Multi.

Alors Tencent forum interne, les nouveaux arrivants doivent souvent demander, si cadre beaucoup plus de développement, à la fin par laquelle?

Tencent interne propage aussi une histoire, un transfert d'emplois de divertissement Tencent mutuel BG lettre micro programmeur BG, a trouvé qu'il doit cadre de développement de réapprentissage.

En outre, avant le « 930 ajustement », Tencent beaucoup cadre de base, il n'y a pas open source interne, beaucoup de code entre les départements, sont fermés les uns aux autres.

Par conséquent, le « 930 ajustement », Tencent a commencé deux directions de nuage d'affaires de collaboration open source et des entreprises d'auto-développement.

Au cours de la dernière année, non seulement la source interne d'ouverture, même si la source externe ouverte, Tencent a également appelé « fou ».

Et dans la recherche depuis les aspects commerciaux du nuage, Tencent prendre leurs propres produits vétérans QQ Test de l'eau, sa détermination est évidente.

QQ Après le succès du nuage, les ingénieurs ont constaté que plus l'efficacité du développement des affaires, l'ancien prend beaucoup de temps pour développer un produit, même si elle est désormais de développer 0-1 nouveaux produits, ne prend que quelques semaines d'un.

Le second est le soi d'ingénieurs a été une expression plus, quand vous voyez les composants pour développer leur propre, transféré vers le nuage pour devenir un service qui est utilisé par beaucoup de gens, le genre de puits de fierté jusqu'à!

Plus important encore, QQ nuage nuages Tencent accumulé beaucoup d'expérience précieuse, l'expérience de l'ensemble de l'industrie du cloud computing, ils sont d'une grande utilité.

Eh bien, QQ Cloud le processus, qui avait rencontré des difficultés? Et comment surmonter?

13 janvier RPSC a interviewé Tencent Li Li, directeur général adjoint serveur et ainsi de suite, vous essayez d'être annoncé QQ Ces choses sur le nuage, ainsi que la technologie Tencent nuage derrière. Ce qui suit est une interview avec enregistrement partiel collationné après.

sur QQ Sur le nuage

RPSC: QQ Lui-même 20 ans d'histoire, il est un certain fardeau historique de la technologie, l'architecture technique et l'adaptation de l'infrastructure cloud aussi plus difficile. Eh bien, QQ Processus sur le nuage, la plus grande difficulté est rencontrée quoi? Li Li, directeur général adjoint du serveur Tencent et ainsi de suite: Le principal problème rencontré est que QQ exigences de coûts et de rendement, dans certains scénarios un nuage auront un impact. QQ Les caractéristiques de l'entreprise est qu'il est un processus d'accès massif de l'utilisateur à l'autre, ce processus est à la fois imprévisible et difficile de faire un bon plan. RPSC: Il est donc de savoir comment surmonter les difficultés? Li Li, directeur général adjoint du serveur Tencent et ainsi de suite: Retour à l'infrastructure cloud lui-même, si vous voulez un simple segment de nuage et une salle physique, vous avez dans la mesure du possible grâce à un logiciel défini, de manière à rendre le nuage avec une meilleure flexibilité.

Dans le réseau spécifique ci-dessus par le sexe, nous avons tous le trafic réseau et les relations réseau, ont été la modélisation du logiciel. Nous donnons donc QQ Chaque connexion et chaque colis, ont fait un niveau de logiciel d'expédition.

Dans ce cas, bien que l'UDP (User Datagram Protocol, User Datagram Protocol) n'est pas connecté, mais à l'intérieur défini par logiciel, il y a une connexion virtuelle. Et, nous allons mettre en place une connexion devient gérable, puis mis en place, continuera d'envoyer des paquets de données aux données de formulaire.

Nous préférons les premières données d'optimisation des performances, parce que dans la plupart des cas, après que le paquet de données est établie, les ingénieurs vont pour la transmission de données. Cependant, QQ A l'intérieur, pas entièrement.

parce que QQ Communications qui permettra de créer un grand nombre de visite temporaire UDP, mais il est devenu QQ Après la performance goulot d'étranglement du nuage. Et ce goulots d'étranglement très faible performance pourrait conduire à une forte augmentation des coûts.

Alors, comment résoudre? Au début de la face QQ Lorsque la scène, nous allons d'abord compléter les ressources pour le faire, mais cela perdre un avantage de coût. Plus tard, notre équipe de R & D et l'équipe de virtualisation a pris beaucoup de temps, beaucoup de travail à faire en termes de détails, et enfin à un coût très raisonnable et les ressources pour répondre à la QQ Groupe des besoins de l'entreprise.

Et pour répondre à compter sur les questions de reprise après incident, par exemple, nous le savons tous, le besoin de nuage gris à migrer, et résultera inévitablement de la salle de recherche de la salle de bande passante et de nuages par la migration, à cette fin, les ingénieurs doivent évaluer à l'avance de la recherche vers les nuages de chambre souhaitée de la bande passante de la chambre.

Si vous utilisez le programme de la ville, pour une bande passante spéciale devrait être aligné sur les trois scénarios de déploiement existants (note RPSC: QQ Serveur situé à Tianjin, Shanghai et Shenzhen trois places). Eh bien, QQ Le système de base a probablement besoin d'une bande passante de dizaines de G.

Si l'utilisation du programme IDC (Internet Data Center, Internet Data Center), QQ Il y a beaucoup d'affaires, en utilisant stateful adressage, et doivent donc briser toute la place dans la même ville accès (hashage cohérent similaire).

À cette fin, les ingénieurs ont évalué depuis la recherche dans la bande passante de salle de nuage, l'évaluation a révélé un soutien QQ Plusieurs systèmes de base (accès, les messages, l'état, l'information, la chaîne de relation, login) la bande passante requise est N.

et tout QQ Les fonctions de base sont migrés vers le cloud, vous avez besoin d'au moins une bande passante de 2N. Compte tenu des problèmes de reprise après incident, les ingénieurs ont en fait tiré l'autre par les deux voies (Waduan verte empêche la formation de l'île), qui est, QQ Spécialement construit sur la ligne de bande passante 4N nuage.

Pour VStation à propos de QQ Le nuage de bénédiction

RPSC: Il est rapporté que le système horaire distribué nuage Tencent VStation, peut gérer des milliers de serveurs, faire aussi simple que la gestion d'un seul serveur, ce processus est de savoir comment atteindre? Li Li, directeur général adjoint du serveur Tencent et ainsi de suite: concepts technologiques avec Tencent QQ et lettre micro La même souche, que nous voulons aborder est les massifs élevés scénarios accès concurrentiel d'affaires. Si vous allez seulement pour gérer des milliers de machines physiques une telle chose, il est avec la gestion d'une seule machine physique, il n'y a pas beaucoup de différence.

Alors, nous avons commencé à réfléchir à ce problème, pense surtout est sur la façon dont un système d'auto-développement, qui doit se rendre à des machines physiques dans un nuage dans la pièce, il peut produire et programmer la machine virtuelle.

Et Tencent VStation, avec d'autres systèmes ne sont pas au même endroit que nous insistons sur l'évolutivité et la haute disponibilité. Par exemple, la programmation originale d'une machine, maintenant prévue pour cent, mille, cela semble être infiniment évolutive, il semble que juste besoin d'exécuter ce script sur une seule machine, ou un millier de machines à exécuter sur peut.

Mais le plus gros problème est que nous voulons le faire comme une machine, comme, il doit être rapide. Mais dans le cluster à grande échelle, un gros problème est qu'il est difficile de se lever.

système Cloud complexe, comprenant le stockage de réseau informatique, la surveillance, la sécurité, les systèmes de gestion et le système DCS ambiant de la pièce (système de contrôle distribué, DCS).

Ainsi, l'ensemble des regards du système de cloud computing faire juste une planification de l'exploitation et la maintenance, mais d'impliquer des centaines de modules de collaboration, alors, est impliqué dans une communication distribuée avec plusieurs milliers de machine physique.

Ainsi, nous pouvons étendre sur les défis auxquels fait face l'opération est susceptible d'être exécuté sur une machine, deviendra une croissance à l'échelle de temps linéaire après l'amélioration de la machine.

Et si nous ne pouvons pas accepter une augmentation du temps linéaire, il ne peut pas être aussi simple que l'expansion du système de la machine. Il y a aussi un point que si je veux maintenant créer une machine virtuelle, machine physique qui dois-je choisir comme machine de traçabilité?

Ce processus est très compliqué, si seulement envisager un seul appel est très simple, je juste besoin d'obtenir toutes les informations, et ensuite essayer de calculer un seul point sur elle. Cependant, notre scénario, il est susceptible d'ouvrir la voie à un grand nombre de demandes en même temps.

Donc, nous faisons beaucoup de la technologie d'optimisation, le but est d'avoir plus de corps pour réaliser autant que possible, et que chaque corps doit effectuer une planification plus entrée.

Et chaque calendrier de temps, car toutes les informations à tout changement de temps, je reçois que toutes les informations à tout changement de temps. Ensuite, nous serons dans cette information, suffisamment sélectionné et a aussi marqué pool de ressources relativement élevée, puis faire un ordre aléatoire, ainsi que quelques algorithmes de hachage, afin d'éviter une collision entre les serveurs.

De plus, quand un nombre particulièrement important de modules lorsque les communications entre toute l'industrie principale fera face à des problèmes. Par exemple, lorsque l'ampleur croissante du système open-source, il sera confronté à un problème typique: qui est, une fois qu'il a envoyé le message à aller après, une fois que le traitement d'interruption ou une exception, le fonctionnement et l'entretien augmentera la difficulté du processus.

Donc, quand nous avons commencé à concevoir un système de nuage micro natif, soutenir l'idée de base est que la communication et des affaires dans l'isolement.

Mais nous n'avons pas service Mesh (grille de services), mais toute l'entreprise d'une manière simple de réaliser des interfaces atomiques, alors le concept de recherche de flux (débit de recherche), le mettre dans une combinaison efficace et complète de DAG (Database Availability Group , groupe de disponibilité de base de données).

Et puis dans le cadre de communication et d'un cadre de base, efficace et compléter cette carte n'optimisé pour le rendre aussi loin que possible en parallèle, et enfin faire un examen complet de l'efficacité de l'Ituri.

En d'autres termes, je mange en un seul endroit, ce lieu viendra automatiquement dans la figure de l'ordre inverse, et les chapitres d'origine peut faire le nettoyage. Cette prise de conscience du concept de grande échelle de systèmes distribués à l'intérieur de l'entreprise, et en fin de compte augmenter la taille de cluster.

Une fois que vous avez la capacité, nous QQ Processus sur le nuage, le principal problème est l'optimisation des performances. On peut dire, Tencent nuage le cadre de la mobilisation ensemble, ont reçu un grand test de Tencent d'affaires, maintenant la taille de cluster dans un environnement de laboratoire, ont déjà la capacité de gérer des millions de serveurs physiques.

Notes Interview

Grand homme a dit: « verrouillé ».

2018 Tencent « 930 ajustement », qui a causé de grandes répercussions dans l'industrie. Rétrospectivement, le résultat d'une réforme très réussie.

Si cet ajustement, qui chef d'oeuvre, QQ Cloud est certainement l'un d'entre eux.

Aujourd'hui, vous et moi savourons QQ Les avantages du nuage, il est peut-être pas aussi simple application de cliquer sur un bouton, mais comme l'Occident classique parlé :. « Vu est temporaire, qui ne sont pas invisibles sont éternelles. »

êtres mortels, un nom d'ingénieur et de l'apparence, il est difficile de se rappeler.

Mais leurs produits peuvent être utilisés par de nombreuses personnes, est une sorte de souvenir.

Pandas traitement des données trois tours, vous serez un peu à bord?
Précédent
visite du Hubei Xiangyang: l'ancienne ville de marée de printemps « de récupération »
Prochain
observation de sport | Tokyo Jeux olympiques remise, l'armée chinoise quelques larmes heureuses
Ningbo Jiangnan « l'esprit d'eau »: la posture du potentiel d'économie d'eau durable
Le président argentin Xi Jinping experts et chercheurs chaud message du Nouvel An 2020
équipe médicale Guangdong Guangdong gérer un retour progressif
Il est monté à bord les pages des journaux italiens abritent après 90 infirmières sont revenus! Avant les étrangers et les pairs
Juste! Hengqin Port O Port Area officiellement remis Macau! La superficie totale de 66.000 mètres carrés
Vanke Yu Liang: Avant de dire « en direct » est préparé, il y a maintenant un vrai spécial
90 après avoir dit à sa fiancée rétrograde Wuhan chercher du travail sur les soins de santé, des rabais de soins de santé et l'amitié de ses dessins animés
180 m vert super-haut réglé Linyi Nouveau train à grande vitesse, ou deviendra une nouvelle carte de visite Linyi
cours d'entretien de voitures: une augmentation soudaine du pétrole n'est pas un problème de qualité?
École primaire Thomas en séance d'information spéciale Jinan à venir
les services de police Tai'an, campagne « étiquette Shou, ligne de la civilisation »