Exploitation d'Apache Hive pour traiter les données brutes et les opérations ETL dans les différents environnements de Hadoop.

Description
ZooKeeper est un service de synchronisation répliqué avec une cohérence éventuelle, robuste, puisque les données persistantes sont distribuées entre plusieurs nuds (cet ensemble de nuds est appelé un ensemble) et qu'un client se connecte à n'importe lequel d'entre eux (c'est-à-dire un serveur spécifique), migrant si un nud échoue ; tant qu'une majorité stricte de nuds fonctionne, l'ensemble des nuds de ZooKeeper est vivant, notamment un nud maître est dynamique.

Chaque fois qu'un client écrit à l'ensemble, une majorité de noeuds persistent l'information : ces noeuds incluent le serveur pour le client, et évidemment le maître, ce qui signifie que chaque écriture rend le serveur à jour avec le maître, ce qui signifie aussi que vous ne pouvez pas avoir des écritures simultanées.

La garantie d'écriture linéaire est la raison pour laquelle ZooKeeper ne fonctionne pas bien pour les charges de travail dominantes en écriture, en particulier, il ne devrait pas être utilisé pour l'échange de données volumineuses, comme les médias ; tant que votre communication implique des données partagées, ZooKeeper vous aide ; lorsque les données pourraient être écrites simultanément, ZooKeeper se met effectivement dans le chemin, car il impose un ordre strict des opérations, même s'il n'en est pas de même s'il ne s'agit pas d'un ordre strict des opérations.

CLIQUEZ ICI pour accéder à ce cours