Apprendre Apache Kude qui est une solution pour Hadoop Storage Challenge.

Description
Afin de mettre à l'échelle de grands ensembles de données et de grands clusters, Kudu divise les tables en plus petites unités appelées tablettes, qui peuvent être configurées sur une base par table pour être basées sur le hachage, le partitionnement de plage ou une combinaison des deux, ce qui permet à l'opérateur d'arbitrer facilement entre le parallélisme pour les charges de travail analytiques et une forte concomitance pour les charges de travail en ligne pour un plus grand nombre de charges de travail en ligne.

Afin de garder vos données en sécurité et disponibles à tout moment, Kudu utilise l'algorithme de consensus Raft pour répliquer toutes les opérations pour une tablette donnée. raft, comme Paxos, s'assure que chaque écriture est persisté par au moins deux nuds avant de répondre à la demande du client, garantissant qu'aucune donnée n'est jamais perdue en raison d'une panne de machine.

Mais contrairement aux systèmes cohérents, le consensus de Raft garantit que toutes les répliques parviendront à un accord sur l'état des données, et en utilisant une combinaison d'horloges logiques et physiques, Kudu peut offrir aux clients qui l'exigent une stricte cohérence d'instantané de l'état des données, et en utilisant une combinaison d'horloges logiques et physiques, Kudu peut offrir une cohérence d'instantané stricte aux clients qui l'exigent.

CLIQUEZ ICI pour accéder à ce cours