Sistema d'arxius distribuïts Hadoop (HDFS)

Autora: Judy Howell
Data De La Creació: 28 Juliol 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Sistema d'arxius distribuïts Hadoop (HDFS) - Tecnologia
Sistema d'arxius distribuïts Hadoop (HDFS) - Tecnologia

Content

Definició: què significa el sistema de fitxers distribuït (HDFS) de Hadoop?

El Sistema de fitxers distribuïts Hadoop (HDFS) és un sistema de fitxers distribuït que funciona amb maquinari estàndard o de gamma baixa. Desenvolupat per Apache Hadoop, HDFS funciona com un sistema de fitxers distribuït estàndard, però proporciona un millor rendiment i accés de dades a través de l'algoritme MapReduce, alta tolerància a les errades i suport natiu de grans conjunts de dades.


Una introducció a Microsoft Azure i al Microsoft Cloud | Durant aquesta guia, podreu conèixer què és la informàtica en núvol i com Microsoft Azure us pot ajudar a migrar i executar el vostre negoci des del núvol.

Techopedia explica el sistema de fitxers distribuït Hadoop (HDFS)

L'HDFS emmagatzema una gran quantitat de dades col·locades en diverses màquines, normalment en centenars i milers de nodes connectats simultàniament, i proporciona fiabilitat de dades replicant cada instància de dades com tres còpies diferents, dues en un grup i una en un altre. Aquestes còpies es podran substituir en cas d’error.

L’arquitectura HDFS consta de clústers, a tots els quals s’accedeix a través d’una única eina de programari NameNode instal·lada en una màquina separada per controlar i gestionar el sistema de fitxers i els mecanismes d’accés dels usuaris. Les altres màquines instal·len una instància de DataNode per gestionar l’emmagatzematge de clúster.


Com que HDFS està escrit en Java, té suport natiu per a interfícies de programació d'aplicacions Java (API) per a la integració i l'accessibilitat d'aplicacions. També es pot accedir a través de navegadors web estàndard.