Quina diferència hi ha entre big data i Hadoop?

Autora: Judy Howell
Data De La Creació: 5 Juliol 2021
Data D’Actualització: 23 Juny 2024
Anonim
Quina diferència hi ha entre big data i Hadoop? - Tecnologia
Quina diferència hi ha entre big data i Hadoop? - Tecnologia

Content

P:

Quina diferència hi ha entre big data i Hadoop?


R:

La diferència entre el big data i el programa de programari de codi obert Hadoop és diferent i fonamental. El primer és un actiu, sovint complex i ambigu, mentre que el segon és un programa que aconsegueix un conjunt d'objectius i objectius per afrontar aquest actiu.

Les dades grans són simplement els grans conjunts de dades que les empreses i altres parts reuneixen per servir objectius i operacions específiques. Les dades grans poden incloure molts tipus diferents de dades en molts tipus diferents de formats. Per exemple, les empreses podrien dedicar-se a molta feina a la recopilació de milers de dades sobre compres en formats de moneda, en identificadors de clients com el nom o el número de Seguretat Social o en informació de productes en forma de números de model, números de vendes o números d'inventari. Tot això, o qualsevol altra gran massa d’informació, es pot anomenar big data. Com a regla general, és bruta i no contundent fins que no es posa a través de diversos tipus d'eines i manipuladors.


Hadoop és una de les eines dissenyades per gestionar big data. Hadoop i altres productes de programari treballen per interpretar o analitzar els resultats de les cerques de dades grans mitjançant algorismes i mètodes específics de propietat. Hadoop és un programa de codi obert sota la llicència Apache que manté una comunitat mundial d’usuaris. Inclou diversos components principals, entre ells un conjunt de funcions MapReduce i un sistema de fitxers distribuït Hadoop (HDFS).

La idea que hi ha darrere de MapReduce és que Hadoop pot primer mapar un gran conjunt de dades, i després realitzar una reducció d’aquest contingut per obtenir resultats concrets. Es pot pensar en una funció de reducció com una espècie de filtre per a dades brutes. El sistema HDFS llavors actua per distribuir dades a una xarxa o migrar-les segons sigui necessari.

Els administradors, desenvolupadors i altres bases de dades poden utilitzar les diverses funcions de Hadoop per fer front a grans dades de qualsevol manera que sigui. Per exemple, Hadoop es pot utilitzar per dur a terme estratègies de dades com ara l’agrupament i l’orientació amb dades no uniformes, o dades que no s’ajusten perfectament a una taula tradicional o responguin bé a preguntes senzilles.