Anàlisi de dades de gran codi obert

Autora: Laura McKinney
Data De La Creació: 1 Abril 2021
Data D’Actualització: 14 Ser Possible 2024
Anonim
Anàlisi de dades de gran codi obert - Tecnologia
Anàlisi de dades de gran codi obert - Tecnologia

Content

Definició: què significa Open Analytics de dades de gran font?

L’analítica de dades de codi obert es refereix a l’ús de programari i eines de codi obert per a analitzar grans quantitats de dades per tal de recopilar informació rellevant i actuable que una organització pot utilitzar per tal d’avançar els seus objectius comercials. El jugador més important en analítica de dades de codi obert és Apaches Hadoop: és la biblioteca de programari més utilitzada per processar enormes conjunts de dades a través d’un grup d’ordinadors mitjançant un procés distribuït per al paral·lelisme.


Una introducció a Microsoft Azure i al Microsoft Cloud | Durant aquesta guia, podreu conèixer què és la informàtica en núvol i com Microsoft Azure us pot ajudar a migrar i executar el vostre negoci des del núvol.

Techopedia explica Analytics de dades de codi obert

L’analítica de dades de codi obert fa ús de programari i d’eines de codi obert per executar analítiques de dades grans mitjançant una plataforma de programari sencera o diverses eines de codi obert per a diferents tasques en el procés d’analítica de dades. Apache Hadoop és el sistema més conegut per a l'analítica de dades grans, però es requereixen altres components abans que es pugui combinar un sistema analític real.

Hadoop és la implementació de codi obert de l'algorisme MapReduce pioner per Google i Yahoo, per la qual cosa és la base de la majoria dels sistemes analítics actuals. Moltes eines d’analítica de dades grans utilitzen el codi obert, inclosos sistemes de base de dades robustos com el MongoDB de codi obert, una base de dades NoSQL sofisticada i escalable molt adequada per a aplicacions de big data, així com d’altres.


Els serveis d’analítica de dades de codi obert inclouen:

  • Sistema de recollida de dades
  • Centre de control d'administració i seguiment de clústers
  • Biblioteca d'aprenentatge automàtic i mineria de dades
  • Servei de coordinació d’aplicacions
  • Motor de càlcul
  • Marc d’execució