6 grans mites sobre la gestió de dades grans

Autora: Eugene Taylor
Data De La Creació: 15 Agost 2021
Data D’Actualització: 22 Juny 2024
Anonim
6 grans mites sobre la gestió de dades grans - Tecnologia
6 grans mites sobre la gestió de dades grans - Tecnologia

Content


Font: Dwnld777 / Dreamstime.com

Emportar:

Les big data són grans empreses, però només si es fan servir correctament.

Al maig del 2014, Forrester Research va publicar dos informes que van treure certes conclusions sobre el bombo que envoltava les grans dades. La firma de recerca va enquestar a més de 250 executius de màrqueting i desenvolupament de negocis. Segons els autors dels informes, la retòrica del big data és sempre alta i els venedors de tecnologia estan oferint productes amb allò que semblen ser increïbles.

Gartner està d’acord amb Forrester Research; El bombo substancial envolta grans dades. A l'informe de setembre de 2014, Gartner va eliminar cinc dels majors mites de les dades i els analistes de Gartner van oferir la seva opinió sobre allò que s'ha entès malament sobre les dades grans i la seva manipulació. Quins són els grans mites de grans dades? Anem a fer una ullada.

Mite: Tothom té per davant l’adopció de grans dades.

Gartner assegura que l'interès per les dades grans és sempre màxim. Malgrat això, el 13 per cent dels enquestats tenen sistemes de treball. El motiu: la majoria de les empreses encara no han esbrinat com es pot extreure qualsevol valor amb grans dipòsits de dades. Aquí, l’enquesta de Gartner és més optimista que l’informe Forrester, que va trobar que només el 9 per cent dels participants a l’enquesta van dir que tenien previst implementar tecnologies de dades grans en el proper any. (Les dades grans tenen molt a oferir. Obteniu més informació en 5 problemes reals del món real. Les grans dades poden solucionar.)

Mite: Tenim tantes dades; no necessitem preocupar-nos per cada petit defecte de dades.

A Gartner li preocupa una cosa feble que tenim els humans: "Tenim molt, el poc que no serà important". Ted Friedman, vicepresident i distingit analista de Gartner, creu que aquesta és la manera equivocada de mirar la situació.

"En realitat, tot i que cada defecte individual té un impacte molt menor en el conjunt de dades del que va fer quan hi havia menys dades, hi ha més defectes que abans perquè hi ha més dades", va dir Friedman. "Per tant, l'impacte global de dades de mala qualitat en el conjunt de dades continua sent el mateix."

Friedman afegeix un altre motiu de preocupació. La captura de dades grans inclou sovint dades de fora del negoci, per tant, d’estructura i origen desconegudes. Això augmenta el potencial d’errors.

Mite: la tecnologia de dades grans eliminarà la necessitat d’integració de dades.

Hi ha dues estratègies d’anàlisi de dades clau que poden aplicar-se a dades grans: "esquema en escriptura" o "esquema en lectura". Fins fa poc, l’esquema d’escriptura era l’únic mètode utilitzat. L'esquema de lectura és la fallida actual en la gestió de la base de dades. A diferència de l’esquema on write, que requereix un format estructurat, les dades es carreguen en bases de dades d’esquema en lectura en el seu format brut. A continuació, els desenvolupadors, que utilitzen plataformes de bases de dades no estructurades com Hadoop, doblen les dades diferents en un format utilitzable. L’esquema de lectura té avantatges òbvits, però, com esmenta Gartner, en algun moment la integració de dades s’ha de produir.

Mite: L'ús d'un magatzem de dades per a analítiques avançades no té sentit.

Passar el temps per crear un magatzem de dades sembla inútil per a molts gestors d'informació, sobretot quan les dades recentment capturades són diferents de les que es troben al magatzem de dades. No obstant això, Gartner torna a advertir que fins i tot les analítiques avançades de dades faran servir magatzems de dades i dades noves, cosa que significa que els integradors de dades hauran de:
  • Perfeccioneu els tipus de dades nous per tal que siguin adequats per a l'anàlisi
  • Decidiu quines dades són rellevants i el nivell de qualitat de les dades necessàries
  • Determineu com agrupar les dades
  • Entengueu que el perfeccionament de dades pot produir-se en llocs diferents del magatzem de dades

Mite: Els llacs de dades substituiran el magatzem de dades.

Els llacs de dades són dipòsits de dades diferents, a diferència dels magatzems de dades on les dades es troben en un format estructurat. La creació d'un llac de dades requereix poc esforç inicial (no cal formatar les dades) en comparació amb els magatzems de dades, és per això que els llacs de dades són d'interès.

Gartner destaca que no és el punt de tenir les dades: és capaç de manipular les dades capturades per a la presa de decisions informada. A més, és problemàtic l’ús de llacs de dades (una mica no provats) per facilitar la presa de decisions.

"Els magatzems de dades ja tenen la capacitat de donar suport a una gran varietat d'usuaris en tota una organització", va dir Nick Heudecker, director de recerca de Gartner. "Els líders de gestió d'informació no han d'esperar que els llacs de dades es posin al dia". (Obteniu més informació sobre l'adopció de dades grans en 7 coses que heu de saber sobre les dades grans abans de l'adopció.)

Big Data Works: nous mètodes de manipulació de dades no poden ser

El motiu pel qual Gartner va dir que "els mites de dades més grans" en lloc dels "mites de dades grans" queda clar després de llegir l'informe. Gartner no és gens divertit. Gartner es mostra decidit per aquells que senten que els nous mètodes de manipulació de dades grans estan preparats per al "temps prime".