10 Big Data Do's and Don'ts

Autora: Eugene Taylor
Data De La Creació: 13 Agost 2021
Data D’Actualització: 22 Juny 2024
Anonim
10 Big Data Do's and Don'ts - Tecnologia
10 Big Data Do's and Don'ts - Tecnologia

Content



Font: Rawpixelimages / Dreamstime.com

Emportar:

El Big Data és un domini nou i emergent per a la majoria de les empreses. Fer que funcioni requereix un ajustament acurat i l’ús de les millors pràctiques.

El Big Data comporta moltes promeses per a tot tipus d’indústries. Si s’aprofita aquesta informació de manera eficaç i eficaç, pot tenir un impacte significatiu en la presa de decisions i l’analítica. Però el benefici de big data només es pot obtenir si es gestiona de forma estructurada. Les bones pràctiques de big data s’estan establint de forma gradual, però ja hi ha algunes clares dosificacions i no a l’hora d’implementar-les.

La següent orientació es basa en l'experiència pràctica i el coneixement que es recullen en els projectes de la vida real. A continuació, es mostren els meus principals dòlars i dades importants.

Impliqueu totes les seccions comercials en una iniciativa de grans dades

Una iniciativa de big data no és una activitat aïllada i independent, i la participació de totes les unitats de negoci és una necessitat per obtenir valor i coneixement reals. Les dades grans poden ajudar les organitzacions a aprofitar grans volums de dades i a comprendre el comportament dels clients, els esdeveniments, les tendències, les prediccions, etc. Això no és possible amb una captura de dades, que només capta una part del volum complet de les dades processades en big data. Com a resultat, les empreses es concentren cada cop més en tot tipus de dades procedents de totes les vies o unitats de negoci possibles per comprendre el patró correcte.

Avaluar tots els models d’infraestructura per a la implementació de grans dades

El volum de dades i la seva gestió són una preocupació principal per a qualsevol iniciativa de big data. Com que el big data tracta de petabytes de dades, l’única solució per gestionar-lo és l’ús de centres de dades. Al mateix temps, s’ha de tenir en compte el component de cost abans de seleccionar i finalitzar qualsevol instal·lació d’emmagatzematge. Els serveis al núvol solen ser la millor opció, però cal avaluar els serveis dels diferents entorns de núvol per determinar-ne l’adequat. Com que l'emmagatzematge és un dels components més importants en qualsevol implementació de grans dades, és un factor que s'ha d'avaluar amb molta cura en qualsevol iniciativa de big data. (Obteniu una altra perspectiva del repte de Big Data de Todays derivat de la varietat, el no el volum o la velocitat.)

Considereu les fonts de dades tradicionals en la planificació de grans dades

Hi ha diverses fonts de dades grans i el nombre de fonts també augmenta dia a dia. Aquest enorme volum de dades s’utilitza com a entrada per al processament de grans dades. Com a resultat, algunes empreses pensen que les fonts de dades tradicionals no serveixen de res. Això no és cert, ja que aquestes dades tradicionals són un component crític per a l’èxit de qualsevol història de grans dades. Les dades tradicionals contenen informació valuosa, de manera que s’han d’utilitzar conjuntament amb altres fonts de dades grans. El valor real de les dades grans només es pot derivar si es tenen en compte totes les fonts de dades (tradicionals i no tradicionals). (Obteniu més informació en Take That, Big Data! Per què les dades petites poden embalar un cop més gran.)

Considereu un conjunt de dades consistent

En un entorn de grans dades, les dades provenen de diverses fonts. El format, l'estructura i els tipus de dades varien d'una font a una altra. La part més important és que les dades no es netegen quan es tracta del vostre entorn de dades grans. Per tant, abans de confiar en les dades entrants, heu de comprovar la coherència mitjançant observació i anàlisi repetitives. Un cop confirmada la consistència de les dades, es pot tractar com un conjunt consistent de metadades. Trobar un conjunt consistent de metadades mitjançant una observació acurada del patró és un exercici essencial en qualsevol planificació de grans dades.

Distribuïu les dades

El volum de dades és una preocupació principal quan tenim en compte un entorn de processament. A causa de l'enorme volum de dades que tracta la gran dada, el processament en un sol servidor no és possible. La solució és un entorn Hadoop, que és un entorn informàtic distribuït que funciona amb maquinari de productes bàsics. Dóna el poder d’un processament més ràpid en diversos nodes. (Obteniu més informació en 7 coses a saber sobre Hadoop.)

No confieu mai en un sol enfocament d’analítica de dades grans

Al mercat hi ha diverses tecnologies disponibles per al processament de dades grans. El fonament de totes les tecnologies de big data és Apache Hadoop i MapReduce. Per tant, és important avaluar la tecnologia correcta per al propòsit correcte. Alguns dels principals enfocaments analítics són analítics predictius, analítics prescriptius, analítics, analítica de dades de flux, etc. La selecció del mètode / enfocament adequat és important per assolir l'objectiu desitjat. El millor per evitar confiar en un sol enfocament, però per investigar diversos enfocaments i seleccionar la concordança perfecta per a la vostra solució.

No inicieu la iniciativa de grans dades abans que estigueu llestos

Sempre es recomana començar amb petits passos per a qualsevol iniciativa de big data. Així, comenceu amb els projectes pilot per obtenir experiència i, a continuació, aneu cap a la implementació real. El potencial de les grans dades és molt impressionant, però el valor real només es pot assolir un cop reduïm els nostres errors i guanyem més experiència.

No utilitzeu dades de forma aïllada

Les grans fonts de dades s’escampen al nostre voltant i van augmentant dia a dia. És important integrar totes aquestes dades per obtenir una sortida d’analítica correcta. Al mercat hi ha diferents eines disponibles per a la integració de dades, però s’han d’avaluar adequadament abans d’utilitzar-les. La integració de big data és una tasca complexa, ja que les dades de diferents fonts tenen un format diferent, però és molt necessari obtenir un bon resultat d’analítiques.

No ignoreu la seguretat de les dades

La seguretat de les dades és una de les principals consideracions en la planificació de grans dades. Inicialment, (abans de fer cap tractament), les dades es troben en petabytes, de manera que la seguretat no està estrictament implementada. Però després d'alguns processaments, obtindreu un subconjunt de dades que us proporciona una mica de coneixement. Arribats a aquest punt, la seguretat de les dades esdevé essencial. Com més es processen i s’ajusten les dades, més valuoses es converteixen sovint en una organització. Les dades de sortida ajustades amb precisió són propietat intel·lectual i s’han de protegir. La seguretat de les dades s’ha d’implementar com a part del cicle vital de les grans dades.

No ignoreu la part de rendiment de les analítiques de dades grans

La sortida d’analítica de dades grans només és útil quan proporciona un bon rendiment. Les dades grans ofereixen més informació basada en el processament d’una gran quantitat de dades a una velocitat més ràpida. Per tant, és imprescindible gestionar-lo de manera eficaç i eficaç. Si no es gestiona detingudament el rendiment de dades grans, això causarà problemes i farà que tot l’esforç tingui sentit.

En la nostra discussió, ens hem centrat en la quantitat i no les iniciatives de big data. El Big Data és un àmbit emergent i, quan es tracta d’implementar-lo, moltes empreses encara es troben en fase de planificació. És bàsic comprendre les bones pràctiques de big data per minimitzar el risc i els errors. Els punts de discussió han estat derivats d’experiències de projectes en directe, de manera que es donaran algunes pautes per aconseguir que l’estratègia de big data sigui exitosa.