Dades brutes

Autora: Randy Alexander
Data De La Creació: 27 Abril 2021
Data D’Actualització: 21 Juny 2024
Anonim
Excel Pivot Tables from scratch to an expert for half an hour + dashboard!
Vídeo: Excel Pivot Tables from scratch to an expert for half an hour + dashboard!

Content

Definició: què significa Dirty Data?

Les dades brutes fan referència a dades que contenen informació errònia. També es pot utilitzar quan es refereix a dades que es troben a la memòria i que encara no es carreguen a una base de dades. L’eliminació completa de les dades brutes d’una font no és pràctic o impossible.


Les dades següents es poden considerar com a dades brutes:

  • Dades equivocades
  • Duplicar dades
  • Dades incorrectes
  • Dades incorrectes
  • Dades no integrades
  • Dades que violen les normes comercials
  • Dades sense format generalitzat
  • Puntuació o puntuació incorrecta de les dades

Una introducció a Microsoft Azure i al Microsoft Cloud | Durant aquesta guia, podreu conèixer què és la informàtica en núvol i com Microsoft Azure us pot ajudar a migrar i executar el vostre negoci des del núvol.

Techopedia explica les dades brutes

A més de l'entrada incorrecta de dades, es poden generar dades brutes a causa dels mètodes indeguts en la gestió i l'emmagatzematge de dades. A continuació s’expliquen alguns tipus de dades brutes:

  • Dades incorrectes: per garantir que les dades són vàlides o correctes, el valor introduït hauria de complir els valors vàlids dels camps. Per exemple, el valor introduït al camp del mes hauria d’estar entre l’1 i el 12, o l’edat d’un individu ha de ser inferior a 130. La correcció del valor de les dades pot ser aplicada programàticament mitjançant taules de cerca o amb comprovacions d’edició.
  • Dades inexactes: és possible que un valor de dades pugui ser correcte, però no exacte. De vegades, és pràctic examinar contra altres fitxers o camps per esbrinar si el valor de les dades és exacte en funció del contingut que s’utilitza. Tot i així, la precisió sovint només es pot validar mitjançant verificació manual.
  • Violacions de regles comercials: les dades que incompleixen les regles comercials són un altre tipus de dades brutes. Per exemple, una data d’efectivitat sempre ha d’arribar abans d’una data de caducitat. Un altre exemple de violació de regles comercials pot ser una reclamació d’assegurança de Medicare per a pacients quan el pacient encara pugui tenir l’edat de jubilació i no tingui dret a Medicare.
  • Dades inconsistents: la redundància de dades no verificada comporta incoherències de dades. A cada organització es veuen afectades dades inconsistents i repetitives. Això és particularment típic amb les dades dels clients.
  • Dades incompletes: les dades amb valors que falten és el tipus principal de dades incompletes.
  • Dades duplicades: es poden produir dades duplicades a causa de les enviaments repetits, la unió de dades indegudes o un error de l'usuari.

Per tal d’augmentar la qualitat de les dades i evitar dades brutes, les organitzacions haurien d’incorporar metodologies per assegurar la completa, validesa, coherència i correcció de les dades.