Funció: Data Scientist

Autora: Roger Morrison
Data De La Creació: 28 Setembre 2021
Data D’Actualització: 11 Ser Possible 2024
Anonim
Funció: Data Scientist - Tecnologia
Funció: Data Scientist - Tecnologia

Content


Font: Sergey Khakimullin / iStockphoto

Emportar:

Els científics de dades tenen un ampli treball que varia considerablement segons l'aplicació. Però una cosa que tenen en comú és la unitat de fer un bon ús de les dades.

Què fa un científic de dades en matèria d’intel·ligència artificial i aprenentatge automàtic? Un munt de professionals que tracten aquest tipus de projectes cada dia diria que és difícil de respondre a la pregunta simplement. Una millor pregunta seria: Què fan els científics de dades NO?

Un científic de dades és integral d’un procés d’IA o ML, en el sentit que tots aquests projectes depenen de dades grans o d’entrades complexes. El científic de dades és el professional de la carrera essencial que sap treballar amb dades per produir resultats.

Tot i això, hi ha algunes maneres de parlar sobre què fa un científic de dades, quines qualificacions necessita i quin és el seu paper en el procés.


Llegiu: 6 conceptes clau sobre ciències de dades que podeu dominar mitjançant l'aprenentatge en línia

Definicions variades, deures variades

Molts experts que descriuen el treball d’un científic de dades en parlen de forma àmplia.

"En empreses petites o quan treballen en un nou mercat, el paper d'un científic de dades és convertir fonts relativament novedoses (però òbvies) de dades en coses que resolguin un problema per a un usuari final, cosa que anteriorment no hauria estat possible. on les tecnologies emprades no existien ", afirma Antonio Hicks, responsable de comptes de Mercury Global Partners. "El candidat ideal és algú que sigui matemàtic, enginyer de programari de part i emprenedor."

Altres es fan ressò d'aquesta idea bàsica i citen quines dades els científics necessiten per fer front a projectes de modelització.


"L'atribut més important que necessita un científic de les dades és una profunda curiositat pel món que els envolta, tant si responen a preguntes com si construeixen models, és fonamental el desig d'entendre el problema que hi ha al davant", afirma Erin Akinci, responsable de científics de dades. a Asana. "A partir d'aquí, la majoria de la gent requerirà habilitats en matemàtiques i programació per trobar solucions, però els tipus específics de matemàtiques i de programació varien molt segons l’àrea d’expertesa de la ciència de dades."

Sense errors, sense estrès: la vostra guia pas a pas per crear programes que canvien la vida sense destruir la vida

No podeu millorar les vostres habilitats de programació quan ningú es preocupa per la qualitat del programari.

"Un treball científic excel·lent té més a veure amb la forma en què un científic pensa sobre un problema, que amb les eines que utilitzen per resoldre'l", afegeix Charlie Burgoyne, fundador i conseller delegat de Valkyrie Intelligence. Valkyrie és una empresa de consultoria en ciències aplicades amb projectes impressionants a la seva ala, com el Mark I, un dispositiu de xarxa dedicat que potencia la formació i les proves de xarxes neuronals, millorant el que és possible amb anteriors plataformes d'aprenentatge de màquines basades en núvol.

"El mercat exigeix ​​científics coneixedors del desenvolupament de Python, disseny de xarxes neuronals i capacitat de reformular un dipòsit de dades a l'arquitectura de bases de dades més recent", afirma Burgoyne. "Aquestes capacitats, però, són apostes per a un científic amb talent. El que és menys obvi és l'aptitud d'un científic per una curiositat intrèpida, un enginy agressiu i una adhesió al mètode científic. "

Les habilitats d’un científic científic de dades

Pel que fa a conjunts d’habilitats pràctiques, els científics de dades necessiten una gran quantitat de creativitat i experimentats en la mesura del model. També poden beneficiar-se molt de tenir “habilitats dures” com ara la codificació d’experiència a Python, C ++ o altres llenguatges habituals aplicats a projectes de ML.

"Python i C ++ són fonamentals i són capaços de combinar les habilitats de codificació amb l'anàlisi i el processament de dades i les estadístiques són habilitats bàsiques que faran que un científic de dades destaqui com a candidat o empleat fort", afirma Val Streif a Pramp, una plataforma d’entrevistes en línia amb simulacres. per a enginyers de programari, desenvolupadors i científics de dades. "Si bé es pot tenir cura d'algunes de les habilitats de programació combinant un científic de dades amb un desenvolupador, és molt més fàcil si es combinen ambdues habilitats en una, des de la perspectiva d'una empresa."

Altres experts afegeixen R, Hadoop, Spark, Sas i Java a la llista, així com tecnologies com Tableau, Hive i MATLAB.

Totes aquestes opten per un currículum impressionant, però algunes de les persones amb experiència en el reclutament de científics de dades asseguren que els altres aspectes “humans” també són importants. (Un dels tipus de científics de dades és el científic de dades ciutadanes. Obteniu més informació a El paper dels científics de dades ciutadanes en el Big Data World.)

"Tradicionalment, els individus amb una diversa formació en arts liberals fan de científics excel·lents dades", afirma Burgoyne, fent una distinció entre enginyers, que són a la banda de la construcció, i científics de dades, el treball pot ser molt més conceptual. Ell continua:

L’experiència en un camp tradicional STEM amb un enfocament complementari en el domini d’humanitats, arts o negocis dóna aquestes qualitats que fan d’un excel·lent científic orientat a la indústria. Cal dir que és igual d’important per a la capacitat de l’organització d’aprofitar aquestes qualitats i de configurar el seu fervor i mètodes de manera productiva. He observat que quan una iniciativa de ciències de dades no té èxit, l’organització és tan culpable com els científics. Els científics no són enginyers. No estan impulsats a executar i construir. Es veuen impulsats a descobrir i comprendre. Les organitzacions que assoleixen aquesta diferència són ben recompensades pel cultiu d’ambdós camps.

Quant a les dades en què s’apliquen habitualment els científics, això té a veure amb els objectius bàsics de l’empresa. Algunes empreses persegueixen una Internet descentralitzada, algunes juguen amb IoT o SaaS. D’altres intenten ser una PIA “fàcil d’utilitzar” o “ètica” o “transparent”.

En qualsevol cas, és probable que els científics de dades puguin establir una divisió entre les mètriques dures de les dades que utilitzen, en qualsevol pila de tecnologia que estigui en joc i el treball lliure de conceptualització de la funcionalitat AI / ML.

"Contractem científics per gestionar la recollida i neteja de dades, a més de traduir aquestes dades a informació significativa", afirma Michael Hupp, gerent de Ciències de dades i anàlisis de G2 Crowd. Elabora:

Típicament això significa gestionar qualsevol algorisme important que condueixi el motor de dades d’una empresa i que parleu fluidament en les eines i els idiomes d’analítica clau, però en els darrers anys també ha inclòs camps emergents com el processament de llenguatges naturals, l’aprenentatge automàtic, altres formes d’anàlisi habilitada per IA. Els científics de dades més reeixits són aquells que combinen les seves habilitats dures amb la capacitat d’aprendre ràpidament i la capacitat de comunicar eficaçment els coneixements que descobreixen perquè siguin significatius per al seu negoci.

Amb aquests tipus d’informació, és més fàcil per a joves professionals o estudiants descobrir si el científic de dades seria un bon paper per a ells i com adquirir habilitats. L’aprenentatge STEM és cada cop més accessible a les escoles de tot el país, però no hi ha substitut per a la passió per la codificació i la tecnologia i la capacitat d’aprendre sobre la marxa.