4 Mites sobre l'inici d'un projecte d'aprenentatge de màquines

Content

Mite # 1: Sempre són millors les dades
Mite # 2: Les dades que tenim són prou bones
Sense errors, sense estrès: la vostra guia pas a pas per crear programes que canvien la vida sense destruir la vida
Mite # 3: És massa aviat per a nosaltres!
Mite # 4: L’aprenentatge de màquines és sempre el mateix
Mite # 5: L’aprenentatge de màquines només funciona amb dades curosament acurades

Font: monsitj / iStockphoto

Emportar:

Obteniu informació sobre aquests mites de l'aprenentatge automàtic per orientar-vos millor a l'adopció empresarial.

No és una cosa a prendre a la lleugera: començar amb un projecte d'aprenentatge automàtic pot ser un procés desagradable per als executius que vulguin aprofitar aquesta tendència informàtica, però poden tenir el coneixement propi per entendre realment els aspectes del que fa la màquina. els projectes d’aprenentatge marquen.

Aquí parlarem sobre algunes de les idees bàsiques que tenen un impacte en la manera com les empreses desenvolupen tecnologies d'aprenentatge de màquines en un mercat que canvia ràpidament. (La ciència de dades és un altre negoci que s’està implementant, però, en què es diferencia de ML? Esbrineu-vos a la ciència de dades o a l’aprenentatge automàtic? Heu com es detecta la diferència.)

Mite # 1: Sempre són millors les dades

Realment és un dels majors mites de l'aprenentatge automàtic. La gent pensa que més dades significa més capacitat d'aprofundir en els coneixements que poden actuar. En alguns casos, tenen raó, però sovint, la inversa pot ser certa.

Més dades només són millors si es tracta de dades rellevants que s’afegeixen a tota la imatge. Les dades han d’ajustar-se al model d’aprenentatge de màquines o el programa pot patir alguna cosa anomenada “overfitting” on els resultats d’aprenentatge automàtic no apareixen de la manera que haurien de fer.

"La causa d'un mal rendiment en l'aprenentatge de màquines consisteix en un ajustament o una adequació adequada de les dades", escriu Jason Brownlee a Mastery Learning Machine.

En estadístiques, una adaptació es refereix a com s’aproxima bé la funció d’orientació. Aquesta és una bona terminologia que s’utilitza en l’aprenentatge automàtic, ja que els algoritmes d’aprenentatge automàtic supervisats busquen aproximar la funció de mapatge subjacent desconeguda per a les variables de sortida donades les variables d’entrada. Les estadístiques sovint descriuen la bona adequació que es refereix a les mesures utilitzades per estimar fins a quin punt l’aproximació de la funció coincideix amb la funció objectiu.

En poques paraules, dades externes poden causar problemes greus. Abans de posar en marxa un projecte d'aprenentatge de màquines, els executius i altres grups d'interès han de fer una idea i saber quins són els tipus específics de dades que proporcionaran la base adequada per avançar.

Mite # 2: Les dades que tenim són prou bones

De nou, els processos d'aprenentatge automàtic funcionen en models de dades molt precisos. Les dades no són prou bones, tret que estiguin orientades de manera clara, que siguin recollides o avaluades per tenir en compte coses com el biaix i la variació.

Sense errors, sense estrès: la vostra guia pas a pas per crear programes que canvien la vida sense destruir la vida

No podeu millorar les vostres habilitats de programació quan ningú es preocupa per la qualitat del programari.

Una cosa de la que escolteu molt en el món de l’aprenentatge de màquines és el biaix incontrolat. L’aprenentatge automàtic pren els nostres biaixos humans i els amplifica picant les dades que el programa obté en resultats potencialment extrems.

Això vol dir que les dades han de ser orientades més per compensar aquesta tendència.

Mite # 3: És massa aviat per a nosaltres!

Algunes empreses es preocupen que sigui massa aviat perquè s’apropin a l’aprenentatge automàtic. Però si parleu amb molts innovadors i empresaris, diran que és exactament el moment per entrar a la planta baixa.

Sigui on sigui aquesta tendència informàtica, voleu estar per davant de la corba. En l'avantguarda és la millor posició. Esperar que tot estigui perfecte pot costar un negoci a llarg termini. (Per obtenir més informació sobre les raons per les quals les empreses encara no han implementat ML, vegeu 4 bloquejos de carreteres que estan pendent de l'adopció de l'aprenentatge automàtic.)

Mite # 4: L’aprenentatge de màquines és sempre el mateix

Definitivament, hi ha un ampli ventall de programes d’aprenentatge automàtic.

Alguns d’ells es troben fonamentalment amb un sol algoritme: són matemàticament llegibles i transparents. Els enginyers poden veure com les dades que es corresponen es relacionen amb les sortides del sistema.

Altres processos d'aprenentatge automàtic són molt més elaborats i difícils d'entendre. Les xarxes neuronals compostes per neurones artificials poden convertir-se fonamentalment en una “caixa negra” on fins i tot els millors enginyers tenen un temps de seguiment de dades a través del sistema o que expliquen el funcionament dels algoritmes.

"Les tecnologies més hàbils, és a dir, les xarxes neuronals profundes, són notòriament opaques, i ofereixen poques pistes sobre com arriben a les seves conclusions", escriu Ariel Bleicher a Scientific American, tot passant per aspectes d'aquest essencial grup.

Eines com les xarxes d’estat eco prenen aquesta idea de caixa negra i funcionen amb ella. Això fa que sigui més difícil comprovar del tot el funcionament d'aquests sistemes.

Mite # 5: L’aprenentatge de màquines només funciona amb dades curosament acurades

Si bé el punt anterior sobre dades de precisió continua essent cert, dos tipus diferents d’aprenentatge automàtic funcionen fonamentalment diferents.

Un tipus d’aprenentatge automàtic anomenat aprenentatge automàtic supervisat tracta de dades etiquetades: les dades de formació ja tenen etiquetes per descriure les seves propietats i categories.

Un altre tipus d'aprenentatge automàtic s'anomena aprenentatge automàtic no supervisat. Tracta de dades sense etiquetes.

L’aprenentatge automàtic no vigilat pren dades brutes i la màquina l’analitza fonamentalment per a les característiques i les agrupa per categories per si soles. Hi ha molts potencials en els dos tipus d'aprenentatge automàtic, però és més fàcil configurar un programa amb dades etiquetades per a l'aprenentatge automatitzat supervisat. L’aprenentatge automàtic no vigilat és un tipus d’aigües sense cobrir per a moltes empreses.

Aquestes són algunes de les consideracions que podeu tenir i les idees errònies sobre l'aprenentatge automàtic que poden causar problemes en l'adopció de l'empresa. Tant de bo això hagi ajudat a esborrar certa confusió sobre els projectes d’aprenentatge automàtic.