Xarxes Q profundes

Autora: Laura McKinney
Data De La Creació: 5 Abril 2021
Data D’Actualització: 26 Juny 2024
Anonim
Haec Díes - Clamavi De Profundis
Vídeo: Haec Díes - Clamavi De Profundis

Content

Definició: què significa Deep Q-Networks?

Les xarxes Deep Q (DQN) són xarxes neuronals (i / o eines relacionades) que utilitzen l'aprenentatge Q profund per proporcionar models com la simulació de jocs de videojocs intel·ligents. En lloc de ser un nom específic per a una creació de xarxes neuronals específiques, les xarxes Deep Q poden estar compostes per xarxes neuronals convolucionals i altres estructures que utilitzin mètodes específics per conèixer diversos processos.


Una introducció a Microsoft Azure i al Microsoft Cloud | Durant aquesta guia, podreu conèixer què és la informàtica en núvol i com Microsoft Azure us pot ajudar a migrar i executar el vostre negoci des del núvol.

Techopedia explica Deep Q-Networks

El mètode d’aprenentatge Q profund utilitza normalment una cosa anomenada iteració general de polítiques, descrita com la conjunció d’avaluació de polítiques i iteració de polítiques, per aprendre polítiques d’aportació sensorial d’alta dimensió.

Per exemple, un tipus comú de xarxa Q profunda coberta en publicacions de tecnologia com Medium aporta aportacions sensorials de videojocs Atari 2600 per modelar els resultats. Això es fa a un nivell molt fonamental recollint mostres, emmagatzemant-les i utilitzant-les per a la reproducció d’experiència per tal d’actualitzar la xarxa Q.


En un sentit general, les xarxes Q profundes entrenen en entrades que representen jugadors actius en àrees o altres mostres experimentades i aprenen a combinar aquestes dades amb les sortides desitjades. Es tracta d’un mètode potent en el desenvolupament d’intel·ligència artificial que pot jugar a jocs com escacs a un nivell elevat o realitzar altres activitats cognitives d’alt nivell: l’exemple de joc de videojocs d’Atari o d’escacs també és un bon exemple de com utilitza l’AI. tipus d’interfícies que tradicionalment eren utilitzades pels agents humans.

És a dir, amb l'aprenentatge Q profund, el jugador d'AI arriba a ser més com un jugador humà en aprendre a assolir els resultats desitjats.