Quina diferència hi ha entre el discurs i el text de xat?

Content

P:

Quina diferència hi ha entre la paraula de veu i el chatbots?

R:

Les nombroses diferències significatives entre les tecnologies de parla a veu i els chatbots formen part del que s’està examinant en la ràpida evolució dels projectes de chatbot i voicebot.

Un sistema de parla a tecnologia és simplement aquell que converteix el discurs verbal en una pàgina digital. Aquesta és la seva funció completa, però no és senzilla de dissenyar. Per convertir la parla verbal en, la tecnologia ha de desglossar paraules i frases en fonemes individuals i treballar amb ells segons algoritmes complexos per crear que sigui exacte i que representi el que va dir el parlant.

Els chatbots, d’altra banda, són tecnologies que compleixen l’objectiu de comunicar-se amb un humà. Hi ha dos tipus de chatbots: els chatbots i els bots de veu. Els xerrades han estat molt més llargues, perquè no necessiten l’element de veu que fan servir els correus vocals.

La principal diferència entre les tecnologies de parla i les xerrades de xat és l’abast. Com s'ha esmentat, tot el que cal parlar de tecnologia és transcriure el discurs verbal. El xat de xat, per la seva banda, ha de prendre un discurs en la forma que estigui adreçat, entendre-ho i proporcionar respostes que busquen passar la prova de Turing, la prova de si una tecnologia pot enganyar un humà a pensar que ell o ella és. parlant amb una altra persona.

Tenint això en compte, els chatbots són molt més fàcils de crear que els bots de veu. El chatbot acull els humans i proporciona una resposta. Fins i tot els chatbots relativament simples han pogut proporcionar resultats interessants i agradables per als humans des de finals dels anys vuitanta i principis dels noranta.

El bot de veu, d’altra banda, ha d’adoptar la parla verbal, convertir-la en, comprovar-ne la precisió, produir una resposta i crear aquesta resposta des del llenguatge de la màquina en un discurs audible. Aquest gran nombre de tasques força significatives significa que la bústia de veu requereix molta potència informàtica i molt de disseny per crear.

Projectes com Siri, Cortana i Alexa demostren part de l'avantguarda de les tecnologies de voicebot. També il·lustren que aquesta tecnologia encara està a la seva infància. Tot i que Alexa i altres tecnologies poden respondre verbalment a la parla humana, no són extremadament capaces en el sentit que ens associem amb el discurs verbal verbal en general. És a dir, hi ha una limitació per a les respostes que aquestes tecnologies poden proporcionar. Hi ha fins i tot una capacitat limitada de la generació d’assistents personals d’avui en dia per generar discurs per, per exemple, amb els propòsits de transcriure o ajudar algú a escriure un assaig sense utilitzar les seves mans. Alguns dels programes específics d’expressió al mercat ho fan millor que Siri o Cortana, probablement a causa de l’assignació de recursos. Tanmateix, hi ha indicis que aviat s’enlairarà el progrés de la veu, com ara la plataforma Amazons Lex que permet un entorn d’estudi per a la creació d’aquest tipus de tecnologies.

En un assaig intel·ligent i instructiu sobre el tema, Tobias Goebel parla de la diferència entre aquestes tecnologies, contrastant el procés de “transcripció”, que fa el discurs, a la feina d’entendre, que se suposa que fan els chatbots.

"Si bé elimina la necessitat de reconeixement de la veu, les coses són més fàcils per a un chatbot, el principal repte per crear bots que funcionen rau en la comprensió del llenguatge natural", escriu Goebel.

Goebel també identifica molts dels actors actuals del sector:

El líder del mercat per al reconeixement de la veu és Nuance, que es troba al darrere de sistemes molt coneguts com Dragon NaturallySpeaking per a dictar en un PC, que es troba des dels anys noranta, però també Siri: la tasca de reconeixement / transcripció del discurs realitzada al núvol d'Apple utilitza Tecnologia de matisos darrere dels escenaris. Altres són LumenVox, Verbio o Interaccions, però ara es reconeix el reconeixement de la veu com a servei de núvol mitjançant API també com Amazon, Google, Microsoft i IBM.

A mesura que els xat bots es desenvolupen, se suposa que la seva comprensió continuarà augmentant en alguna trajectòria, i també se suposa en gran mesura que més tecnologia bot passarà de les interfícies a les interfícies verbals, requerint quantitats addicionals de potència informàtica.