Tecnologia de reconeixement de veu: útil o dolorosa?

Autora: Judy Howell
Data De La Creació: 28 Juliol 2021
Data D’Actualització: 1 Juliol 2024
Anonim
Tecnologia de reconeixement de veu: útil o dolorosa? - Tecnologia
Tecnologia de reconeixement de veu: útil o dolorosa? - Tecnologia

Content


Emportar:

Interactuar amb l'electrònica conversacional és cada cop més comú - i és necessari. Però fins ara, els resultats es barregen decididament.

Alguna vegada ha trucat a una empresa per obtenir ajuda o pagar la factura, només per rebre una agradable i enregistrada veu que vol tenir una conversa amb vostè, però no entenc la meitat del que estàs dient? O potser és propietari d’un iPhone i, si Siri va semblar com un bon aliat, t’has adonat que de vegades (està bé, deixem de ser sincer, sovint) ella no ho aconsegueix? La tecnologia de reconeixement de veu (VRT), també coneguda com a veu-parla, entra en un parany comú: té un potencial increïble (i noies, estem arrelant-ho), però més sovint és un exercici de picat de dents. en la frustració.

Una vegada que es va fer una idea que pertanyia a l’àmbit de la ciència ficció, el reconeixement de la veu ha crescut des de la seva infància a la dècada de 1950, quan el sistema Audrey de Bell Laboratories Audrey va ser dissenyat per reconèixer els dígits parlats en una sola veu, a la moderna xarxa d’electrònica conversacional que ara interactuem amb diàriament, amb resultats mixtos.

Per parlar amb un ésser humà, premeu 0

Moltes de les empreses actuals utilitzen ara sistemes anomenats resposta de veu interactiva (IVR) per gestionar les trucades d’atenció al client. L’ús més comú és per als menús de navegació per veu, però algunes empreses utilitzen sistemes d’IVR que poden accedir a la informació del compte del client i respondre preguntes menors. El programari del menú IVR sol tenir un vocabulari limitat, que pot restringir-se a "sí", "no" i números. Els sistemes més complicats poden reconèixer paraules i frases específiques de l’empresa.

Aquests sistemes són cada vegada més populars (almenys per a empreses) per una simple raó: són rendibles. Segons un informe del 2010 de Wall Street Journal, una trucada típica del client que arriba a un agent costa entre 3 i 9 dòlars, mentre que una trucada gestionada a través d’un sistema automatitzat només costa entre cinc i set cèntims. I, per descomptat, els programes informàtics no es cansen, criden malalts ni es frustren amb els clients (tot i que els clients, certament, es frustren amb ells).

Afortunadament, això no sempre significa que l'IVR es tregui de la feina a les persones, o almenys, que totes les persones desapareguin dels centres d'atenció telefònica. Aquests ajudants activats per veu permeten que els representants d’atenció al client humà siguin més productius dirigint trucades i responent a preguntes senzilles.

Per descomptat, per als usuaris humans que interactuen amb aquestes tecnologies, la seva navegació no sempre és fluida. La tecnologia ajuda a millorar els problemes comuns de la tecnologia d’IVR, com ara els problemes d’accentuacions, però el saqueig de sistemes automatitzats continua sent un tema comú en línia. Doneu un cop d'ull a aquest còmic còmic sobre un ascensor equipat amb reconeixement de veu, que posa de manifest la frustració que poden produir desperfectes en els sistemes d’IVR.

Aplicacions per a telèfons personals: Siri, Google Now

La majoria de les persones coneixen el reconeixement de veu per als telèfons intel·ligents. Si bé la majoria dels últims models de telèfon tenen VR, la seva popularitat i notorietat van augmentar quan Apple va presentar Siri, el "assistent personal" lleugerament sarcàstic i activat per veu per a l'iPhone 4S el 2011. Google va crear ben aviat un competidor directe: Google. Ara per al sistema operatiu Android Jelly Bean. Tots dos sistemes presenten veus femenines i funcions de reconeixement sofisticades que permeten als usuaris "parlar" amb els telèfons mitjançant un llenguatge casual.

Però, si bé aquests sistemes són molt més sofisticats i funcionals que els seus predecessors, també demostren que la tecnologia encara té molt camí per recórrer. Les bromes sobre el fracàs de Siris s’han convertit en un popular meme Internet. Un home fins i tot va demandar a Apple per publicitat falsa sobre les capacitats de Siris.

Potser per això, si bé Apple va crear Siri per ser informatiu i avançat, el programari de VR també és una mica descarat. Per exemple, si parleu d’una de les línies tecnològiques d’intel·ligència més infames de la història del cinema de la pel·lícula de 1968 "2001: A Space Odyssey" - "obriu les portes del portell" - Siri respondrà amb la línia de resposta de la pel·lícula ". Ho sento (el vostre nom), tinc por que no pugui fer-ho, o més sarcàstic, "els agents d'intel·ligència mai no hi viuran tan aviat, segons sembla".

Trucar-te pel nom és només una de les funcions que tracta de fer més fàcil estimar a Siri i una mica més humana. L’assistent de VR pot seguir comandaments de veu per fer trucades, prendre dictats i realitzar cerques d’informació a Internet, trobar botigues properes, donar indicacions de conducció i molt més, sense necessitat de tocar res. El telèfon parla simultàniament de les respostes i es mostra a la pantalla.

Google Now, la porció VR de la plataforma Android Jelly Bean, s’assembla molt a Siri. El sistema ofereix les mateixes àmplies capacitats de reconeixement mitjançant la traducció de la veu casual a ordres que permeten als usuaris realitzar trucades, s, executar cerques, realitzar càlculs i conversions, agafar definicions de paraules, configurar alarmes, reproduir cançons i obtenir mapes i indicacions.

Amb assistents personals de veu com Siri i Google Now, els avantatges són evidents. Tot, des de trucar i fer servir fins a la cerca i entreteniment, és més ràpid i fàcil. Només heu de dir el que vulgueu i, (la majoria de vegades,) l'aplicació VR us agrada. La tecnologia hands-off de VR és especialment útil durant la conducció. I, tot i que moltes persones han decretat els defectes de Siris, i els escriptors han defensat que la capacitat de Google Nows per executar essencialment la vida dels usuaris és una mica insultant, la majoria de les persones encara senten que aquestes tecnologies futuristes són força divertides.

Per descomptat, les aplicacions de telèfons personals com Siri i Google Now no estan perfectes, tot i que demostren cap a on es podria dirigir aquesta tecnologia en el futur. Això vol dir que, fins i tot quan Siri mostri una resposta equivocada, és probable que riu i perdonés, sabent que la següent versió serà molt millor.

On VR cau plana

Si alguna vegada heu trobat un VIV quan heu trucat a una empresa, és possible que hagueu observat algunes barreres a la comunicació. Alguns programes utilitzen una veu robòtica en veu alta que pronuncia malament les paraules i dificulta la comprensió de les coses. Altres tenen problemes de sensibilitat que donen com a resultat que el programari no pot processar el que estàs dient si estàs massa fort, massa suau o no enunciant-ho amb cura.

A més, moltes persones encara no se senten còmodes parlant amb una màquina. Si feu unes quantes cerques a l’IVR, trobareu llistes de persones que han combinat maneres d’evitar els sistemes d’IVR i arribar a una “persona real”. Aquestes solucions van des de "seguir pressionant 0 per a un operador" fins a "jurar la màquina fins a obtenir un ésser humà". Com a resultat, bona part del recent desenvolupament dels sistemes d’IVR ha girat al voltant del que els fa més agradables per als humans; fer que les veus siguin més simpàtiques i menys robòtiques, fent que el sistema sigui més fàcil de navegar, i permetent als trucadors saber el temps que es durà de tot a principi fins al final. Això suggereix que la millor tecnologia és només la meitat de la batalla aquí; l’altra meitat fa que els usuaris puguin parlar a casa amb una màquina.

El que té el futur

Malgrat aquests reptes, la tecnologia de reconeixement de veu millora constantment. Aplicacions com Siri i Google Now (defectes i tot) són encara impressionants en el seu rendiment i diverses empreses estan ampliant les capacitats de VR a altres aplicacions.

Per exemple, Nuance, els creadors del programari de veu a Dragon NaturallySpeaking, ja ha desenvolupat controls de veu per a televisions i automòbils, i s’incorporen versions d’aquesta tecnologia a alguns televisors Samsung i als sistemes d’entreteniment SYNC utilitzats en determinats vehicles Ford.

I mentre Google i Apple continuen trobant nous usos per a les seves tecnologies de reconeixement de veu, és probable que estiguin parlant cada cop més amb tot tipus de màquines quotidianes, des de les televisions fins a les nostres torradores. I, una vegada més, sembla que la ciència ficció tenia raó. Bé, només haurem d’esperar que aquells intel·ligents escriptors s’equivocessin en alguna cosa. Si aquestes màquines es fan càrrec, podríeu tenir molts problemes la propera vegada que demanis a Siri que "obri les portes de la marineta".