Skip to content

Del “voice search” al “voice interface”. De la información al servicio.

No es necesario recordar como Google ha cambiado nuestra vida, basta solo pensar en como era un día a día sin buscador, sin Google maps, sin Youtube hace algo así como ¿15 años? Ahora bien, pensar en ese mundo pre-Google nos ofrece hoy una reflexión interesante, nuestro comportamiento actual no siempre fue así y sin ser conscientes hemos interiorizado comportamientos que no son inherentes a nuestra manera de pensar, que son más artefactos culturales fruto de nuestra relación con ciertos dispositivos, más que fruto de la normalidad en como nos comunicamos/comportamos, es decir, nuestra relación con una interfaz ha influido nuestra manera de comportarnos, en concreto la de “hablar” con las máquinas, generando un comportamiento “antinatural”.

Me gustaría aquí llamar la atención sobre dos de estos aspectos “antinaturales” al hablar con máquinas.

1- La simplificación del lenguaje al utilizar los buscadores. Hemos interiorizado a base de aprendizaje, que los buscadores, llegan hasta donde llegan, que son buenos a la hora de devolvernos una información, pero malos para realizar una acción o darnos una respuesta y sin ser conscientes hemos ido simplificando nuestro lenguaje, generando una búsqueda para eliminar subjetividad y tratar de evitar problemas de comprensión. Es decir, de nuestra necesidad ¿dónde puedo llevar a mi chica a cenar esta noche?, nuestro cerebro acaba generando una búsqueda del tipo “restaurante Madrid” ó siendo generoso “restaurante romántico Madrid“. Esta simplificación implica un aspecto importante, estamos eliminando la capacidad de decisión del buscador, esperamos básicamente un listado de opciones, sobre las cuales nosotros decidir. Es importante añadir, no es que nos guste decidir, es más una adaptación porque las máquinas no nos han conseguido entender. Es decir, sin ser conscientes hemos ido pasando al utilizar los buscadores de dejar de utilizar preguntas más complejas, que impliquen un procesado subjetivo, una recomendación, por simplemente buscar información sobre la cual podamos elegir, hemos pasado de preguntar “¿Qué cocino hoy?” “¿dónde llevo a mi novia a cenar?” o “¿qué nueva banda podría escuchar?” por buscar información del tipo “receta pollo patatas“, “restaurante romántico Madrid” ó “mejores grupo rock 2018“.

2- El concepto de URL. La incapacidad de procesar estas preguntas más complejas, de entender la profundidad de la pregunta, se acabó resolviendo en un concepto muy artificial y nuevo, el concepto de URL. El concepto de URL se asemeja al de la página de un libro, lo que han conseguido los buscadores, es hacernos pensar que todo lo que buscamos está en una página de un libro ya escrito y básicamente lo que deberías hacer es ajustar tu búsqueda para que la pueda relacionar con algo ya existente, algo que en el mundo real no funciona así. Otro aspecto relevante sobre la extracción de la información asociada a una URL es que hay una elección, la información es estática, yo te muestro la que tengo y tú como usuario debes elegir, documentarte y sacar el valor.

Toda esta realidad ha supuesto un gran avance, gran parte de nuestras dudas son informacionales y obviamente ante una necesidad concreta, la información es la mejor manera de tomar una decisión, pero también es cierto que nos limitaba otros aspectos, aspectos más relacionados con el servicio, con el poder “hacer algo” para ti.

Ante este panorama, aparecen los dispositivos de voz, esos cacharros que van a estar presentes en cada rincón de nuestra casa, escuchando de forma continua cada cosa que decimos, cacharros que pertenecen al mundo “zero interface“, es ek “voice UI“. Pues bien estos “cacharros” revolucionan los dos aspectos que venían marcando nuestro comportamiento en el mundo buscador/información.

1- La interacción por voz devuelve la naturalidad al lenguaje. Obviamente este patrón puede ser alterado, pero es cierto, que estos dispositivos de voz tienen mejor comprensión del lenguaje y hemos asociado su uso a otros servicios que jamás habríamos pensado en preguntar a un buscador como “¿Cuál es mi agenda del día?“, “¿Puedes ponerme música?“, “Pide mi pizza favorita“. Todos damos por hecho que si pongo en Google “Big Mac con coca cola” no queremos que nos lo traigan, algo que si podría suceder con estos interfaces de voz.

Esto sin duda, abre un nuevo horizonte respecto a nuestra relación con la tecnología y es por ello que todos los grandes se han lanzado y por lo que Google ha entrado con todo a este área (imagina un mundo donde no buscamos, sino pedimos acciones).

2- Los dispositivos por voz eliminan la URL como elemento clave para alojamiento de la información, teniendo que realizar un procesado más complejo. “pide mi pizza favorita”, “¿cuál es mi saldo bancario?”, esto ya no va de mostrar un listado de datos de contacto de pizzería, estamos pidiendo mucho más, un conocimiento personal, una interrelación y procesado de información más elaborado y una respuesta clara (no hay más elección). De aquí la importancia de los “chatbots”, entendidos como algoritmos que ofrecen una respuesta a una pregunta que imitan al lenguaje natural.

Y bien ¿cómo me enfrento a este cambio? Pues bien, no parece tarea sencilla y sin duda habrá que ponerse a explorar, algunas ideas que me pueden venir a la cabeza.

  1. Seguir investigando. Al final, si no tenemos claros los casos de uso, poca lógica de programación podremos aplicar.
  2. Los lingüistas se volverán a poner de moda, entender la sintaxis, lógicas del lenguaje etcétera será clave.
  3. Tendremos que seguir trabajando en crear lógicas de programación y secuencias cada vez más complejas. Esto se lo tendremos que dejar a los buenos programadores.
  4. De nuevo, la web semántica, que no es más que poder dotar de significado gracias a un lenguaje de marcado a la información existente. (Aquí los amigos de los buscadores ya juegan con ventaja).
  5. Más data y personalización. Igual es algo obvio, pero si espero respuestas concretas (personalizadas), la tecnología necesita más contexto y eso se traduce en el conocimiento de más datos. Pensemos en el proceso en el momento en que pregunte a un dispositivo “¿cuál es mi saldo bancario?”, voy a necesitar: validar quien eres (para ofrecer información personalizada para ti), acceder a un servicio, poder identificar la entidad “saldo” y devolverla… ahí es nada.

Pero vamos, esto por empezar a marcar algunas vías de pensamiento, lo importante sobre todo va a ser estar atento y empezar a cambiar el “chip”, al humanizar la tecnología, volvemos a humanizarnos en nuestro trato con ella.

Sé el primero en comentar

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *