¿Por qué la industria de la automatización del hogar está tan obsesionada con el control por voz?

Algunos de nosotros tenemos esposos o esposas. Algunos de nosotros tenemos socios. Algunos de nosotros tenemos compañeros de cuarto. Pero la mayoría de nosotros tenemos una IA en estos días, ya sea Siri en nuestro iPhone o Alexa desde un Echo en la cocina.

¿Cómo te comunicas con tu IA tan íntimamente como lo haces con tu esposa, pareja o compañero de cuarto? Es una pregunta con la que empresas como Google, Apple y Amazon han estado luchando durante los últimos años. Pero es Mark Zuckerberg de Facebook quien tiene la mejor respuesta hasta ahora: por mensaje de texto.

Por lo menos parte del tiempo.

Daniel Terdiman de Fast Company nos dio un recorrido por el autodenominado «Jarvis» del fundador de Facebook, Mark Zuckerberg: una IA completa para la automatización del hogar, cuya creación se fijó como su Resolución de Año Nuevo 2016.

Los parámetros de lo que llamaremos «Jarvis» (¡con deferencia a Marvel Entertainment !) son bastante sencillos. Como le dijo el fundador de Facebook a Fast Company :

No es un sistema de producción que esté listo para ir a otras personas. Pero si no pudiera construir un sistema que al menos pueda hacer lo que [Echo y Home pueden], probablemente me habría decepcionado bastante.

Esos sistemas, Google Home y Amazon Alexa, permiten a los usuarios controlar cualquier cosa compatible en sus hogares (sus luces, termostatos, sistemas de seguridad, centros de entretenimiento y más) a través del control por voz. Lo cual es bastante estándar: Apple está tratando de hacer lo mismo con Siri y HomeKit.

Pero la observación clave de Zuckerberg no es que la gente quiera poder controlar sus hogares con la voz. Es que ellos también quieren poder controlar sus casas por mensaje de texto. Como Terdiman escribió:

Hablar con Jarvis y hacer que responda tiene sentido para reproducir música. (En la demostración que obtuve, Jarvis habla con una voz femenina sintetizada muy variada, no muy diferente a la de Siri o Alexa; Zuck está a punto de conseguir que una persona conocida proporcione voces personalizadas). Pero Zuckerberg descubrió que en muchos otros casos, el texto era más deseable, especialmente cuando había otras personas alrededor.

“Si estoy dejando entrar a alguien en la puerta. . . eso no es relevante para las personas que me rodean”, dice [Zuckerberg], “así que prefiero enviarlo por mensaje de texto”.

En este momento, las empresas asumen que la voz eventualmente será el sistema operativo de la automatización del hogar. Imaginan a la IA como una especie de sirviente compañero de habitación invisible: alguien a quien regañamos en voz alta cuando tenemos demasiado frío, o queremos que alguien presione el timbre o ponga música diferente. Y cuando queremos mandarles, pronunciamos nuestros pedidos en voz alta, al aire, esperando que ellos, con servilismo tecnológico, nos escuchen y comprendan.

Eso es justo, pero es la mitad de la imagen. La idea clave que tiene Zuckerberg es que habrá ocasiones en las que no querremos pronunciar ostentosamente nuestras órdenes. Habrá momentos de mando más tranquilo. Momentos en los que estás conversando con tus invitados a la cena, y suena el timbre de tu puerta. ¿Cómo preferirías escucharlo? ¿Un estruendo ensordecedor que interrumpe a todos, seguido por la calamidad de los cuerpos que fluyen hacia la puerta? ¿O un zumbido insistente en su teléfono, al que puede responder con la eficiencia de un mensaje de texto?

Evidentemente esto último. La verdad es que llevar una IA a nuestra casa es una sociedad, como cualquier otra. Y no siempre nos comunicamos con nuestros socios por voz. Si estoy sentado en el sofá con mi esposa, sí, hablamos entre nosotros, pero especialmente en presencia de otros, nos enviaremos mensajes de texto, porque el texto es la interfaz de usuario invisible en nuestro hogar. Es la capa oculta que usamos para decirnos unos a otros que bajen la calefacción, que revisen la puerta, que cambien la música o, ¡sí!, a veces nos enviamos dulces palabras cuando hay otros en la habitación.

Eso es lo que Zuck ha construido él mismo. Su Jarvis no es la IA más inteligente del bloque, de ninguna manera. El artículo de Terdiman muestra múltiples ejemplos de cómo la IA de Zuckerberg no comprende los comandos de voz del fundador de Facebook. Pero eso también sería cierto para Siri, Alexa o Google. Lo que Zuck reconoció es que hay ocasiones en las que es simplemente raro, o inapropiado, gritar tus órdenes al aire.

Obviamente, todo esto está en línea con las aspiraciones de chatbot de Facebook Messenger, anunciadas en 2015 . Pero Zuckerberg tiene palabras sabias sobre por qué una línea de comando solo de voz aún no funciona con IA:

Si entrena un sistema de aprendizaje automático con datos de Google de personas que hablan con un motor de búsqueda, funcionará relativamente peor en Facebook para comprender a las personas que hablan con personas reales. En el caso de Jarvis, entrenar una IA con la que hablarás a corta distancia también es diferente de entrenar un sistema con el que hablarás desde el otro lado de la habitación, como Echo. Estos sistemas son más especializados de lo que parece, y eso implica que estamos más lejos de tener sistemas generales de lo que parece.

En otras palabras, las personas hablan entre sí usando una sintaxis diferente a la que usamos para hablar con las IA. Es un problema del huevo y la gallina: hasta que empecemos a hablar con las IA como personas, las IA no tendrán suficientes datos para entender cómo hablar con personas como personas.

Mientras tanto, los mensajes de texto, especialmente en situaciones de ambigüedad, tienen más sentido. Todos hemos pasado la mayor parte de la década comunicándonos con la interfaz de búsqueda similar a texto de Google. Sabemos cómo enviar mensajes de texto a las máquinas, y el propio medio del texto nos entrena para entrar en una sintaxis más parecida a la de una máquina. ¿Pero hablar con las máquinas? Pase unos minutos vacilando con Alexa, y Zuck parece más correcto por segundos. Simplemente no estamos listos todavía. Y por eso, las IA tampoco lo son.

Rio Casma SAC