Oye, Siri, ¿me oyes?

Existen varias formas de activar el asistente de voz en nuestros dispositivos, normalmente a través de botones físicos, pero para todas aquellas situaciones en las que nuestro dispositivo está fuera de nuestro alcance podemos usar «Oye, Siri».

Con esta frase Siri empieza a escuchar lo que tenemos que decir y nos devuelve una respuesta cuando terminamos. Hoy vamos a ver uno de los aspectos más curioso de nuestro asistente favorito: cómo es capaz de afinar el oído.

Por qué decimos «Oye, Siri»

El motivo por el cual cuando queremos que Siri nos escuche debemos decir «Oye, Siri» es porque se trata de un patrón concreto. Siri solo nos oye, no nos ve ni es consciente del contexto que rodea una interacción, de modo que necesitamos usar una «palabra mágica» para que Siri reconozca que nos dirigimos a él.

De entre todas las expresiones que Apple podría haber decidido utilizar para llamar a su asistente se debía escoger una que cumpliera dos requisitos fundamentales: ser natural en el contexto de una petición y reducir el número de falsos positivos.

Un falso positivo es cuando Siri piensa que hablamos con él y en realidad no es así. Aunque el caso opuesto, que estemos hablando con él y no nos conteste, tampoco es nada deseable.

Puntuación y umbral de confianza

De forma muy simplificada podemos decir que Siri solo se activa al detectar el patrón «Oye, Siri», pero se trata de un proceso muy complejo.

Siri escucha y analiza todas y cada una de las frases que oye y las puntúa de 0 a 100 según lo seguro que está de que la frase escuchada es «Oye, Siri». De modo que si escucha «buen tiempo» probablemente le dará una puntuación de 0 mientras que si oye «Osiris» puede que le asigne un 60.

Hasta aquí tenemos los diferentes patrones puntuados. Ahora veamos el umbral de confianza.

El umbral de confianza es el punto o la puntuación a partir de la cual Siri considera que ha acertado el reconocimiento y puede decidir que está seguro que ha oído bien.

Los ingenieros de Apple han ajustado cuidadosamente el umbral de confianza a partir del cual Siri se activa para optimizar que responda el máximo de veces que debe hacerlo y el mínimo de las que no debe.

¿Realmente ha dicho «Oye, Siri»?

Vamos a imaginar que el umbral de confianza está en el 75%, es decir que si Siri está seguro en más de un 75% de que ha oído «Oye Siri» se activará y de lo contrario no.

Ahora imaginemos la situación en que nosotros hemos dicho «Oye, Siri» pero que por distancia al dispositivo o por ruidos externos Siri le ha asignado una puntuación del 72%. En este escenario Siri no se activará, pues no está lo suficientemente seguro de que deba hacerlo, pero hace una cosa de lo más curiosa: afina el oído.

Por unos cuantos segundos Siri desciende el umbral de confianza, pongamos de un 75% a un 60%. De esta forma si repetimos exactamente el mismo «Oye, Siri» desde la misma distancia, en el mismo tono y con los mismos ruidos ambientales esta vez el asistente sí se activará y contestará.

Este comportamiento hace que, mientras en la mayoría de ambientes Siri no se active cuando no debe hacerlo, en aquellas situaciones en las que queremos llamarlo y no nos contesta no tengamos que gritarle, simplemente él nos escuchará con más atención.

Sin duda un carácter que además de gran utilidad dota de humanidad a nuestro buen amigo Siri.


Artículos relacionados: