Oye Siri, ¿y la privacidad?

A estas alturas todos conocemos a Siri, el asistente que desde nuestros dispositivos nos ayuda en muchas actividades que realizamos diariamente. Como ya vimos en este artículo Siri es más que un mero asistente de voz, pues cumple muchísimas funciones, desde la recomendación de páginas web durante la búsqueda hasta la creación de recuerdos en Fotos.

Hoy vamos a hablar de la función Oye Siri que nos permite llamar al asistente desde la distancia y sin tener que actuar físicamente con el dispositivo en forma alguna.

Oye Siri, para el usuario, funciona de la siguiente manera: cuando nosotros pronunciamos estas palabras el dispositivo nos responde.

Tenemos que entender lo que Siri puede o no puede hacer. Los ordenadores son excelentes en reconocer patrones. Es decir, durante la primera configuración que hacemos del dispositivo se nos pide que leamos algunas frases a Siri. De esta manera el sistema aprende a reconocer nuestra voz de entre las demás voces.

Siri está entrenado para encontrar el patrón de sonido que genera pronunciar Oye Siri. Es importante notar que Siri en nuestro dispositivo no es capaz de entendernos, solo detecta un patrón carente de significado.

Una analogía podría ser cuando nosotros oímos como llueve. Reconocemos que llueve pero no entendemos lo que la lluvia «dice», dejando de lado que la lluvia no tiene significado, Siri se siente igual cuando nos oye hablar.

Siri funciona con lo que llamamos un buffer de grabación, de forma conceptual podríamos entenderlo como una grabación de un tiempo corto que se va sobreescriviendo de forma continua. Es decir, que solo contiene, por ejemplo, los últimos 10 segundos.

Todo este procesado se hace en el dispositivo y nunca se guarda.

Solo cuando nuestro dispositivo detecta el patrón propio de Oye Siri, la grabación que lo contiene, de forma cifrada y además anónima (con un identificador aleatorio que no tienen ninguna relación con nuestra AppleID), viaja hasta los servidores de Apple.

Allí un centro de datos, huelga decir muchísimo más potente que nuestro dispositivo, procesa el sonido. Es en este punto donde el sonido adquiere un significado, pues se le asigna una transcripción.

Después de que el sonido sea transcrito el sistema es capaz de analizarlo y, gracias a la inteligencia artificial, entender qué le estamos diciendo.

Siri es capaz de entender una pregunta o una orden. Reconoce palabras clave como «busca», «reproduce», «cierra» y complementos a estas instrucciones como «en internet», «música» o «la ventana». Esta información viaja de vuelta a nuestro dispositivo y, si estas ordenes coinciden con las áreas de conocimiento de Siri, este las ejecuta en nuestro dispositivo.


Gracias a la enorme potencia de procesado de que disponen nuestros dispositivos Apple puede ponerles a cargo de las tareas más privadas, del reconocimiento de patrones y de la ejecución de las ordenes, por ejemplo. Solo la transcripción de la grabación viaja a los servidores de Apple de forma anónima y no es conservada.

Apple pone mucha dedicación en construir todos sus sistemas con la privacidad por diseño, es decir, que respeten la privacidad desde su concepción, y es de esperar que más temprano que tarde los dispositivos sean lo suficientemente potentes como para procesar todo el contenido de Siri por ellos mismos.

Artículos relacionados:

Deja un comentario