miércoles, 18 de abril de 2018

Apple explica cómo entrena a Siri para reconocer tu voz

Apple ha publicado una nueva entrada en su Machine Learning Journal que explica cómo entrena a Siri para que reconozca su voz. Apple llama a este PHS o 'Personalizado Hey Siri'. Consiste en dos métodos para la inscripción del usuario: explícito e implícito. Durante la configuración de su dispositivo, se le pedirá que pronuncie algunas frases que comienzan con Hey Siri. Esta es una inscripción explícita. Con el tiempo, Apple agrega expresiones pronunciadas por el usuario principal en situaciones del mundo real. Esto es inscripción implícita.

En cada dispositivo habilitado para "Hey Siri", almacenamos un perfil de usuario que consiste en una colección de vectores de altavoces. Como se discutió anteriormente, el perfil contiene cinco vectores después del proceso de inscripción explícita. En la etapa de comparación de modelos de la figura 1, extraemos un vector de altavoz correspondiente para cada enunciado de prueba entrante y calculamos su puntaje de coseno (es decir, un producto de punto normalizado por longitud) contra cada uno de los vectores de parlante actualmente en el perfil. Si el promedio de estos puntajes es mayor que un umbral predeterminado (λ), entonces el dispositivo se despierta y procesa el comando subsiguiente. Por último, como parte del proceso de inscripción implícita, agregamos el último vector de altavoz aceptado al perfil de usuario hasta que contiene 40.

Más detalles en la publicación completa vinculada a continuación …

No hay comentarios:

Publicar un comentario