VeriSpeak SDK

Reconocimiento de registros de voz para aplicaciones autónomas o web

La tecnología de identificación de voz VeriSpeak está diseñada para desarrolladores e integradores de sistemas biométricos. El algoritmo de reconocimiento del orador con dependencia de un texto específico garantiza la seguridad del sistema por medio de una doble confirmación: autenticidad de la voz y de la frase. Las plantillas de registros de voz pueden ser comparadas en los modos 1 a 1 (verificación) 1 a N (identificación).

VeriSpeak está disponible como un conjunto de desarrollo de software que permite el desarrollo de soluciones autónomas y basadas en Web sobre las plataformas Microsoft Windows, Linux, Mac OS X y Android.

Características y capacidades

  • El algoritmo dependiente de texto impide el acceso no autorizado mediante una grabación encubierta de la voz del usuario.
  • Autenticación de dos factores: mediante la comprobación de la biometría de voz y la autenticidad de una frase de contraseña.
  • Los micrófonos comunes y teléfonos inteligentes son adecuados para la grabación de las voces de los usuarios.
  • Disponible como un SDK multiplataforma que soporta múltiples lenguajes de programación.
  • Los precios son razonables, la concesión de licencias flexible y el soporte al cliente gratuito.

El algoritmo de VeriSpeak implementa el enrolamiento de la voz y la comparación de registros de voz mediante el uso de tecnologías propietarias de procesamiento de sonido:

  • Algoritmo dependiente de texto. El reconocimiento del hablante dependiente del texto se basa en pronunciar la misma frase durante el enrolamiento y la verificación. El algoritmo VeriSpeak determina si una muestra de voz coincide con la plantilla que se extrae de una frase específica. Durante el enrolamiento se solicita que la persona que está siendo enrolada diga una o más frases. Más tarde, esa persona puede recibir la solicitud de pronunciar una frase específica para su verificación. Este método garantiza la protección contra el uso de una frase aleatoria de esa persona grabada en forma encubierta.
  • Autenticación de dos factores con una frase de contraseña. El algoritmo de comparación de registros de voz de VeriSpeak puede configurarse para trabajar en un escenario en el que cada usuario registra una única frase (como frase de contraseña o una respuesta a una "pregunta secreta" que es conocida sólo por la persona que está siendo enrolada). Más tarde, esa persona es reconocida por su propia frase específica con un alto grado de precisión. La seguridad global sistema se incrementa ya que se comprueban tanto la autenticidad de voz y como la contraseña.
  • Algoritmo dependiente de texto. El reconocimiento del hablante independiente de texto utiliza diferentes frases para el enrolamiento de los usuarios y su reconocimiento. Este método es más conveniente, ya que no requiere que cada usuario recuerde la frase de contraseña. Se puede combinar con el algoritmo dependiente de texto para realizar la búsqueda independiente de texto de manera más veloz, con posterior verificación de frase utilizando el algoritmo dependiente de texto, que es más confiable.
  • Detección automática de la actividad de voz. VeriSpeak es capaz de detectar cuándo las personas empiezan y terminan de hablar.
  • Detección de vida. El sistema puede solicitar a cada usuario que enrole un conjunto de frases únicas. Más tarde se le pedirá al usuario que pronuncie una frase específica del conjunto enrolado. De esta manera el sistema puede garantizar que una persona viva está siendo verificada (en oposición a un impostor que esté utilizando una grabación de voz).
  • Capacidad de identificación. Las funciones de VeriSpeak se pueden utilizar en comparaciones 1 a 1 (verificación) y 1 a N (identificación).
  • Múltiples muestras de la misma frase. Una plantilla puede almacenar varios registros de voz con la misma frase para mejorar la confiabilidad del reconocimiento. Ciertas variaciones naturales de la voz (por ejemplo, voz ronca) o cambios en el entorno (por ejemplo, dentro de la oficina o al aire libre) se pueden almacenar en la misma plantilla.
  • Comparación fusionada. El sistema puede pedirle a los usuarios que pronuncien varias frases específicas durante la verificación o la identificación del hablante y combinar cada muestra de audio con los registros de la base de datos. El algoritmo VeriSpeak puede fusionar los resultados de la comparación para cada frase en conjunto a fin de mejorar la confiabilidad de la comparación.