Nuestro agente biométrico solicita un video-selfie en el que se te pide pronunciar un código, por ejemplo "5782".

A partir de ese video, el sistema debe evaluar si realmente dijiste el código solicitado o si se trata de un intento de suplantación con un video pregrabado.

Para saber si dijiste el código correcto, se compara tu frase con la esperada usando herramientas que evalúan su similitud.

¿Cómo se mide la similitud entre dos frases?

Las computadoras no entienden el lenguaje como las personas, por eso los sistemas de verificación por voz usan métricas que comparan frases.
Estas métricas miden cuán similares son, en una escala de 0 (muy diferente) a 1 (casi idéntico), para saber si lo dicho coincide con lo esperado.

Lo hacen por medio de diferentes métodos; a continuación te ilustramos con algunos:

Sequence Matcher

Sequence Matcher compara si hay partes iguales en el mismo orden entre dos frases.

Ejemplo:
Frase esperada: "Dije el código 5782" Frase dicha: "Dije el número 5782"
Coinciden varias palabras, así que da un valor de similitud como 0.85 (bastante parecido).

Cosine Similarity

Cosine Similarity compara el significado de las frases usando representaciones matemáticas del lenguaje.
Ejemplo:
"Cinco siete ocho dos" y "5782" suenan distinto, pero significan lo mismo. Esta métrica lo detecta y puede dar un valor como 0.95 (muy similar).

Eudex (Similitud fonética)

mide qué tan parecido suenan dos textos, sin fijarse en cómo se escriben.
Es útil cuando hay diferencias en pronunciación o acentos, ya que analiza el sonido, no las letras. Es útil cuando hay errores de pronunciación o acentos distintos.

Ejemplo:
Frase esperada: "Dije cinco siete ocho dos" Frase dicha: "Dije sinko syete ocho dos"

Aunque hay errores de pronunciación ("sinko" en lugar de "cinco"), el sonido es muy parecido.

Distancias de edición: Levenshtein y Damerau-Levenshtein

Miden cuántos cambios se necesitan para transformar una frase en otra.
- Levenshtein considera inserciones, eliminaciones y sustituciones.
Damerau-Levenshtein también incluye transposiciones (cambiar el orden de letras vecinas).
👉 Un valor bajo indica frases similares; uno alto, muchas diferencias.

Ejemplo:
"5782"→ "5732" Solo cambió el orden del 8 y el 3, así que Damerau-Levenshtein lo detecta como un cambio menor.

Hamming Distance

Cuenta cuántos caracteres son diferentes entre dos frases del mismo largo. Es útil para comparar códigos cortos, como "1234" y "1334", donde una sola diferencia ya puede ser importante.

Ejemplo:
Código esperado: "1234" Código dicho: "1334"

Jaro Distance

Compara frases parecidas, incluso si hay letras fuera de lugar.
Detecta coincidencias aunque el orden no sea perfecto, y entrega un valor de similitud entre 0 y 1. Es más tolerante al desorden que otras métricas.

Ejemplo:

Frase esperada: "5782" Frase dicha: "7582"

Aunque el orden de los primeros dos dígitos está invertido, los números son casi los mismos.

Jaro Distance detecta que las frases son muy parecidas, aunque no idénticas, y puede dar un valor como 0.93 (alta similitud).

La clave detrás de la validación biométrica

El agente biométrico actúa como un filtro inteligente: analiza lo que dices y lo compara con lo esperado. Si todo cuadra, la verificación pasa sin problemas.

Si hay muchas diferencias, salta una alerta y se revisa manualmente.

Todo ocurre en segundo plano, garantizando seguridad sin complicaciones.

Agente biométrico | ¿Cómo sabe si dijiste el código correcto?