Desarrollan una tecnología capaz de detectar deepfakes con gran precisión

Investigadores estadounidenses buscan desarrollar un modelo de IA capaz de discernir aquellos videos que sean generados por estas herramientas de inteligencia artificial.

Actualidad30 de julio de 2025TechinfoTechinfo
WhatsApp Image 2025-07-31 at 22.53.31

La llegada de la inteligencia artificial trajo consigo la irrupción de los deepfakes: videos falsos - o modificados parcialmente - generados a través de herramientas de IA. A medida que el desarrollo de esta tecnología avanza, también la capacidad de generar este contenido que trae consigo el problema de la incapacidad de discernir entre aquello que es real, de lo que fue generado por una computadora. Sin embargo, investigadores estadounidenses avanzan en el desarrollo del modelo UNITE (Red universal para la identificación de videos manipulados y sintéticos).

“La tecnología de deepfake se está desarrollando tan rápidamente que ya no se trata solo de intercambiar caras. Todo el video, desde la cara hasta el fondo, puede crearse fácilmente con IA generativa”, explicó Rohit Kundu, uno de los investigadores. En detalle, el modelo UNITE tiene la capacidad de detectar - con alto grado de precisión - aquellos videos que hayan sido generados a usando inteligencia artificial sin depender si el video muestra o no con un rostro humano.

Deepfakes: la nueva tecnología para parar la generación de videos falsos con IA
Hasta el momento, las únicas herramientas disponibles para discernir estos videos reales de los falsos estaban llegando a su límite. Es que estas tecnologías se basan, principalmente, en la identificación de rostros humanos - y los rasgos faciales - para realizar su tarea. Sin embargo, todo podría comenzar a cambiar con la aparición de UNITE.
Para su desarrollo, los investigadores utilizaron un modelo de IA creado por Google, llamado SigLIP. El mismo aprende la correspondencia entre imágenes y videos y el lenguaje natural. Así, tiene la capacidad de extraer características abstractas con gran precisión sin depender directamente de caras u objetos.

El modelo de UNITE utiliza una técnica de aprendizaje profundo denominada transformadores. Estos son mecanismos desarrollados para procesar información simultáneamente en función del contexto. Así, con la aplicación de esta herramienta en los modelos de lenguaje de IA se puede detectar - con gran precisión - incoherencias como la suavidad del movimiento o la falta de naturalidad en los componentes del video.

Además, los investigadores también agregaron un método de aprendizaje llamado attention-diversity loss: un dispositivo que evita la dependencia de la herramienta en ciertas regiones del video - en contraposición de otras que son ignoradas - y distribuye la atención por la composición de toda la imagen.

UNITE logró - en el pasado - alcanzar una precisión de clasificación superior al 87% en el último conjunto de datos "DeMamba", que incluye videos creados por Sora, la inteligencia artificial de Google.

Te puede interesar
Lo más visto