Home technologyYa no vale con contar dedos para saber si una imagen está hecha con IA. Ahora hay que aprender dibujo técnico

Ya no vale con contar dedos para saber si una imagen está hecha con IA. Ahora hay que aprender dibujo técnico

by markoflorentino@icloud.com


Detectar imágenes generadas por inteligencia artificial se ha convertido en un juego del gato y el ratón. Y lo peor es que va a ir a más. Durante un tiempo, todos nos empezábamos a fijar en las manos y en la cantidad de dedos que representaba la IA en las imágenes de personas a través de los mecanismos de difusión de los modelos. Hace unos pocos años era evidente ver cuándo una imagen estaba creada por IA. Ahora, con modelos de imagen y vídeo cada vez más precisos, la tarea es mucho más compleja.

La buena noticia es que todavía hay maneras de detectar si una imagen ha sido generada por IA, aunque viendo el ritmo al que avanzan los modelos, posiblemente esto vuelva a cambiar dentro de muy poco. Detectarlas es menos intuitivo que antes, pero basta con prestar atención a la geometría, las sombras y la perspectiva. Básicamente, dibujo técnico.

Quién está detrás de esta idea. Hany Farid, especialista de la Universidad de California en Berkeley y uno de los mayores expertos mundiales en análisis forense de imágenes, lleva más de dos décadas dedicado a determinar si una foto o un vídeo han sido manipulados.

Santiago Lyon, exdirector de fotografía de Associated Press y que hoy trabaja en seguridad digital en Adobe, describe a Farid en un reportaje de Science como «una especie de decano del análisis forense digital», precisamente por llevar tanto tiempo en ello. Farid ayudó a fundar esta disciplina hace más de 20 años, y asegura que la IA es el mayor reto al que se ha enfrentado.

soldados
soldados

Farid ejemplifica su método con esta imagen. Si trazamos una línea hacia el horizonte entre las baldosas y los rodapiés, vemos que las líneas no convergen en un único punto, lo que nos indica que la imagen está generada por IA

Cuesta saber lo que es verdad y lo que no. Estamos perdiendo la capacidad de fiarnos de lo que vemos. La combinación de IA generativa, capaz de crear imágenes casi indistinguibles de la realidad, y una tibia regulación en redes sociales hace que los bulos se acaben amplificando, siendo cada vez más difícil saber si lo que estamos viendo es real o no. Y en muchos casos, igual ni nos importa.

Farid habla directamente de una «guerra global por la verdad», con consecuencias para las personas, las instituciones y las democracias. En una charla de TED contaba que cree que el porcentaje de imágenes falsas en internet se acerca al 50%.

Ya no sirve fijarse en los píxeles. Una de las primeras técnicas que desarrolló Farid se basaba en el «ruido» que dejan las cámaras reales. Una foto auténtica nace de la luz que golpea un sensor electrónico; una imagen de IA, en cambio, surge de un proceso estadístico que convierte ruido aleatorio en una imagen coherente con el texto que se le pide. Ese origen tan distinto dejaba huellas detectables a nivel de píxel. El problema es que los generadores han aprendido a imitar incluso esas imperfecciones, el ruido del sensor y los artefactos de lente.

Como explica el reportaje de Science, muchos de los métodos pioneros de Farid basados en relaciones estadísticas entre píxeles «ya no funcionan bien, si es que funcionan», porque las imágenes de IA se crean desde cero en lugar de editarse sobre una foto previa.

Dibujo técnico. La IA, dice Farid, «no sabe de física, no sabe de geometría, y hace todo tipo de barbaridades». Y ahí es donde entra el dibujo técnico. Según Farid, estos son los tres frentes que debemos examinar:

  1. Puntos de fuga. En el mundo real, las líneas paralelas (las vías del tren, los azulejos del suelo, los lados de una pared) convergen hacia un único punto a medida que se alejan. Es un principio que los artistas conocen desde hace siglos, pero que la IA ignora porque no entiende el espacio tridimensional. Si esas líneas no se encuentran en un solo punto, la escena es físicamente imposible.
  2. Sombras. El Sol está tan lejos que sus rayos llegan a la Tierra prácticamente paralelos. Eso significa que las líneas que unen cada objeto con la sombra que proyecta deberían cruzarse también en un punto coherente con la posición de la luz. En muchas imágenes generadas por IA, esas líneas ni se acercan a cruzarse.
  3. Reflejos. El mismo principio se aplica a los espejos, ya que las líneas que conectan un punto de un objeto con su reflejo deberían converger en un punto de fuga. Cuando no lo hacen, la imagen se delata.
cubo
cubo

Lo mismo ocurre en esta imagen. Si trazamos una línea que pase tanto por los vértices de cada cubo como por los vértices de su sombra proyectada, vemos que tampoco convergen en un único punto

Acumulación de pistas. Ninguna técnica es infalible por sí sola, y Farid insiste en que el método consiste en acumular pistas, como en una investigación. En su charla TED lo ejemplificaba con una imagen hecha con IA de varios soldados mirando al frente. En ella detectó el patrón sospechoso en el ruido, la ausencia de un punto de fuga coherente en las paredes y unas sombras que no intersecaban. Tres anomalías que daban pistas de que la imagen no era real.

La razón de fondo por la que este enfoque resiste mejor el paso del tiempo es que las empresas de IA no buscan engañar a expertos forenses como Farid, sino al usuario medio, ya que estamos en un listón mucho más bajo. Como él mismo dice, «el sistema visual perdona todo tipo de disparates en las fotos porque no le importan».

figura
figura

En esta imagen, si trazamos una línea desde un punto de la figura, al mismo punto reflejado en el espejo, vemos que las líneas tampoco convergen en un único punto

Las dudas y los límites. No todos en el campo comparten el mismo optimismo. Algunos investigadores se reafirman en que cada técnica de detección tiene una «vida útil» cortísima, a veces de pocos meses, porque la IA mejora muy rápido. De hecho, los famosos errores en las manos con seis dedos desaparecieron en un suspiro. Farid, sin embargo, se muestra escéptico ante la idea de que la IA llegue a dominar la física compleja del mundo real, como una explosión, porque simularla es endiabladamente difícil y las empresas tienen pocos incentivos para llegar tan lejos.

Aun así, reconoce que recibe cada día una decena de correos de periodistas de todo el mundo pidiéndole verificaciones, cuando hace años eran una o dos peticiones al mes.

Soluciones. Farid cuenta que las herramientas forenses que desarrolla con su equipo se están poniendo a disposición de periodistas, instituciones y tribunales, lo que indirectamente protege a todos. Existe además un estándar internacional de «credenciales de contenido» que busca autenticar el origen de las imágenes en el momento de su creación. No va a resolver todos los problemas, pero será parte de la solución. También advertía en su charla que las redes sociales no son un lugar para informarse, porque están “demasiado plagadas de mentiras” y de «AI slop» (basura generada por IA) como para ser fiables.

Imagen de portada | chaindrop y Sora

En Xataka | Las gafas inteligentes para policías parecían ciencia ficción. Algunos agentes chinos ya han empezado a utilizarlas



Source link

related posts

Leave a Comment