Apple desarrolla un modelo para hacer ediciones guiadas en las imágenes con IA

La empresa unió sus esfuerzos con la Universidad de California para desarrollar el proyecto.

Estos son los avances del estudio entre Apple y la Universidad de California. Foto: iStock

PeriodistaActualizado:
Apple, en asociación con investigadores de la Universidad de California en Santa Bárbara, ha anunciado el desarrollo de un innovador modelo destinado a realizar ediciones guiadas en imágenes utilizando lenguaje natural.
Conocidos como grandes modelos de lenguaje (LLM, por sus siglas en inglés), estos sistemas han demostrado una notable capacidad para comprender diversos formatos multimedia y generar respuestas visuales.
El nuevo modelo, denominado MGIE, es el resultado de una investigación que exploró cómo los LLM pueden ser empleados para editar imágenes basadas en instrucciones proporcionadas por los s.

Según la consultora IDC, Apple se quedó con el primer puesto en las ventas acumuladas del año en 2023. Foto:iStock

El MGIE ha sido sometido a evaluaciones exhaustivas en colaboración con investigadores de la Universidad de California en Santa Bárbara.
Estas evaluaciones han abordado diferentes aspectos, como la aplicación de modificaciones al estilo de Photoshop, la optimización global de la imagen y la edición local. Los resultados de este trabajo se detallan en un artículo publicado en Arxiv.
Un ejemplo de la capacidad del modelo es su capacidad para eliminar elementos no deseados de una imagen, como un árbol de navidad en segundo plano, o transformar por completo una escena, como cambiar un paisaje diurno por uno nocturno con relámpagos reflejados en el agua de un lago.
Incluso puede realizar cambios más sutiles, como modificar el aspecto de objetos, como donuts con diferentes glaseados.
Apple destaca la importancia de las instrucciones expresivas en la edición de imágenes basada en instrucciones, ya que permiten al modelo realizar ediciones coherentes y significativas.
Esta innovación no solo tiene aplicaciones prácticas inmediatas, sino que también abre nuevas vías de investigación en el campo de la visión por computadora y el procesamiento de lenguaje natural.

Más noticias

*Este contenido fue reescrito con la asistencia de una inteligencia artificial basada en información de Europa Press y contó con la revisión de una periodista y un editor.

Sigue toda la información de Tecnología en Facebook y X, o en nuestra newsletter semanal.

Conforme a los criterios de

Saber más

¡Notamos que te gusta estar bien informado!

¡Notamos que te gusta

estar bien informado!

Para continuar leyendo, si ya eres suscriptor:

En este portal utilizamos datos de navegación / cookies propias y de terceros para gestionar el portal, elaborar información estadística, optimizar la funcionalidad del sitio y mostrar publicidad relacionada con sus preferencias a través del análisis de la navegación. Si continúa navegando, usted estará aceptando esta utilización. Puede conocer cómo deshabilitarlas u obtener más información aquí