Logo de Actualidad
Actualidad

Janus Pro, generador de imágenes "altamente realistas" de DeepSeek

Imágenes generadas por Janus Pro. DEEPSEEK
Compartir

DeepSeek, la empresa china creador del 'chatbot' que ha superado a ChatGPT en la App Store, ha lanzado Janus Pro, un modelo innovador de generación de imágenes que optimiza la comprensión multimodal y la estabilidad en la conversión de texto a imagen. Este nuevo modelo produce resultados "altamente realistas" y con gran detalle, a pesar de contar con una resolución relativamente baja.

Janus Pro es la última incorporación a la familia de modelos generativos Janus, una versión optimizada que, según explica la empresa en su repositorio de GitHub, "incorpora una estrategia de entrenamiento optimizada, datos de entrenamiento ampliados y escalabilidad a un tamaño de modelo mayor".

PUEDE INTERESARTE

Incorpora una estrategia de entrenamiento optimizada, datos de entrenamiento ampliados y escalabilidad a un tamaño mayor

DEEPSEEK

En su base se encuentra el modelo de lenguaje visual DeepSeek VL2, con 4.500 millones de parámetros activados. Según la compañía, "logra un rendimiento competitivo o de última generación con parámetros activados similares o menores en comparación con los modelos densos y basados en MoE de código abierto existentes".

"Altamente realistas"

Janus Pro está disponible en dos versiones: una con mil millones de parámetros (1B) y otra con 7.000 millones de parámetros (7B). La versión más avanzada mejora la comprensión multimodal y ofrece mayor estabilidad en la generación de imágenes a partir de texto.

PUEDE INTERESARTE

La versión más avanzada mejora la comprensión multimodal y ofrece mayor estabilidad en la generación de imágenes

En concreto, en comprensión multimodal, sus creadores aseguran que supera a TokenFlow XL (13B), algo que atribuyen a "la disociación de la codificación visual para la comprensión y la generación multimodales, que mitiga el conflicto entre estas dos tareas".

En cuanto a la generación de imágenes a partir de texto, en las pruebas GenEval y DPG-Bench, Janus Pro 7B obtiene una precisión global del 80% en la primera evaluación, superando a Dall-E 3 (67%) gracias a su capacidad para seguir instrucciones. En el test DPG-Bench, alcanza una puntuación de 84.19.

PUEDE INTERESARTE

DeepSeek resalta la calidad de los resultados generados por Janus Pro, con imágenes "altamente realistas" y un alto nivel de detalle, a pesar de la resolución limitada de 384x384 píxeles, que sigue siendo una de las restricciones del modelo.

La firma china lanzó recientemente otra familia de modelos de razonamiento, DeepSeek-R1-Zero y DeepSeek-R1. Este último, y según la compañía, con capacidad para alcanzar "un rendimiento en tareas de razonamiento comparable a OpenAI o1".

Suscríbete a las newsletters de Informativos Telecinco y te contamos las noticias en tu mail.

Síguenos en nuestro canal de WhatsApp y conoce toda la actualidad al momento.