Janus Pro, generador de imágenes "altamente realistas" de DeepSeek

Imágenes generadas por Janus Pro
Imágenes generadas por Janus Pro. DEEPSEEK
Compartir

DeepSeek, la empresa china creador del 'chatbot' que ha superado a ChatGPT en la App Store, ha lanzado Janus Pro, un modelo innovador de generación de imágenes que optimiza la comprensión multimodal y la estabilidad en la conversión de texto a imagen. Este nuevo modelo produce resultados "altamente realistas" y con gran detalle, a pesar de contar con una resolución relativamente baja.

Janus Pro es la última incorporación a la familia de modelos generativos Janus, una versión optimizada que, según explica la empresa en su repositorio de GitHub, "incorpora una estrategia de entrenamiento optimizada, datos de entrenamiento ampliados y escalabilidad a un tamaño de modelo mayor".

PUEDE INTERESARTE

Incorpora una estrategia de entrenamiento optimizada, datos de entrenamiento ampliados y escalabilidad a un tamaño mayor

DEEPSEEK

En su base se encuentra el modelo de lenguaje visual DeepSeek VL2, con 4.500 millones de parámetros activados. Según la compañía, "logra un rendimiento competitivo o de última generación con parámetros activados similares o menores en comparación con los modelos densos y basados en MoE de código abierto existentes".

"Altamente realistas"

Janus Pro está disponible en dos versiones: una con mil millones de parámetros (1B) y otra con 7.000 millones de parámetros (7B). La versión más avanzada mejora la comprensión multimodal y ofrece mayor estabilidad en la generación de imágenes a partir de texto.

PUEDE INTERESARTE

La versión más avanzada mejora la comprensión multimodal y ofrece mayor estabilidad en la generación de imágenes

En concreto, en comprensión multimodal, sus creadores aseguran que supera a TokenFlow XL (13B), algo que atribuyen a "la disociación de la codificación visual para la comprensión y la generación multimodales, que mitiga el conflicto entre estas dos tareas".

En cuanto a la generación de imágenes a partir de texto, en las pruebas GenEval y DPG-Bench, Janus Pro 7B obtiene una precisión global del 80% en la primera evaluación, superando a Dall-E 3 (67%) gracias a su capacidad para seguir instrucciones. En el test DPG-Bench, alcanza una puntuación de 84.19.

PUEDE INTERESARTE

DeepSeek resalta la calidad de los resultados generados por Janus Pro, con imágenes "altamente realistas" y un alto nivel de detalle, a pesar de la resolución limitada de 384x384 píxeles, que sigue siendo una de las restricciones del modelo.

La firma china lanzó recientemente otra familia de modelos de razonamiento, DeepSeek-R1-Zero y DeepSeek-R1. Este último, y según la compañía, con capacidad para alcanzar "un rendimiento en tareas de razonamiento comparable a OpenAI o1".

Suscríbete a las newsletters de Informativos Telecinco y te contamos las noticias en tu mail.

Síguenos en nuestro canal de WhatsApp y conoce toda la actualidad al momento.