据悉,中国公司DeepSeek在图像生成基准测试中推出了一款名为Janus-Pro的多模态大模型。该模型采用了新颖的自回归框架,并通过将视觉编码分离为“理解”和“生成”两条路径来提升性能。尽管目前只支持较小规格的图像(384 x 384),但在部分文生图基准测试中表现令人印象深刻。Janus-Pro通过添加7200万张高质量合成图像,实现了真实数据与合成数据比例达到1:1,在视觉生成方面输出更具吸引力和稳定性的图像。此外,该模型还参考了DeepSeek VL2并增加了约9000万个样本进行多模态理解的训练数据。
网友评论