DeepSeek宣布开源全新的视觉多模态模型Janus-Pro-7B,在基准测试中击败了Stable Diffusion和OpenAI的DALL-E 3。该模型整合了优化的训练策略、扩展的训练数据和更大规模的扩展,取得了在多模态理解、文本到图像指令遵循能力方面显著进展,并增强了文本到图像生成稳定性。据悉,JanusFlow引入一种极简架构,可以直接在大型语言模型框架内进行训练而无需复杂调整。这项工作代表着朝着更高效、更通用的视觉语言模型迈进了一步。
DeepSeek宣布开源全新的视觉多模态模型Janus-Pro-7B,在基准测试中击败了Stable Diffusion和OpenAI的DALL-E 3。该模型整合了优化的训练策略、扩展的训练数据和更大规模的扩展,取得了在多模态理解、文本到图像指令遵循能力方面显著进展,并增强了文本到图像生成稳定性。据悉,JanusFlow引入一种极简架构,可以直接在大型语言模型框架内进行训练而无需复杂调整。这项工作代表着朝着更高效、更通用的视觉语言模型迈进了一步。
热点播报 2025-01-28 08:14:24
热点播报 2025-01-28 07:16:45
热点播报 2025-01-28 07:02:19
热点播报 2025-01-28 06:26:42
热点播报 2025-01-28 05:47:49
网友评论