腾讯混元文生图开源模型推出小显存版本仅需6G显存即可运行_热点播报

腾讯混元文生图开源模型推出小显存版本仅需6G显存即可运行

2024-07-05 16:02 出处/作者：快科技整合编辑：佚名

7月4日，腾讯混元文生图大模型（混元DiT）宣布开源小显存版本，仅需6G显存即可运行，对使用个人电脑本地部署的开发者十分友好，该版本与LoRA、ControlNet等插件，都已适配至Diffusers库；并新增对Kohya图形化界面的支持，让开发者可以低门槛地训练个性化LoRA模型；同时，混元DiT模型升级至1.2版本，在图片质感与构图方面均有所提升。

此外，腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语，针对文生图场景进行专门优化，可帮助开发者快速制作高质量的文生图数据集。

相比起业界的开源打标模型，混元Captioner模型能更好的理解与表达中文语义，输出的图片描述更为结构化、完整和准确，并能精准识别出常见知名人物与地标。模型还支持开发者自行补充和导入个性化的背景知识。

混元Captioner模型开源之后，全球的文生图研究者、数据标注人员，均可使用混元Captioner高效地提升自身图像描述质量，生成更全面、更准确的图片描述，提升模型效果。混元Captioner生成的数据集不仅能用于训练基于混元DiT的模型，亦可用于其他视觉模型训练。

腾讯混元文生图开源模型推出小显存版本仅需6G显存即可运行

苹果iPhoneX 64GB

三星S9

vivo NEX旗舰版

OPPO Find X

努比亚Z18mini

OPPO A5

荣耀Play（4GB RAM）

vivo Y85

坚果R1（6GB RAM）

一加6（8GB RAM）

腾讯混元文生图开源模型推出小显存版本 仅需6G显存即可运行

腾讯混元文生图开源模型推出小显存版本仅需6G显存即可运行