太平洋网络
产品库
聚超值
视频
站内导航

登录
注册
进入论坛
最近访问

加载中
论坛收藏

加载中
移动应用

首页 > 热点播报 > 正文

DeepSeek大范围开放识图模式实现图文交互并公布高效多模态技术框架

2026-05-09 18:32 整合编辑：科仔播报

据悉，DeepSeek已大范围开放其“识图模式”供用户体验，该模式并非简单的文字识别，而是具备了真正的图片理解能力。在实测中，它能识别文物并推断其历史风格，解答高难度空间推理题，理解网络梗图情绪，并能将截图中的代码或界面解析并还原为可交互的HTML代码。

同时，DeepSeek公布了其多模态模型的技术细节，核心是“以视觉原语思考”框架。该框架将点、边界框等视觉元素直接融入推理链，解决了传统模型在密集场景中的“指代鸿沟”问题，使推理更精准。此外，该框架在算力上极具效率，处理图片消耗的tokens远低于其他主流模型，并在多项基准测试中达到领先水平。

需要指出的是，目前上线的识图模式仍标注为内测，功能集中于视觉理解与分析，暂不支持图像生成或视频理解等更广泛的多模态功能。

2026款乐道L90开启全国交付沙溢胡可明星家庭复购成L90双车主

相关阅读

DeepSeek服务遭遇重大中断后已恢复但网页端识图功能暂未出现
热点播报 2026-05-09 11:30:53
DeepSeek寻求巨额融资并计划加快产品发布节奏以加速商业化进程
热点播报 2026-05-09 09:32:38
DeepSeek计划六月推出V4.1模型并启动高达五百亿元的首轮融资
热点播报 2026-05-08 20:02:14
DeepSeek V4不能用了 Claude桌面应用再次封杀第三方AI
热点播报 2026-05-07 19:16:46
NVIDIA拿下开源AI模型第一！Nemotron 3 Super击败Kimi、DeepSeek登顶
热点播报 2026-05-06 16:02:30

网友评论

24小时内最火资讯

精彩图赏 热点视频

热门IT产品

￥6499
HUAWEI Pura90 Pro Max
·
￥1699
华为畅享90 Pro Max
·
￥5999
苹果iPhone17
·
￥1999
vivo Y600 Pro
·
￥7499
OPPO Find X9 Ultra
·
￥3599
荣耀500 Pro
·
￥2999
REDMI K90 Max
·
￥3499
一加Ace 6至尊版
·
￥9999
苹果iPhone17 Pro Max
·
￥5299
OPPO Find X9 Pro
·

用户反馈 返回首页 相关阅读 参与讨论 回到顶部

About PCGROUP | 网站介绍 | 隐私政策 | 广告服务 | 合作媒体 | 投稿指南 | 使用条款 | 联系我们 | 分站加盟 | 招聘精英 | 网站地图 | 用户体验提升计划 | PCauto

未经授权禁止转载、摘编、复制或建立镜像，如有违反，追究法律责任。

增值电信业务经营许可证：粤B2-20040647

广播电视节目制作经营许可证：粤字第806号

网站备案号：粤B2-20040647号-11

举报邮箱：shenhezhiban@pconline.com.cn

粤公网安备 44010602000162号

中国互联网举报中心