首页 > 热点播报 > 正文

AI行业重心转向多模态领域 文本模型进入优化阶段 多模态成新爆点

2025年AI行业重心正从纯文本模型转向多模态领域。下半年以来,Sora 2、谷歌Nano Banana等多模态应用相继推出,视觉创作类AI Agent也获得高度关注。

文本模型已进入优化阶段,性能提升趋于平稳,而多模态能力在可用性上取得突破。DeepSeek-OCR通过将文本转化为图像识别,大幅降低了计算成本,展示了文本模型优化方向。

多模态发展以文本模型为基础,理解与生成相互促进。业界认为多模态是通向AGI的必经之路,其突破将推动世界模型、具身智能等发展,并为市场带来更多商业机会。

网友评论

热门IT产品
  1. ¥5999
    苹果iPhone17
    ·
  2. ¥5299
    vivo X300 Pro
    ·
  3. ¥2599
    REDMI K90
    ·
  4. ¥9999
    苹果iPhone17 Pro Max
    ·
  5. ¥5299
    OPPO Find X9 Pro
    ·
  6. ¥4699
    HUAWEI Pura 80
    ·
  7. ¥4399
    OPPO Find X9
    ·
  8. ¥4499
    荣耀Magic8
    ·
  9. ¥4199
    iQOO 15
    ·
  10. ¥4399
    vivo X300
    ·