首页 > 热点播报 > 正文

阿里宣布开源全模态Qwen2.5-Omni 7B尺寸可识别情绪

阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。据悉,在权威多模态融合任务OmniBench等测评中,Qwen2.5-Omni全维度超Google的Gemini-1.5-Pro等同类模型,刷新业界纪录。

Qwen2.5-Omni以接近人类的多感官方式认知世界并与之实时交互,还能通过音视频识别情绪,在复杂任务中进行更智能、更自然的反馈与决策。现在,开发者和企业可免费下载商用Qwen2.5-Omni,手机等终端智能硬件也可轻松部署运行。相较于数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。即便在手机上,也能轻松部署和应用Qwen2.5-Omni模型。当前,Qwen2.5-Omni已在魔搭社区和Hugging Face 同步开源,用户也可在Qwen Chat上直接体验。

网友评论

热门IT产品
  1. ¥2899
    OPPO K15 Pro
    ·
  2. ¥3099
    OPPO K15 Pro+
    ·
  3. ¥1799
    vivo Y500s
    ·
  4. ¥1399
    荣耀X70
    ·
  5. ¥1299
    华为畅享90
    ·
  6. ¥1699
    华为畅享90 Pro Max
    ·
  7. ¥1999
    荣耀X80i
    ·
  8. ¥1999
    REDMI Turbo4 Pro
    ·
  9. ¥8999
    苹果iPhone17 Pro
    ·
  10. ¥6999
    vivo X300 Ultra
    ·