首页 > 热点播报 > 正文

360开源视觉语言对齐模型FG-CLIP2 在29项测试中超越谷歌和Meta

近日,360集团低调开源的视觉语言对齐模型FG-CLIP2在全球科技圈掀起热议。在涵盖长短文本图文检索、目标检测等在内的29项权威公开基准测试中,这款模型全面超越了科技巨头Google的SigLIP 2与Meta的MetaCLIP2。

据悉,360的FG-CLIP2成功攻克了CLIP模型长期存在的“细粒度识别”痛点,面对包含多个物体的复杂场景,其细节识别置信度仍高达96%。该模型实现了三大创新:层次化对齐架构、动态注意力机制和双语协同优化策略。

网友评论

热门IT产品
  1. ¥2599
    REDMI K90
    ·
  2. ¥5999
    苹果iPhone17
    ·
  3. ¥5299
    OPPO Find X9 Pro
    ·
  4. ¥5299
    vivo X300 Pro
    ·
  5. ¥9999
    苹果iPhone17 Pro Max
    ·
  6. ¥4699
    HUAWEI Pura 80
    ·
  7. ¥3999
    一加15
    ·
  8. ¥4499
    荣耀Magic8
    ·
  9. ¥2599
    一加Ace6
    ·
  10. ¥4199
    iQOO 15
    ·