首页 > 业界资讯 > 正文

谷歌发布新AI视频生成模型Veo3 支持同时生成画面和背景音

【太平洋科技快讯】5月21日,在 2025 年的 I/O 开发者大会上,谷歌发布了其最新一代视频生成模型 Veo3,该模型的核心功能在于其强大的音效和对话生成能力。它不仅能够生成逼真的视频画面,还能根据场景添加相应的背景音效,例如鸟鸣声、街头交通噪音、人物对话等,使得生成的视频更加生动、真实,极具沉浸感。

此外,Veo3 在物理模拟和口型同步方面也表现出色。它能精准地模拟真实世界的动态变化,并确保生成的人物对话与其唇形变化完美匹配,进一步提升视听体验的真实度。

据悉,Veo3 采用了先进的自然语言处理(NLP)和语音合成技术,实现了视频和音频的同步生成。这一突破性技术极大地提高了创作效率,用户只需提供文本或图像提示,即可快速生成完整的音视频内容。

Veo3 的应用场景十分广泛。在影视制作领域,它可以用于快速生成预告片、场景片段,甚至可以辅助创作完整的影视作品。在虚拟现实领域,Veo3 可用于创建虚拟角色、互动场景或沉浸式体验。此外,Veo3 的多人和多人唇形同步功能,为数字人技术的发展带来了新的可能性,有助于推动虚拟人类与真实人类之间的交互。

目前,Veo3 仅对美国地区的 Gemini Ultra 用户和 Vertex AI 的企业用户开放,并且部分功能(如 Flow)目前仅支持英文提示词,这限制了非英语用户的体验。而随着技术的进一步发展,Veo3 有望扩展到更多地区和语言,为全球用户提供更广泛的支持。

网友评论

热门IT产品
  1. ¥4699
    HUAWEI Mate 80
    ·
  2. ¥5999
    HUAWEI Mate 80 Pro
    ·
  3. ¥5999
    苹果iPhone17
    ·
  4. ¥9999
    苹果iPhone17 Pro Max
    ·
  5. ¥3599
    荣耀500 Pro
    ·
  6. ¥1399
    荣耀X70
    ·
  7. ¥2399
    一加 Ace 6T
    ·
  8. ¥2599
    REDMI K90
    ·
  9. ¥2599
    一加Ace6
    ·
  10. ¥5299
    vivo X300 Pro
    ·
为您推荐
  • 相关阅读
  • 业界资讯
  • 手机通讯
  • 电脑办公
  • 新奇数码
  • 软件游戏
  • 科学探索