2024年,关于大模型的讨论从未停歇,国内大模型市场进入到新阶段,大模型落地情况到底如何?AI+应用有哪些新场景、新变化?近日,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目,从技术发展及产业实践角度分享了当前以大模型为代表的人工智能技术发展及产业应用的最新进展。
当下,人工智能的技术和应用受到了全球关注。在节目上,中国科学院院士何积丰、开源鸿蒙项目群技术指导委员会主席、上海交通大学特聘教授陈海波与百度、腾讯、Minimax企业代表围绕AI技术发展与产业落地等话题展开讨论。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜做客CCTV-2《对话》节目
从大模型技术来看,吴甜认为,模型的幻觉与创造力一体两面,在创意需求高的场景下,大模型强大的创造力无疑是优势;但在与行业实际问题相结合时,则需模型展现出更强的稳定性和准确性,以确保可以解决任务问题。技术上,抑制模型产生幻觉,主要有两方面:一方面是优化基础模型,力求从根本上降低幻觉出现的频次及其严重度;另一方面,在模型应用中,通过引入检索增强、智能体等技术或机制,有效提升模型对事实的遵循。
根据中国信通院《全球数字经济白皮书(2024年)》,目前全球人工智能大模型共1328个,中国占比达到36%。随着技术的快速演进,大模型发展日新月异,已经从去年的“百模大战”,到了当下“拼落地”“拼应用”的阶段。对此,吴甜指出,从增速角度来说,大模型应用场景在非常快速地发展,她现场分享了一组数据,百度文心大模型日调用量超过15亿,对比今年5月2亿的日调用量,半年时间达到了原来的7.5倍,对比一年前5千万的日调用量,达到了30倍。
此外,公开数据显示,目前飞桨文心开发者数量已达1808万,服务了43万家企业,创建了101万个模型。从数据的规模上来说,可以看到文心大模型发展增速很快,展现了广泛的应用潜力。
吴甜进一步表示,尽管大模型应用已经初具规模,但最后真的落地到各个场景,仍需要进一步地开发与完善。从发展阶段上来说,大量场景还处于量变的积累阶段。这个过程中,我们观察到,AI技术和大模型的使用方式,正在从个别场景点的提效,逐步扩展到业务流程的改进和优化。当这种由点及线、由线及面、由面及体的系统性过程得以实现后,质变就会到来。
那么,大模型落地产业到底是“最后一公里”还是“最后一百公里”?吴甜认为,这取决于行业自身的数字化根基及业务面向数字化的的抽象程度。例如,互联网行业产品应用与AI技术收益贴合紧密,或许半公里即达;金融等行业数字化基础较高,主要需解决系统对接与部署,可以称为一公里。相比之下,农业等行业的数字化基础相对薄一些,需要解决的问题更为复杂和多样,其大规模落地可能是几十公里到百公里的距离。
在探讨人工智能赋能千行百业所面临的挑战时,吴甜剖析了当前存在的两大主要难题。她表示,一方面,需要挖掘具体的、基于真实场景的真实需求。过去几年,尽管人工智能与各类场景结合的应用层出不穷,但较多未触及到场景中的关键问题。这些应用,还未能发挥出人工智能深度使用的最大价值。为破解这一难题,百度设立了AICA人才培养项目,并已经持续6年,今年进行到第八期。该项目的核心目标,就是培养既懂业务又精通AI技术的人才,帮助他们能更好地结合AI技术解决场景问题。另一方面,专业数据的缺乏也是人工智能深入应用目前的重要制约因素。重点是那些能体现业务逻辑理解的数据,这些数据在自然数据中稀缺,却对提升模型在真实场景中完成复杂任务的能力极为关键,是行业应用真正所需要的。建设这些数据,需要社会各界一起努力,为人工智能的广泛应用提供支撑。
此外,算力问题也是人工智能中不可忽视的一环。吴甜坦言,随着模型规模的扩大,算力需求也随之激增。要更有效利用大规模算力,需集约化建设并优化调度,提高使用率。百度通过深度学习平台飞桨和文心大模型的联合优化,训练效率提升5.1倍,推理效率提升125倍,并将继续优化。同时,算力应多元化,尤其在大量推理和场景化训练中,这有助于降低成本、提高效率。百度持续积极开展硬件统一适配工作,飞桨已支持超过60个芯片系列,为算力的多元化提供了有力保障。
当下,国内大模型市场从“百模大战”到“大浪淘沙”,从拼参数到拼落地、拼应用的新阶段,各行各业都在依据自有的场景和特有经验、规范、数据等进行大模型落地的产业实践,形成了庞大的应用生态。
有分析认为,2025年大模型将进一步发展,其理解、生成和交互能力将达到新高度,各行业也将加速与大模型的应用与融合。预计到2025年,大模型应用将加速渗透到多个垂直行业,形成更加成熟的行业解决方案。大模型将对社会、经济和技术领域带来更加深刻的变革。
网友评论