为了解决用户在工作和学习中高效精确地获取知识的需求,4月26日讯飞星火V3.5春季上新,推出了业界首个能够处理长篇文本、图文混排内容和长段语音的大模型。通过这次升级,讯飞星火大模型V3.5不仅能够迅速吸收来自不同信息源的大量文本、图形材料和会议记录,还能在各种行业场景下提供专业且确切的解答,从而将大型模型的使用从“偶尔”提升到“常态化”,极大地提高每个人在工作和学习中的效率,助力人们更高效地获取知识,更精准地解决问题。
作为业界首个同时支持长文本、长图文和长语音的大模型,本次讯飞星火V3.5长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。
随着文本越来越长,效率是关键,当文本信息达到几十万字甚至上千万字的时候,考验的不止是大模型理解与概括能力的最优解,还需要兼顾获取的效率与质量。为了解决大模型应用效率和准确率问题,刘庆峰谈道,基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都做到业界最优。
当登陆讯飞星火PC版你会发现,输入框上方新增支持长文本、长图文、长语音的上传按钮,仅长文本一项就支持pdf、doc、txt等多种主流格式。在演示视频中,科大讯飞副总裁、研究院院长刘聪用《星火相传》这本书进行了演示,该书文件格式是PDF,容量为14MB、共计400页、合计27万字,讯飞星火不仅快速领会了全书要义、知识点与研究成果,更机智地回答了刘聪对书中有关大模型生态布局建议的提问,涵盖了平台建设、产业应用、产学研合作、数据质量、社会责任五大核心环节。
网友评论