快科技4月23日消息,商汤科技在中国北京举行新品发布会,正式发布人工智能大模型“日日新5.0”。
日日新5.0大模型采用了先进的MOE(Mixture of Experts)混合专家架构,这一架构的引入,使得模型在处理复杂任务时能够表现出更高的效率和准确性。
同时,该模型基于超过10TB的数据tokens进行深度学习训练,还拥有高达200K的推理上下文窗口。 这一特性使得模型在处理长文本或复杂推理任务时,能够更好地捕捉上下文信息,从而做出更准确的判断。
此外,该模型在知识、推理、数学、代码等多个方面全面对标GPT-4 Turbo,展现了其强大的综合实力。
网友评论