【太平洋科技快讯】近日,智谱公司宣布推出一款多模态语音模型——GLM-4-Voice。该模型具备情感理解能力,能够模拟不同的情绪和语调,如高兴、悲伤、生气、害怕等,实现情感表达和共鸣。
GLM-4-Voice支持用户随时打断对话,并根据实时指令调整语音输出的内容和风格,实现更灵活的对话互动。在对话过程中,用户可以根据需求调整模型的语速,使其更快或更慢,满足不同场景下的交流需求。
此外,该模型不仅支持中英文语音,还能识别和表达中国各地方言,特别是粤语、重庆话和北京话。未来GLM-4-Voice将结合视频通话功能,实现既能听又能看的全方位交互体验。
据了解,智谱公司将GLM-4-Voice模型开源,成为公司首个开源的端到端多模态模型,目前,GLM-4-Voice已部署在“智谱清言”App上,用户可即刻体验这款创新的情感语音模型。
网友评论