2023年12月17日,掘力计划在深圳成功举办第28期分享活动。本次活动以《大模型的技术探索与AIGC应用创新》为主题,云集多名人工智能业内大咖,就大模型技术的最新进展与商业化应用进行深入探讨。会场座无虚席,现场气氛热烈。
本次活动内容丰富,观点独特,深受与会者好评。其中,RWKV元始智能联合创始人罗璇讲师详细解析了RWKV模型的计算效率优势;NVIDIA资深工程师王猛讲师介绍了TensorRT-LLM强大的推理性能;阿里巴巴企业智能算法负责人陈祖龙讲师分享了大模型助力企业内部数字化转型的实例;爱创作人工智能联合创始人朱强强讲师则阐述了AIGC怎样颠覆出口跨境行业的运作模式。
二、RWKV模型带来计算效率和成本的双提升
罗璇讲师带来主题为《RWKV,新架构的大模型》的分享,他不仅是RWKV元始智能的联合创始人,还拥有丰富的技术研发与产品管理经验。罗璇讲师指出,RWKV模型通过其特有的网络结构设计,使得其时间和空间复杂度分别降至O(1)和O(T),极大提升了计算效率。其中,Receptance模块提取输入的语义特征,Weight模块通过位置权重实现长程依赖建模,two-stream设计则兼具了RNN和Transformer的优点。这种算法架构避免了Self-Attention中顺序操作的计算瓶颈,可实现顺序长度不变的恒定时间复杂度。
网友评论