实现大模型按需所取!商汤“日日新5.0”发布

上海徐汇 2024-04-30 09:52:10

徐汇创新科技领军企业商汤科技SenseTime日前在技术交流日活动上发布了行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova 5.0”大模型体系,其综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。

“日日新SenseNova5.0”性能超越GPT-4 Turbo

自2022年4月首度发布至今,“日日新SenseNova”大模型体系已完成五次重要迭代。最新的“日日新SenseNova 5.0”(简称“日日新5.0”)基于超过10TB tokens的庞大训练数据和大量合成数据,采用混合专家架构,使得推理时上下文窗口可达约200K,进一步拓宽了模型的理解和处理边界。

此次升级聚焦于知识、数学、推理和代码四大能力的强化,全方位对标并超越GPT-4 Turbo。在一系列主流客观评测中,“日日新5.0”在各项指标上与GPT-4 Turbo不相伯仲。在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。

率先完成“云端边”全栈布局

商汤科技领先业内首次推出“云、端、边”全栈大模型产品矩阵,其中包括应用于终端设备的“商汤端侧大模型”,以及面向金融、代码、医疗、政务等多个领域的边缘产品“商汤企业级大模型一体机”。

商汤日日新·端侧大语言模型的推理速度达到了业内最快,可在中端平台实现18.3字/s的平均生成速度,旗舰平台更是达到了78.3字/s。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤正式推出企业级大模型一体机,可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

联合生态伙伴创新AI 2.0时代产品应用,打造新质生产力

在活动现场,商汤与金山办公、海通证券、小米、阅文集团、华为等多家生态伙伴共聚一堂,深入探讨大模型技术在办公、金融、出行等领域的广泛应用,并分享了一系列成功案例。

自2023年起,商汤与金山办公达成深度合作,基于“日日新”大模型的卓越代码生成及工具调用能力,助力WPS 365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。金山办公CEO章庆元表示:“在办公应用场景内,商汤大模型的表现十分出色,能够帮助我们的用户解决办公中的复杂问题,提升效率。”

在金融领域,海通证券与商汤科技联合推出金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、展业办公助手等多个业务场景深入推进AI技术应用,并共同探索智能投顾、舆情监控等前沿领域,为证券行业大模型落地构建了完整的全栈式能力体系。此外,在个人出行领域,近期火爆市场的小米汽车SU7,小米“小爱同学”为车主提供智能化交互体验,当中也有集合应用了商汤的大模型技术能力,有基于商汤端云大模型解决方案。

“文生视频”已在路上,商汤科技坚定迈向AGI时代

在本次技术交流日最后环节,商汤科技董事长兼CEO徐立还展示了三段由大模型自动生成的视频,并强调文生视频平台对于人物、动作和场景的可控性。

用户仅需输入一段文字或详细描述,即可生成连贯、符合预设的人物形象、动作及场景的高质量视频内容。商汤科技依靠强大的智能算力中心,持续为日日新大模型体系的训练提供强大支撑,目前该体系已在自然语言处理、视频生成、深度学习优化等领域取得了多项创新成果。

0 阅读:25