电子报阅读机
2025-10-12
星期日
当前报纸名称:徐汇报

商汤科技“日日新5o”发布,能听会看还会找话题

日期:07-15
字号:
版面:第02版:要闻       上一篇    下一篇

  □ 记者  王永娟

  7月5日发布了“日日新5o”——国内首个所见即所得模型。它通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,带来一种全新的AI交互模式,即实时的流式多模态交互。交互体验对标GPT-4o。

  作为2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴,商汤科技召开了“大爱无疆·向新力”人工智能论坛。现场,近千人共同见证这一创新交互模式——

  能听,会看,还会找话题,和“日日新5o”的交互就如同和真人对话一般。这种交互模式特别适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。

  商汤科技表示,能够实现对标GPT-4o的交互体验,正是源于“日日新5.5”基础模型能力的全面提升。7月5日,商汤科技正式发布“日日新5.5”大模型体系,在今年4月商汤科技发布的“日日新5.0”大模型基础上又迎来多项升级,综合性能较“日日新5.0”平均提升30%,数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标对标GPT-4o。

  据了解,“日日新5.5”采用混合端云协同专家架构,最大限度发挥云边端协同,降低推理成本,模型训练基于超过10TB tokens高质量训练数据,包括大量合成的思维链数据,提升推理思维能力。

  为了让更多企业用户低门槛接入并使用“日日新”大模型体系的强大能力,商汤于近期推出了“大模型0元Go”计划。凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时,商汤还将赠送5000万tokens包,并且派出专属搬家顾问,帮助OpenAI用户实现零服务成本迁移。