阶跃星辰发布新一代基础大模型Step 3,上海国投生态体系将参与其最新一轮融资

来源: 朋湖网
    作者: 朋湖网        
阶跃星辰发布新一代基础大模型Step 3,将开源,还发起生态联盟,上海国投生态体系将参与其融资。

7 月 25 日,在2025世界人工智能大会(WAIC)前夕,上海阶跃星辰智能科技有限公司(以下简称“阶跃星辰”)在上海正式发布了新一代基础大模型——Step 3。

据了解,这款模型兼顾智能与效率,旨在面向推理时代打造最适合应用的模型,将于7月31日面向全球企业和开发者开源。

此次发布会上,阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,致力于打通芯片、模型和平台全链路技术。通过底层联合创新提升大模型适配性和算力效率,该联盟将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。

目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原科技等也已初步实现运行Step 3。其它联盟厂商的适配工作正在开展。

据了解,Step3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与Scale Up。Step 3采用 MoE 架构,总参数量 321B,激活参数量 38B。

Step3在视觉感知和复杂推理能力层面,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的SOTA成绩。

Step3在架构设计层面,Step 3便充分考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3实现了行业领先的推理解码效率。根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。

在应用场景层面,阶跃星辰战略性聚焦智能终端Agent的方向,重点布局汽车、手机、IoT设备等场景。截止当前,已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent体验;联合吉利推出AI智能座舱。同时与金融财经、内容创作、零售等领域的行业头部公司深度合作。

值得关注的是,发布会还宣布了上海国有资本投资有限公司与阶跃星辰的深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

公开信息显示,阶跃星辰成立于2023年,是国内大模型初创公司,创始人姜大昕曾任微软副总裁、微软全球合伙人、STCA副院长及首席科学家。公司Step-1V多模态大模型支持200K上下文窗口,在图像理解、多轮指令跟随、数学能力、逻辑推理、文本创作等方面性能达到了业界领先水平。

阶跃星辰基于Step系列千亿参数模型,推出了“跃问”和“冒泡鸭”两大AI应用产品。1)跃问(StepChat)是一个具有多模态能力的AI效率工具,用户可以通过输入文字、上传图片、上传文档和发送网址等方式对其进行提问,但其并不具备图像生成能力。2)冒泡鸭(Bubble Duck)是一个角色扮演类的AI聊天机器人,旨在创造一个AI开放世界,通过个性化定制智能体和参与虚拟角色互动来开启全新社交方式。

成立两年多以来,阶跃星辰构建起“1+N”的Step系列大模型矩阵。“1”是指Step 3基础大模型;“N”则为Step系列的多模态大模型矩阵,广泛覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。

责任编辑: 沐锦

相关资讯
写评论