本智激活:源自上海交大顶尖研究所,深耕端侧原生AI全栈技术
本智激活
作者: 本智激活孵化自上海交大顶尖研究所,专注端侧原生AI技术,推出多项全球领先成果,推动端侧智能发展。

-
PC端性能突破: 团队于2023年12月发布的PowerInfer端侧大模型Infra系统,突破性地实现了在消费级NVIDIA RTX 4090 GPU上高效运行千亿参数大模型的能力,其性能达到数据中心级A100 GPU的90%,推理速度较前代技术提升最高11.69倍。该项目开源后,连续两天蝉联开源平台GitHub国际开源项目趋势榜第一。
-
手机端“从零到一”: 2024年6月,团队推出PowerInfer-2,基于自研的TurboSparse大模型稀疏化方法,进一步将技术边界扩展至移动端,首次在智能手机上流畅运行470亿参数模型,推理速度超越国际标杆系统llama.cpp达29倍,推动终端硬件智能水平到达新高度,实现了手机侧百亿级大模型部署“从零到一”的跨越式发展。 -
端侧原生大模型算法创新:2025年7月26日,「本智激活」将联合上海交通大学发布并开源全球首批端侧原生大模型。该系列模型采用原创算法架构,从零开始预训练构建。这一架构专门针对端侧设备的算力、内存和存储限制进行设计,通过与原生端侧Infra深度协同,实现了百亿参数大模型在百元级硬件上的流畅运行。这标志着研发团队已贯通从模型算法创新、大规模预训练到端侧Infra部署的全栈核心能力。值得一提的是,「本智激活」团队在2024年12月30日曾开源全球首个30亿参数长链推理大模型SmallThinker。凭借出色的推理性能,该模型在发布仅7天内,就在HuggingFace等平台累计下载量突破10万次,并一度在HuggingFace模型全球趋势榜总榜位列第二(仅次于DeepSeek-V3模型),文本生成类大模型榜排名第一。
责任编辑: 沐锦