对话松应科技创始人&CEO聂凯旋:人工智能+物理模拟仿真,赋能行业加速创新 | 极新对话直播实录

来源: 极新
   
“ 无论是人的沟通还是理解物理世界,载体本质上都是数据。 ”
“ 无论是人的沟通还是理解物理世界,载体本质上都是数据。 ”
 
 

整理 | 王娴

编辑 | 云舒

出品|极新

2024年4月28日,在老时间(20:00-21:30),「极新」对话松应科技创始人聂凯旋,聂凯旋认为“唯有深入各个行业,充分理解各类数据,才能训练出具备全局物理认知的智能体”。华为工程师出身的他,对潜在技术瓶颈有着深刻的认知。2021年,凭借对市场动向的敏锐洞察与深厚的技术积累,聂凯旋与其团队积极投身于物理模拟仿真技术领域,致力于促进我国人工智能与物理世界的深度融合。

图片

聂凯旋 松应科技创始人&CEO,华为云鲲鹏解决方案原副总指挥,华为云互动与云游戏原总经理。

于2021年成立松应科技,其自主研发的ORCA STUDIO是国内首个物理准确模拟器,是对标英伟达战略产品OMNIVERSE的国内唯一平台。松应科技致力于通过Orca将人工智能与物理世界深度融合。Orca平台通过软件协同+数据统一,融合CAD/CAE工业软件、AI、机器人、渲染与物理引擎、传感器等,实现多种类仿真环境完整构建。支持具身智能/人形机器人/飞行器/自动驾驶训练的合成数据与仿真模拟等。

在数字化转型的浪潮中,实体产业正面临着前所未有的机遇与挑战。随着人工智能、大数据、云计算等技术的发展,实体产业开始探索如何将这些先进的技术融入到自身的生产、管理和运营中,以提高效率、降低成本、增强竞争力。其中,物理世界模拟器作为连接数字世界与实体产业的桥梁,扮演着至关重要的角色。

物理世界模拟器通过创建物理环境的、可交互的数字孪生,使得企业能够在虚拟世界中模拟、测试和优化其产品和生产流程。这种技术的应用,不仅能够减少实体原型的成本和时间,还能够在产品投入市场前预测和解决潜在的问题。其提供了一个平台,让大模型技术能够在实体产业中发挥其强大的能力。

本文,极新对话聂凯旋,围绕“AI在实体革新中的角色与挑战”这一主题展开讨论,大模型要如何走进实体产业?聂凯旋给出了关于这些板块的回答:

“大模型尚未对物理产业产生显著的加速作用,根本原因在于缺乏物理准确仿真环境支持其在模拟场景中的训练。”
“仿真环境结合合成数据进行训练有望成为主流。”
“若存在一套数据协作平台,便可参照完整的工业软件套件进行重新组合,构建端到端的解决方案。”

“开源的本质是创新的催化剂。”

以下是问答整理(「视频号:极新企服」有直播回放):

极新:极新企服有幸邀请到松应科技的创始人聂凯旋先生作客直播间。诸多车展上能够看到的人形机器人,已是当下具身智能浪潮里的技术弄潮儿。松应科技的产品与具身智能相关,涉及人形机器人和3D建模。许多顶级资本,如顺为资本、云启资本、红杉资本、高瓴资本等都在布局此领域。首先,请聂总做个自我介绍,也介绍一下松应科技。

聂凯旋:松应科技于2021年11月创立,初期设定目标是开发基于原生数据平台的物理世界模拟器,早期这一概念并未得到广泛理解,而随着Sora等基于视频和互联网学习的世界模拟器概念的出现,大家对此有了更广泛的认识。松应科技致力于物理实体产业连接,用实时高精度数据构建仿真模拟环境,用于训练人工智能体和处理复杂工作流,更准确地称为“物理准确模拟器”。松应科技始终深耕于数据打通、软件协作、人工智能应用、物理仿真模拟和渲染引擎等领域的研发。现已有初步产品和对客户服务的案例,但仍处于第一代初级产品阶段,需要更多投入进行迭代和演进。

01

从CUDA到Omniverse,从观望到加入

“大模型尚未对物理产业产生显著的加速作用,根本原因在于缺乏物理准确仿真环境支持其在模拟场景中的训练。”

极新:松应科技的业务偏向科技领域,在仿真、工业软件模拟以及大模型训练的预训练等场景中发挥了重要作用。在行业发展过程中,与消费或云产业相比,松应科技或会面临更多的阻力——目前,芯片供应紧张,算力产层也面临压力。在这样的环境下,松应在物理模拟领域的定位如何,是否具有差异化特征?

聂凯旋:第一,源于对未来物理世界与人工智能融合发展的前瞻性构想,英伟达推出了全球首个实现物理精确模拟的Omniverse系统,促进了人工智能技术与物理产业的深度融合,引领智能化浪潮。而松应科技,则是目前全球第二家、中国首家且唯一一家这一领域的企业若各位看过松应科技的样例,不难发现,在这一高精尖领域,真正有所建树的公司屈指可数。因此,松应科技的产品无疑具有较高的辨识度和市场影响力。

第二,松应科技是一家百分百的中国本土企业尽管初创阶段获得美国风险投资,但团队与核心业务始终根植于中国,推出了中国版的Omniverse。松应科技拥有深厚的底层技术积累,长期专注于自主研发图形处理、CPU、GPU和系统软件架构等技术。

目前,英伟达在人工智能、自动驾驶和游戏领域展现了强大的软件和API能力,但硬件只是载体,其重点是为开发者和用户提供大量软件基础设施。将用户关系建立在CUDA之上是英伟达做的最正确的一件事,英伟达在全球人工智能市场的统治地位也正源于CUDA技术。但CUDA的研发在早期面临着诸多质疑与压力,在长达六年的时间里,英伟达没有对手,因为业界同行如AMD、英特尔等都无法理解为何一家专注于游戏显卡和硬件的公司会致力于开发CUDA这样的软件。直到2012年之后,CUDA的价值才逐渐为市场真正认可,并为英伟达今日赢得了AI领域90%的市场份额,奠定了其在人工智能市场的绝对地位。六年的“真空期”对于任何一家企业而言都是极其宝贵的发展窗口,甚至可以说是通往成功的大门。

多年来,我国一直在倡导互联网+,但在工业领域的收效甚微,原因在于它仅仅实现了连接功能,而未能真正推动行业的变革。即使人工智能和大模型备受瞩目,但其除了作为辅助写作+查询助手推出一些APP外,仍未能展现出显著的商业价值。原因在于,目前模型训练所依赖的数据主要来自公开市场上获得的互联网数据,主要解决互联网常见问题,对实体产业帮助不大。由于缺乏针对实体产业的模型和高精度数据,大模型与实体行业关联度相对较低,尚未对物理产业产生显著的加速作用,其根本原因在于缺乏相关的准确数据和模型,以及一套仿真环境来支持其在模拟场景中的训练。

因此,英伟达创建基于物理世界规律的数字模拟训练环境的策略体现出充分的前瞻性。回顾中国企业多年来在技术领域的探索,不难发现,许多国产版本的工业软件相较于国际同行,起步时间较晚,这导致其市场占有率未能与努力程度相匹配。

2019年,松应察觉到捕捉到英伟达在新基础软件研发方面的动态,思考英伟达在已经拥有了CUDA这张王牌的情况下,其下一步可能的战略方向——其正试图通过新的基础软件平台,将人工智能领域的技术优势与物理世界相结合,以开辟新的应用领域。这一发现让松应的团队感到振奋,因为这不仅意味着新型基础软件所具备光明的发展前景,更意味着中国企业也具备在这一领域发展的可能。

2020年10月,Omniverse发布了测试版,松应团队成员立即捕捉到其巨大的潜力,敏锐地判断当下就是我国发展基础软件的黄金时期,便立马创办松应科技,投身于基础软件的研发当中。在Omniverse刚起步的时刻投入其中是更明智的选择,如等到其发展成熟、市场格局明确后再行动,则将面临更大的竞争压力。

另外,从经济成本的角度考虑,国外先进工业软件的高昂成本我国产业发展构成了不小的压力,降低成本成为技术发展的关键。如果松应有能力开发出性能与国外先进软件功能相当的产品,成本却能够大幅度降低,将使得国内的企业和生态伙伴能够更好地应用这些技术,推动产业的升级和赋能。

目前,松应的软件基础设施已经构建完毕,能够与各种专业软件、工业软件协作,为不同行业提供赋能、革新工作流程,推动行业快速发展,为多个领域带来创新和突破。未来,希望有更多同行的伙伴加入广阔的赛道,与松应并肩同行,为国家、为社会、为行业积累真正的底层技术。

图片

02

复杂场景,“仿真”解决

“仿真环境结合合成数据进行训练有望成为主流。”

极新:松应科技的领域处于高科技前沿,大家对此知之甚少。聂总能否举例几个仿真软件需求比较高的场景,让大家明白哪些场景下的技术需求比较广泛?

聂凯旋:工业机器人的早期应用场景相对简单,主要局限于机械臂切割、焊接和搬运等任务。由于机器人的位置固定,操作单一,可以通过编写控制程序来实现其快速运行。但随着技术进步,场景变得越来越复杂。

如今,复合型机器人已经具备了行走、抓取和操作物体的复杂能力。因此,机器人研发过程中需要借助大量的仿真模拟软件,模拟机器人在不同场景下的行为,帮助工程师预测和解决问题。单一部件的仿真软件无法解决复杂体的全量模拟问题,需要进行有效组合以应对不同场景下的挑战。许多团队使用昂贵的商业软件来完成仿真任务;成本较低的开源软件往往只能够提供部件级仿真,工程师只能使用拼凑式的模型解决问题,这显然并非最优方案。

即使克服了以上困难,对于一个能够走进千家万户的机器人来说,仅仅只是完成了训练“小脑”的工作。具备成熟商业价值的机器人,必须是一个大小脑兼具的智慧体,能够理解、分解、执行任务。“大脑”的培养需要给大模型提供大量的数据,让它理解指定的任务与场景。

有意思的是,很多专注于做机器人“小脑”的公司,希望由人工智能领域的公司来完成“大脑”的设计。但这一领域的公司无法充分理解“机器人”实际处境,导致双方未能有效结合。机器人实现“大、小脑”融合,要经过一个类似人类教育小孩的训练过程,包括在不同的场景下教导机器人如何执行各种任务,但其速度缓慢,若以人类劳动力的培养标准来衡量,可能需要二三十年的时间。

仿真的重要作用由此凸显。仿真可以通过构建基于物理世界的训练场,模拟出100倍实际数量的机器人,加速数据采集和训练过程。例如,物理空间可能只有两台实体机器人,但模拟场可以生成数百甚至上千个虚拟机器人进行训练,采集大量与应用场景紧密相关的数据。人工智能模型可以从零开始逐渐接入这些数据,并在1000亿级别的数据规模中逐步成长,为人形机器人的智能发展提供有力支持。机器人公司需要这样一个模拟场来进行更高效的数据采集和训练,而人工智能公司则需要它来验证和优化其算法。双方可以基于此逐步实现融合,共同推动人工智能和机器人技术的发展。

目前,英伟达所具备的开发、仿真平台以及基础套件和训练套件已经能够为机器人公司提供全方位的服务与支持。在美国,仿真模拟和合成数据也已被广泛应用于智能体的开发中,加速了技术的进步。相比之下,我国大多数团队仍聚焦于部件级的仿真和物理训练,进展相对缓慢。幸而国内越来越多客户开始认可松应方案的价值——有效加速智能体的演进和开发。此外,面对关于虚拟世界真实性的质疑声,松应也已经采取一系列措施,提高虚拟环境的真实性,消除仿真与物理之间的Gap。未来,仿真环境结合合成数据进行训练有望成为主流占据90%甚至95%以上的市场份额。

03

时势将至,乘势而上

“若存在一套数据协作平台,便可参照完整的工业软件套件进行重新组合,构建端到端的解决方案。”

极新:AI领域的四个要素为场景算法、算力、数据,其中数据是国内企业的优势,因为中国的人口量级会带来丰富的场景,从而带来丰厚的数据沉淀,且国内对数据隐私保护的限制相对较少。那么,松应目前在数据方面遇到的困难和挑战是什么?

聂凯旋:目前业内关于数据的观点存在分歧,一方主张数据量愈大愈佳;而另一方则强调数据精度与质量的重要性,认为模型规模较小时,采用小级别参数已能满足需求,无需盲目追求千亿或万亿参数的模型。各行业盲目追求大模型的经济效益比很低,应基于行业特点和场景需求来确定所需的数据量和数据资产规模。数据是有精度的,此数据应分为有价值与无价值两类。例如当前热门的知识问答模型、图像生成模型以及法律大模型等,其大量数据并不具备实际价值,需要对原始数据进行清洗处理,以提取有价值的数据。所以,不应仅依赖数据量来评估数据的价值,而应更加注重数据的有效性和精度

无论是人的沟通还是理解物理世界,载体本质上都是数据。在实体领域,除了办公和知识问答,还应关注如何高效收集物理世界数据,并在实际环境中模拟应用,然后进一步实现升级、优化。这一目标的实现,有赖于过去多年所提及的互联网和物联网技术的发展,通过连接城市中包括工业、交通、物流以及制造业等领域的大量数字化设备,收集、分析、提取进而训练出有价值的数据。松应科技当下就是在做这件事。

多年来,我国在网络及算力等多个领域的基建方面取得了显著成就,物联网的快速发展也使得企业能够大量收集和处理数据,为物理实际智能化的实现提供了可能性与有序性。人类将数千年的文字、声音和图像信息留存下来,并在近几十年将其转化为网络化、数字化的信息,为训练语言模型提供了基础。物理世界同样,收集有价值的环境和设备数据是建立物理智能的首要任务当下,众多传感器设备和智能联网设施已广泛建立并投入应用,我国已经具备了实现物理智能的条件

但人工智能不仅仅局限于大语言模型,而是一个多模态的存在,能够全面理解文字、语音、图像、视频乃至3D空间。唯有如此,大语言模型才能为实体产业提供有效服务,才能够被称为真正的AGI。目前所谓的人工智能主要基于互联网数据,是为“互联网模拟体”,而非“面向世界的模拟的人工智能体”。唯有深入各个行业,充分理解各类数据,才能训练出具备全局物理认知的智能体AGI

然而,AGI并非万能,其作为超级智能体,主要负责控制现有设备和软件,理解各类现象,并提供智能化建议它采纳现存的专业设备和软件,通过引入一种全新的逻辑,实现了这些元素的高效组合,使得它能够端到端地处理各种任务。尽管智能体在某些情况下展现出强大的能力,但其更多地扮演着“大脑”的角色,无法完全脱离物理世界,仍需遵循物理定律、数学逻辑和公式等。例如,智能体即便拥有高智商,也无法独立完成如空客飞机模型的设计和仿真等任务,仍需依赖专业软件如CAE和CAD。

图片

极新:随着AI技术的不断进步,松应科技产品在强AI时代有望发挥更大作用,实现物理世界的AI预训练和预模拟。为开发出高质量的工业软件,必须首先构建完善的工具链。那么松应科技如何突破工具链的制约?

聂凯旋:松应科技并未开发如CAD或CAE等专业工业软件,而是与这些软件形成了一种互补与协作的关系。松应的平台强大的数据处理能力,可以对设计、仿真、工业控制及场景构建等多元化来源的软件数据进行归一化处理,确保来自不同模块的专业软件和专业工具能够无缝进行数据交换,进而在统一的环境中进行仿真与合成。完成数据统一处理后,允许数据在平台上仿真,之后无缝返回至原始系统,确保平台与现有工具和系统实时互通,实现数据交换器功能。在工具套件中,松应提供data link打通各类专业软件,实现不同软件在平台上的数据交换,构建集成平台的基础和至关重要的一环。

西门子是全球最具影响力的工业软件供应商。除自主生产大量工业设备,西门子早期便成功整合各类软件,集成多种复杂系统,打造了超级智能工厂,通过西门子统一套件进行高效管理,这一体系的核心就在于标准化的数据模型。西门子的套件由多个专业部件组成,每个部件都有其竞争对手。但国产化软件难以与西门子形成竞争关系,因为这些竞争厂商往往难以融入西门子的主流生态系统,除非遵循其标准这导致许多国内专业工具难以进入主流市场,只能局限于小型工厂。从订单收入、场景完善度和复杂度等方面来看,小型工厂的场景相对简单,软件迭代的环境并不理想。因此,我国的工业软件虽付出巨大努力,但收效甚微。

若存在一套数据协作平台,便可参照完整的工业软件套件进行重新组合,构建一套能够满足企业需求的端到端解决方案,降低对单一国产软件的要求。因此,面向全新客户时,通过数据平台实现软件间的协作,确保数据实时交换和处理,将使我国企业能够像西门子套件一样根据不同行业、场景和客户需求灵活组合套件,实现价值最大化,吸引更多上下游供应商成为客户的生产环境供应商,共同构建满足客户需求的高效工业体系,为企业带来巨大的机遇和价值提升空间

04

达,则兼济天下

“开源的本质是创新的催化剂。”

极新:互动提问:松应科技的客户是哪些群体?

聂凯旋:松应公司的客户群体主要包括工业智能化和机器人领域的客户。这些客户涉及各种类型的机器人,如复合型机器人、人形机器人以及具身智能机器人等。

当前,工业智能化不仅仅关注设备的升级,更侧重于优化生产线的效率从工厂规划阶段开始,即可在模拟环境中整合BIM软件、CAM工业套件以及专业的CAD设计和CAE仿真软件。完全数字化的模拟场所能够构建新的工厂设计,进而构建生产线,最终实现生产线的实际运行。这种数字孪生或数字模拟的环境极大地加速了物理新建工厂的进程

为了提前了解设备在市场上可能获得的反馈,松应会在生产环境中进行相应验证。以汽车制造为例,为确保生产线上的车型契合客户期望,从概念设计阶段开始,松应平台能够将生产线、设计模型和渲染效果实现实时对接,客户可根据所提供的效果来参与产品定义和改进。这意味着,在规划阶段,产品已具备推向市场的条件。这一过程摒弃了传统耗时耗力的调研、设计和样车制作流程,通过数字化手段仿真,利用高度逼真的可视化方案,实现快速迭代与优化

柔性产线是未来的主流生产方式。柔性生产线通过智能化手段,迅速模拟和规划生产线的改造过程,使其产能在短时间内实现数倍甚至数十倍的提升。随后,生产线上的机器人会根据规划,自动调整布局,以满足新的生产需求,有效实现降本增效,对提升工业产能具有重要意义。这也是松应的一种客户群。

其次,在当前热门的具身智能与人形机器人领域中,具身智能专注于构建机器人的本体与小脑功能,而另一部分则致力于开发大脑功能。然而,双方不能充分互相理解,导致对机器人运行环境的不佳。为弥补这一缺陷,急需构建一个如同学校的训练场,为机器人教授各种知识、设置多种场景,赋予其推理、运行和计算等能力。松应同时服务于机器人公司和人工智能体公司,因此这一训练场能够双向提供支持,携手双方,共同加速生产环境和训练环境的构建

极新:互动提问:目前已经在哪个行业或者场景进行了模拟训练?

聂凯旋:简单来说是三个类型的场景:工业智能制造、移动复合机器人、人形机器人。

极新:互动提问:松应科技未来的规划是什么?

聂凯旋:松应今年的工作重点是工业领域的仿真环境构建,如人形机器人、具身智能和无人机等。目标是拓展更多行业生态,以产生强大的放大效应。在松应Orca或自有平台支持下,伙伴的相机模拟器可无缝集成到仿真模拟平台上,客户可从模拟器中选择合适的工业相机模拟器进行仿真,增强对相机的了解和信任,进而选择他们的相机产品。此外,松应将与后端物理部件或物理厂商建立紧密联系,形成相互融合、共同发展的生态,促进软件、生态和硬件层面的发展,发挥强大的产业带动能力。

未来,松应希望与实体行业建立深厚合作和连接,与上下游合作伙伴建立紧密联系松应拥有自研的中国版英伟达Omniverse,同时还计划开源一套“开源版omniverse”的系统,支持CAD、BIM、CAE等厂商接入,帮助客户解决实际问题。同时,松应提供原厂技术支持,协助合作伙伴优化上下游关系,提升数据处理能力。智能工厂客户可牵头使用松应版本建立纯数字化工厂,并邀请上下游合作伙伴接入平台,实现有价值场景。

极新:互动提问:您认为开源的本质是什么?

聂凯旋:开源的本质是创新的催化剂。

很多人苦苦寻求人生的价值在于达则兼济天下,穷则独善其身开源本身从更广泛的角度来看,是一种公益性的行为。以奠定世界数字化基础的Linux系统为例,如仅依赖于昂贵的 Windows 系统,IT行业和信息化行业或许无法达到现今的发展速度,因为当下大部分数据中心都运行在Linux系统之上;同样,如果市场只存在付费的 iOS 软件,缺乏像安卓这样的开源系统,智能手机的普及和移动互联网的蓬勃发展也将无从谈起,市场的繁荣与这些开源系统和组件密不可分,它们对产业创新起到了重要的推动作用

松应不想仅成为英伟达的替代品,因为这对产业的赋能有限。松应一家企业的能力仅能够服务好自己的客户,而市场上仍有大量客户需要服务,这就需要更多参与者加入,共同推动平台和社会进步,激发创新活力所以,未来松应开源版本会占据 90% 或 99% 的市场份额,只有 1% 的客户选择松应商业版本,也是一种成功。

极新:上一位嘉宾极睿科技创始人武彬留给您的漂流瓶问题是:第一,3D扫描如何与松应的产品结合?会怎么用?用在什么地方?第二,3D的扫描能做到什么样的效果,AIGC生成3D的成果在实际应用中能发挥什么价值?

聂凯旋:首先,3D扫描技术目前正广泛应用于3D模型的创建过程中。通过实物扫描进行建模,能够在基础平台上获得所需的3D模型。松应的方案存在四种数据来源。一种是通过Connector连接各种软件;另一种来自于历史上已存在的资产库,类似于许多知名工具平台过去收购的图片和三维模型素材库;3D扫描技术也是快速构建3A模型的一种重要来源——随着技术的不断进步,新的扫描算法持续迭代优化,其精度和速度均得到了显著提高。这些3D模型可被应用于模拟场中,用于机器人的交互训练,完成碰撞测试、抓取等任务,以及其他测试环境的构建;此外,AIGC生成模型也是一种数据来源,尽管其精度目前尚不足以与扫描建模相媲美,但仍然具有很高的价值。

其次,AIGC生成3D技术在多个行业正受到广泛的探索和应用

在游戏行业,过去游戏环境主要依赖美术师和模型师共同搭建,且美术方面的投入也随着游戏级别的提升而增加。若AIGC生成的方法能达到游戏美术所需的精度标准,将极大地降低游戏公司在3D建模和美术修饰方面的成本。

在影视动画行业,影视动画通常不涉及复杂的交互功能,制作流程相对简化。但隐式动画对精度的要求却更高。因此,利用AIGC技术大量生成模型和场景,可以显著加速影视动画公司,尤其是3D动漫公司的工作流程。

在工业生产行业,自动驾驶作为一个典型场景,同样需要大量的合成数据作为支撑。过去,车厂主要依赖基于视觉的训练方法。而面对极端或复杂路况时,由于缺乏足够的用例,现有算法仍显得捉襟见肘。为此,车厂需要收集更多极端案例数据,但其不仅成本高昂,而且难度极大。因此,采用合成数据和仿真模拟技术成为了降本增效的有效方案为确保数据的有效性和可用性,车厂需要与模拟器建立紧密的合作关系,确保数据的兼容性和准确性。在此基础上,通过AI技术对这些数据进行组合和处理,可以为自动驾驶系统提供更丰富、更真实的路况模拟,从而推动自动驾驶技术的进一步发展。

极新:最后是我们的漂流瓶环节,请您给下一位做客进行直播间的嘉宾来问题。

聂凯旋:在国际形势风云变幻的情况下,大部分企业在国际市场上或多或少都受到了阻碍,也有的企业在国内市场与国际市场中做了二选一。而作为企业创始人,应该怎么将初心与市场结合?换言之,在动荡的环境里,应该怎么调整自己的心态来适应市场,让企业行稳致远?

责任编辑: 椰子

相关资讯
写评论