清华博士做出可信AI ,对规范性知识的幻觉“零容忍”,获千万级投资
来源: 杨婧雪
作者:
杨婧雪
近日,大模型可信知识服务技术厂商彩智科技宣布完成数千万级A轮融资,本轮融资由致远互联独家领投。彩智科技透露,融资资金将投入深知可信智能体和精准业务认知工具的进一步商品化,以及全国企业AI市场的拓展。

近日,大模型可信知识服务技术厂商彩智科技宣布完成数千万级A轮融资,本轮融资由致远互联独家领投。彩智科技透露,融资资金将投入深知可信智能体和精准业务认知工具的进一步商品化,以及全国企业AI市场的拓展。
随着AI的不断发展,大模型在一些垂直的严肃工作场景落地越来越普遍。比如政务服务大模型、企业客服大模型,这些严肃的场景,需要大模型对制度、章程的严谨、准确输出,对幻觉“零容忍”。但目前市面上常见的大模型都是概率模型,尤其遇上章程知识,AI幻觉更加严重。
但对政企办公来说,规章制度是基本守则。AI如果不能解决对规章制度的幻觉,就很难真正进入严肃办公场景。
彩智科技正在推进的深知可信知识模型,针对的就是这一市场痛点。
彩智科技试及其创始人徐剑军观察到,AI碰上规章制度,最容易出现幻觉。
这种现象,是由于大模型基于统计规律和训练数据模式进行预测时产生的偏差或错误。大语言模型遵循概率算法,习惯从大量历史数据中总结最有可能正确的答案,而不是对照最新的规章制度原文。但互联网和历史文档里 99.9% 都是旧版本,最新版本只占极少数0.1%,“这会导致大模型一定跟着99.9%的旧规章制度走,不会跟着那 0.1% 的最新版本。”徐剑军说。
瞄准规章制度这一切口,徐剑军和团队推出核心产品——深知可信知识模型,100%消除对规章制度的AI幻觉,服务政府和企业。
针对政府,深知可信知识模型为政府门户网站、政策问答平台、政务服务平台以及各地12345和专项政务热线等提供可信的政策知识,实现政务咨询和办理环节的提质提效。
以全国政务热线为例,接入深知可信知识模型之前,一个咨询工单从受理到答复平均需要6分钟;接入之后,平均完成工单的响应时间可以缩短到1分钟。对于一线话务人员来说,过去需要人工介入资料查阅工作,如今通过模型,可以直接给出有依据、有条文可查的答案。
深知可信知识模型也是熟知规章制度的“业务大脑”,只需要通过模型的API接口,快速上传政企内部制度条文等电子文档,几分钟之内就可以完成训练,掌握企业丛内控管理、经验案例、流程规范到行业标准、财税人资等所有工作知识。在此基础上,政企可以搭建面向内部员工的智能体,覆盖智能问答、章程解读、公文写作、智能搜索等工作,辅助员工工作。
以广东省政务服务和数据管理局为例,这是第一个使用深知可信知识模型的政府单位。接入后,模型能够准确运用各类最新规章条文,再与通用大模型配合组织语言,即可完成公文材料写作,整体完工率达到约80%,只需要做润色和微调,极大解放了生产力。
与通用大模型不同,深知可信知识模型在输出答案时可以追溯到具体的规章条文,做到 AI 生成内容可溯源,并对齐规章制度的最新版本。这也让其在对“可信”要求最高的政企办公场景里,真正具备了可以直接用起来的基础。
要训练出这样的模型,徐剑军和团队必须清洗出市面上最准确且动态更新的数据集。做出这个数据集,他们用了四年时间,并称之为“大知识工程”。
在知识工程领域,徐剑军专研了近20年。他是福建泉州人,本科就读于清华电子系,并获得推免直博的机会。读博期间,徐剑军在导师的带领下做一些校企合作项目,很早接触到知识工程的产业化。毕业后,他先后在清华紫光和央企工作。2015年,徐剑军注意大数据和人工智能的苗头,想要在新一波浪潮到来之前创业。
2017年,徐剑军回学校找导师聊了聊,拉上了当时在腾讯工作的师弟李奇,又叫上了同在央企负责大型政企应用软件业务、熟悉传统行业知识图谱的张绚、高丽。四人商定,一起辞职创业。
一开始,他们接了一些知识图谱项目,主要梳理企业客户的行业规范、内部管理条例等规章制度的数据,并把这些数据做成结构化的图谱。2019年,这块业务进入快速发展阶段,2020年,营收已经达千万级别。知识图谱业务是定制化项目,不能标准化,这也使得公司规模无法进一步扩大。
转机发生在2020年,这一年,GPT 3.0诞生,徐剑军感觉到,通用人工智能将要来临。
这一年,科技部还设立了“2030新一代人工智能”重大专项,专项的主导课题是北京智源人工智能研究院牵头的第一代国产大模型悟道1.0,像月之暗面的杨植麟、硅基流动的袁进辉都曾参与这个项目。
徐剑军和彩智科技接到了一个课题子任务——大规模知识图谱的自动化构建。
基于知识图谱业务积累下的技术,徐剑军和团队借着课题子任务的契机,把过去20年全中国公开的、没有版权纠纷的社会公共章程类知识,包括法律条例、政策、行业标准、行业规范从网页爬取下来,一共有100 亿文件,去重后为20亿。
为了做到对最新内容的实时更新,徐剑军在内部自研了一体化知识工程平台和知识工程母模型。
一体化知识工程平台是管理平台,把知识分析师的工序拆成了十几个流程环节的流水线。而知识工程母模型,负责的是模拟知识分析师的输入和输出,与一体化知识工程平台配合,实现知识加工的自动化。一旦发现新的知识概念,知识工程母模型就会预警,让人类知识分析师介入。目前,99%知识点都可以由模型完成,只有1%的知识点需要人工介入。
历经4年,彩智科技完成了大知识工程,实现大规模知识图谱构建的自动化,覆盖了16亿个关于规章制度知识点。基于这个大知识工程,团队每月能加工上百万知识点,实现公开规章制度的数据实时更新。
2024年,徐剑军推出深知可信知识模型,彩智科技也开始业务转型。
在传统的知识图谱业务之上,徐剑军新增了大模型业务,业务分为两个板块:可信知识服务智能体和精准业务认知工具(MCP)。
其中,可信知识服务智能体是一款标准化的产品,通过API接口快速上传政企内部章程知识体系,帮助政企完成自动化训练,让智能体掌握从内控管理、经验案例、流程规范到行业标准、财税人资等所有章程知识,成为政企内部办公的章程知识服务工具。目前,可信知识服务智能体业务板块,已经有国家能源集团、北京控股、国务院办公厅等客户。
精准业务认知工具,是面向市面上其他通用大模型的辅助工具,帮助这些大模型更准确地理解章程。“用户在使用市面上的通用大模型的时候,一旦涉及到规章制度的知识,就可以调用彩智科技的MCP接口,帮助通用大模型理解这部分知识,给出更准确的回复。”徐剑军说。
以和携程的合作为例,当时携程要做一款能订机票酒店、还能自动规划线路的旅游攻略智能体,但一到出国游就卡住了——用户需要护照办理,全国三百多个城市、办理护照的章程都不一样。携程通过调用彩智MCP,可以针对用户所在城市的护照办理流程,给出最准确、可执行的指南。
在徐剑军看来,这代表着彩智科技是用两条腿走路,一边是标准化的智能体产品,一边是可接入智能体生态的工具。
目前,彩智科技的MCP已经入驻百度千方、腾讯元气、阿里百炼、智谱、字节扣子平台、火山引擎和华为鸿蒙等智能体生态。
徐剑军认为,在未来,一旦智能体之间互相形成协议,可以互相形成协作,彩智科技的MCP做的就是一个大事业。
以机器人赛道为例,要让机器人在工地做安全生产检查,就必须了解安全生产的所有规范,“机器人厂商肯定不会再去训练一个安全生产的知识模型,而彩智的模型接口是现成的,这也是彩智的机会。”徐剑军说。
徐剑军透露,2024年公司总营达到4000万,一半由原先项目制的知识图谱业务贡献,一半是由大模型业务提供。“我们原来以为大模型业务要再等一年,但在过去一个月,智能体生态带来的增长超出了我们的预期。”徐剑军说,预计2025年,彩智科技营收将到达6000万,其中2/3由大模型业务提供。
彩智科技本轮融资的投资方致远互联,做的也是协同办公的业务,双方达成合作,深知可信知识模型的企业知识服务组件融入到致远互联全新一代AI-COP智能协同运营平台。徐剑军认为,致远互联在企业级场景的积累与全国性服务网络,与彩智科技的大模型可信知识智能技术形成互补,可以加速推动彩智的产品在能源、金融、制造等更多行业场景的落地。
“规章制度是一个很细分的切口,是个小场景,为此模型化、标准化做起来特别辛苦,做完还要经过市场认知期。”但徐剑军认为,随着通用大模型进入产业深水区,各行各业都将需要“可信的章程大脑”,去补足通用大模型在制度知识上的短板。 责任编辑: 星月