金融大模型落地,得场景者得天下

来源: 极新
   
“ 场景,金融大模型非它不可。 ”

自2022年底以来,ChatGPT引发了人工智能新一轮创新热潮,各大企业更是争先拿出各自的大模型产品,尤其在中国市场的竞争,已经进入白热化阶段。各行各业关注的问题逐渐转移到了大模型具体能够解决什么问题上,更注重实用性商业化,更聚焦场景

7月29日,文因大模型成果汇报会在上海良友大厦举办,会上,文因互联创始人鲍捷分享文因大模型在金融领域的落地成果与进展。现场有近百位商业银行、投行、证券的IT负责人到场聆听。极新也全程参会,并在现场对鲍捷博士采访,这篇文章,我们一起追溯下金融大模型的缘起与未来。

金融大模型的缘起

“大模型的基本技术原理非常复杂,但我想用一个比较简单的比喻来说明。不同的动物会根据环境的不同进化出不同的特征,而人类的DNA虽然相同,但我们可以在不同的环境中游泳、跑步、打猎等,这是因为人类具有泛化能力人类本质上是一种软件,大脑是软件执行器,大模型也具备类似功能。”当被问到大模型是什么,文因互联创始人鲍捷这样表示。

文因互联创始人鲍捷

大模型的应用好比炼钢。作为通用底座的炼钢工厂越大越好,要集中力量办大事,避免遍地小高炉。而作为应用场景的用钢,则应多元化、市场化。“用钢”部分可以分成两段,AIGC与其它一些大模型的应用场景端形成市场化,具体应用场景里自己负责。

过去金融机构中台的建设通常是分散的,每个应用场景都需要不同的业务逻辑和技术框架。而现在,使用同一个基座可以实现所有应用,包括数据治理、分析型应用、写作类应用和智能交互式应用,这种工作范式是之前难以想象的。基于这一范式,可以在同一个基座上完成所有下游任务,无论是撰写招股说明书,还是进行券商质控和核查,甚至是投资研究和研报启发式撰写。

基于这一范式,首次拥有了一种可能性,人们可以在同一个基座上完成所有下游任务。无论是撰写招股说明书这样的写作类应用,还是进行券商的质控、核查,或者投资研究、研报汇总,所有这些下游任务都可以在同一个基座上完成

没有数据和场景,金融大模型无用武之地

金融行业大致分为银行业、保险业、信托业、证券业和租赁业。

针对五大行业,分别有不同落地细分场景,如为自动客服和虚拟助手、风险评估和欺诈检测、投资和资产管理、信贷评估和审批、金融市场预测和交易策略。多变且严谨的应用场景,使得大模型+场景插件可能成为落地通路。

文因互联给极新(ID:jixintech)举例了文因大模型的三个具体应用场景。

场景一:企业债发行更趋市场化后,发行周期轮动会更快(周期变短,提出效率更高的要求),如何快速高效处理发行文档,也是各家机构发展市场的重要突破口。大模型+金融文档理解插件,可以处理文档,从原本的周、月、日为单位传递的文档信息,变为分钟级或秒级传递。

场景二:以债务融资工具发行为例。在发行环节,很多业务人员在处理庞杂的数据信息,并且如何做到内部审查合规方面非常头疼,有些需要一些外部数据辅助判断,有些需要通过翻找上下文相关信息判断。业务处理费时,而且数据看得人头昏脑涨,容易出错,并且有时核查标准松紧程度是不一样的,造成一些风险。大模型+业务分析场景插件,可以快速核查,几百页的文档,从原本几十个工作日的核查投入压缩为几分钟。

场景三:以评级报告生成为例,不同评级场景的文档众多、需求零散多变,占用大量人力成本;评级分析需要大量专业知识积累和数据查找,关键信息隐藏在海量的文档数据中,缺少数据加工生产线,将非结构化的文档,转换成可利用的数据和知识。基于大模型+文档生成场景插件,辅助评级报告素材收集、初稿写作、跟踪评级报告财务数据刷新、评级报告审核等全作业流程,深度挖掘评级报告数据价值,沉淀指标数据,赋能业务场景,实现完整闭环的评级报告生产流水线,提高工作效率。

显然,通用大模型要满足上述具体业务应用场景得需要具备两个条件,一是要杜绝胡说八道,二是有市场能接受的落地方案,包括算力、训练参数和价格的合理分级。杜绝胡说八道靠前文提到的基座,它可以实现所有应用,包括数据治理、分析型应用、写作类应用和智能交互式应用,这是一种新的技术范式。

在市场商业化探索方面,文因针对性的给出了一个方案。

鲍捷博士认为,方案的首要任务是打破大模型训练昂贵、落地成本高的硬门槛,在发布会当中提出了三个针对性方案,分为三个价格档次,10-30万,30-100万,100-300万,不同的投入可获得不同的模型效果,让落地成为一件清晰投入产出比的买卖。

文因大模型,每一步都算数

2015年,鲍捷带领团队回国,在北京成立文因互联,同年12月,拿到了天使轮投资。

2018年,文因互联决定由C端向B端转型。在2016至2018年间,完成了Pre-A以及A轮融资。

现在看来,文因互联的这一转型判断完全正确,也正是这判断,文因互联命运的齿轮开始转动。

紧接着,2019至今,文因互联完成了A+、B、B+三轮融资,目前正在进行C轮融资

2018年起,文因互联铸造了两把利剑——飞梭智能文档认知平台知识图谱平台,不仅是其沉淀清洗有效数据的药引,同时也是沉淀出文因大模型的基础。

飞梭智能文档认知平台的研发从2018年开始,可以提供对数据生产的全流程、一站式服务,能够理解文档、生成文档。基于“飞梭”平台,文因互联采取自动化的方式沉淀了知识图谱,是“飞梭”的核心能力,基于深度学习的构建技术,和传统人工成本相比,已降低不止 100 倍。

某头部银行为例,在合同自动解析和抽取方面,以前人工解析一份合同需要约两个小时。飞梭系统上线后,提取一份合同的时间仅为一分钟,速度较之前提高 120 倍,实现了整体效率的提升。

某案例应用数据显示,飞梭帮助用户完成划款指令的自动分类和处理,在 19 个小时里帮助客户完成 1200 多笔指令处理,完成 2500 多只产品、10 天的对账工作。

在底稿生成方面,文因互联目前与券商合作撰写债券发行中的承揽、承做分析报告。以前一个分析师写一份报告需要三天时间,现在只需要 3 分钟就可以帮助分析师完成底稿生成工作,极大提升效率。

“文因的打法是,先在金融行业,把公司的技术理念实践出来。当把一个行业‘吃透’,能适应所有的需求时,再开始做其他行业的拓展。目前,从技术积累上看,文因互联已经具备了拓展行业的能力。但在短期内,公司仍将在金融领域持续深入布局”鲍捷说。

值得一提的是,若要将硬实力转化为真正意义上的价值,实现与用户之间的相互赋能,仍需向商业化落地看齐,否则也只是空中的虚无。

金融大模型的未来

盘古大模型深入千行百业的口号,坚定了企业走行业大模型的路径和信心。

恒生电子高级副总裁、恒生聚源董事长王锋提到,“当技术、模型、数据、应用快速形成闭环,将产生真正的业务价值,AI进入了从能力涌现走向价值涌现的新阶段。”

度小满CTO许冬亮表示,在前台,大模型将提升金融机构客户经理的专业水平,降低客户经理的运营成本。在中台,其有机会改变企业内知识获取、内容创作、代码开发与测试的方式,甚至有可能全方位提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

陆金所控股CTO毛进亮在某次采访中谈到,AIGC很可能导致所有的“专家系统”领域都会受到冲击,包括咨询顾问、代码技术专家等。具体将在金融行业的智能运营、智能风控、智能投顾、智能营销、智能客服等多个场景产生影响。在金融服务方面,AIGC能够将原本更加依赖专家“个体”知识与经验的服务,扩展到可以支持到所有的从业者,不仅提升整体行业服务水平,也会大大提升服务能力。

B2B行业存在高毛利、高周转、大规模的“不可能三角”,这同样适用于方兴未艾的大模型产品:更大普及率、更高性价比、更可观的利润不可兼得。“这个三角从来都不是技术造成,技术擅长掀桌子”鲍捷对极新说。

后记:

  1. 2020年,熵简科技 AI Lab 开源了基于 BERT 架构的金融领域预训练语言模型FinBERT 1.0。据悉,这是国内首个在金融领域大规模语料上训练的开源中文BERT预训练模型。

  2. 2020年,华为云推出了智能金融大模型“ModelArts Finance”,该模型基于华为云的Atlas 200 DK和MindSpore深度学习框架,可以应用于风险管理、反欺诈、信用评估等多个场景。

  3. 今年 3 月,彭博针对金融业推出大型语言模型BloombergGPT,引发市场对金融垂直领域大模型的关注。

  4. 今年4月份金证股份在公司AI战略发布会上正式发布了自己的AI战略,将在金融AI大模型、RPA+AI、智能客服、智能投资等方面进行布局。

  5. 今年 5 月,星环科技推出了第一款面向金融量化领域的生成式大语言模型 " 无涯 Infinity"

  6. 同样在5月,度小满开源国内首个千亿参数金融大模型 " 轩辕 ",在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势 。

  7. 今年 6 月,恒生电子发布金融行业大模型LightGPT,并宣布将于 9 月底正式开放试用接口。

  8. 7月25日,北京知未智能科技有限公司在上海发布了知未智能 KDF 大模型 ,以及基于该模型研发的一系列产品,包括“ KDF 智讯”、“KDF 绝未”、“KDF 中书”等金融行业工具。从部分基准测试结果来看,知未智能 KDF 大模型在七个自然语言处理任务中展现出稳定的性能。

  9. 马上消费基于自主的金融大模型和动态自适应强化学习技术,在营销、服务运营、数据决策等领域已经实现落地,近期将正式发布自主大模型。

  10. 奇富科技自研的行业大模型奇富GPT 取得阶段性成果,预计在年内推出金融行业通用大模型产品。该模型在过去半年中在各个业务场景中表现良好,并计划运用AIGC 的能力逐步向金融机构开放使用。

责任编辑: 云舒

相关资讯
写评论