京东言犀:不秀肌肉,只看能力
通用大模型有很好的泛化性和分析理解能力,在多轮对话中有表现突出。但众所周知,通用大模型的局限性也非常明显,它一般基于公开文献与网络信息训练,专业知识与行业数据积累不足,导致回答的精准度不够。另外,训练和推理的成本很高,而响应速度也经常满足不了部署需求。
就在几天前,京东对外推出言犀大模型及言犀AI开发计算平台。与通用大模型相比,这一参数达千亿级“高效率、低成本、低门槛”的产业大模型,源于产业土壤,更懂产业诉求,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
这也是京东从未考虑做类Chat GPT产品的原因,“变成了纯粹秀肌肉的模型,这不是我们想要的。”京东集团技术委员会主席、京东云事业部总裁曹鹏说,“发大模型本身不是我们目标,怎么利用这个技术真的带来产业变革,这才是我们想看到的。”
“京东言犀大模型 ‘源于产业、服务产业’,具有更高的产业属性、更强的泛化能力和更多的安全保障。”7月18日,京东集团技术委员会主席、京东云事业部总裁曹鹏在2023中国互联网大会开幕式演讲时表示。
瞄准产业价值是大模型的众望所归
2017年,京东曾旗帜鲜明地在战略中强调“技术!技术!技术!”。京东认为,研发技术不应当只关注商业价值,更要承担起产业和社会责任。对此,曹鹏详细阐释了京东的技术追求:成本、效率、体验、可信、普惠、突破。基于此,曹鹏介绍了言犀大模型三步走战略:现阶段,基于京东集团核心产业数据,京东于7月13日推出言犀大模型与大模型计算开放平台;今年内,应用于京东域内多项核心业务,通过模型精调提升专业域任务能力;在明年上半年,将面向京东域外重点产业场景全面开放大模型能力,向产业输出可用、可控、可信、可负担的定制化模型。
会上,曹鹏介绍了大模型和营销的结合如何带来全新的营销模式:AI增长营销平台,是京东科技市场和平台运营团队,依托日常的金融营销工作,结合大模型应用的探索。通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。
当大模型成为数字基础设施
为了降低企业享受大模型技术红利的门槛,京东把大模型的底层能力解耦出来,推出了言犀AI开发计算平台,该平台将于8月上线。
将大模型能力迁移到产业领域,实现垂直行业的“智能涌现”,并非易事。高质量的行业知识作为稀缺要素,决定了大模型的“智商”。言犀AI开发计算平台沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,通过算法工具集成到平台,并部署了京东技术团队开发出的100多种训练和推理优化工具,结合低代码应用平台,为客户提供从数据建设到模型应用的一站式服务。不到一周时间,用户即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。
为了应对大模型训练对AI算力的迫切需求,最新升级的混合多云操作系统云舰,通过创新的异构计算池化技术,实现GPU/NPU资源成本下降50%,全面支持多云多芯多活,助力企业渐进式完成国产化替代;最新版存储平台云海,单集群每秒读写性能提升5倍,达到行业领先的千万级,延迟时间低至百微秒,存算分离技术使成本降低30%。
传统数据库面对大模型训练的图片、音频、视频等非结构化数据,显得捉襟见肘,此时,专门针对此类场景的向量数据库应运而生。京东从2019年开始自主研发向量数据库,目前,向量数据库Vearch已经实现大规模落地实践:平稳支撑京东百亿级向量数据高性能检索,延迟时长降低到毫秒级,降低60%存储成本降低和80%推理成本。

“大模型真正实现自己的价值,一定是在产业应用中。”京东集团CEO许冉在京东云峰会上表示,大模型的价值=算法×算力×数据×产业厚度²“前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键。当产业效率和产业的边界拓展得到质的提升以后,大模型才有了更重要的实际价值和意义,这将不亚于又一次工业革命。”
“从产业端切入大模型,如同从北坡攀登技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景。”许冉说。大模型的难点,不仅在技术追赶,更在产业突破。京东言犀大模型能否成就更多产业案例,让我们拭目以待。
责任编辑: 云舒