百度世界大会:大模型的应用冲刺
“没有构建于基础模型之上的丰富 AI 原生应用,大模型就一文不值。”
如果一项新技术不能跨越应用鸿沟,让生活更方便、有趣,或让工作更高效,不论它亮相之初有多大想象力,都会被边缘化。过去几十年,从虚拟现实到元宇宙再到区块链,都卡在了寻找应用、兑现商业价值的关口,从一时喧嚣走向相对沉寂。
大模型如今也处于寻找落地应用的关口。在 10 月 17 日举行的百度世界大会上,这家中国投入大模型最用力的公司,给出了自己对大模型落地的阶段性回答。
与 3 月 16 日发布文心一言时相比,百度创始人、CEO 李彦宏现在更自信、松弛了。今天大会现场,他面向台下 4000 多名拥挤的观众,张开双臂表达兴奋,在此前的发布会上,他鲜有类似的大幅度肢体动作。
李彦宏宣布了百度大模型的新进展:发布新版本的文心大模型 4.0,同时用大模型改造了百度的十余款应用,包括搜索、地图、文库和网盘等。
“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。” 李彦宏如此形容大模型的应用竞争,这也是百度现在的策略:加速冲刺,多方探索应用可能,尤其看重 “AI 原生应用”,即离开 AI 无法成立的应用。
“没有构建于基础模型之上的丰富的 AI 原生应用,大模型就一文不值。” 李彦宏说。本次百度世界大会的主要内容就是 “李彦宏手把手教你做 AI 原生应用”。
在 6 月参加一场活动时,李彦宏还从国家科技实力竞争层面总结了 AI 应用的重要性:“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生 AI 应用,这些应用在多大程度上提升了生产效率。”
在今天长约 70 分钟的百度世界大会主论坛演讲中,李彦宏只分了约 20 分钟给文心大模型 4.0,重头戏落在百度会如何用好大模型。
过去 7 个月里,百度把文心一言和它背后的大模型更新了大大小小数十次,举办了大模型创业大赛,提出了多个大模型生态计划,向全社会开放了大模型应用。作为中国最早大力度投入 AI 的互联网大公司,百度对大模型的期待,甚于同样在追逐这个机会的对手。
更大的参数规模、更强的基础能力
百度世界大会上,李彦宏首先公布了百度在基础模型上的进展——文心大模型迭代到 4.0 版本。李彦宏没有提及具体的参数规模,只强调它是最强的文心大模型,“综合水平与 GPT-4 相比已毫不逊色”,已开启内测。
据《晚点 LatePost》了解,文心大模型 4.0 版本的参数规模或达到万亿级别。李彦宏现场用文心一言 App 展示了新版大模型的能力:
-
理解语义。李彦宏问文心一言:“我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作。” 他刻意打乱表达顺序,先说回承德,再说北京公积金,这是口语交流的常见情况。文心一言正确理解了上下文,它告诉李彦宏,河北承德户籍的用户也能用北京公积金在承德贷款购房,并给出了办理步骤。
-
多模态生成。李彦宏要求文心一言基于长安新能源车的照片,结合 “春天”“富有生机”“体现飞驰感” 等描述生成竖版海报和 5 条广告文案,文心一言不仅完成了规定任务,还额外做了一条 30 秒的数字人广告,只花了 3 分钟。
-
逻辑推理。李彦宏出了道应用题:把一个底面积 8 平方米、高 12 分米的锥形沙堆,以 5 厘米厚度,铺在宽 2 米的路上,能铺多少米?文心一言给出了详细解题步骤和思路:基于沙堆体积保持不变的常识,运用圆锥体积公式、统一计量单位和解方程等知识点。
-
记忆能力。李彦宏先让文心一言写一篇情节跌宕的武侠小说,然后让它把角色从 2 个增加到 4 个,增加故事冲突性,文心一言新增了可以预测未来的角色,还让大宗师变成了反派的幕后头领,使故事多了反转。这展示了文心一言通过记忆多轮对话,生成复杂文本的能力。

李彦宏让文心一言写武侠小说。
据介绍,文心 4.0 在理解、生成、逻辑、记忆四大能力上均有提升,而其中逻辑和记忆能力的提升更大,逻辑能力的提升幅度是理解能力的近 3 倍,记忆能力的提升幅度为理解能力的 2 倍。李彦宏说,文心大模型在这些能力上的进步,是 AI 原生应用赖以生存的基础。
AI 原生应用的意义之一,是让 AI 和大模型找到适合它的经济模型。传统软件的特点是:一次开发、无限复制,边际成本显著降低。而大模型的特点是,用户每次调用大模型时,都要消耗 GPU 计算资源做推理。
更好发挥大模型的价值,需要技术进展:如提升算力使用效率,或针对特定场景开发效益更高的模型;也需要应用创新与商业创新:在发布参数更大、性能更强的文心 4.0 后,李彦宏和百度多部门高管展现了百度当前的应用探索成果。
从搜索到网盘,百度用大模型 “重做” 多款产品
从 Google 到微软再到百度等自研大模型的大公司,寻找大模型应用方向的共同选择之一,是用大模型改造公司已有的产品或应用。
这一策略的好处是,公司不用投入太多资源吸引大量新用户,靠上线部分新功能,就能基于庞大的用户基数,更快获取大量真实使用反馈,在竞争初期加速大模型迭代。
就产品上线速度看,百度目前是中国大公司中,用大模型改造已有产品最快、涉及产品数量最多的公司之一。其主要切入点是通过大模型的理解、生成、逻辑推理和记忆等能力,改造已有产品的交互方式。
什么才是大模型时代的好交互?李彦宏有一个精简的评判标准:菜单不应超过两级。这些变化体现在百度今天发布的各款应用升级中:
-
百度搜索:交互界面还是搜索框,但反馈的结果不再仅是网页内容匹配,而是大模型理解问题后给出的回答。比如当用户在搜索框中输入 “过去 20 年工业增加值排名”,百度搜索引擎会直接返回结果,甚至附带数据图,同时会推荐与 “工业增加值” 有关的更多内容。此外,百度还在搜索中增加了多轮交互能力,引导用户一轮轮提问、找到答案。
-
百度办公应用如流中新增 “超级助理”,可让用户通过 “讲话” 直接完成复杂办公任务。如规划出差行程时,用户可以对如流说,“计划出差去上海,和人保王总见面”,如流会根据他的日程安排时间,预定 7 点半之后的飞机、推荐附近符合差旅标准的酒店,整理这次出差的背景资料、给对方发起邀约……它还可以快速总结工作群中的未读消息和会议纪要,李彦宏称,新功能能 “让开会时间缩短 40%”。李彦宏现场让如流把他刚才演讲的 40 分钟内容总结成了几百字的要点,涵盖文心大模型的新能力特征和搜索产品的核心变化等。
-
百度文库。李彦宏说这是百度用 AI 重构得最彻底的产品,现在用户可以告诉百度文库:我想做一场 “AI 心理学应用” 的主题演讲,百度文库即可自动搜索文库中的相关期刊和报告等资料,生成一篇演讲稿,还可生成相应的 PPT,并根据反馈调整 PPT。“百度文库已经从内容工具变成了生产力工具。” 李彦宏说,目前已有上千万用户使用了上亿次百度文库的新功能。
-
百度网盘新增智能助理 “云一朵”,它可以根据模糊的主题词和描述,帮用户找文档和视频片段等,还能帮用户快速提炼视频重点、添加字幕。“云一朵” 还可以在微信端总结、提炼微信文章要点。目前 “云一朵” 用户已达到 2000 万。
-
百度地图,强调 “新交互” 和 “新导航”,李彦宏称之为 “全球首个 AI 原生地图产品”,用户可以通过描述搜索地点,而不用给出精确的地址:如让百度地图推荐百度大厦、中国美术馆、望京 SOHO 三地之间的居中聚会地点,通过持续对话,人工智能助手还能协助用户完成餐厅预约、打车等任务。
除了重构现有应用产品,百度也在用大模型能力打造新产品。“AI 原生应用,要能解决过去解决不了或解决不好的问题,而不是对移动互联网应用或者电脑软件的简单重复。” 今年 9 月,李彦宏在面向开发者的百度云智大会上说。
无人驾驶和今天发布的百度 GBI (Generative Business Intelligence,生成式商业智能)是这一方向的尝试。
百度投入无人驾驶(无人出租车)已有 10 年,它本身不是新业务,但由于尚未进入商业化落地阶段,仍处在 “创业期”。李彦宏认为,无人驾驶是最典型的 “AI 原生应用”。行业现在的技术趋势之一,是尝试使用与大语言模型类似的底层架构训练用于无人驾驶的模型,提升其感知和决策能力。在大会展示的一段视频中,百度智能驾驶事业群组总裁李震宇在武汉机场用萝卜快跑 App 叫了一辆出租车,主驾和副驾上都没有安全员,是一辆真正的全无人出租车,这辆车顺利把李震宇载到了武汉主城区。目前,在武汉、北京等地,百度已有约 800 台无人出租车在运营载客,累计完成 400 万订单。
百度 GBI 是一款面向企业或行业客户的云服务,能帮助企业更智能、快捷地分析商业数据。与一般 BI 工具的区别是,GBI 的交互方式更简单,它允许用户 “以任意问题询问任意一张或多张数据表,快速得到结论”,接入充分数据后,它可以根据各种场景分析公司经营情况,比如 “做一个新项目的成本有多少,实施周期多久,利润率会有多少”。这一定程度上解决了一些老板和企业经营者的痛点:他们希望更快、更方便地随时了解经营状况,但过去的工具用起来复杂,很难办到。
百度智能云应用产品中心总架构师孙珂说,GBI 将作为一个百度智能云提供的新能力,通过云服务和其他大模型能力一起用到制造、能源、电力、化工和交通等实体行业中。
作为掌握云计算的大公司,百度还在布局大模型落地的第三条路:与云服务结合,提供智能算力资源和训练工具,帮其它企业做出自己的模型。
除了以百度智能云提供训练和运营大模型所需的算力外,今年至今,百度还陆续推出了一系列平台或工具产品,如帮助生成营销材料的 “擎舵”、文心大模型插件开发平台 “灵境”、企业级大模型生产平台 “千帆” 等。
李彦宏今年 5 月底曾在文心杯创业大赛启动时说:“中国会有自己的生态系统,拥有自己的大语言模型和基础模型。中国会出现至少一个,也可能是两个或三个基础大模型,可以支持人们开发各种 AI 原生应用。百度的文心大模型就致力于成为 AI 开发者的默认基础模型之一。”
大模型的应用大考
百度在持续投入 AI 与大模型,而它的一款小产品,记录着这个领域或概念的 “归于平静”。根据可以反映中文互联网搜索热度的 “百度指数”,引爆此轮 AI 热潮的 ChatGPT 搜索量在今年春节后激增,于 2 月 8 日达到顶峰,此后震荡下滑,目前的日均搜索指数只有顶峰期的约 1/28,AI 一词的搜索指数也有类似走势。
舆论骤起骤落在情理之中:任何 “黑科技” 要带来巨变,都需要时间。在时不时惊艳一次世人后,技术产业的常态是渐进与等待。不同的是,一些技术最终走过了低谷与沉寂,成为新商业与经济的要素乃至基石,如电力技术、计算机和互联网技术,另一些则长期挣扎于寻找落地场景,如虚拟现实技术,过去近 70 年的 AI 发展也是如此,直到最近才有了变化。
越来越多人现在相信 AI 和大模型会成为那类能度过低谷,带来变革的技术。据市场调研机构 Grand View Research 估算,未来 7 年,由大模型支撑的人工智能市场规模会以 35.6% 的复合增长率,膨胀至 1094 亿美元。咨询机构麦肯锡的预测更乐观:大模型和它掀起的生成式人工智能有望为全球经济贡献约 7 万亿美元价值,并将 AI 总体经济效益提高 50% 左右。
规模推演之外,市场上也出现了各种应用尝试。第一类努力是百度今天重点发布的方向:把大模型融入已有业务或产品中。除百度外,微软用大模型改造了 Office 办公软件,推出 Microsoft 365 Copilot 等产品;Google 发布了大模型版本的地图、Gmail;Adobe 把图像生成能力融入 Photoshop 等设计软件中。中国公司中,基于大模型能力的钉钉 “魔法棒” 今年 4 月开始内测,腾讯将生成式大模型用于帮客户生成广告素材,有道近期推出了大模型口语私教。
用大模型寻找新应用、开辟新客户的尝试,按服务对象,则大致分为两类:
-
面向个人用户开发大模型应用。常见形态有个人助手:如 OpenAI 的 ChatGPT Plus 和百度的文心一言等。据了解,王小川创立的百川智能计划明年推出的 to C 应用,其形态可能也是个人助手。另一种尝试,是把大模型能力用于开发社交、游戏等新型娱乐应用:国外有 Character.AI,国内也有多家公司在近期上线了可与虚拟智能体聊天的社交应用或者新增角色聊天功能。
-
面向开发者 / 政企用户,出售大模型和开发大模型应用的能力。比如微软 Azure、百度云等云服务供应商,既提供基础算力,也在开发一系列大模型工具,让客户能做自己的大模型。
一些信号说明实现商业价值指日可待:OpenAI 近期称,其今年的收入会超过 13 亿美元,是去年 2800 万美元年收入的 46 倍。挑战也存在:如微软就发现用户的订阅费无法覆盖大模型使用成本。据报道,微软推出的编程助手服务 GitHub Copilot 目前的月订阅费是 10 美元,但微软每月花在单个用户身上的平均成本超过 30 美元,微软的对策是涨价,但这有可能削弱增长。
整个行业的共同课题,还在于找到真正适合 AI 技术特性和商业特性的应用方向。李彦宏强调的 “AI 原生应用” 是一个很好的思考框架,类比过去的互联网和移动互联网,抓住最大机会的最成功企业,都没有简单复制过去的产品与服务,而是找到了最适合新技术特点的产品与服务新形态,如互联网时的搜索、社交与游戏,移动互联网时期连接线下服务与广大消费者的外卖平台与打车平台等,还有重塑了内容形式与分发方式的短视频应用等。
不变的是,大机会往往对应着广泛人群的大需求,如与人连接和交往(通信与社交)、娱乐(游戏与短视频)、购物(电商)、吃饭旅游(生活服务)、工作(办公软件)和出行(打车)等。
属于 AI 和大模型的杀手级应用仍在萌芽期。百度正全速解题,更强的文心大模型只是第一步。百度和其它想抓住这个机会的公司,需要同时完成技术迭代,和应用创新。在第一个任务上,百度已走到了中国公司的第一梯队,在第二个任务上,紧锣密鼓的产品更新,证明了它现阶段的决心和速度。
责任编辑: 椰子