智谱AI CEO 张鹏:AGI比进入某个垂直领域更值得追求

来源: 极新
   
“ 预设未来 ”

整理 | 云舒

出品|极新

10 月 27 日,智谱 AI 在 2023 中国计算机大会(CNCC)上发布了新一代的瞄准 GPT-4V 的中英双语对话模型 ChatGLM3 、国内首个具备代码交互能力的大模型产品「智谱清言」,并发布了新的MaaS平台商用部署方案——ChatGLM-turbo。

在国内众多的大模型公司里,智谱AI被称为最有 OpenAI 气质的中国公司。

面对智能时代的浪潮,智谱AI 有哪些深刻认知?在商业规划上有何见解?对大模型的竞争格局如何看待?如何寻找新的机会?

极新整理了智谱AI CEO 张鹏近三个月的最新演讲与媒体对话,选出了最具代表性的观点,相信能为你拨开眼前的云雾。

张鹏,智谱AI CEO,清华大学2018创新领军工程博士。

 

01

慢慢清晰

“ 从火热到理性 ”

对于模型侧,现在是混战的后期,格局会慢慢地清晰下来。

红杉资本的公众号有篇文章讲到,现在进入到了一个新的阶段,这个新的阶段跟之前那个阶段略微会有些差异。之前火热是因为大家都没把这些事情想的特别明白,投资也好,政策也好,市场的期待也好,大家是把它胡子眉毛一把抓的。

不管你是做基座模型的,做行业模型的、还是做应用的,反正只要是跟这个沾边,都算到这个里头。但是到了现在这个阶段,大家逐渐的会把这些尝试分开来看,谁是做通用的,谁是做行业的,谁是做应用的,可能慢慢地就会把它分清楚。

对于智谱AI来说,在差异上的认知还是很明确的。首先我们对这件事情的认知和目标非常明确,就是聚焦在基座和通用的基座模型上、技术模型上。行业应用、商业落地就用生态式的方法来做,当然核心的还是我们自己的技术。随着时间往后,大家对我们的认知也越来越趋同和一致,这是个好事。

关于发布的新模型,我们基本上是和跟 OpenAI 比,因为 OpenAI 是做的最好的,我们基本上是这样来比,那至于国内的水平,大家各自心里有把尺可以去量。

我们一般的迭代周期就是 3 到 6 个月一代。上次二代是 6 月底,这次是 10 月底。

团队规模目前是 400 多人,当中有 70% 左右的人员是研发,当然这个研发是比较宽泛的概念。

有些人注意到了智谱清言在代码理解上出了一些 bug,现在准确度肯定在持续提升。当然这个具体的成功率或之类的,可能每个人的体感不太一样。根据测试的用例、测试的方法周期范围,只能是无限的去逼近准确,但也没办法做出最准确的一个测算。虽然整体成功率还是比较高,但是现场演示的确会有一些风险,这个也没办法,我们还是希望把真实的演示呈现给大家。

 

02

国内大模型公司在商业化上存在共性问题

“  需在生态里互相磨合 ”

人工智能本来就是一个综合性学科,如果研究的成果不能很快被应用,它的价值很可能被遗忘。所以在KEG,我们会把研究和工程放在相对平等的位置上。这个风格也延续到我们出来做公司。

另一个因素是,在大模型时代里,产学研用这件事被极度压缩,表现为周期变短、距离变近。原来像神经网络、CV等技术从被学界研究出来,到真正落地工业产生实际价值,中间要2-5年。但ChatGPT模型训练到产品上线,再到有一亿全球用户,可能不超过1年。

我们有一个和别人不一样的特点,长期有一群工程师和研究员一起工作,所以从成立第一天起,智谱AI就是从一个团队开始的。

所以从公司的发展路径上来说,我们是带着技术,带着团队,带着客户和市场直接启动。我们是一边做核心的技术,一边去拓展市场。从第一天开始,我们就有收入。

说实话,我们也不是一直信心满满,一开始也大胆假设,小心求证。

有一句话叫做“预见未来”,这和我们一开始主要的研究方向有关,包括数据挖掘、机器学习、算法这些知识工程下面的分支。这个过程中我们可以做科技趋势的分析和对未来的预判。

关于国内大模型创业公司在商业化上的共性问题,其实是大家对 AI 助手技术的认知参差不齐。

首先,大家对它的能力上限和下限的认知,很难完全达成一致,需要一个磨合过程。如果对能力有过高预期,在交付使用过程中就会碰到许多困难;如果预期过低,则会觉得 AI 助手没什么用处。这些可能都会让人很难真的去接受这项新技术。所以,认知预期不一致是比较普遍的问题,这个就需要通过磨合达成共识。

基于一些很新的技术,我们想要打造的生态,需要大家在整个大的生态版图里面互相磨合的。那么,哪些是面向客户做解决方案的?他们是要怎么样去引入这个技术,还是他们自己原创去做这个技术,自己去摸索这个技术?还是说他们要基于我们这个能力去做这个应用解决方案?

其实大家的想法是千奇百怪的,差异很大的,这个也是一个很实际的问题。所以我们在外头跟大家聊的时候,或者说做这种演讲的时候,都会强调这件事情,我们希望的是生态的打法。

行业性的行业模型、垂直模型或者是行业性的应用空间,我们是留给我们的生态合作伙伴,大家一起来把这个空间扩大。通过这种方式把客户价值的天花板持续往上抬,这是我们想要做的事。而不是说这个饼就这么大,大家在里面挤来挤去,你抢我一口,我抢你一口,这个事情永远做不大,而且大家都会很累,所以说不要内卷,要反向外扩,这样大家就会舒适一些,这是个很自然的想法,当然要做到这件事情还有很多困难,比如首先达成共识就很困难。

当然大家最终都会找到自己在版图当中的生态位。在这之前,有可能会担心被别人挤掉或者被别人侵占掉,这是很自然的一个现象,所以才会有些选择,总觉得好像得把所有东西都把握在自己手里,但是能不能真正的把握得住,也许得去拿脑袋往前拱一拱,试试看前面是堵墙还是什么,就是得试试看,这也是很正常的心态。只是我们希望,尽量跟大家以一种开放的心态,去沟通和交流,去建立一些共识,尽量磨合的过程不要损耗太大。

在磨合的过程中,主要是沟通。第一个是通过面对面的交流或者通过演讲、媒体来输出一些观点、想法和态度,让大家对我们的理念和做法有更多认识。第二个是通过一些已有的圈层,或者是社区,比如说开源,我们把我们的技术开源出去,把我们的一些经验,一些技术上的积累,一些资料分享给大家。这样大家也会更深入的去理解这件事情它背后的价值、难度、成本等一系列的事情,然后根据这些他们自己会做一个判断,自己能做到什么些事情,又很难做到些什么事情。还有一个是跟合作伙伴建立生态合作机制,可以针对性地结合他们所处的行业和能力需求去做一些技术培训、联合创新这样的工作,来让合作更加顺畅。

 

03

正因聚焦才领先

“ AGI比进入某个垂直领域更值得追求 ”

智谱的目标特别明确,就是要面向AGI,去做更强的模型。而且我们是最早在国内做这些事情的公司。我们并不想做一个模型够用就好,然后去开发应用,不是这样的。

开发AGI还是一个开放性探索性问题,目前做得最好的当然是OpenAI,它的GPT-4和GPT-4V,智能水平已经超过了人类平均线。OpenAI还在继续做,还没有达到所谓的AGI,当然还有很多问题需要去解决。我们也是朝着这个目标,但是OpenAI确实比我们跑得快。对我们来讲,一个比较简单的路径,就是瞄准OpenAI能做到的事情,我们尽快赶上它,赶上以后再来看未来应该怎么办。

一方面来说,做到AGI这件事本身就很难,很多事情都在探索。第二件事就是,OpenAI走到最前面,它很多事情从GPT-3以后就已经不再对外公布,也不发论文,不写详细的技术介绍。关键在于,我们对标OpenAI的GPT-4,我们只能对标它做的事。

比如说,GPT-4相比GPT-3.5加上了多模态,我们就分析这件事情,首先OpenAI为什么这么做?从效果上看,是不是加了多模态之后,整个模型的推理能力、逻辑能力、智能水平就会上一个档次?我们要来验证这件事,后来发现可能确实如此,那我们肯定也要往这个方向去发展。去研究具体怎么做,这一步就是我们自己得想办法的事情了。

单纯从大模型本身的能力来看,我们还没有碰到天花板,它还有很多空间可以去探索。比如具身智能,把模型加到硬件里或者游戏里,做有大模型的agent,都是另外的探索方向和路径,我没有说它错。这些探索都会对我们去实现AGI有所帮助,而且都是很顶尖的研究者在做这些研究,我相信这些东西最终都会往AGI这个方向去归拢。目前来说,我们还是比较聚焦在大语言模型和跨模态能力上。

大公司有比较丰厚的资源,可以调动能力投入更多资源,选择面也更宽。创业公司可能就需要更聚焦。我们是国内第一家做大语言模型的创业公司,正因为我们比较聚焦,所以在大语言模型的效果上才会有一个比较领先的身位。

 

04

AI Agent是新风向

“ 未来大模型能否产生更大价值,很大程度要看AI Agent的发展 ”

AI Agent(智能体)的应用非常有空间和前景。原来模型的能力大多数都是对标 ChatGPT 那种对话式的,它不能做一些复杂的事情,只能回答问题,如何扩展它的能力?

之前想过很多招,比如说 Plug-in platform 其实就是在扩展模型的能力,让它能够和现有的这些外界的系统去对齐,能够去很自然、自动地去对接。

 AI Agent 的这个能力其实是把这些东西都融合到一起,从模型层面来实现复杂任务的拆解,像人一样进行规划。比如我有 plan A、plan B、plan C,plan A 我要分为 step one,step two,step three,一步一步的去执行。step one,我可能要去 call 一个外面系统的数据库,step two,可能我要去做数学的一个计算,step three,可能我们需要去把这个计算的结果用一个自然语言去 wrap 一下,形成一个输出,或者是形成一个表格,它是会有这样的一些能力,来解决这些问题。

 AI Agent 很重要。未来大模型能不能在实际应用当中产生更大的价值,或者说把它变成一个理想中的所谓的「大脑」的角色,而不是停留在 Q/A bot、Chat bot 的角色,很大程度上要看 AI Agent 的发展如何。

从落地到实现以上功能,这会是一个加速的过程。因为 AI Agent 这个能力,从学术研究提出到现在大家可以体验的过程是非常快速的,我相信后面真正到实际应用当中的过程会更快,因为现在你看它已经能做到一些事情了,虽然可能还有些瑕疵,有一些没有不完美的地方,但我觉得随着这个研究的深入,最终会加速实现更广泛和深入的应用。

责任编辑: 黔小景

相关资讯
写评论