大模型落地呼声越来越大,但是以什么方式落地依然有争议。国内如此,国外亦然。不同的思想对应着不同的方法论。
一部分AI企业忙着更新通用大模型打榜,做一些视频生成工具之类的热门产物,巨头多数属于此类。
另一部分则在专注行业大模型或是平台,例如国外的Glean和国内的第四范式,后者最近还发布了AI数字人视频合成平台,着眼于让企业更方便地用上大模型能力。
此外,还有以服务大模型发展为己任的“卖铲子”型公司,比如从数据标注工作发展到AI全流程数据服务和模型搭建的Scale AI――如果转型顺利,它也会成为第二类公司。
这不是单纯的商业模式辩论,“所有行业都值得用AI再做一遍”的共识早已形成,但直到现在,还有很多问题在等待着回答。尤其是背靠中国产业背景的AI公司们,也许可以送上不同的答案。
AI大模型的方向划分
很多公司现在都可以说自己是AI行业的,但形成模式≠有长期价值。
目前大多数企业利用AI展业的方式,一定是通用的语言大模型,使用本行业的数据语料训练一下,就已经称得上差异化应用。但这很可能是一种取巧的方法,Zapier(一家基于无代码模式开展业务流程自动化探索的公司,与生成式AI自主工作的智能化特点有较强契合性)联合创始人Mike Knoop认为,扩大语言大模型本质上只能推动“记忆”这种智力形式的发展,和智能是有区别的。它不能理解企业的场景和需求,所以也做不到把AI的价值彻底发挥。
(图源:Zapier官网)
另外,如果我们能将GPU算力投入增加与语言大模型能力提升的曲线进行对比,那么它的收益增量虽然确实存在,但很有可能是存在边际收益递减的。当互联网上已经存在的公开简易数据都被用光了之后,再想依靠做通用语言大模型在AI领域弯道超车,就会变成一种幻想。
这对企业来说更是不利的。企业总是会在追求新技术的过程中如“猴子掰玉米”,譬如一开始想要用新技术解决一个确切的问题,结果变成了一场概念追逐战:大数据出来了就用大数据,计算机视觉火了开始研究CV,到了大模型和生成式AI的时代,AIGC、AGI变成了他们战略报告的关键词。但越往后,最根本的问题反而被忘记了。
解决这个问题,或者说解决企业AI大模型需求问题的方法,其实就握在AI企业手中。
明星风投公司Benchmark的合伙人Sarah Tavel认为,第一波AI用例只是给出了一种API的使用方式,但把人工智能技术限定在帮助单一工具层面并不是合理的结果,最好的发展方向是基于给客户提供完整的产品和服务――面向行业客户具体需求开展大模型创业。
而号称华裔天才少年的Alex Wang,同时也是Scale AI(Scale AI最初以数据标注服务起家,后来在此基础上转变为以AI为主导的全流程数据解决方案服务商,包括帮助客户建立可用大模型,以及托管服务)的联创,他认为,数据才是AI模型性能的瓶颈,而非算法或计算。数据最终来自很多个垂直行业,这意味着AI企业应当深入到行业领域,做符合企业需求的行业大模型。
这个过程有两个需要注意的关键点:
一方面是数据问题,正如Alex Wang的观点,AI公司要有“读懂”用户和行业的能力。因为从根本上来说,经历过数字化时代的公司大多有很多数据语料躺在仓库里,但缺乏辅助情况下,它们无法发挥作用。
另一方面是管理和迭代问题,由于行业、场景千变万化,目前的行业资源不太可能支持一家公司横跨所有领域一个一个建造大模型。如何解决这个问题呢?
第四范式和Zapier联合创始人Mike Knoop都将关键指向了自动化。技术方面,AutoML、程序合成和神经架构搜索都涉及自动化和优化过程,以期减少人工干预,提高效率和效果。Mike Knoop认为AGI的探索需要基于程序合成和神经架构搜索,而第四范式创始人兼CEO戴文渊则在接受“智能涌现”采访时提到,构建无数个行业大模型的底座技术是AutoML――自动机器学习。
(图源:Microsoft Learn)
戴文渊说,AutoML是“一个失败的艺术”,它能发挥更大的价值,是因为第四范式做过太多的场景,懂得怎么让数据和模型的发展,向特定场景的需求贴近。成功的化为成果,失败的变成养料,基于自动化加速扩大迭代。就像Alex Wang说的:“机器学习是一种垃圾输入、垃圾输出的框架。”但如果我们有高质量的行业数据,以及不断纠错的能力,最终就会让行业大模型成为现实,并实现可靠的落地。
这个行业的顶尖思想者们,一定程度上对行业塑造的逻辑保持了对齐。而像第四范式这种根植于中国复杂产业场景的AI公司,所做的延伸还可以更多。
做不同的AI模型,想法、途径和前景
以OpenAI为代表的、一部分专注通用大模型的企业,发展趋于横向,大模型就是一切。在商业模式上,它们售卖的就单纯是大模型的能力。相比之下,第四范式、Glean,甚至Palantir这样的利用AI技术帮企业在某些方面做决策以提升整体工作效果的公司,走的是另一条路。它们的商业模式也不一样。
比如Glean,它提供基于AI技术打造的AI企业搜索和知识管理平台,并集成了非常多的第三方应用功能,直达其他的SaaS产品。也就是说,把自己变成了工作流的一部分。同时,Glean也可以帮企业用企业数据训练专属AI模型,而训练的基础是Glean自主打造的“可信知识模型”。这家公司的出发点是,员工往往很难在复杂的工作体系中找到有用的信息,而Glean在传统企业搜索的基础上,利用AI模型和工作流全流程跨应用服务能力,建立了新的优势。
对照Glean来看,第四范式对提升企业核心业务的关注,以及实现AI大模型介入业务的手段,在思想内核上是一致的。这是因为它们的理念就是从行业和企业需求出发的,脱离了单纯的唯技术论、唯参数论、唯语言论。不过,第四范式更深入到行业核心业务问题的预测管理上。
第四范式在今年上半年发布了行业大模型平台先知AIOS 5.0,它继承了此前第四范式对数据治理与智能发展等方面的思考,但更注重帮助企业挖掘行业大模型的潜力。AIOS 5.0核心特点是基于各行各业场景的X模态数据,构建行业基座大模型。
(图源:第四范式官网)
在能力层面,它侧重于Predict the Next “X”,X代表各大行业包罗万象的逻辑和结果。在使用层面,在支持接入企业各类模态数据的基础上,先知AIOS 5提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。在应用层面,考虑到中国的产业和场景复杂度水平极高,实际为行业大模型垂直发展提供了环境。
这其实是中国AI公司基于产业背景发展的一个极佳案例。戴文渊曾说:“我们国内有大量场景和数据优势,当我们覆盖场景足够多,把这些模型拼起来,最后你可能也实现了AGI。”相比之下,现在流行的很多行业大模型,依然还是行业大语言模型,大而不精。划分到更精准的场景后,虽然表面上看起来需要建立很多个大模型,但每个精准场景的数据量负载有限,同时有自动化技术的帮助,反而另辟蹊径实现了AGI在应用层面的发展。
如同Mike Knoop的观点,AGI之所以在狂飙突进后迅速遇到了上行阻碍,是因为我们过度依赖语言大模型,把AGI定义为能完成大多数工作的系统,但AGI实际上应该更侧重高效获取的新的能力,解决各种场景下的开放性问题。
事实上,这也许才是正确的思路。英伟达CEO黄仁勋就在美国加州理工学院第130届毕业典礼讲话中提到,随着大模型发展,计算机从指令驱动转向意图驱动,“将来的应用程序所做的和执行的都会与我们做事的方式相似,组建专家团队,使用工具、推理、计划和执行我们的任务”。这样的逻辑本身就意味着通用性。所以我们也看到,大模型正在进入物理世界,因为物理世界的决策同样有迹可循。
类似的例子,就像过去一年多时间因AI技术估值暴涨两倍多的Palantir。Palantir原本是一家To G的大数据公司,基于数据分析和建模仿真辅助决策,但生成式AI技术令其处理数据的方式发生转变,在自动化与数据决策方面进步甚多,加速了AI To B业务的开拓。第四范式,就是在每个具有确定性的场景中建立行业大模型,助力企业掌握自己的应用,做出有效的决策。
(图源:雪球)
最后,回到关于未来前景的思考上。OpenAI过于注重把通用能力做到极致,因而暂时失去了占据特定领域产品优势的机会。相比之下,那些侧重于发展更自由、更开放的模型的企业,都得到了发展机会。而在商业模式上,以订阅为主导的OpenAI会继续“出售”大模型的能力,更像是工具;而第四范式、Glean、Scale AI、Palantir等公司则是销售技术及其附加组件和服务,更像一个系统。
Scale AI上半年以138亿美元估值融资了10亿美元。成立五年的Glean在 D 轮融资中筹集了2亿美元巨款,估值已高达22亿美元,换算成人民币在160亿元左右。第四范式在港股的估值稳定在224亿港元左右,其成长性应该主要挂钩先知平台的发展和收入。今年一季度,第四范式8.28亿元的总营收中,先知平台占5亿元,比例为60.6%。随着应用场景的增加和收入的增长,它的价值也会得到释放。
最终,AI公司在通往AGI的道路上一定免不了和行业巨头对比。但只要它们能生产出越来越多的能在实际场景中为企业创造价值的产品时,市场自然会为它们赋予不一样的价值。AGI是个巨大的概念,一切探索对未来而言都是有益的。
来源:港股研究社
原文标题 : 中国AI公司可以不走寻常路