(原标题:生成式AI加速向自主AI演变,投资机构的攻与守丨GAI进化论)
2022年末,OpenAI推出ChatGPT惊艳众人至今,大模型技术还在不断演进。与此同时,大模型的应用下沉正成为今年一大主要命题。随着基础大模型能力走到一定平台期,生成式AI的发展阶段以及相应投资机会都正有所演变。
近日,Gartner发布2024年新型技术成熟度曲线显示,生成式AI已经处在“期望膨胀期”的末端,常规来说,不久之后将进入“泡沫破裂低谷期”。Gartner杰出研究副总裁Arun Chandrasekaran表示:“虽然目前的AI模型缺乏自主行动能力,但各AI研究实验室正在快速推出智能体,借助智能体与环境之间的动态交互来实现目标,不过这将是一个循序渐进的过程。”
对此,一村淞灵投资总经理张晨接受21世纪经济报道记者采访时表示,“在深入学习了解多种AI大模型的底层算法后,我们认为,如果要让AI技术加速渗透到生活中应用,可以分为三个AI发展周期:感知周期、模型周期、行动周期。目前阶段会重点布局前两个周期。关于近期大热的具身智能赛道,随着下游应用场景的丰富,可能会在2025年形成生态位,但具身智能最合适的形态可能未必是人形,要结合具体场景而定。”
技术剧变
当前大模型浪潮是由Transformer架构支撑发展的产物,但至今业界依然有观点认为,Transformer未必会是大模型发展的终极路线。
近期再度受到关注的Mamba架构,就是一种非Transformer路线。这是因为Transformer架构的一大关键要素在于自注意力(Self-attention)机制,其可以更好处理上下文理解问题,但也有缺点。这也是后续如MoE等新技术在持续推出以优化该架构,同时市场依然在探索大模型技术路线的原因。
(2024年新兴技术成熟度曲线,图源:Gartner)
“自注意力机制的不足,在于面临低成本推理、可扩展能力、并行计算这‘不可能三角’,三者无法同时满足。”张晨对记者分析,“我们研究认为,AI强大的点在于,从多个层面会颠覆人的知识体系。以前的一些发展路径不是不好,只是人类认知不理解而已。例如Transformer架构的前身是生成对抗网络(GAN),当时很多人觉得其最终实现效果不好,但可能只是人类无法理解而已,并不是这条路线本身的不足。”
他进一步指出,OpenAI坚定走Transformer技术路线,除了自注意力机制外,核心还有基于人类反馈的强化学习机制,到Sora推出,更是将Transformer积累的优势发挥到了极致。
“目前市场上如OpenAI、谷歌等巨头都是在基于这一架构进行堆叠和优化。整体看很强大,但从个体能力方面还存在局限。”张晨续称,所以下一步要推动技术进一步升级,业界可能需要探索如何解决前述“不可能三角”问题。这也许要回归到原本的生成对抗网络路线,或者有新的算法出现,从而推动AI实现螺旋式上升发展。
天风证券近期发布的报告也提到,2024年模型架构的变化将成为最重要的变化,模型架构变化有望带来的能力进步,将直接打开大模型应用的更广阔空间。
这也是技术加速变革期的典型特征,即不确定性。这不仅围绕着产业界,也是投资界需要面对的难题。
“要延续投资,就需要对市场和技术有敬畏心。”张晨对记者表示,“通识大模型的核心是比拼算力资源,但根据我们所在投资机构的资金属性,我们更愿意谦逊地先跟国内AGI头部公司虚心学习交流,掌握他们的最新动向和底层逻辑后,等我们有相当规模的资金时,可能会考虑投资一家基础大模型公司。但那时就不是根据估值逻辑投资,而是依照投资周期的角度入手。”
他进一步指出,“我们团队看好中国科技行业,尤其是其中AI产业的发展。因此希望在这轮周期中,逐渐把生态布局完善,覆盖感知、决策(模型)、行动周期等阶段。”
具体来说,所谓感知,就是要让机器感知外部世界的多种环境,这涵盖视觉、嗅觉、类脑等,核心是解决信息获取问题;体会到环境后,机器就进入了思考阶段、需要进行相应决策,目前是由基础和行业等不同大模型来推进;到行动周期则可能是出现人类目前认知无法达到的应用。
探路落地
技术演进之外,应用落地正成为今年大模型企业共同推动的方向。
在此前一轮头部大厂相继喊出部分大模型应用免费开放后,8月27日,智谱也宣布GLM-4-Flash免费开放给所有人,并且提到,相信未来将催生出更多基于大模型的应用和创新。
Arun Chandrasekaran表示,随着企业的关注重点继续从基础模型转向可提高投资回报率的用例,生成式人工智能(GenAI)即将越过期望膨胀期。这一趋势正在加速自主AI的发展。
所谓自主AI,即AI的快速演进正在催生出自主AI系统。自主AI系统可以在几乎没有人为监督的情况下运行、不断自我完善并在复杂环境中作出有效决策。此类技术包括多智能体系统、大型行动模型、机器客户、人形工作机器人、自主智能体和强化学习。
这也是当前不少投资机构对外释放的消息:在模型应用阶段将出现诸多投资机会。
“在我们团队的判断中,不太根据是大模型还是小模型来选择投资与否。而是根据其产品是否能够解决实际场景中的问题,以提高效率、降低成本,实现增量价值。”张晨对记者表示。
面向感知环节,在2020年和2023年,一村淞灵先后参与了光鉴科技两轮融资。对此,他对记者分析道,“我们认为,3D视觉在未来会与2D视觉共存。虽然已经有一些上市公司,但目前全球范围内都还没出现3D视觉领域的绝对巨头,这显然是AI感知周期发展过程中的刚需。所以肯定要布局。”
据悉,光鉴科技在移动支付、消费电子、智能座舱、移动机器人等领域取得落地进展,过去两年间营收持续实现数倍增长,并于2023年四季度正式盈利。
“类脑领域我们目前投资的公司更多落地应用在车载芯片市场,这将可以对很多边缘侧芯片做替代,同时功耗非常低。”张晨进一步介绍,人类大脑最大的特点就是事件驱动,而在没有接收到外部信号刺激时会保持低功耗状态,这就是类脑芯片的一大主要特点。
脑机接口也是近些年间国内外都在积极探索的领域,只是选择落线有所不同。其中国际头部公司Nuerlink被视为相对激进选择了侵入式脑机接口路线,国内公司则多数选择半侵入式或非侵入式路线。
“从科学规律角度看,Nuerlink最显著的优势是克服了材料难题,让生物体能不对其产生排斥效应。如果选择非侵入式或半侵入式路线,就非常考验(处理脑外收集信息环节的)降噪算法,理论上这与侵入式路线还无法形成直接优势。”张晨如此分析。
硬件机会
从AI驱动决策到行为落地,具身智能和新形态终端都是国内外厂商竞相角逐的领域。
对于新型终端的机会窗口期,张晨认为,某种程度上可以参考苹果的探索思路。因为硬件的最终呈现形式相对复杂,除了硬件本身的设计积累,还需要掌握消费心理等层面才能更好匹配落地。
“因此目前还很难说是否有颠覆手机的AI硬件出现,但大模型与手机的结合、大模型与汽车的结合都值得研究,换个角度看,手机与汽车属于另一种形态的智能体或机器人。”他续称,在软件端,未来可能出现类似“超级集成器”的形态,也即将AI Agent嵌套到手机等硬件中。
在今年热度高涨的具身智能方面,海外市场的波士顿动力公司多年来都被业界视为工程化方面走在领先位置。
“波士顿动力机器人公司核心是改变了整套驱动系统。机器人原本采用液压驱动路线,但波斯顿动力最新发布的机器人采用了电驱路线,这与目前汽车行业的发展趋势十分接近。考虑到汽车形态也适合发展智能体,波士顿动力公司选择的纯电路线也值得我们进一步思考。”张晨对记者分析,“我们持有一种未必对的观点,具身智能最终的表征未必是人形,大概率是根据细分垂类应用,更好适配人类交互环境的形态。因为在一些垂直场景,未必是人类形态更有利于场景落地。”
虽然今年以来“人形机器人”掀起了一轮又一轮关注,但同时也伴随质疑和疑惑,例如,即便发布商用的机器人已经来到10万元左右,但用户真的会买单吗?
“现在面临的一大难题是寻找落地场景并且提供匹配的能力。”一名芯片行业从业者对21世纪经济报道记者分析,不同于工业机器人/臂可以广泛应用在工厂特定场景、扫地机器人可以较大帮助家庭清洁,“例如展示出人形机器人能翻跟头,但如何落地;又怎么应对日常复杂场景中产生的问题,业界还在思考。”
“当前阶段的确会有一波‘to VC’的应用出现。”张晨对记者表示,“对我们来说逻辑一以贯之:最终能推动一个任务完成,在过程中能实现如降本或增效、挖掘新价值等能力,就值得坚定投资。”
实际上产品都是需要通过持续迭代-淘汰-迭代的循环演进发展。“所以抛开‘to VC’的部分,目前大模型主要集中为语言类大模型,在很多场景的模型还没出现,例如还没有视觉类大模型。那么未来,大模型就是一种基础设施,中国市场未来一定需要有自己属性的大模型。底层能力有了后,在数据安全和隐私、代码编写等方向我们已经看到很多机会。”他续称。