6月5日,证券时报记者从多方获悉,大模型创业公司生数科技完成数亿元Pre-A轮融资。本轮融资由百度、北京市人工智能产业投资基金领投,中关村科学城公司、启明创投等跟投。此前,生数科技已经获得来自蚂蚁集团、BV百度风投、卓源亚洲、锦秋基金、达泰资本、智谱AI等机构的投资。本轮融资完成后,生数科技将坚持其原生通用多模态技术路线,持续迭代优化自研大模型,并加速产品开发与市场拓展。
生数科技作为国内最早布局多模态通用大模型的团队之一,今年4月联合清华大学发布了国内首款全面对标OpenAI Sora的视频大模型Vidu。Vidu支持一键生成16秒、分辨率1080P的高清视频内容,不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点,性能全面对标国际顶尖水平。这也是Sora发布以来,多模态大模型领域在全球范围内的又一重大技术突破。
据了解,生数科技在2022年提出全球首个Diffusion与Transformer融合架构U-ViT,并在半年后再次取得重大突破,开源全球首个基于此融合架构的多模态扩散模型 UniDiffuser,成功验证了大规模训练融合架构的可行性与涌现能力。自成立以来,生数科技就坚持采用U-ViT融合架构处理多模态数据,持续探索大模型在图像、3D、视频等多模态生成任务下的性能边界。
2024年初,OpenAI推出视频大模型Sora,其背后采用的融合架构Diffusion Transformer和原生多模态技术路线引发关注,而彼时生数科技对该技术路线的布局已持续超过一年。据介绍,早在 2023 年初大语言模型兴起之际,生数科技创始团队就研判大模型的发展必将从语言单一模态走向多模态融合。因此成立之初,生数科技就坚持采用 U-ViT 融合架构处理多模态数据,持续探索大模型在图像、3D、视频等多模态生成任务下的性能边界。
值得注意的是,百度是生数科技本轮融资的领投方。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,投资生数科技是百度在多模态大模型领域的重要战略布局。未来,百度将发挥自身在AI异构算力、大模型平台、生态等方面的独特优势,帮助生数科技加速技术研究与创新,快速打通商业成功路径,共同做大产业“蛋糕”。
百度副总裁陈一凡表示,百度百舸针对大模型训练、推理等任务,对智算集群进行了全面优化,实现了业界领先的算力效能,结合千帆平台提供的大模型全流程工具链,能够支持生数科技开发出最好的多模态大模型。未来,生数科技将基于百度百舸·AI异构算力平台持续训练、提升模型能力,并逐步通过百度智能云千帆平台开放模型服务。
同为领投方的北京市人工智能产业投资基金表示,多模态大模型是 AI 下一阶段发展的关键方向,市场潜力巨大,生数科技拥有领先的生成式 AI 研发团队,具备坚实的人才基础和深厚的技术积累。生数科技在图像、视频、3D 等多模态领域所取得的一系列关键创新成果,在业内获得了广泛认可和高度评价,也充分证明了生数科技的技术实力和行业领先地位。
老股东启明创投表示,生数科技汇聚了一批生成式 AI 领域的资深专家和顶尖精英,凭借十多年的沉淀,已在多模态大模型的架构设计、训练策略、扩散模型的加速推断、多模态可控生成等关键技术领域,构建了全栈的自主研发能力。他们不仅拥有完备的技术实力、深刻的技术洞察和独到的技术布局,还积累了丰富的实践经验。“公司凭借业界首创的 Diffusion Transformer 架构,当前已成为全球多模态大模型领域中最具竞争力的企业之一。启明创投作为生数科技上一轮的领投方,在本轮继续支持公司,我们坚信,生数科技将是这波大模型技术浪潮中的佼佼者,期待他们开启一段更加辉煌的新篇章。”启明创投主管合伙人周志峰说。