投资界(ID:pedaily2012)8月25日消息,多模态大模型公司“智子引擎”近日完成天使+轮融资。此轮融资由两家头部投资机构联合领投,软通高科等多方跟投,竟合资本担任独家财务顾问。

智子引擎成立于2021年,是国内较早对多模态大模型展开研究的团队。人大高瓴人工智能学院教授卢志武担任公司的首席技术顾问,并对大模型相关研究成果进行商业转化。

相较于路径探索初有成效的大语言模型,多模态大模型依然几近“无人区”。基于三年多的学术研究,智子引擎团队的多模态探索已经初有成效:

2021年3月,推出多模态大模型“文澜BriVL(Bridging-Vision-and-Language)”,并已迭代至2.0版本;2023年3月8日发布150亿参数规模的多模态对话应用“元乘象 ChatImg”(早于GPT-4),后续发布的2.0版本在多模态对话数据集(LLaVa)的公开评测过程中,中英双语多模态对话能力超过了目前主流的开源模型。

元乘象 ChatImg效果。图源:作者测试

不过,踩在大语言模型的风口,多模态大模型的进度条也从研发被快速拉到落地阶段。目前,To B是智子引擎主要的商业化方向。此前,智子引擎也与城市治理解决方案服务商“软通智慧”达成合作,共同研发了城市多模态大模型和城市治理云。

智子引擎CEO、中国人民大学高瓴人工智能学院博士高一钊告诉36氪,为了加速多模态大模型在To B场景的落地,此轮融资资金将主要用于扩充团队和购买算力。 “目前公司最大的成本除了算力,就是人力。”但高一钊认为,To B场景的应用落地,完整的产品、商务以及工程团队必不可少,“产品的开发不仅仅涉及模型研发,还需要进行前端页面开发、后端并发维护等工程。”

投资人表示 :智子引擎团队是国内最早开展多模态AI大模型研究的团队,有着丰富的大模型研究经验,多年来一直坚持持续创新,推出了多个有影响力的模型,在多模态检索、多模态生成领域保持着领先地位。今年,随着智子引擎模型产品融入到多个行业场景中,商业前景广阔。我们看好智子引擎团队在多模态领域的创新和落地能力,相信智子引擎可以成长为中国多模态大模型领域的代表性企业。