智东西3月24日报道,今日,GTIC 2023中国AIGC创新峰会在北京圆满举行!
正值GPT-4时代的大幕被一把拉开,本届峰会以“AI新纪元创造新世界”为主题,是国内首场聚焦生成式AI(AIGC)的高规格创新峰会,汇聚超20位产学研大佬展开了一轮轮激烈的技术交锋、观点碰撞,帮助每一个在迷雾中砥砺前行的产业人完成一场去伪求真的旅程。
太多问题在过去两个月里涌向我们的大脑:GPT-4真的会带来认知智能的爆发吗?我们的AI和ChatGPT有多少差距?中国版OpenAI会诞生吗?被大厂高频提及的MaaS(模型即服务)会是确定趋势?中国AIGC产业会是“大厂赢者通吃”还是“百花齐放”……很多问题都在这场峰会中得到了解答,答案大多与我们不假思索的直觉不同,甚至专家之间的观点也截然相反,使得这些探讨变得格外有价值。
从大厂大模型产品交锋到*AI投资观点碰撞,从AIGC硬创先锋产品尝鲜到算力企业的“暴力美学”PK,从“大模型VS小模型”的争论到“ChatGPT为什么没有首先出现在中国”的灵魂之问……一波波高潮迭起,峰会现场座无虚席、人气爆棚,交流氛围热烈,全天到会观众超过千人,全网观看直播人数高达420万人次。
智一科技联合创始人、CEO龚伦常代表主办方在峰会上说,AI产业正在迎来新的市场机遇期,中国AIGC创新峰会希望为学术界、产业界、投资界搭建一个交流的平台。本届峰会主要包括一个AIGC高峰论坛主论坛,大模型、中国类ChatGPT、AIGC应用创新三大专题论坛。
会上,来自中科院等学术机构,微软、百度、快手、英伟达、昆仑万维、商汤科技等行业巨头,澜舟科技、墨芯人工智能、优必选、智谱AI、潞晨科技、云知声、竹间智能、aiXcoder、影谱科技、计算美学(Nolibox)等创业先锋,启明创投、创世伙伴资本、蓝驰创投等投资机构的嘉宾代表们,分享了大模型与生成式AI的前沿创新、商业前景、算力进化、创业机会与投资策略。
以下,是今日AIGC峰会的演讲精华。
一、主办方致辞:大模型演进AI产业正迎来新机遇期
智一科技联合创始人、CEO龚伦常代表主办方为本届峰会致辞。预训练语言模型、扩散模型等关键算法和模型的出现与演进,推动了生成式AI的快速发展,相关产品在极短的时间内吸引了全球的关注。
过去一周更是AI突飞猛进的关键期,GPT-4和文心一言的发布、微软将GPT整合进了office全家桶带动了生产工具的飞跃。AI产业正在迎来新的市场机遇期。
基于此,中国AIGC创新峰会希望为学术界、产业界、投资界搭建一个交流的平台,让大家能在这里深入交流、激荡思想,并促进合作和创新的落地。
今年是智一科技成立的第7个年头。智一科技坚持技术和产业双轮驱动,聚焦以数字化、智能化为代表的前沿技术及其行业应用,构建产业媒体与企业服务两大业务体系。
智一科技拥有以智东西、芯东西、车东西为代表的产业媒体矩阵,已成为国内定位独特且具有较高影响力和公信力的产业媒体;同时针对产业升级需求,发展出以智东西公开课为核心的企业服务体系,与产业优秀公司、全球*高校的专家学者合作,举办系列公开课及新青年讲座,并与国内外*企业合作举办定制公开课,截至目前已完成的课程超过600节,收获良好口碑。
二、大模型带来认知智能崛起大厂和世界级科学家划重点
在上午的峰会现场,澜舟科技创始人兼CEO&中国计算机学会CCF副理事长周明讲解了大模型带来的新范式,中国科学院自动化研究所研究员&博士生导师、武汉人工智能研究院副院长张家俊解读了紫东太初大模型如何理解世界的奥秘。
同时,微软全渠道事业部首席技术官徐明强带大家探索了AIGC趋势及微软Azure OpenAI服务在企业的应用;刚刚推出文心一言的百度集团副总裁袁佛玉来到现场,探讨文心一言如何改变云计算市场游戏规则。
1、澜舟科技周明:大模型带来认知智能崛起,九大方面划重点
澜舟科技创始人兼CEO、中国计算机学会CCF副理事长、创新工场首席科学家周明深入解读了大模型带来的新范式。
作为微软走出的技术专家,周明说自己深受微软联合创始人比尔·盖茨影响,认为大模型正带来认知智能的崛起。大模型尤其是ChatGPT代表着语言理解、多轮对话、问题求解进入了一个可实用的时代;同时,大模型有效解决NLP任务碎片化问题,大幅度提高研发效率,标志着NLP进入工业化实施阶段。
当下,AI正历经从单个任务的专用模型,到广泛任务的通用模型的2.0时代,再到通用人工智能的AGI时代。AI 2.0时代将首先革新创作内容、办公方式、搜索引擎、人机交互界面、金融等多个领域。
创立于2021年6月的澜舟科技已推出了多个大模型对外产品服务,目前已落地孟子大模型、AIGC(智能创作)平台、机器翻译平台、金融NLP平台等多款技术及产品,落地同花顺、华夏基金等企业。结合类ChatGPT技术,澜舟科技推出了对话机器人MChat,能够通过智能对话帮助用户完成特定场景中的多种工作任务。
谈及对产业未来方向的展望,周明坦言,当下类ChatGPT技术在推理、逻辑、数学和算术、事实性错误等方面仍有所欠缺。未来,大模型相关的九大问题尤其值得关注,涉及推理能力、事实正确性、中文处理能力等方面。
2、微软徐明强:与OpenAI合作构建超级计算机
模型参数正在呈现指数型增长趋势。如今,对大模型的质疑会在短短1-2年内就被新的质疑所替代。所以,微软全渠道事业部首席技术官徐明强坚信,模型仍然会快速增长,因为目前的高质量语料目前仅使用了1/10。
这一切的背后都离不开强大算力的支撑,这也决定了所能训练模型的大小、参数。因此,微软Azure与OpenAI合作构建了专为大规模AI训练而设计的AI超级计算机,该计算机拥有285000个CPU、10000块GPU。
徐明强把大语言模型比作了一块海绵,维基百科、医学或科学论文就是水,把这些论文塞进去就会带来其能力的涌现。
最后落脚到企业应用中,在CPU时代,企业应用时思考的问题是如何把商业问题转变为计算问题,也就是通过编译器将应用转为计算问题,如今则转变为如何把各行各业的问题转化为内容处理问题。
企业级ChatGPT应用场景包括客户服务、销售市场、内容生成、知识管理、辅助决策等。
3、中科院张家俊:揭秘“紫东太初”,多模态大模型初现“多专多能”
会上,中国科学院自动化研究所研究员&博士生导师、武汉人工智能研究院副院长张家俊解读了“紫东太初”大模型如何理解世界的技术奥秘。
张家俊谈道,深度学习预训练大模型效果不断提升。当下,通过自监督学习条件下“大数据+大模型”方式,多模态大模型初现“多专多能”,在小样本学习、自然语言问答、跨模态生成等方面快速进步。大模型带动了创新潮,但其能耗和成本极高,认知能力与人相比仍有很大差距。
“紫东太初”是中科院自动化所团队推出的全球*千亿参数多模态大模型。张家俊称,这一模型支持Token级别、模态级别与样本级别的多任务自监督学习,多模态弱关联数据在512卡训练128天,同时实现模态理解与模态生成统一建模。“紫东太初”支持以文搜图、以图生音、以音生图等跨模态检索与生成实例,比如输入一个真实图像,紫东太初就能生成个性化的3D形象。
目前,团队已推出了紫东太初开放服务平台1.0、紫东太初·洛神1.0 AIGC智能生成平台,并整合产学研用各方资源搭建人工智能开源开放生态,探索通用人工智能产业化路径。
4、百度袁佛玉:文心一言将改变云计算市场游戏规则,超10万家企业申请调用
全球AI产业已经进入爆发期,AI正在创造一个全新的世界。2021年,百度CEO李彦宏曾说过:“当电脑具备了对人类自然语言的理解能力,具备清晰的表达能力,具备很好的逻辑推理能力,它就非常像人。而机器的记忆力、计算能力远比人强。因此,AI一定会彻底改变今天的每一个行业。”
百度新一代大语言模型、生成式AI产品文心一言背后的关键技术支撑就是自然语言理解。
百度集团副总裁袁佛玉强调,“全球大厂当中,百度是*个发布的。微软是直接调用Open AI,谷歌3月21日开放测试。Meta和亚马逊,现在都没有真正的发布同类型、同级别的产品。”
文心一言拥有五大核心能力,分别是文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,能续写《三体》、《红楼梦》;生成直播文案;指出数理问题的错误并给出解题过程;强大的对中文语言的理解能力;基于百度自研大语言模型的生成图片、音频和视频的多模态生成能力。
袁佛玉谈到,从文心一言的表现来看,它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。
文心一言新闻发布会后一周,已经有超10万家企业申请文心一言API调用服务测试。
人工智能时代IT技术栈有应用层、模型层、框架层、芯片层四层架构。袁佛玉说:“全球范围内,百度是*在这四层都拥有*产品的公司。”
此外,大模型发展会在新型云计算、行业模型精调和应用开发方面带来三大产业机会。
三、中国不会出一个OpenAI?投资人:不同意!
向上追溯应用,快手MMU NLP中心和音频中心负责人张富峥讲述了AIGC技术在快手的探索和应用;向下探究算力,墨芯人工智能创始人兼CEO王维则向底层溯源了AIGC时代算力如何“进化”;此外,启明创投合伙人周志峰从投资角度讲解了AI新浪潮中的创业机会和投资策略。
1、快手张富峥:探索AIGC应用,数字人、音视频多点开花
实践出真知。会上,快手MMU自然语言处理中心&音频中心负责人张富峥通过演示AI生成数字人、音乐、视频的最新案例,分享了快手在AIGC的探索和应用。
张富峥首先从工作流程角度谈及了对AIGC的理解,基于“创作者将想要表达的想法输入,通过AI技术合成内容输出“工作流出发点,快手通过平台引擎、基础设施、AI原子能力、AIGC解决方案、落地场景等多方面布局了AIGC。
在数字人场景,通过简单输入文字,用户在5分钟之内就能生成具备精确口型、丰富表情/动作的数字人的应用,能用于电商、招聘、主播、培训等多个场景。
在智能音乐方面,用户可以根据用户输入指定的主题词等信息,生成押韵且与主题词相关的歌词、特定旋律,AI歌手等应用也已接近真人的歌唱水平。
在视频制作方面,AIGC技术对创作者也是大有帮助。比如,快手视频创作“一键成片”均消费量超4.5亿,文案成片日均作品消费量超4000万。
2、墨芯人工智能王维:稀疏计算成大模型落地*解,墨芯引领AI 2.0算力进化
在需求侧,数字文明发展已经发生了根本变化。生成式AI打开了构建爆炸性成功应用的大门,AI 2.0大模型时代对算力的需求已经完全被颠覆。相较于AI 1.0小模型时代关注算力通用性,大型预训练模型结构统一化,更专注于可扩展性。算力的增长和推理速度,已成为大模型发展和应用的痛点。
墨芯人工智能创始人兼CEO王维说:“单纯靠硬件难以满足指数级的算力增长需求,必须通过软硬融合。在这个方向上,稀疏计算是公认的最有潜力发展和落地的方向。”相比稠密计算,稀疏计算可以达到1-2个数量级的性能提升。
2022年初,墨芯*颗高稀疏率的AI计算芯片Antoum流片成功,随后墨芯发布了基于Antoum的AI计算卡系列S4、S10、S30,支撑多样化的AI应用场景。基于墨芯独特的双稀疏算法与软硬协同理念,墨芯的产品可以兼顾高性能与低功耗,并且双稀疏算法可以在许多网络和应用中实现高达32倍的稀疏。
通过在176B开源大模型BLOOM上的实测,墨芯S30计算卡在仅采用中低倍稀疏率的情况下,就可以达到25tokens/每秒的生成速度,并以4张S30超过8张A100的生成速度,大幅加速推理速度。
王维说:“大模型的快速发展,给AI芯片初创公司带来了向巨头玩家发起挑战的机会,拥有了全新的展示舞台,用颠覆式创新带来数量级性能突破。”
3、启明创投周志峰:近六成生成式AI创业者聚焦多模态应用,中国生态或创造更多机会
40年以来,随着算力和数据的不断爆发式增长,AI技术形态发生成倍加速变化。如何站在新的节点上预判趋势、提前布局?
启明创投合伙人周志峰谈道,这波由超大规模预训练模型驱动的AI浪潮从底层技术展现出变革性的泛化能力和涌现现象,一定程度解决了AI 1.0时代创业面临的不少问题,包括AI技术仅是隐藏在终端产品中的很小一部分、社会缺乏对AI技术的合理预期、缺乏完善的应用开发基础设施与环境、缺乏上市公司和资本市场估值体系等。AI再次成为创业和投资的热点。2020年GPT-3发布的两年内,全球创投机构对AI企业的投资增长了4倍,仅2022年就有13.7亿美元的融资。
与百度创始人称“中国基本不会再出一个OpenAI”的观点不同,周志峰认为,中国与美国对于AI底座大模型的生态环境非常不同,中国有很多独特的机会。除了高技术壁垒、高人才密度和高资本需求的大模型方向,年轻创业者、垂直产业老兵、AI界大咖在技术和应用多个维度都有不同的创业机会。启明创投科技团队总结了一张AI新浪潮生态架构及重点布局领域“地图”,从智算平台、工具链、开/闭源大模型、自建模型/第三方模型构建的应用等领域带来创投参考。
根据启明创投科技团队与100余家2020年后成立的企业的交流统计,在生成式AI创业领域,有14%的创业者聚焦于底层技术,57%的创业者聚焦多模态应用,29%的创业者聚焦语言类应用,能够在AI技术上构建自有壁垒的技术驱动型创业公司和可以融入产业工作流、提供高商业价值的应用型创业公司更容易脱颖而出。
四、圆桌对话:ChatGPT引爆科技革命赢者通吃还是百花齐放?
狂飙的ChatGPT如何掀起新一轮科技革命?在上午的圆桌对话,智一科技联合创始人、总编辑张国仁与竹间智能总裁&COO孙彬、优必选语音技术科学家黄东延、创世伙伴资本合伙人梁宇一起探讨了关于技术、产业、投资的劲爆问题,将现场的氛围推向高潮。
ChatGPT横空出世,被英伟达CEO黄仁勋盛赞是“人工智能的iPhone时刻”,专注于自然语言理解赛道产业落地的竹间智能总裁&COO孙彬感慨道,这一产品的火爆确实在他们的意料之外,大模型、暴力参数带来的新范式改变已成为一个开始。
优必选是将人工智能赋能到服务机器人的头部玩家。“GPT的出现,让我们看到了人工智能深入各行各业,服务机器人走进千家万户的时代到来了。”优必选语音技术科学家黄东延说。
此前深度学习三巨头之一杨立昆(Yann LeCun)曾谈道,ChatGPT没有特别的创新,只是被很好地组合。专注于早期科技企业投资的创世伙伴资本合伙人梁宇也表达了相近的观点,他认为从技术角度来讲,Transformer架构的系统集成和工程化一直在稳定创新,ChatGPT并没有实现革命性突破。黄东延同意梁宇的观点,并补充说,OpenAI是在集成、试错的过程中发现了“上帝给的密码”,使得对话达到类似人类的惊艳表现。随后,张国仁抛出一个备受关注的问题:OpenAI的GPT-4推出、微软相关产品接二连三地发布让同行感受到不小的压力,微软+OpenAI组合的*优势预计能保持多久?
对此,孙彬认为,任何绩效工具的组合都在于人如何使用和运用,最终还是要以人的产出来作为评判标准。他们组合的长期价值在于未来能不能用在其他产业中,让技术和行业实现*统一。黄东延谈道,微软和OpenAI的组合能走多远,还需要看其技术创新能力和迭代开发速度,当然这个过程中还会有大量AI企业可能会出现“黑马”技术。
总的来看,微软的做法其实是为这个产业的发展打了个样。梁宇说:“从某种程度上来说,微软玩的是一种生态战略。”行业的应用、用户接入生态中,能形成“数据飞轮”,其滚动速度也会越来越快。
落脚到国内环境中,大模型训练还需要好的中文语言学习语料,才能作为“飞轮”滚动起来。
从美团联合创始人王慧文,到搜狗创始人王小川,再到李开复宣布Project AI 2.0计划,众多大佬都在加入AIGC创业潮。当张国仁问到这波创业潮是会像互联网时代创业一样“赢家通吃”,抑或是“百花齐放”,几位嘉宾都认可后者。
孙彬称,大模型时代的情况不同于互联网“大补贴”时代,AI已经形成了相对固定格局的创业链条,新大语言模型带来新的底层发动机,但沉淀的产业生态、模式会复用,会延续百花齐放的特征。他承认,大语言模型在产业可能仍是大厂主导,但关键点突破还要看科创公司。
梁宇也很认可这一观点。他认为在大厂领跑的同时,初创公司的机会可能在应用层,从垂直领域切入做产业落地、降本增效。“创企要学会躲开‘巨兽踩下的脚印’,所有伟大的公司都是从很小的缝隙中钻出来的。”
谈到AIGC创业应具备的要素,梁宇称,当下大模型创业的竞争、资本环境、人才与前两年相比有质的变化,资金密度、创业者密度、企业家密度飙升,创业者需要有深厚的技术功底和行业理解。
孙彬认为,就像OpenAI联合创始人8年前创业利用了技术、资源、人脉等积累切入创业一样,当下创业者也需要考虑好算力、工程师、数据三件事,创业才会事半功倍。
峰会多位演讲嘉宾都将AI发展的终局指向通用人工智能(AGI),如何定义通用人工智能?它要解决的*问题是什么?
黄东延认为,通用人工智能和垂直领域的人工智能实际上是相辅相成的,直观来讲,大厂会提供一个通用人工智能的平台,而垂直领域的人工智能就是在不同产业上做深入开发。
孙彬说,站在十年后看现在,这或许是通用人工智能的起始点。梁宇也提到今年或许是通用人工智能元年,通用人工智能从今天开始或许会慢慢像水、电一样渗透到人们生产生活的方方面面。
张国仁谈道,也许很多科幻电影已经为我们描绘出了通用人工智能的面貌,比如钢铁侠里面的贾维斯、流浪地球里的MOSS,虽然形态不一,但在智慧程度上将会达到或超越人类。
那么,假设让我们从10年后回头看今天这一波AIGC应用创新,对科技产业和人类社会的意义和影响会是怎样?
孙彬认为,如果从10年后看今天,这会是对计算机交互方式的一个重大变革,使得人们不再去学复杂的语言。梁宇称也提到今年或许是通用人工智能元年,通用人工智能从今天开始或许会慢慢像水、电一样渗透到人们生产生活的方方面面。
从伦理层面看,黄东延谈道:“如何从人性出发将技术正面作用激发出来,十分关键。十年后或许每个人都有一个自己的智能机器人,将人在获得效率提升后能够更好地享受生活。”随之而来的是安全和伦理问题成为产业人的顾虑。黄东延认为,需要从法律法规、公司自律、大众意识、安全伦理标准等全方位治理。
张国仁总结说,十年后回看,应该有不少现在觉得习以为常的事情,到时候会变得不寻常,以当下视角而言,这就像人们现在已经习惯使用电子支付,与十年前或更早的采用现金支付方式之间的关系。
五、大模型专场:国产与GPT-4差距如何?垂直化、本土化超车
在下午的大模型专题论坛上,北京智谱华章科技有限公司CEO张鹏讲解了预训练大模型这一生成式AI时代的基座,潞晨科技创始人、新加坡国立大学计算机系校长青年教授尤洋探讨了低成本训练AI大模型的挑战与实践。蓝驰创投投资合伙人石建平认为预训练大语言模型正开启认知智能时代,NVIDIA消费互联网行业解决方案架构师负责人徐添豪、商汤科技联合创始人&大装置事业群总裁杨帆从算力、算法实践层面带来了真知灼见。
1、智谱AI张鹏:大模型也有摩尔定律,探索GLM新路径
大模型专题论坛的首位演讲嘉宾是北京智谱华章科技有限公司(简称:智谱AI)CEO张鹏。作为跨产学界先锋,他分享了预训练大模型的技术路径与落地进展。
预训练大模型已成为新一代AI应用的基础设施。张鹏称,大模型领域有一个摩尔定律:单模型参数量每年会增长10倍。当模型参数达到千亿级,大模型已迈过了一个质变的重要门槛,ChatGPT是一个代表。
“我们一直在努力。”张鹏说,基于清华大学计算机系的成果转化,智谱AI于2021年就推出了*多模态大模型。张鹏谈道,训练一个千亿模型面临种种挑战,需要耐心也需要时间。
张鹏说,智谱AI合作研发的双语千亿模型GLM-130B,评测报告显示GLM-130B在准确性和公平性指标上与GPT-3 175B (davinci) 接近或持平。此外,自去年以来,智谱AI相继开源AI代码工具CodeGeeX,并发布了可单卡跑的ChatGLM-6B开源模型,同时上线了辅助写作应用“写作蛙”、个性化对话“小呆”等免费产品,大大降低了大模型的使用门槛。
最后,张鹏在会上强调了Model as a Service(MaaS)理念,主张提供从预训练大模型到API到应用多层级以及从云端到私有化到一体机部署的灵活部署方式。
2、潞晨科技尤洋:构建大模型训练基础设施Colossal-AI,降低AI大模型应用落地成本
AI模型参数量短短几年间翻了上万倍,未来,AI可能会比人类大脑更加智能、强大。如今横亘在大模型训练前面的挑战是训练成本极高。
在大数据、大模型同步提升的同时,如何创造出更有效的优化方式,降本增效实现可扩展性的高效计算,降低AI大模型的应用落地成本,已成为行业的关键痛点。
潞晨科技构建了一套高效的分布式AI大模型训练基础设施Colossal-AI。它包含高效的内存管理系统、N维并行技术和大规模优化方法三个部分。
据潞晨科技创始人、新加坡国立大学计算机系校长青年教授尤洋透露,目前,Colossal-AI已经成为全球基础软件市场增长最快的软件之一,并已在Github开源:https://github.com/hpcaitech/ColossalAI
潞晨科技研发的N维并行技术打造了更高维度的张量并行在内的多种并行策略,为大模型提供更低成本的高效分布式训练方案。
此外,基于Colossal-AI的异构调度系统,用户只需要写一行代码就能对GPU内存、CPU内存、硬盘实现动态管理,将硬件的模型容量提升数十倍。
例如,此前1750亿参数的GPT-3训练需要128个GPU,而Colossal-AI只需要64个GPU,显著降低大模型的硬件需求和成本。而在同样设备情况下,Colossal-AI可以帮用户更快速地完成模型训练,降低成本。
3、蓝驰创投石建平:认知智能已成AI前沿,“AI-First应用”成趋势
蓝驰创投投资合伙人石建平提出,预训练语言大模型开启了认知智能时代,认知智能已成为下一个AI的前沿。
机器正前所未有地获得语言生成和理解、知识推理等认知能力,背后是AI OS(操作系统)、基础模型及预训练模型、强化学习技术等方面均已准备就绪。
创业公司如何去拥抱认知智能世界?石建平建议,不是所有的公司都要做大模型,还可以从垂直应用路径切入,比如用自有数据微调开源模型/第三方hosted模型;也可以从平台路径方向切入,比如为下游垂直应用开发者提供训练、微调、管理、服务等平台性工具等。
他谈道:“预训练语言大模型开启了以认知智能为核心驱动力的智能计算时代。”数字文明的底座是代码,而认知智能也将重新定义软件的构建方式,“AI-First应用”将成为趋势,比如目前微软搜索引擎新版Bing等已经给了出色样板。
“现在技术迭代的节奏比PPT都快。”石建平笑谈。在这种背景下,企业如何建立核心竞争优势?在他看来,这个核心将是运用自有数据训练微调的人工智能模型;同时,智能世界与数字世界的融合将带来更多想象。
4、NVIDIA徐添豪:软硬件协同使大规模集群训练GPT3时算力有效性超50%
硬件算力的提升不仅依靠芯片工艺的提升,更依靠准确捕捉AI模型算法演进的需求和趋势,NVIDIA消费互联网行业解决方案架构师负责人徐添豪说:“找到计算加速的关键点,并不断创新满足未来的业务需求。”
进入大模型时代,一张卡远远无法承载一个模型的训练,需要更多个体组成能互相协作的机器节点。
NVIDIA引入NVLink,NVSwitch和IB技术,其中Ampere和Hopper架构就是根据NVSwitch构建节点,通过IB网络进行集群组网,使得这些实力强劲的个体能高效协作完成同一件事。
其中底层硬件是底座,为了开发者把硬件用起来并真正解决问题,需要软件的协同。因此,NVIDIA在过去一直在构建SDK和场景应用以解决各行各业的问题,其中NeMo Framework就是为了解决大模型训练和推理部署问题。
那么,怎么评估训练GPT-3到底需要多少资源?徐添豪讲解了一个公式:消耗的时间=做大模型需要的FLOPS/硬件发挥的有效算力。基于并行方式的有效集成及一系列的优化,NVIDIA的NeMo Framework在训练GPT-3过程中能使得硬件算力有效性能达到50%以上。
此外,为了加速企业的大模型规模化部署,NVIDIA NeMo Framework还提供了基于FasterTransformer和Triton整合的一体化大模型方案。
5、商汤科技杨帆:AI生产范式已发生重大转变,人工智能将迎来一个更加繁荣的“大航海时代”
会上,商汤科技联合创始人、大装置事业群总裁杨帆讲解了作为“小模型时代”走出的创企的求变之路和能力圈。
AI正引领新一代技术革命,从AI辅助科研、生成式AI席卷到近期爆火的对话机器人ChatGPT。大(算)力出奇迹、量变引发质变。杨帆称,AI生产范式正发生重大转变——大模型时代到来。
杨帆谈道,在过去10年的AI“小模型”时代,解决单一问题的深度学习方法与工业化小模型生产工具逐步成熟;在新的大模型时代,大模型即服务(MaaS)成为新主题,诞生了围绕大模型基础设施降本、算力数据军备赛、实时用户反馈展开的AI新范式。面向这一趋势,扎根AI近10年的商汤沉淀出商汤SenseCore大装置,从AI原生基础设施、大模型生产平台、算法模型服务、行业应用四个层面,使能*大模型开发体验。杨帆说,商汤将结合多年行业经验累积,提供高效率、低成本、规模化的新一代AI基础设施产品与服务,全栈加速千亿级大模型生产部署,促进数据采集、标注、管理效率大幅提升,缩减模型迭代周期。同时商汤还会通过提供大模型开发支持服务,保障开发成果落地。
六、类ChatGPT专场:To B 和To C之争大模型VS小模型
在下午的中国类ChatGPT专题论坛,云知声联合创始人、副总裁李霄寒,竹间智能创始人兼CEO简仁贤,昆仑万维CEO方汉分别讲解了自家的大语言模型发展历程和行业洞见。
1、云知声李霄寒:AI演进呈现三大规律,企业将走向通用、垂直两种路径
云知声联合创始人、副总裁李霄寒谈道,ChatGPT的出现对于AI创企来说,*的感受就是AGI有可能在未来几年成为现实,他们正在想办法融入到大模型浪潮中。
AI演进正在呈现出三个规律,以算法为中心转变为以模型为中心,从小而美到大工程以及中间任务的凋零。中间任务指的是,此前AI发展中没有独立目标的中间任务将逐渐被弱化或消失。
2022年以前,不论是巨头还是AI创企都在做大模型,而ChatGPT的出现为产业验证了这条路的可行性。“当模型参数达到一定规模时,就有可能出现‘涌现’能力。”李霄寒说,并且,在认知智能层面,经过一定时间的发展后机器可能会超过人类。
与此同时,大模型使得企业发展呈现出两种路径,分别是打造通用大模型服务和面向垂直场景的大模型。大厂的通用大模型平台会对外形成服务,以“白菜价”产生模型飞轮。面向不同场景的公司,则需要更垂直的大模型,更注重数据和服务的可控性。
云知声将专注于智慧医疗行业,推出面向特定行业版的大模型,并在行业之上面向客户提供企业定制版大模型。李霄寒说道,他们的愿景就是从行业版迈向增强通用版。
2、竹间智能简仁贤:“大语言模型+知识+应用”,通用人工智能的未来操作系统
竹间智能的创始人兼CEO简仁贤表示,大型语言模型将成为通用人工智能的操作系统,将会带来“两个世界”,一个是由OpenAI和微软主导的闭源世界,另一个是由Deepmind和Google主导的开源世界。他认为,创业公司和大公司的结合将会使创新达到规模化,并呈现“百花齐放”的局面。
他进一步指出,未来的软件范式将是自然语言技术驱动的应用,由“大语言模型+知识+应用”组成。他认为,模型本身并没有实际价值,而是基于大型语言模型的细分应用才有实际价值,因此他主导开发的是“模型即应用”(MaaA)而非“模型即服务”(MaaS)。简仁贤认为,基于ChatGPT的应用将会为白领工作者带来巨大价值,并为企业带来价值,比如客服服务自动化、虚拟助手、知识管理和员工培训等四个应用场景方向将首先被颠覆。
为了平衡大型语言模型和小型语言模型的优缺点,简仁贤提出了一个公式:“小型自然语言处理模型+知识模型+大型模型=自然语言处理双引擎”,他认为,小型模型可以使大型模型更可控、可用和可解释。目前,竹间智能已经利用其自然语言处理专长,将现有的可扩展产品与大型语言模型集成,为各行业提供预训练模型。
3、昆仑万维方汉:中外大模型发展有三大差距,国内商业模式创新始于企业服务
大模型千亿级别的模型开始涌现真正的通用人工智能,AI的iPhone时刻已经到来。昆仑万维CEO方汉谈道,ChatGPT有可能成为碳基生命向硅基生命进化的里程碑,并且是人类史上第二次进化。
不过,当下在中外发展大模型的差距包含三个方面,首先是每年5000万到1亿美元的花费是千亿级大模型训练的入场券,其次是中文文本的数据质量并不高,*的差距则是工程技术差距。
方汉谈道,OpenAI在GPT方向上的努力证明了通用人工智能是可以实现的。他在GPT-3刚刚发布并体验后认为,GPT-3代表着AIGC的里程碑,会极大颠覆内容生成领域。
在应用层面,方汉谈道,AIGC产业将遵循为B端降本、为C端增效的逻辑。可以看到,微软在B端的布局是集中于金融、能源等行业的大客户,其原因在于“这些企业的数据能够和GPT这样的大模型结合并产生下一代生产范式”。在C端,以微软的Copilot为例,将为人们带来生产力的提升。
因此,方汉预计,国内AIGC产业的商业模式创新将首先出现在B端企业服务领域,其次是C端UGC工具领域。
七、AIGC应用创新专场:AI变革代码生成、视频创作、艺术设计……
在下午的AIGC应用创新专题论坛,aiXcoder CTO郝逸洋、影谱集团董事&北京区总裁樊硕、计算美学(Nolibox)联合创始人黄晟昱分别探讨了AIGC与代码生成、元宇宙、设计创意等行业的碰撞融合。
1、aiXcoder郝逸洋:GPT-4带来代码生成新变革,未来将促进模型扩展到千亿级
会上,aiXcoder(硅心科技)CTO郝逸洋带来了主题为《大型语言模型(LLM)时代下的代码生成》的主题演讲。
他谈道,GPT-4带来了代码生成的新变革,支持更长序列、更多指令号微调、多模态(图片输入)等操作,展现出更适于泛用的效果,同时也面临不少问题,包括缺乏相关文件、依赖库及需求文档,以及速度较慢、信息安全威胁等。
实际上,程序生成模型与语言模型有较大区别,比如在交互方式方面,普通的对话语言模型以问答、续写为主,程序生成模型则需要填空、补全、备份。GPT-4在代码生成中还有不少事做不到,比如在实时性方面,GPT-4在某些需要实时反馈的代码纠错和代码补全场景中并不适用;上下文序列依然有限,难以顾全中大型项目的全部上下文;代码项目的完整信息和网页爬取的文本差距大等。
作为2018年就切入AI智能编程机器人赛道的创企,aiXcoder于2022年6月推出了国内*代码生成预训练模型产品aiXcoder XL。该产品支持由完整功能自然语言输入到完整编程语言的输出。
展望aiXcoder路线图,郝逸洋称,aiXcoder将促进模型从百亿级扩展到千亿级,加入大量自然语言处理+代码的混合数据,针对编程中的各类场景专门构造指令数据集,从而得到综合性能更好的代码编辑工具。
2、影谱集团樊硕:为内容终端构建数字化操作系统,多模态将在未来两年迎来爆发
生成式AI已到达爆发式阶段,其带来的应用爆发让人们感受到了AI从感知到认知智能跨越的过程,并带来了很大的市场空间。
ChatGPT使得文字模态达到爆发期,但图片、视频、声音的爆发期在这个时代还没有到来。影谱集团董事、北京区总裁樊硕谈道,随着行业需求的出现、生产效率的提升,未来图片、视频甚至于数字孪生都将成为不可逆的趋势,使得人们获取信息更加直观、便利。
整个技术的变革和人类发展的进程是一样的,从解决重复性工作上升到对思维逻辑、创意的思考。
目前,文字模态已经为人们带来了生产力的提升,樊硕说:“2023年到2025年将成为多模态爆发的时代。”未来,生成式AI构建的内容将不仅是论文、代码,而是用户自定义、自交互化的生产。
此外,对于终端企业来说,“模型并不是很多企业能直接接触到的。”樊硕说,因此模型需要更多的应用进行连接、更多的平台进行支撑,再把数据结构化、生产内容标准化和流程化,才能将其真正应用于整个内容生成过程中。影谱集团开发了一个AI数字化操作系统。
大模型产业的发展将不断适配一些内容生成领域的重复性工作,未来其系统实现标准化能力,同时对接相应开放的引擎构建整体生态,不断去辐射文字、声音、图片、视频等不同模态。
3、计算美学黄晟昱:抓住转化“三要素”,让AIGC驱动设计创意
AI正在影响人类艺术。计算美学(Nolibox)联合创始人黄晟昱分享了AIGC如何驱动设计创意生产机制革新。
黄晟昱谈道,设计与计算的融合演化经历了三个阶段:1.0时代是以Adobe为代表工具的机器辅助设计,2.0时代是以canva等工具为代表的数字设计工具,3.0时代则是基于AIGC的直接设计,为此计算美学推出了“图宇宙”、“画宇宙”等工具。
“智能设计之于设计行业,正如自动驾驶之于交通行业。”黄晟昱说,“但设计行为是复杂的、一般是没有*解的,优化函数往往并不是*的、明确的。”
实现AIGC驱动下的可控的设计创意生产面临至少三大挑战:1、人和机器在涉及创意中的语言不可通约性。2、复杂设计创意需求的获取与分析。3、设计生成创意方案难以迭代及落地。对此,黄晟昱提出设计认知到机器人认知的转化“三要素”:1、设计资产的可量化性。2、设计经验的可归纳性。3、设计行为的可模拟性。
创立于2020年的计算美学是清华大学孵化的科技企业,目前已推出了全球*可商用视觉设计数据集,旗下核心产品包括AIGC生产力工具“画宇宙”、智能设计引擎“图宇宙”,下一步计划推出AI设计创意平台Yeahpix。
八、结语:生成式AI引爆内容生产与交互范式革新,见证AI新纪元到来
GTIC 2023中国AIGC创新峰会圆满落幕,但大模型与生成式AI催生的内容生产与交互范式革新才刚刚开始。
在这场AIGC盛会中,我们看到大模型时代技术的发展与积累下诞生的ChatGPT,让产业界、学术界和投资界无一不为之振奋。同时,这一现象级产品更是成为大模型时代的里程碑事件,为深耕大模型多年的企业展现了智能涌现的潜力。
同时,模型参数规模爆炸,千亿级模型训练的困难程度可想而知,在AI芯片、算力层则展现出让生成式AI产品拥有大规模部署的机会。
生成式AI带来了颠覆性的应用创新,从文字、图片、代码、视频甚至于创意生产、元宇宙产业,生成式AI为不同行业打开了无限的创造与想象空间。越来越多的类ChatGPT产品走向商业化落地,AI正在深入各行各业,加速通用人工智能时代的带来。
展望未来,生成式AI正在引领我们进入AI新世界,狂飙突进的ChatGPT正在掀起新一轮科技革命。
GTIC 2023中国AIGC创新峰会将会成为产学研界围绕前沿技术与产业落地进行深入交流、思想激荡的重要平台,邀请各细分赛道的AIGC企业成为AI新纪元时代到来的见证者。
接下来,智东西将就部分演讲及*论坛进行更完整的报道,请关注智东西的后续推送。
过去一周,AIGC 在狂欢。
我们真切地体验到了人工智能的“指数级增长”,还未从GPT-4 带给我们的震惊之中恢复,马上就被卷入了其与“文心一言”的对比和争论,紧接着微软又丢下了一颗名叫Copilot的重磅炸弹,要重新发明生产力,顺便给它差着辈儿的表亲Clippy正名(没错,就是二十多年前那个“臭名昭著”的回形针)。
不过,在OpenAI、微软、谷歌、MidJourney、百度的轮番轰炸之下,在Copilot 究竟是解放打工人还是革打工人的命的争论之余,我们想谈谈人,包括技术背后的,当然也包括技术面前的。
在这个全球化、细分工的时代,我们每个人或多或少都可能感觉自己像一颗螺丝钉,能做的永远都是高度分化的冰山一角,但事情并不总是这样的。回望我们文明的历史,那些璀璨的时代总是会出现一些极其耀眼的人物。文艺复兴时期诞生了达芬奇这样的绘画大师,但他同时还是自然科学家、工程师,精通雕刻、发明、建筑、数学、生物学、物理学、天文学、地质学等等,而这样的通才在那个时代或许并没有现在这么无法想象,毕竟文艺复兴的"Renaissance"一词延续至今,已经成为了通才、博学家的代名词。
我们把时间再拉近一点,看见上世纪初风起云涌的物理世界,一场索尔维会议集结了普朗克、爱因斯坦、玻尔等17 位诺奖得主,是量子力学的疯狂年代。而到了世纪末,约翰·卡马克和约翰·罗梅洛在堪萨斯城的车库里就捣鼓出了《德军总部3D》这样的FPS 游戏的奠基之作,乔布斯这样的狂人则凭着个人意志直接定义了苹果。可以说,每一次范式的转移,每一次对个人、对生产力的解放,都会带来一个野蛮生长的时代,而随之而来的是井喷一般的人才涌现,而历史也许很快就要重复这一点了。
或许去年我们仍对文生图的Stable Diffusion、MidJourney摇摆不定,或许早前我们仍对ChatGPT的实用性有所怀疑,但GPT-4 和Copilot 的出现,意味着"Work with AI" 将个人的生产力提高到了一个新的高度,配备了合适的AI 工具之后,一个人就是一支队伍,现有的社会规则很有可能被打破,“超级个体”的时代很可能即将(或者说,再次)来临。
同时,AIGC 目前已经触及了许多领域,包括自动驾驶、医疗、金融、教育,以及以生物科技为代表的AI for Science,这一轮AI 的爆发势必将进一步赋能各行各业,带来生产方式的变革、指数级的增长,乃至科学研究的突破。
不过,AI 虽然近来“功力大增”,可以帮我们完成更多的事情,但归根结底“超级个体”的天花板永远将由那个人才本身决定,而想要以AI 重塑各行各业,同样需要大量的专业人才进行迁移、设计乃至训练、调校才能实现。我们相信,在AIGC 爆发式增长的时代,人才的重要性同样也被提高到了一个前所未有的高度,而这一点,从当今世界各国的战略政策也可见一斑。
为保障其在人工智能、量子信息科学、网络安全、先进制造业等领域的持续进步和*地位,美国延续其一向对科学、技术、工程和数学(STEM)领域的重视,多年来频频出台政策以构建全方位的STEM 人才培养体系,更于2022 年2 月5 日在众议院通过了《2022 年美国竞争法案》,为吸引全球人才赴美、留美推出了一系列“突破性”新政,释放出强烈的人才争夺信号;欧盟也不甘落后,于2022年7 月通过新的《欧洲创新议程》,旨在引领新一轮的深科技创新,同样在进行中的还有著名的“地平线”计划,大力支持基础研究创新与合作。
作为全球科技创新的重要主体,我国自然也十分重视人才的培养与引进。党的二十大报告提到,“教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑”。而在刚刚结束的全国两会上,总书记再次同代表委员谈到这三方面的工作。显然,科技是*生产力,而教育与人才,本质上都是对人才的极高重视。据悉,我国还出台了诸如《关于开展科技人才评价改革试点的工作方案》、《关于支持女性科技人才在科技创新中发挥更大作用的若干措施》等一系列战略措施,旨在更深、更广地挖掘更多的人才,培养一批具有国际影响力的领军型、战略型、复合型和跨界型创新创业人才。
创新人才从未如此重要。“跟随式创新”的时代正在或已经成为过去,基层科学突破为应用技术升级累积了强大的发展势能,在当前全球形势下,“跟随”已经不再是选项。在这样的背景下,我们秉承对科技创新人才的一贯关注,在中关村科学城管理委员会作为指导单位下,由北京清华工业开发研究院与《麻省理工科技评论》中国联合主办的全球青年科技*峰会将于3 月30日-31 日在北京海淀举办。
北京市海淀区作为国家一流高等院校及科研院所集聚密度最高的区域,在科学基础设施、科技创新生态方面遥遥*。北京清华工业开发研究院(简称“清华工研院”)成立于1998 年8 月,是由北京市人民政府和清华大学共同组建和管理的事业单位,承担清华大学科技成果在北京转化和产业化的使命。《麻省理工科技评论》诞生于1899 年,是历史上最悠久、影响力*的科技商业化智库之一。自诞生起,就深刻洞察每个时代的新兴科技和创新商业,长期聚焦于创新科技的商业化和资本化进程,使它不仅见证了百年岁月中跌宕起伏的产业变迁,也参与了一代又一代新技术浪潮引发的时代变革。
此次活动的举办,除了希望聚集全球创新人才和资源,打造创新人才高地、加快提升海淀区域创新能力,还将通过最*的科技大脑们的分享,为我们绘制出一份关于中国创新技术与产业发展的蓝图。
本次活动现场,除了新一届的TR35 中国入选者之外,我们还将同步邀请往届TR35 代表及评委,以及多位*科学家、科技商业*、政府代表等一同参与。围绕科技创新的*目标以及中国式自主创新的意义和指导等“大问题”进行深入的探讨,不仅要在实践创造中找寻答案,更要在思想碰撞中提对问题,在为中国科技发展提振信心、指明方向的同时,共同投身于下一轮的科技成果转化与产业化爆发。
在此之前,我们对这些“可能改变世界”的青年科学家们做了一个采访,提前问了他们关于这些“大问题”的思考,比如:从国家产业发展和人民生活福祉的角度出发,我们有哪些*命题亟待解决?又比如在各个科技领域,他们创新的最终目标和*想象是什么样?
我们试图通过聚合他们的答案,拼出一张中国科技和产业未来的蓝图。以下为部分节选。
终极命题
为了人类物种的延续与繁衍
有人钻研卵子分子机理,TA 说我们的使命是在伦理规范下改善全体人类的生活和健康。
有人要做“三维基因组版AlphaFold”,TA 说希望能给世界带来战胜各种大脑相关疾病的新武器。
有人致力于“看清”癌细胞的分子特点及其生存环境,TA 说将帮助我们对于生命体和疾病的分子特征的理解提升到一个全新的层次,希望能够引起生物医学研究与制药产业的范式转变。
为了打破芯片和算力的瓶颈
有人利用磁学新奇物理现象,要打破冯·诺伊曼结构的长年垄断,建立IT 器件新范式,TA 说大力提升国家的科技竞争力,是每一个中国科研工作者的使命。
有人专注构建更高效、更通用的光学芯片接口方案,TA 说科研工作者需要去解决国家和社会所面临的一些公共问题,需要有直面问题的勇气,敢于挑战痛点,不去回避难点,不跟风追热点,才能做出有意义的工作。
有人致力于将金刚石变成半导体,并实现微电子应用,TA 说要破除当前发达国家对我国的技术封锁,在新的赛道上“换道超车”。
有人专研将光子芯片通用化,TA 说作为科研工作者很重要的一点在于需要把握理想主义与现实主义的平衡,经常反省自己研究工作的价值。
为了解决全球的气候与能源问题
有人研究高端微型热电制冷器件,TA 说TA 的研究拓展了新型制冷材料的研究范围。
有人聚焦光伏发电多维评估技术,构建了全球普遍使用的综合评估体系,TA 说要寻求低风险-高效益的光伏开发路径以服务全球净零排放愿景。
有人专注于高温超导带材,赋能下游紧凑型可控核聚变,TA 说让中国高温超导产业蓬勃发展是我一直坚持的梦想。
为了拓宽人类的认知边界
有人深入钻研光与自由电子的相互作用,TA 说创新的意义在于增强我们对世界的基本理解或造福我们的实际生活。
有人用物理学实验方法,在原子尺度拍摄下溶液中化学反应的过程,TA 说要帮助人们更好地建立“物质观”。
有人利用基于物理模型的计算成像技术,并与先进电磁探针结合实现原子级别分辨率,摆脱光学观察手段,TA 说要拓展人类感知客观世界的边界。
有人建立起单原子催化剂的数据库,找寻规律、探索纳米催化,TA 说想看见催化的最本质过程。
有人专注电子显微学,利用机器学习、材料学等交叉学科方法解决技术难题,TA 说我们的研究非常基础,从原子尺度上观测材料的结构,从而为未来在原子尺度上调控材料性质打下基础。
终极想象
一个超信息化社会
有人专注于重构6G 智能超表面,要实现无所不在的通信场景,TA 说应该通过自己的研究成果为人类未来创造更美好的机会。
有人致力于开发可穿戴的柔性电子纤维,打造智能服装、纤维手术机器人等,TA 说要开发能够计算的织物/衣服,就如同我们的手机和电脑。
有人钻研非侵入式脑机接口,投身开发面向普通大众的,能用、好用、爱用的消费级脑机接口产品,彻底改变人机交互方式,TA 说这必将颠覆人类现有的生活方式。
通用人工智能
有人基于“不同智能问题的本质一样”的信念,统一机器看世界和读文字的方式,颠覆机器视觉领域长期占主导地位的深度卷积神经网络,TA 说如果真能实现这样的通用人工智能系统,将有望和100 年前的电力革命一样,改变整个人类社会的生活和生产方式。
颠覆医疗
有人研发电子皮肤和更高集成度的芯片,TA说我更愿意把技术拿出来,和产业公司一道探讨产业化。
有人专注柔性可穿戴电子皮肤发光显示器件,TA 说未来有望能够彻底改变人们的生活、通讯和医疗方式,实现全新的疾病预防和治疗模式。
有人利用跨学科的功能性光刻胶打破了柔性电子皮肤可拉伸晶体管的集成密度世界纪录,TA 说要逐步替代现有有线连接的、硬质的、大型的医用传感器,如心电监测器、血压监测器等,把门诊搬到家里,甚至是身上。
一个大同的世界
有人致力于结合前沿物理与硅基集成电路技术,实现服务于量子计算的大规模低温精密测控电路,TA 说当今世界的问题,在于物理学的发展遇到了瓶颈,由此导致新的产业出现的速度缓慢,加剧了世界范围内的不平等。我们将致力于解决这个问题,虽然个体的力量很渺茫。
当然,我们最喜欢的,还是其中一位入选者的说法,在科学研究项目中,创新=生存。
截止目前,已有80 余位顶尖科技大脑和青年人才确认出席,他们将在为期2 天的会议里,围绕生物医疗、科学家创业、AIGC、量子计算、可持续能源及材料、交叉跨界等主题,将他们的创新成果及对创新目标的思考密集地呈现给现场所有参会嘉宾。