井喷式爆发即将到来！华为、百度、阿里、京东激战大模型

大模型即将迎来井喷式爆发。

为期三天的2023世界人工智能大会已经在上海闭幕，共有32个重大产业项目签约，总额达288亿元。在今年的世界人工智能大会上，大模型成为外界关注的焦点，国内外总计30余款大模型集体亮相。

目前，华为、百度、阿里、京东、字节跳动、商汤等巨头相继入场“参战”。不过，有分析认为，大模型在井喷式爆发之后，但最终能留存下来的通用大模型只会有2-3家。

（图片来自海洛）

//大厂云集，开打大模型//

所谓人工智能大模型，通常指的是经过大规模数据训练后，能够适应一系列任务的模型。

不完全统计显示，目前，已有约30款大模型新品发布或宣布即将发布。

此前，在5月底举行的中关村论坛上，有专家披露，据其统计到当时为止，中国10亿级参数规模以上大模型已发布了79个。如今，随着世界人工智能大会上批量发布的一批大模型，百模大战也已经正式打响。

7月7日，百度、华为、阿里巴巴等企业被工信部中国电子技术标准化研究院授予“国家人工智能标准化总体组大模型专题组”组长单位，正在积极推动大模型国家标准体系建设，助力中国大模型产业发展。

近期发布的大模型新品包括：阿里巴巴的绘画大模型“通义万相”、中国电信的类ChatGPT产品“TeleChat大模型”商汤科技联合香港中文大学和清华大学等推出的“书生通用大模型体系”、第四范式专注企业软件领域的“式说”大模型。

作为国内首个发布大模型的互联网大厂，百度在人工智能大会上公布了“文心一言”最新进展。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰称，文心大模型3.5效果、功能、性能全面提升，实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

7月7日下午，华为开发者大会2023（Cloud）在东莞揭开帷幕。华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0，将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向，持续打造核心竞争力，为行业客户、伙伴及开发者提供更好的服务。

（张平安发布华为云盘古大模型3.0。图片来源：华为）

阿里云在7月7日的2023世界人工智能大会上宣布了推出通义大模型家族新成员“通义万相”的消息，瞄准文字生成图像赛道。此前，阿里云在今年4月发布了AI大模型通义千问,并宣布通义千问将接入阿里巴巴所有产品,进行全面升级改造。6月1日，阿里云对外推出了面向AI音视频赛道的“通义听悟”。

金山办公最近也发布了他们基于大模型的AI办公产品“WPS AI”，可以润色文章，自动制作表格和PPT。用户可以让AI把一篇提纲制作成PPT，并能随意更换PPT风格。

京东将在7月13日发布的千亿级“言犀大模型”，中国移动将于近期发布“九天”1+N大模型，医渡科技称正在研发医疗大模型，并将于近期针对部分目标场景推出小范围邀请测试。奇安信集团董事长齐向东表示，正在研发安全行业大模型，面向政府和企业客户；10月24日，科大讯飞将发布通用大模型，全面对标ChatGPT。

有一批知名“玩家”行动更早。

字节跳动4月18日发布大模型训练云平台，包括自研DPU等系列云产品，推出新版机器学习平台，支持万卡级大模型训练、微秒级延迟网络，弹性计算可节省70%算力成本，主要为大模型公司提供算力支撑等服务

腾讯云4月14日正式发布新一代高性能计算集群，算力性能和上一代相比提升3倍，服务器接入带宽从1.6T提升到3.2T，是目前国内性能最强的大模型计算集群。

商汤4月10日发布了通用大模型产品“日日新”。7月7日，“日日新”更新到2.0版。

// 入局大模型，至少需10亿美金 //

大模型的“烧钱”已成为业内共识。此前，华为云人工智能领域首席科学家田奇曾在公开演讲中表示，大模型可能收编高度定制化的小模型，导致市场向大公司集中，其资本门槛高，大模型开发和训练一次1200万美元。

昆仑万维此前也在公告中表示，大模型市场已经进入10家左右中大型公司，打3-5年持久战的格局，要做好这件事情，需要长期储备至少10亿美金以上的资金。

根据澎湃新闻报道，网易伏羲预训练及生成式人工智能平台负责人赵增介绍，目前企业入局大模型主要分为两种范式：第一种是着力于通用能力的基础大模型，这也是成本最高、最为昂贵的大模型。另一种则是基于基础大模型的行业垂直大模型，以大部分创业公司为例。

基础大模型以国外的OpenAI，国内的阿里、百度等为例，据浙商证券分析师陈杭此前发布报告，一片英伟达顶级GPU成本为8万元，GPU服务器成本通常超过40万元，“对于ChatGPT而言，支撑其算力基础设施至少需要上万颗英伟达GPU A100，一次模型训练成本超过1200万美元。”行业垂直大模型则以腾讯和大部分创业公司为例。

腾讯高级执行副总裁汤道生表示，基础通用大模型可以在100个场景中，解决70%-80%的问题，但未必能100%满足企业某个场景的需求。基于行业大模型构建自己的专属模型，虽然参数比通用大模型少，但是训练和推理的成本更低，优化也更容易，可能是性价比更高的选择。

// 多地支持，人才、基础创新存缺口 //

根据第一财经报道，此次2023世界人工智能大会，共有32个重大产业项目签约，总额达288亿元。

在大会的“大模型时代的通用人工智能产业发展机遇以及风险”论坛上，上海市徐汇区委常委、副区长俞林伟宣布了《徐汇区关于支持生成式人工智能发展的若干措施》，推出了大模型产业扶持新政。此外，人工智能产业政策正在各地密集出台，包括北京、上海、深圳等第一梯队，杭州、南京、苏州、成都等第二梯队都在布局。

(图片来源：启明创投x未尽研究《生成式AI》报告)

启明创投发布的《生成式AI》报告显示，第一梯队城市均围绕算力、数据、产业上下游生态加以布局，成为跨区域协作的中心。第二梯队城市也紧随其后，成都是首个在这波AI大模型浪潮中公布政策的西部地区城市，计划到2025年，全市人工智能产业产值突破1500亿元；南京则提出到2025年，全市人工智能核心产业收入超过500亿元。

分析人士认为，目前市场正处于井喷的前夕，人才、基础创新尚存缺口。

//井喷式爆发后，幸存者最多只有3家？//

根据第一财经报道，在WAIC期间，围绕大模型，算力、算法、数据、芯片等基础设施也成了讨论重点。此外，目前大模型都处于几何级的迭代进化中，在未来要如何和行业、场景结合，打通最后一公里，也成为众多嘉宾谈及的关键。

经济观察报援引腾讯高级执行副总裁汤道生观点表示，通用大模型一般基于公开信息来训练，在许多专业知识和行业数据积累不足。在策略上，通用大模型有点像“把大海煮沸”，不够聚焦，可以解决80%的问题，但未必能够满足企业某个场景的具体需求。

徐立也提到，大模型的幻觉性问题仍很严重，是需要解决的问题。幻觉性问题是自然语言处理领域中的基础问题之一，指文本生成模型的生成结果中含有与输入事实上冲突的内容。这些问题造成了大模型“一本正经的胡说八道”现象。

除此之外，清华大学智能产业研究院院长、中国工程院院士张亚勤提到，当下大模型仍有自己的局限性。比如ChatGPT会有时效性问题，你问它它是什么时候发布的，它不知道，因为它使用的是2021年9月前的数据。另外，大模型还有效率低、涉嫌侵犯隐私和知识产权保护问题等，这些问题都将影响大模型的商用。张亚勤认为，大模型效率至少还要提高10倍，才有大规模商用的可能性。

据证券时报报道，本届论坛期间，启明创投和未尽研究共同发布了《生成式AI》报告。报告提到，2023年把大模型推向了一个高峰，以GPT-4发布为标志，生成式人工智能朝着通用人工智能的方向，进入了创新应用的阶段。

DCCI互联网研究院院长刘兴亮认为，大模型会迎来井喷式爆发，但最终能留存下来的通用大模型只会有2-3家，“通用大模型能留存下来的最多只有三家。但会有很多专业的模型应用于医药、办公等不同的行业场景，未来我们会有不同的AI助理、AI医生、AI家教等角色。”

（Wind综合第一财经、中国证券报、经济观察报、证券时报、澎湃新闻等）

发表回复 取消回复

发表回复取消回复