凯发k8娱乐官网app中国芯片实|像素岛|现过去完全不敢想的发展局面有美国制裁的
来源:凯发k8·[中国]官方网站 发布时间:2025-07-29
2025年7月15日ღღ◈ღ,英伟达CEO黄仁勋接受央视记者采访时表示ღღ◈ღ:“美国政府已经批准了我们的出口许可ღღ◈ღ,我们可以开始发货了ღღ◈ღ,所以我们将开始向中国市场销售H20ღღ◈ღ。我非常期待能很快发货ღღ◈ღ,对此我非常高兴ღღ◈ღ,这真是个非常好的消息ღღ◈ღ。”
AMD发言人同日称ღღ◈ღ,美国商务部告知公司ღღ◈ღ,MI308产品的许可申请将进入审查程序ღღ◈ღ。与H20类似像素岛ღღ◈ღ,MI308是AMD专为中国市场设计的AI芯片ღღ◈ღ。
早前4月初ღღ◈ღ,特朗普政府突然叫停了H20的销售ღღ◈ღ,让英伟达碰上麻烦ღღ◈ღ。黄仁勋罕见地主动介入政治ღღ◈ღ,频繁奔走于世界各地积极协商ღღ◈ღ,2025年已三次来华稳定与中国政府ღღ◈ღ、客户的关系ღღ◈ღ。
另一头ღღ◈ღ,黄仁勋改变作风极积参与美国政治活动ღღ◈ღ,努力说服特朗普政府改变政策ღღ◈ღ,跟随特朗普出访中东ღღ◈ღ,赴美国国会作证ღღ◈ღ,和白宫积极建立良好关系ღღ◈ღ。
7月23日ღღ◈ღ,黄仁勋在华盛顿举行的AI峰会上回答主持人提问时表示ღღ◈ღ:“美国拥有任何国家都无法比拟的独特优势ღღ◈ღ,那就是特朗普总统ღღ◈ღ。”他随后解释ღღ◈ღ,特朗普上任第一天就认识到AI与能源的重要性ღღ◈ღ,并推出减税ღღ◈ღ、放松监管ღღ◈ღ、AI行动计划等一系列政策ღღ◈ღ,为美国企业在全球竞争中创造了“不可复制的制度红利”ღღ◈ღ。特朗普本人也在现场回应ღღ◈ღ:“你做得真棒ღღ◈ღ!”一个科技工作者的政治工作做到这个水平ღღ◈ღ,让人感叹ღღ◈ღ。
另一个关键因素ღღ◈ღ,是中国自身的技术能力ღღ◈ღ。7月15日ღღ◈ღ,美国财政部长贝森特在彭博电视台节目中说ღღ◈ღ,中国已经研发出性能与H20相当的芯片ღღ◈ღ,因此英伟达销售H20芯片不存在问题凯发k8娱乐官网appღღ◈ღ。这是美国政府首次公开承认ღღ◈ღ,中国在同类AI芯片上已具备可替代能力ღღ◈ღ。
更为直接的解释ღღ◈ღ,是白宫“AI沙皇”大卫萨克斯点出的ღღ◈ღ。2024年12月5日ღღ◈ღ,特朗普宣布萨克斯将任新设的“白宫人工智能与加密货币事务专员”ღღ◈ღ。今年7月16日ღღ◈ღ,萨克斯对彭博社表示ღღ◈ღ,恢复向中国大陆销售英伟达H20芯片并非“让步”ღღ◈ღ,而是一种精准遏制华为的手段ღღ◈ღ。萨克斯说ღღ◈ღ:
“有充分理由这么做ღღ◈ღ:你不希望把整个中国市场拱手让给华为ღღ◈ღ。即使是一颗性能被削弱的芯片ღღ◈ღ,英伟达也能在中国拿下很大一块份额ღღ◈ღ,从而挤压华为的空间ღღ◈ღ。”
美国对H20解禁ღღ◈ღ,政治相关的活动不难看到ღღ◈ღ,但并非关键ღღ◈ღ。贝森特与萨克斯所指的GPU技术与市场背景ღღ◈ღ,是说服特朗普的关键ღღ◈ღ,需要仔细解释ღღ◈ღ。
上图为国外机构对华为昇腾GPU营收的估计ღღ◈ღ,根据国内先进芯片产能估算ღღ◈ღ,图中910Bღღ◈ღ、910C和910X是性能逐步提升的昇腾GPU型号ღღ◈ღ。产能单位“kwpm”意为“千片晶圆每月”ღღ◈ღ,而“Die per wafer”是指每片晶圆上的“裸芯片”数量ღღ◈ღ,单个芯片面积越大数值越小ღღ◈ღ,可以看出910C和910X面积约是910B两倍ღღ◈ღ,而910B一片12寸晶圆(直径300毫米ღღ◈ღ,面积约700平方厘米)也只有78颗ღღ◈ღ,说明GPU芯片面积是比较大的ღღ◈ღ。
“yield rate”是指良率ღღ◈ღ,由于7nm先进芯片用DUV光刻机需要复杂的多重曝光工艺ღღ◈ღ,外媒估计良率起步只有15%ღღ◈ღ,逐步提升至50%ღღ◈ღ,最高70%ღღ◈ღ。910Bღღ◈ღ、910Cღღ◈ღ、910X的初始价格根据市场信息估为5万ღღ◈ღ、11万ღღ◈ღ、14万ღღ◈ღ,供应上来后会有降价ღღ◈ღ。
这个估算很粗略ღღ◈ღ,但结果极为惊人ღღ◈ღ。2024年华为GPU芯片营收为429.47亿人民币ღღ◈ღ,2025年预计大增240%至1461.07亿ღღ◈ღ,2026年再增45%至2120.23亿ღღ◈ღ,2027年2865.67亿ღღ◈ღ。2024年华为营收为8621亿ღღ◈ღ,净利润626亿ღღ◈ღ。如果利润率极高的GPU能再有2000多亿营收ღღ◈ღ,这将极大支撑华为的研发能力扩增ღღ◈ღ。这个估算肯定不准确ღღ◈ღ,但能够说明中国算力GPU市场的规模与利润ღღ◈ღ。
在5月21日的台北国际电脑展新闻发布会上ღღ◈ღ,黄仁勋说“英伟达在中国的市场份额从95%跌到了50%”ღღ◈ღ。其实2024 年ღღ◈ღ,中国市场只占英伟达全球营收12.5%ღღ◈ღ,对应金额约170亿美元ღღ◈ღ,并不算特别多ღღ◈ღ,因为比H20更先进的GPU不能卖ღღ◈ღ。虽然中国市场销售受限ღღ◈ღ,但并未影响英伟达全球营收飞速扩增ღღ◈ღ。不过黄仁勋担心的是ღღ◈ღ,2025年之后中国算力GPU市场会有较大增长ღღ◈ღ,英伟达让出的市场份额会成为中国竞争对手的“成长加速器”像素岛ღღ◈ღ。
英伟达算力GPU在国际上几乎没有竞争对手ღღ◈ღ,2024年数据中心GPU营收约1150亿美元ღღ◈ღ,市场份额高达93%-94%ღღ◈ღ。唯一值得一提的对手AMD份额仅约4%ღღ◈ღ,英特尔等其它对手合计不到3%ღღ◈ღ。
这种极为罕见的格局ღღ◈ღ,其技术原因笔者曾于2024年初在《没人能“杀死”1.5万亿美元的英伟达》文中解释了ღღ◈ღ。原本打辅助的GPU依靠通用计算功能与CPU地位倒转ღღ◈ღ,成为芯片计算能力的绝对主力ღღ◈ღ。英伟达服务客户的精神非常极致ღღ◈ღ,在神经网络ღღ◈ღ、科学计算ღღ◈ღ、游戏开发ღღ◈ღ、云计算凯发k8娱乐官网appღღ◈ღ、AIGCღღ◈ღ、大语言模型等众多领域主动优化ღღ◈ღ,将CUDA打造成为事实上的“GPU操作系统”ღღ◈ღ,而且没有值得一提的竞争对手ღღ◈ღ。
算力GPU相关程序开发极为复杂ღღ◈ღ,“万卡互联”涉及到的软硬件开发难度让人望而生畏ღღ◈ღ,需要优化的环节极多ღღ◈ღ。各环节稍有缺陷就会导致客户研发流程卡顿ღღ◈ღ、崩溃ღღ◈ღ,一旦问题难以解决ღღ◈ღ,结果就会是“送给人用都不要”ღღ◈ღ,这就是AMD面对的尴尬情形ღღ◈ღ。
只有英伟达在GPU芯片设计ღღ◈ღ、GPU系统架构ღღ◈ღ、HBM内存管理ღღ◈ღ、NVlink/NVSwitch高速数据传输ღღ◈ღ、InfiniBand连接GPU服务器ღღ◈ღ、CUDA软件配合硬件性能优化等诸多环节都做到了极为优秀ღღ◈ღ,让客户可以方便地使用英伟达GPU进行大模型等前AI前沿研发与应用ღღ◈ღ。
英伟达数据中心GPU产品高达73%的毛利润率ღღ◈ღ、90%以上的市场份额ღღ◈ღ,都与这些极为困难的技术有关ღღ◈ღ。竞争对手也许在某个专门的应用上指标超过英伟达ღღ◈ღ,就如AMD不时宣传的ღღ◈ღ,但“实战”应用就毛病一堆像素岛ღღ◈ღ。领域还在以“超摩尔定律”快速发展ღღ◈ღ,英伟达不断推出Blackwellღღ◈ღ、Rubin等新GPU架构ღღ◈ღ,有超过万名员工在针对机器人ღღ◈ღ、光刻等多类专业应用优化CUDA系统ღღ◈ღ,软硬件优势相当牢固ღღ◈ღ。即使AMD等芯片业竞争对手在芯片设计领域很有实力ღღ◈ღ,但如黄仁勋所言ღღ◈ღ,英伟达已经从芯片设计公司转型成为“软件公司”ღღ◈ღ,不在同一个层面了ღღ◈ღ。
让外界震惊的是ღღ◈ღ,在技术如此复杂的算力GPU领域ღღ◈ღ,中国遭美国最高程度限制打压ღღ◈ღ,却初步发展出了能与英伟达竞争的软硬件系统能力ღღ◈ღ。近期出来的标志性成果ღღ◈ღ,是华为基于昇腾910C打造的CloudMatrix 384超节点凯发k8娱乐官网appღღ◈ღ,性能直接对标英伟达GB200 NVL72系统ღღ◈ღ。
2025年4月16日ღღ◈ღ,半导体与人工智能分析机构SemiAnalysis出报告详细分析了华为CloudMatrix和910Cღღ◈ღ。从中可以看出ღღ◈ღ,虽然中国先进芯片制造技术受限ღღ◈ღ,但用综合解决方案追平了GPU芯片的性能差距ღღ◈ღ。让众多西方公司难以追上英伟达的复杂技术问题ღღ◈ღ,却是中国公司的机会凯发k8娱乐官网appღღ◈ღ,复杂反而提供了多条路线优化的可能性ღღ◈ღ。
图为GB200 NVL72机柜ღღ◈ღ,比一个成人高一些ღღ◈ღ,体积不算太大ღღ◈ღ。论单个芯片性能ღღ◈ღ,910C与GB200有一定差距ღღ◈ღ。算力用BF16稠密算力衡量(稀疏算力更高ღღ◈ღ,但不稳定)ღღ◈ღ,GB200高达2500 TFLOPS(TFLOPS是指“每秒1万亿次浮点运算”)ღღ◈ღ,而910C是780 TFLOPSღღ◈ღ,可简略理解为三分之一算力ღღ◈ღ。
GB200中的B100芯片是台积电3nm工艺ღღ◈ღ。B100有1040亿个晶体管ღღ◈ღ,B200是两颗B100 die先进封装ღღ◈ღ,共2080亿个晶体管ღღ◈ღ。再加上HBM相关差异ღღ◈ღ,910C单卡性能与GB200相比ღღ◈ღ,有不小的差距ღღ◈ღ。除了算力与传输速率差距ღღ◈ღ,还有7nm与3nm工艺导致的芯片功耗差距ღღ◈ღ。
在物理尺寸上ღღ◈ღ,CM384就明显比GB200 NVL72机柜要大得多ღღ◈ღ。它有16个机架ღღ◈ღ,12个做计算ღღ◈ღ,4个用于数据交换ღღ◈ღ,简单目测就是NVL72机柜约16倍大小与占地面积ღღ◈ღ。需要用五倍的芯片数量ღღ◈ღ,10倍以上的体积与占地面积ღღ◈ღ,来弥补单个芯片性能的差距ღღ◈ღ。
但总算力赶超就是很大的成就ღღ◈ღ,为此CM384架构上需要一些“大招”ღღ◈ღ。有趣的是像素岛ღღ◈ღ,只要想出了办法ღღ◈ღ,7nm与3nm芯片性能的差距ღღ◈ღ,在整个GPU算力系统中就不算很关键了ღღ◈ღ。例如华为擅长的数据通信领域技术ღღ◈ღ,“光互联”就起到了重要作用ღღ◈ღ。
SemiAnalysis认为华为的工程优势在于系统层面ღღ◈ღ,而不仅仅是芯片层面ღღ◈ღ,还有拓扑网络ღღ◈ღ、光互联技术和软件堆栈的创新ღღ◈ღ。总体来说ღღ◈ღ,华为的技术方案的缺陷是成本高ღღ◈ღ,能耗还高4倍ღღ◈ღ,虽然总算力高ღღ◈ღ,但综合指标性能明显不如英伟达NVL72ღღ◈ღ。正常情况下ღღ◈ღ,市场不会接受这样的方案ღღ◈ღ。
但现在情况就是极不正常ღღ◈ღ。最大的不正常是英伟达AI算力产品不卖给中国ღღ◈ღ,国产系统做出来能用就有价值ღღ◈ღ。另一个不正常是ღღ◈ღ,英伟达GPU产品利润率极高ღღ◈ღ,以至于华为对标产品的高成本ღღ◈ღ、高能耗根本不是问题ღღ◈ღ。
笔者曾参观过H20服务器生产线的盒子(英伟达销售的时候就是8卡一起)ღღ◈ღ,还有主板ღღ◈ღ、CPUღღ◈ღ、NVLink互联及4×400 GbE网卡等等ღღ◈ღ,组装成一个完整的服务器ღღ◈ღ。它的总算力是BF16 1184 TFLOPSღღ◈ღ,不比一个910C的理论算力高多少ღღ◈ღ,不适合用于基座大模型训练ღღ◈ღ。
H20在中国需求不错ღღ◈ღ,一个重要原因是DeepSeek带动了推理服务器部署需求ღღ◈ღ,以及垂类模型训练需求ღღ◈ღ。H20单卡价格在10万元左右ღღ◈ღ,八卡服务器的价格在110万元至130万元之间ღღ◈ღ,利润很高ღღ◈ღ。中国大模型研发应用还是更习惯CUDA生态ღღ◈ღ,H20组的推理应用较为成熟ღღ◈ღ。
H20的特性是凯发k8娱乐官网appღღ◈ღ,算力不到H100的十分之一ღღ◈ღ,但是HBM容量有96GBღღ◈ღ、141GBღღ◈ღ,HBM带宽4.0TB/sღღ◈ღ,这都和H100接近ღღ◈ღ。大模型推理应用时ღღ◈ღ,矩阵计算远不如训练时密集ღღ◈ღ,数据在GPU之间的传输多ღღ◈ღ,H20的数据传输表现不错ღღ◈ღ。几家头部互联网公司下了不少订单ღღ◈ღ,2024年就预订了160亿美元的H20ღღ◈ღ。
H20的性能指标不算太强ღღ◈ღ,国产GPU完全有能力接近它ღღ◈ღ。除华为昇腾ღღ◈ღ,还有摩尔线程ღღ◈ღ、壁仞科技ღღ◈ღ、沐曦ღღ◈ღ、天数智芯等多家在做算力GPUღღ◈ღ。这几家GPU头部企业已全部启动IPO或借壳程序ღღ◈ღ,在科创板ღღ◈ღ、港交所同步推进ღღ◈ღ,上市节奏明显加快ღღ◈ღ。拿出了性能不错的GPU产品的其它公司还有多家ღღ◈ღ。
科大讯飞星飞大模型与华为联手ღღ◈ღ,坚持软硬件全栈自主的技术路线ღღ◈ღ。星火大模型训练与推理全部跑在华为910B/910C全国产万卡集群“飞星一号”上ღღ◈ღ;二期 “飞星二号”预计2025年内交付ღღ◈ღ,可支撑万亿参数模型持续训练ღღ◈ღ。
星火大模型研发团队由于技术路线特殊ღღ◈ღ,适配需要花费极大精力ღღ◈ღ,华为也要派很多人一起维护开发GPU运行ღღ◈ღ,非常艰苦ღღ◈ღ。经过几年努力ღღ◈ღ,目前星火大模型性能已经追赶上来了ღღ◈ღ,多种垂类模型与中石油ღღ◈ღ、中海油等大国企应用合作ღღ◈ღ,有特殊的战略价值ღღ◈ღ,生态会不断壮大ღღ◈ღ。
上市公司寒武纪的MLU(Machine Learning Unit)云端智能芯片ღღ◈ღ,其实就是GPUღღ◈ღ,目前取得了仅次于昇腾系列的应用成绩ღღ◈ღ。寒武纪思元590能支撑DeepSeek-R1 671Bღღ◈ღ、Llama-3ღღ◈ღ、Qwen-3等主流开源大模型的千卡级训练ღღ◈ღ,实测算力密度达到 A100的80%ღღ◈ღ。思元690传有中芯国际预留先进芯片产能ღღ◈ღ。寒武纪的“硬件-软件-生态”体系已经初步成型ღღ◈ღ,与国内主流大模型开发商合作ღღ◈ღ,目标是2025-2026年形成训练推理全覆盖的国产算力矩阵ღღ◈ღ。技术前景支撑了寒武纪2800亿的市值ღღ◈ღ,维持了超过半年ღღ◈ღ,并非一般快速见顶的题材炒作ღღ◈ღ,2025年一季度转为盈利ღღ◈ღ。
近期ღღ◈ღ,国产大模型开发势头很好ღღ◈ღ。DeepSeek在2025年初突破以后ღღ◈ღ,开源了几项关键技术ღღ◈ღ,推动了行业大发展ღღ◈ღ。目前阿里Qwen系列ღღ◈ღ、Kimi K2等国产大模型在开源榜单上成绩很好ღღ◈ღ,引发了全球关注ღღ◈ღ。字节ღღ◈ღ、腾讯等大企业对大模型也有很高投入ღღ◈ღ,应用场景丰富ღღ◈ღ,实力迅速增长ღღ◈ღ。
国产AI软硬件生态与半年前相比ღღ◈ღ,都可以说完全两样了ღღ◈ღ,实力暴涨ღღ◈ღ,各类突破层出不穷ღღ◈ღ。生态有了ღღ◈ღ,技术信心也起来了ღღ◈ღ,对于美国AI封禁并没有那么在乎了ღღ◈ღ。
这一切ღღ◈ღ,是以前完全不敢想的ღღ◈ღ,大发展的动力绝对是美国芯片制裁ღღ◈ღ。芯片业国产替代ღღ◈ღ、生态建设已经进入繁荣期ღღ◈ღ。而GPU由于技术复杂ღღ◈ღ,应用场景多ღღ◈ღ,能想的系统级办法也多ღღ◈ღ,对于EUV光刻机的依赖并不严重ღღ◈ღ,因此CM384可以追上NVL72的总算力ღღ◈ღ。多家国产GPU各有绝活ღღ◈ღ,又是IT互联网公司资本投入的重点有真金白银ღღ◈ღ,属于较为活跃的芯片创新领域ღღ◈ღ。
美国的制裁现在很微妙ღღ◈ღ,全球业界其实也已有了判断ღღ◈ღ,愿意与中国搞好关系ღღ◈ღ。连美国政府自己都明白像素岛ღღ◈ღ,中国已经熬过了芯片制裁ღღ◈ღ,国产GPU芯片的巨大市场需求都出现了ღღ◈ღ。而国产大模型与美国差距显著缩小ღღ◈ღ,几家公司都至少有技术跟随能力ღღ◈ღ。从限制中国芯片与人工智能技术发展的角度来看ღღ◈ღ,美国制裁已经失败了ღღ◈ღ,中国取得了长足的进步ღღ◈ღ,没法限制了ღღ◈ღ。
2018年美国对中国发动贸易战以来ღღ◈ღ,已经可以得出结论ღღ◈ღ:美国科技制裁像素岛ღღ◈ღ,对我国科技发展正面作用极大ღღ◈ღ;芯片产业出现了发展奇迹ღღ◈ღ,连最尖端的GPU芯片都有了中国生态像素岛ღღ◈ღ。
而H20的解禁ღღ◈ღ,说明美国内部承认中国AI领域的软硬件自主发展成果ღღ◈ღ,认识到了制裁的负面作用ღღ◈ღ。美国方面已经调整目标ღღ◈ღ,不再坚持彻底封杀中国的目标ღღ◈ღ,而是改为“占领全球AI市场”ღღ◈ღ。
这其实就是意识到ღღ◈ღ,中国是竞争对手ღღ◈ღ,市场需要去竞争ღღ◈ღ。黄仁勋在中国ღღ◈ღ、中东等地的商业活动ღღ◈ღ,对美国政府的全球AI战略很有帮助凯发k8娱乐官网app凯发k8娱乐官网appღღ◈ღ,因此线解禁也在情理之中ღღ◈ღ。
美国政府的态度变化ღღ◈ღ,说明了中美芯片斗争已经进入了新的阶段ღღ◈ღ。美国政府愿意用稍微正常一点的市场逻辑来看问题了ღღ◈ღ,不再一味封杀ღღ◈ღ、愚蠢地让出宝贵市场ღღ◈ღ,而是希望用H20来抢中国企业的市场份额ღღ◈ღ。
至于H20解禁是否会损害国产芯片的市场前景ღღ◈ღ,看了前面的技术分析就能明白ღღ◈ღ,华为CloudMatrix 384这种能与英伟达最先进服务器对标的产品ღღ◈ღ,远超H20的技术指标ღღ◈ღ,不在一个层面竞争ღღ◈ღ。H20能够补充中国的大模型推理算力ღღ◈ღ、垂直模型训练算力ღღ◈ღ,有利于大模型应用推广ღღ◈ღ,解禁也不是坏事凯发k8娱乐官网appღღ◈ღ。
在更为广阔的AI训练与推理应用市场ღღ◈ღ,国产GPU市场需求随着自主生态的逐渐完善ღღ◈ღ,必然有高速增长ღღ◈ღ。如果美国为了破坏中国市场生态ღღ◈ღ,又解禁性能更强的GPUღღ◈ღ,那么中美科技斗争的胜负趋势就更为明显了ღღ◈ღ。K8天生赢家一触发ღღ◈ღ,凯发官网入口首页ღღ◈ღ,凯发k8·[中国]官方网站ღღ◈ღ,天生赢家 一触即发ღღ◈ღ,凯发国际k8官网ღღ◈ღ,K8凯发VIP入口ღღ◈ღ,凯发国际app首页ღღ◈ღ!