脉络梳理:华为盘古被曝抄袭阿里千问事件

avatar
关注

近日,科技圈内爆发了一场关于大型语言模型知识产权的争议。争议的核心是华为诺亚方舟实验室开发的盘古大模型(Pangu Pro MoE)被指控存在抄袭行为,指控方为GitHub上的@HonestAGI,其发布的研究论文指出盘古大模型涉嫌抄袭阿里巴巴的通义千问Qwen-2.5 14B模型。

面对这一指控,华为诺亚方舟实验室迅速作出回应,坚决否认抄袭,并解释称盘古Pro MoE开源模型的部分基础组件代码实现确实参考了其他开源大模型的代码,但这一切都是严格遵循开源许可证要求进行的。本文将通过一文梳理,梳理此次华为盘古大模型被曝抄袭的全过程


事件起因

2021年,华为云发布了盘古系列预训练大模型,包括NLP(自然语言)大模型、CV(视觉)大模型、科学计算大模型。

今年6月21日,华为云发布盘古大模型5.0,包含不同参数规格的模型,如十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、低成本的推理场景;以及千亿级参数的Pangu U系列、万亿级参数的Pangu S系列超级大模型等,帮助企业更好地在全场景应用AI技术。

6月30日,华为公司宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术,并对外公布相关研究论文。对此,华为表示,此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

7月4日,一位自称为哥斯达黎加大学的韩国学生在GitHub上发布了一份技术分析报告。报告指出,通过“LLM-Fingerprint”(大语言模型指纹)技术对比,盘古Pro MoE模型与阿里通义千问Qwen-2.5 14B模型在注意力参数分布上的平均相关性高达0.927,远超正常范围。此外,盘古开源代码文件中还标注了“版权所有2024,Qwen团队,阿里巴巴集团”,进一步引发了抄袭的质疑。


华为回应

否认抄袭指控:7月5日下午,华为诺亚方舟实验室发布声明,否认抄袭指控。声明称盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。

华为承认盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码,但强调严格遵循开源许可证要求,并在开源代码文件中清晰标注了开源代码的版权声明。


争议升级

7月6日凌晨,一位自称是盘古大模型团队的员工自曝,盘古大模型在开发过程中存在套壳、续训、洗水印等“非常规”操作。该员工称盘古大模型实际上是使用Qwen 1.5 110B续训而来,并通过加层、扩增ffn维度等操作凑够了大概135B的参数。

尽管华为否认抄袭,但公众对华为的回应存在质疑。一些人认为,即使华为遵循了开源协议,但两个模型在核心参数分布上出现异常相似性,仅靠“开源代码”解释难以令人信服。


事件影响

截至2025年7月7日,华为尚未对内部员工自曝的内容发表进一步声明,事件仍在持续发酵中。

总结来看,目前尚无证据证实盘古大模型存在抄袭阿里Qwen的“实锤”证据,HonestAGI 所发布的质疑论文所采用的测试方法的可靠性也有待进一步验证,毕竟其并未完全公开其测试代码,更何况HonestAGI 已经下线了之前的质疑论文。至于盘古大模型当中确实有采用Qwen的开源代码,但这部分的代码本就是开源代码,盘古大模型团队的相关的声明做法也是合规的,只能说盘古大模型并不是从零起步的绝对原创,如果只是用了部分开源组件,也并不属于抄袭。

此次事件引发了对AI大模型开源生态的反思,包括开源协议的清晰度、知识产权的界定以及开源社区的信任机制。尽管华为否认抄袭指控,但这一事件可能会影响华为在开源社区的形象和声誉,同时也凸显了在开源项目中透明度和合规性的重要性。

如果一个模型在LLaMA基础上训练,却不说明来源,甚至包装为“完全自主”,无论出发点如何,都违背了开源社区基本的“透明性和尊重原则”。如果盘古确为LLaMA衍生模型而未公开说明,属于严重开源伦理失范;如果确为自主训练,应尽快公开更多训练细节与代码验证,止谣于源头。

不论真假,本次风波对中国AI模型开源生态都是一次集体公信力的考验,中国当前正处于AI国产化、自主化攻坚阶段。盘古是国内极具影响力的大模型品牌之一,曾多次登上发布会主舞台,象征技术自信。这场争议若被坐实,则会让业界质疑中国大模型的原创性,这些质疑,会反过来影响国家推动AI自主可控战略的产业信任度。


JRs们怎么看?欢迎留言讨论!

发布于上海阅读 240251

这些回复亮了

discusser-avatar

江北种桃人

· 山东
虎扑JR1998451160就是靠这个起家的
收起

中兴:终于有人懂了。。

亮了(1804)
查看回复(7)
回复
discusser-avatar

nos金色轰炸机

· 广东
来昂内尓梅西不像小米用别人的架构也能说是自研,大模型这个东西全世界都是互相借鉴的,还是不懂的人多收起

大模型互相借鉴确实没错,使用开源技术没错,但是你用自家昇腾硬件在qwen权重上做增量训练,就叫做全栈自研就搞笑,反正华为+万物=自研

亮了(723)
查看回复(8)
回复