发布日期:2026-02-21 07:35 点击次数:77


这两天的大模子圈子,可谓是滋扰超过。一边,DeepSeek 凭借其低老本、高性能的亮眼发达,迷惑着大量眼力,各路技巧大牛纷繁点赞。
而另一边,应酬媒体和技巧论坛上却运转流行起各式奇特的"颜翰墨",比如" QwQ "、" QVQ ",不解是以的东谈主可能一脸懵,但懂行的东谈主皆知谈,这指的恰是阿里通义千问开源的系列模子。
本年 9 月,阿里发布通义千问新一代开源模子 Qwen2.5 系列,连络推出了从 0.5B 到 72B 参数的不同范畴版块,遮蔽了各式愚弄需求,告捷踏进全球顶尖开源模子行列,多模态、多谈话能力样样不落,成了不少企业和开拓者的心头好。不仅如斯,Qwen 团队最近也算作时时,接连开源了几款颇具亮点的 AI 模子,捏续激勉情切。

Qwen 团队的定名格调亦然荒芜"概括": QVQ,"两眼瞪";QwQ,像是键盘上不防范蹭了一下。 这是什么代码全国的颜翰墨? 似乎技巧大牛们在严肃的科研之余,悄悄藏了小数"皮"。也许,Qwen 的定名玄学即是:名字温暖,能打才是硬兴味?

拿起生成式 AI,寰球的眼力似乎总离不开大洋此岸的科技巨头:OpenAI、谷歌、Meta。但最近,AI 圈子里却时时露出一些来自东方的身影,比如 DeepSeek 和阿里的通义千问 Qwen,它们正在各大 AI 模子性能榜单上攻城略地,成为焦点。

要知谈,往常咱们聊到国产大模子,总嗅觉带着点"追逐者"的暗影。但咫尺这么的中国开源力量,正在用实力解说我方不再是看客,而是足以和 OpenAI、Meta 这些巨头劲旅掰手腕的变装。

Hugging Face 2024 年年度盘货数据就很专门念念:Qwen2.5-1.5B-Instruct 的下载量占比高达 26.6%,碾压了 Llama 3 和 Gemma 这些明星开源模子。下载量这东西,天然不行完全等同于"最强实力",但完全是东谈主气的硬野心。
Qwen2.5-1.5B-Instruct 的超荆棘载量,解说了其在刻下时间节点上的平方愚弄和妙手气,也反应出中国公司开拓的开源大模子正在国际舞台上展现出越来越强的影响力,本色上,Hugging Face 平台上 2023 年下载量最高的开源模子,雷同来自中国社区,是智源考虑院 BGE-base。

关于 Qwen 的亮眼发达,国外网友亦然喜闻乐道,以致一经运转玩梗了:扎克伯格可能正悄悄瞅着你用 Qwen 而不是 Llama。"
圣诞大礼包 QvQ,首个开源多模态推理模子
网友们运转用上的包括 Qwen 团队奉上的圣诞礼物: QVQ-72B-Preview。这是一款大要分析图像并进行推理的全新开源模子。天然还处于执行阶段,但初步测试标明,它在视觉推理任务中发达荒芜出色。

QVQ 通过冉冉念念考来责罚问题,雷同于 OpenAI 的 o1 或 Google 的 Flash Thinking 等大要"冉冉念念考"的模子。用户扔给它一张图和一些教导,系统会分析信息,在必要时花时间进行反念念,并以每个展望的置信度分数提供谜底。

在底层架构上,QVQ-72B-Preview 基于 Qwen 现存的视觉谈话模子 Qwen2-VL-72B 构建,并增添了念念考与推理的能力,这使它成为首个此类开源模子。

开拓者在 Macbook Pro 上运行 QVQ
在基准测试中,开源的 QVQ 全面超越了其前身 Qwen2-VL-72B-Instruct,达到了与闭源模子如 OpenAI 的 o1 和 Claude 3.5 Sonnet 邻近的准确水平。

QVQ-72B-Preview 的基准测试终局
在本色测试中,一位网友拍了一张纽约地铁相片纯属 QVQ,并发问"若是我要去唐东谈主街,我该在这站下车吗?"用户最终默示模子作念出了正确的判断,结合问题进行了灵验的推理。
获陶哲轩点赞的开源推理模子 QwQ
时间再往前推,2024 年 11 月 28 日,Qwen 团队还开源了一款专注于推理能力的 AI 模子 QwQ-32B-Preview。
这是 Qwen 团队发布的首个开源推理模子,旨在增强 AI 推理能力。尽管参数目仅为 32B,但在 GPQA、AIME、MATH-500 和 LiveCodeBench 等多个评测中,QwQ 皆取得了不俗的成绩,以致在部分测试中超越了超越了 o1。QwQ 具备深度内省能力,大要质疑自己假定并进行三念念此后行的自我对话,从而责罚复杂问题。

天然 QwQ 咫尺还处于执行阶段,但它展现出的矫健分析能力和专有的推理款式,一经迷惑了不少眼力,以致连数学界的大牛陶哲轩皆公开点赞,说它的发达超越了以往的所有开源模子。

在 AIMO(AI 数学奥林匹克)挑战赛中,Qwen 系列模子也成为了参赛者们最常用的模子之一,位列前三。

AIMO 使用最多的模子排行前三均为 Qwen
"怒放权重、价钱低、基础能力杰出,这么的推理模子谁不心爱呢"。
Qwen2.5-Coder:开源界的"代码扛把子"?
Qwen2.5 系列的发布,尤其是 Qwen2.5-Coder 的亮相,在 AI 圈内激勉了一波询查。尽管模子体积相对较小,但 Qwen 2.5 Coder32B 在 HumanEval 等编程基准测试中仍能与前沿模子相比好意思。

有国外技巧博主就吐槽,咫尺寰球好像皆盯着 OpenAI、谷歌、Anthropic 这些巨头的动态,却忽略了 Qwen 这个"狠变装"。东谈主家关联词第一个能跟 Claude Sonnet 和 GPT-4o 正面硬刚,还能在你电脑上腹地运行的怒放权重模子。这可不单是是跑分顺眼远程,许多体验过的东谈主皆说"真香"。比较之下,DeepSeek 的模子天然也很牛,但体积太大,腹地跑起来有点费力(彼时 deepseek v3 还未发布)。Qwen2.5-Coder 的出现,关于开源社区来说完全是个大新闻。更良心的是,阿里还把技巧敷陈完完竣整地公开了,莫得藏着掖着,与社别离享这份效果。

还有开拓者基于 Qwen2.5-Coder 作念了 AI 的视频裁剪器 Video Composer,用户不错通过拖放素材(如图片、视频和音频),并使用天然谈话,让 Qwen2.5-Coder 生成新视频(基于 FFMPEG 技巧)。
欣忭各类化需求,全球化的 Qwen
Qwen 的另一大上风在于它的"夷易近东谈主"。Qwen2.5 系列不仅面向技巧大师或大型企业,它的想象初志是让雄壮用户皆能收缩使用。从资源受限缔造适用的 0.5 亿参数版块,到企业级愚弄所需的 720 亿参数版块,提供了丰富的选拔,欣忭不同需求。
在日本,阿里云与东京大学初创企业 Lightblue 合作,旨在升迁其日语大型谈话模子(LLMs)。Lightblue 借助阿里云的架构及 Qwen LLM 技巧,对模子进行了优化,从而提高了东亚谈话的准确性。

闻明投资东谈主 Coinbase 前 CTOBalaji Srinivasan 也公开招供了 Qwen 的多模态和多谈话能力。
咫尺,全球各地的工程师险些皆不错收缩拜访 Qwen 的各种模子。更可贵的是,Qwen 在处理多种谈话方面发达出色,即使是一些全球 AI 检会数据比较少的"小语种",比如缅甸语、孟加拉语和乌尔皆语,它也能搪塞。比较之下,Meta 的开源 AI 模子 Llama 主要如故针对英语愚弄为主。


不少日本开拓者在持重考虑 Qwen2.5 的技巧敷陈
中国 AI 开源势力崛起
Qwen 等中国 AI 模子的崛起,为国内企业提供了更多选拔和可能性。在刻下国际环境,真义愈加突显。更关节的是,它们不单是是一个"备胎"选项,而是正在解说我方有实力与好意思国顶尖技巧掰手腕。
Qwen 的真义,也不单是体咫尺技巧上,其背后代表的怒放、互助,这讲明中国在 AI 规模并莫得掉队,反而通过开源展现出了矫健的竞争力。事实解说,所谓的 GPU 限制并莫得阻隔中国 AI 的发展。若是这个势头保捏下去,中国很有可能在 LLM 市集占据更进攻的地位。当开源模子比 Meta(发布带有极度 Llama 考虑许可的模子)还要怒放,当寰球皆能用上性能不输以致更强的开源模子时,谁会不乐于使用呢?

CNBC 近期也发文指出,中国在 LLM 方面取得了权臣进展,Qwen、DeepSeek 等模子在某些方面一经超越了好意思国的竞争敌手。中国公司正积极拥抱开源模式,鼓励 AI 技巧的发展和愚弄,以促进篡改并扩大全球影响力。著述觉得,中国正在 AI 规模快速崛起,其 AI 模子一经具备荒芜的国际竞争力,况且正在发奋构建自主可控的 AI 生态。

Hugging Face 的 CEO Clem 在其 2025 年 AI 展望中以致提到,中国将运转引颈东谈主工智能竞赛,这主要获利于其在开源东谈主工智能竞赛中的跳动地位。

Sam Altman 最近在"惊叹":复制相对容易,而作念全新且有风险的事情极其穷困。不外他也默示,告捷的个体考虑东谈主员理当赢得赞叹,因为这"是全国上最酷的事"。筹商区里,Vaibhav Srivastav 回复到,公开的分享不应被无情,并点名 Qwen 和 DeepSeek 团队,他们雷同值得喝彩。

怒放的心态,加上对工程扩充的青睐,正在加快中国 AI 行业的发展。也曾被觉得会因半导体限制和计较能力受限而受阻的中国 AI 产业开云体育(中国)官方网站,正以开源模子为代表向全国解说,它有能力与全球顶尖水平同台竞技,并在全球范围内创造更大的价值。