升级版Qwen3开源模型深夜来袭,超越Kimi-K2、DeepSeek-V3
- 2025-07-22 10:28:52
作者 | 量子位 编辑 | 大模型之心Tech
点击下方卡片,关注“大模型之心Tech”公众号
本文只做学术分享,如有侵权,联系删文,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询。更多大模型技术、行业咨询、求职交流,欢迎加入大模型之心Tech技术交流群!
深夜,开源模型 Qwen3 又更新升级了!阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。
链接:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
据介绍,新的 Qwen3 模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。
公开测评得分显示,Qwen3-235B-A22B-Instruct-2507-FP8 在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,甚至了超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。
此外,本次更新的 Qwen3 模型,还增强了以下关键性能:
1、在多语言的长尾知识覆盖方面,模型取得显著进步。
2、在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
3、长文本提升到 256K,上下文理解能力进一步增强。
目前,该模型已经在海外引起了开发者社区热议与讨论。
新 Qwen3 模型已在魔搭社区和 HuggingFace 上开源更新,欢迎开发者们体验。



大模型之心Tech知识星球交流社区
我们创建了一个全新的学习社区 —— “大模型之心Tech”知识星球,希望能够帮你把复杂的东西拆开,揉碎,整合,帮你快速打通从0到1的技术路径。
星球内容包含:每日大模型相关论文/技术报告更新、分类汇总(开源repo、大模型预训练、后训练、知识蒸馏、量化、推理模型、MoE、强化学习、RAG、提示工程等多个版块)、科研/办公助手、AI创作工具/产品测评、升学&求职&岗位推荐,等等。
星球成员平均每天花费不到0.3元,加入后3天内不满意可随时退款,欢迎扫码加入一起学习一起卷!

- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊