作者 | 量子位 编辑 | 大模型之心Tech

点击下方卡片,关注“大模型之心Tech”公众号

戳我-> 领取大模型巨卷干货

本文只做学术分享,如有侵权,联系删文,自动驾驶课程学习与技术交流群事宜,也欢迎添加小助理微信AIDriver004做进一步咨询。更多大模型技术、行业咨询、求职交流,欢迎加入大模型之心Tech技术交流群!

深夜,开源模型 Qwen3 又更新升级了!阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。

链接:https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

据介绍,新的 Qwen3 模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

公开测评得分显示,Qwen3-235B-A22B-Instruct-2507-FP8 在 GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等众多测评中表现出色,甚至了超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。

此外,本次更新的 Qwen3 模型,还增强了以下关键性能:

1、在多语言的长尾知识覆盖方面,模型取得显著进步。

2、在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。

3、长文本提升到 256K,上下文理解能力进一步增强。

目前,该模型已经在海外引起了开发者社区热议与讨论。

新 Qwen3 模型已在魔搭社区和 HuggingFace 上开源更新,欢迎开发者们体验。

大模型之心Tech知识星球交流社区

我们创建了一个全新的学习社区 —— “大模型之心Tech”知识星球,希望能够帮你把复杂的东西拆开,揉碎,整合,帮你快速打通从0到1的技术路径。 

星球内容包含:每日大模型相关论文/技术报告更新、分类汇总(开源repo、大模型预训练后训练知识蒸馏量化推理模型MoE强化学习RAG提示工程等多个版块)、科研/办公助手AI创作工具/产品测评、升学&求职&岗位推荐,等等。

星球成员平均每天花费不到0.3元,加入后3天内不满意可随时退款,欢迎扫码加入一起学习一起卷!