阿里发布Qwen3.6-Max-Preview:智能体编程与知识能力显著提升

张开发
2026/4/20 22:36:47 15 分钟阅读

分享文章

阿里发布Qwen3.6-Max-Preview:智能体编程与知识能力显著提升
Qwen3.6-Max-Preview编程与知识能力双升级阿里在Qwen3.6-Plus发布之后今日推出了Qwen3.6-Max-Preview。该预览版带来了更强的世界知识和指令遵循能力在多项基准上显著提升了智能体编程表现。在SWE - bench Pro、Terminal - Bench 2.0等六项主要编程基准上Qwen3.6-Max-Preview取得了最高分相比前代有大幅进步。同时在知识SuperGPQA、QwenChineseBench和指令遵循ToolcallFormatIFBench方面也表现更优。特性凸显编程与知识能力的显著提升Qwen3.6-Max-Preview的主要特性包括相比Qwen3.6-Plus显著提升的智能体编程能力、更强的世界知识和指令遵循以及更优的真实场景智能体与知识可靠性表现。评测对比显示相比Qwen3.6-Plus预览版在智能体编程方面取得显著提升如SkillsBench 9.9、SciCode 10.8等世界知识更强如SuperGPQA 2.3、QwenChineseBench 5.3指令遵循也更优如ToolcallFormatIFBench 2.8。积极迭代后续版本持续优化作为预览版Qwen3.6-Max-Preview模型仍在积极迭代中后续版本将持续优化。这意味着用户可以期待该模型在未来有更出色的表现。编辑观点Qwen3.6-Max-Preview的发布展现了阿里在大模型领域的持续创新。其在编程和知识能力上的提升有望在相关领域带来新的应用和突破未来发展值得关注。

更多文章