
继今年 2 月的技术迭代后,大模型圈迎来了真正意义上的架构级跃升——Qwen3.6-Plus 正式发布。相较于 3.5 版本,本次迭代并非单纯的参数膨胀,而是将底层核心聚焦于 智能体(Agent)编程能力 与多模态感知闭环。
无论是深水区的前端 3D 渲染代码生成,还是跨文件的复杂仓库级 Bug 修复,Qwen3.6-Plus 在工程落地层面均刷新了当前的 SOTA 标杆。它不仅具备了默认 100 万 Token 的超大上下文窗口,更引入了为长程任务定制的推理机制,为硬核开发者提供了一套真正高可用、低幻觉的“氛围编程(Vibe Coding)”基础设施。
核心基准实测:全维度的能力突围
在海量基准测试中,Qwen3.6-Plus 展现出了极强的工程化特质,其不仅是“会写代码”,更是“懂系统”。
-
代码智能体 (Coding Agent):在极具挑战的 SWE-bench Verified 与 Terminal-Bench 2.0 中,Qwen3.6-Plus 得分分别达到 80.9 和 61.6,紧逼甚至在特定测试中反超了 Claude Opus 4.5 与 Gemini-3 Pro。

-
通用与工具调用 (Tool & Planning):面对深度的长程规划与 MCP (Model Context Protocol) 测试,其在 TAU3-Bench 与 MCP-Atlas 斩获 70.7 与 74.1 的高分,证明了其在多步决策树中极低的“记忆丢失率”。
-
多模态与数学 (Multimodal & STEM):在 AIME 26 与 DynaMath 榜单中表现强势;视觉层面,无论是超长文档的精细解析(OmniDocBench 达到 91.2),还是物理世界的空间感知(V* 与 TIR-Bench),均实现了向真实世界原生的视觉理解演进。

极客级工具链整合:重构本地开发范式
Qwen3.6-Plus 极好地融入了现有的开源终端与 CLI 智能体生态,直接拉升了本地代码库的重构效率。
1. 复杂网页与 3D 交互生成
写一个模拟鱼群的 3D 动效网页,场景是桌子上有个鱼缸,浴缸里生长着一些水草,鱼缸里有十条鱼组成一个鱼群,每条鱼都遵循 Boids Plus 规则,水草会随着鱼群游动带动的水流而摆动。输出单个 html 文件。

2. OpenClaw 终端协同
以下以 万维盟 API作为 openclaw 小龙虾核心推理引擎为例的配置,编辑 ~/.openclaw/openclaw.json 文件的以下片段:
"models": {
"mode": "merge",
"providers": {
"VvmAi_API": {
"baseUrl": "https://api.vvmai.com/v1",
"apiKey": "sk- 开关的密钥 ",
"api": "openai-completions",
"models": [
{
"id": "qwen3.6-plus",
"name": "qwen3.6-plus",
"compat": {"supportsStore": false}
}
]
}
}
},
"agents": {
"defaults": {
"model": {"primary": "VvmAi_API/qwen3.6-plus"},
"workspace": "/root/.openclaw/workspace",
"compaction": {"mode": "safeguard"}
}
},
3. Qwen Code 与 Claude Code 协议适配
借助原生支持的 Anthropic 兼容模式,Qwen3.6-Plus 可以无缝接管 Claude Code 等 CLI 工具。无论你是进行复杂项目的重构,还是生成第一人称视角的 WebGL 游戏,它都能在终端流式输出可直接执行的构建代码。
也支持 Anthropic API 协议,这意味着您可以将其与 Claude Code 等工具配合使用,以获得更优质的编码体验:
# Install Claude Code
npm install -g @anthropic-ai/claude-code
# Configure environment
export ANTHROPIC_MODEL="qwen3.6-plus"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-plus"
export ANTHROPIC_BASE_URL=https://api.vvmai.com/v1
export ANTHROPIC_AUTH_TOKEN=
<your_api_key>
# Launch the CLI
claude
视觉感知进化:向 GUI Agent 迈进
多模态能力不再局限于“看图说话”,而是彻底演进为 理解、推理与执行的闭环。
- Grounding 与视觉定位:能够在复杂的街景中,仅依靠目标人物的面部特征截取,精准推理并输出匹配对象的 JSON 格式二维边界框(Bounding Box)。
- GUI 与计算机接管:在 ScreenSpot Pro 等评测中表现优异。模型能够像真实人类一样,“看”懂复杂的电商界面或本地软件布局,结合时序规划生成坐标点位,直接驱动计算机执行过滤、检索和点击操作。
- 长视频与图文交错逻辑:面对近 30 分钟的未剪辑素材,模型具备提取帧特征与时序逻辑的代码化能力,可用于自动化生成复杂的图文交错教程或抽取视频知识图谱。
未来展望
Qwen3.6-Plus 是一把为长程任务、代码治理和系统操控量身定制的利刃。伴随着开源生态的逐步释放与 API 接口的深度集成,AI Agent 的形态正在从“基于文本的对话框”向“接管真实操作系统的隐形内核”极速演变。