语言智能体被训练在交互式环境中执行动作,但此前从未有语言模型被显式训练来对环境本身进行建模——即在给定当前状态与智能体动作的条件下,预测环境的下一步响应。
今天,我们正式发布 Qwen-AgentWorld——首个原生语言世界模型(Language World Model, LWM),能够在七大领域中模拟智能体交互环境:
原生世界建模: 环境建模从继续预训练(CPT)阶段起即为训练目标,贯穿 CPT → SFT → RL 全流程,而非对通用大语言模型的事后适配。
七大领域,一个模型:单一模型同时覆盖文本类环境(MCP、Search、Terminal、SWE)与 GUI 类环境(Web、OS、Android),实现跨领域知识迁移。
同步发布的还有 AgentWorldBench——覆盖七大领域的语言世界模型评测基准,每条测试样本均配备真实环境执行所得的真实环境观测数据。模型与评测基准可从 Hugging Face 和 ModelScope 获取。
开源地址
Blog:
https://qwen.ai/blog?id=qwen-agentworld
Paper:
http://arxiv.org/abs/2606.24597
GitHub:
https://github.com/QwenLM/Qwen-AgentWorld
ModelScope:
https://modelscope.cn/collections/Qwen/qwen-agentworld
Hugging Face:
https://huggingface.co/collections/Qwen/qwen-agentworld
事实上,现在留给各个厂商大模型的赛道已经不多了,抓紧选好自己的细分领域,深入优化,才能在将来有一席之地
好用吗