每经杭州7月23日电(记者叶晓丹)7月23日清晨,阿里开源全新的通义千问AI(人工智能)编程大模型Qwen3-Coder,编程能力登顶全球开源模型阵营,并超越GPT4.1等闭源模型,比肩全球最强的编程模型Claude4。千问3编程模型在代码能力及Agent(智能体)调用能力方面取得重大突破。借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。 Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型,总参数达480B,激活35B参数,原生支持256K token的上下文并可扩展至1M长度。Qwen3-Coder在代码占比70%的7.5T数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及Agent能力的飞升:在浏览器调用(WebArena)、工具调用(BFCL)等Agent能力评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1;在考察模型自主规划解决编程任务的SWE-Bench评测中,Qwen3-Coder取得了开源最佳效果,可媲美Claude4。 每日经济新闻 (责任编辑:董萍萍 )
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com |