阿里通义千问大模型Qwen3发布并开源 民众国际期
上证报中国证券网讯(记者杨翔菲 温婷)4月29日,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型。
民众期货官网通义千问表示,作为Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Qwen3模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。
民众期货官网Qwen3融合了推理与非推理能力,在逻辑分析和创意生成等任务中表现卓越。预训练数据量达到约36万亿tokens,并通过多轮大规模强化学习与精细优化,在推理、工具调用、指令遵循及多语言能力等方面显著提升。
民众期货官网其中,Qwen3-235B-A22B表现尤为突出,刷新了开源模型的智能水平新高,显存占用仅为性能相近模型的三分之一。无论是数学推理、代码生成还是综合逻辑分析,Qwen3均展现出卓越能力,稳居全球开源模型前列。在工具调用方面表现优异,大幅降低了复杂任务的实现门槛,同时还支持119种语言,覆盖全球主要语种,满足多样化需求。
民众期货官网Qwen3引入了“思考模式”和“非思考模式”,使模型能够在不同场景下表现出最佳性能。在思考模式下,模型会进行多步推理和深度分析,类似于人类在解决复杂问题时的“深思熟虑”。在非思考模式下,模型优先追求响应速度和效率,适用于简单任务或实时交互。
(民众国际期货:上海证券报·中国证券网)