本文作者:访客

阿里巴巴正式开源千问3 仅需4张H20即可部署满血版

访客 2025-04-29 08:27:06 21794
阿里巴巴正式开源千问3 仅需4张H20即可部署满血版摘要: 4月29日消息,今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。千问3是混合推理模型,...

4月29日消息,今天凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量为DeepSeek-R1的1/3,成本大幅下降。

阿里巴巴正式开源千问3 仅需4张H20即可部署满血版

千问3是混合推理模型,快思考与慢思考集成进同一个模型,对简单需求可低算力秒回答案,对复杂问题可多步骤深度思考,节省算力消耗。

作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。

在相同计算资源下,Qwen3 模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了小而强大。

千问3总参数量235B,刷新了开源模型的智能水平新高,阿里称仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

千问3模型版本包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享