阿里通義千問發(fā)布小尺寸模型Qwen3-4B：超越GPT4.1-Nano

時(shí)間：2025-08-07 11:05:39

關(guān)鍵字：阿里通義大模型

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]8月7日消息，今日，阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

8月7日消息，今日，阿里通義千問宣布發(fā)布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

目前新模型已在魔搭社區(qū)、HuggingFace正式開源。

據(jù)介紹，在非推理領(lǐng)域，Qwen3-4B-Instruct-2507全面超越閉源的GPT4.1-Nano。

在推理領(lǐng)域，Qwen3-4B-Thinking-2507甚至可以媲美中等規(guī)模的Qwen3-30B-A3B(thinking)。

官方表示，2507版本的Qwen3-4B模型對手機(jī)等端側(cè)硬件部署尤為友好。

以下為模型核心亮點(diǎn)

Qwen3-4B-Instruct-2507

通用能力均大幅提升，超越商業(yè)閉源的小尺寸模型GPT-4.1-nano，與中等規(guī)模的Qwen3-30B-A3B(non-thinking)性能接近。

新模型覆蓋更多語言的長尾知識，在主觀和開放性任務(wù)中增強(qiáng)了人類偏好對齊，可提供更符合人們需求的答復(fù)。

上下文理解擴(kuò)展至256K，小模型也能處理長文本。

Qwen3-4B-Thinking-2507

推理能力大幅增強(qiáng)，AIME25高達(dá)81.3分，Qwen3-4B-Thinking-2507的推理表現(xiàn)可媲美中等模型Qwen3-30B-Thinking。

特別是在聚焦數(shù)學(xué)能力的AIME25測評中，以4B參數(shù)量斬獲81.3分成績。

Agent分?jǐn)?shù)爆表，相關(guān)評測均超越更大尺寸的Qwen3-30B-Thinking模型。

256K tokens上下文的理解能力，支持更復(fù)雜的文檔分析、長篇內(nèi)容生成、跨段落推理等場景。

女人被狂躁到高潮视频免费无遮挡,内射人妻骚骚骚,免费人成小说在线观看网站,九九影院午夜理论片少妇,免费av永久免费网址