通義千問放大招,新模型震撼登場且全面開源!歷經潛心開發,這款模型基于海量資料完成預練習,改善后的架構顯著提升性能。面對復雜 數學難題,能條理清晰給出解答;解決多語言任務時,輕松實現流暢交互。
開源后,研發者可自由獲取模型,基于其特性,在智能客服、內容創作、智能輔助辦公等多範圍探索創新應用,為行業演變注入新活力。
阿里通義千問刊登新模型并正式開源 8月7日,阿里通義千問刊登更小尺寸新模型,即Qen3 – 4B – Instruct – 2507和Qen3 – 4B – Thinking – 2507。
通義千問稱,Qen3 – 4B – I nstruct – 2507在非推理範圍全面超越閉源的GPT41 – Nano;Qen3 – 4B – Thinking – 2507在推理範圍可媲美中等規模的Qen3 – 30B – A3B。現階段,新模型已在魔搭社區、HuggingFace正式開源。
新模型在非推理範圍展示出色,Qen3-4B-Instruct-2507全面超越了閉源的小尺寸模型GPT41-Nano,并在性能上接近中等規模 的Qen3-30B-A3B(non-thinking)。
在推理範圍,Qen3-4B-Thinking-2507的展示甚至可以與Qen3-30B-A3B(thinking)相媲美。 官方提出,2507版次的Qen3-4B模型特殊適合在智慧型手機等端側硬件上部署,這將使得智慧型手機等移動設備能夠高效地運行這些模型。
Qen3-4B-Instruct-2507模型的通用能力獲得了顯著提升,不只超越了商務閉源的小尺寸模型GPT-41-nano,並且在性能上接近Qen3-30B-A3B(non-thinking)。
新模型還覆蓋了更多語言的長尾知識,并在帶有立場和開放性任務中增強了人類偏好對齊,能夠供給更符合人們市場需求的答復。此外,模型的上下文了解能力擴展至256K,使得小模型也能夠解決長文本。
Qen3-4B-Thinking-2507模型在推理能力上獲得了顯著增強,人工智慧ME25進球高達813分,推理展示可以媲美Qen3-30B-Thinking模型。尤其是在人工智慧ME25測評中,該模型在數學能力方面展示出色,以4B參數量得到了813分的高分。
此外,該模型的Agent分數也很突出,相關評測均超越了更大尺寸的Qen3-30B-Thinking模型。模型的256K tokens上 下文了解能力支持更復雜的文檔研究、長篇內容生成、跨段落推理等場景,為使用者供給更加豐富的應用體驗。
