【CNMO科技消息】近日,DeepSeek R1模型迎來重要升級,最新版本DeepSeek-R1-0528正式發(fā)布。此次更新通過強(qiáng)化后訓(xùn)練過程,顯著提升了模型的思維深度與推理能力,在多個領(lǐng)域展現(xiàn)出更優(yōu)異的性能。

在深度思考能力方面,DeepSeek-R1-0528以2024年12月發(fā)布的DeepSeek V3 Base模型為基座,投入更多算力進(jìn)行優(yōu)化。這使得新模型在數(shù)學(xué)、編程和通用邏輯等多個基準(zhǔn)測評中表現(xiàn)卓越,成績位居國內(nèi)模型前列,并接近國際頂尖水平,如o3與Gemini-2.5-Pro。特別是在AIME 2025測試中,新版模型的準(zhǔn)確率從舊版的70%提升至87.5%,顯示出在復(fù)雜推理任務(wù)中的顯著進(jìn)步。這一提升得益于模型在解題過程中進(jìn)行了更為詳盡和深入的思考,平均每題使用的tokens從12K增加到23K。

除了深度思考能力的提升,DeepSeek-R1-0528還在其他方面進(jìn)行了優(yōu)化。針對“幻覺”問題,新模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中的幻覺率降低了45%~50%,提供了更為準(zhǔn)確、可靠的結(jié)果。在創(chuàng)意寫作方面,新模型針對議論文、小說、散文等文體進(jìn)行了優(yōu)化,能夠輸出篇幅更長、結(jié)構(gòu)更完整的長篇作品,且風(fēng)格更貼近人類偏好。
此外,DeepSeek-R1-0528還支持工具調(diào)用功能,盡管不支持在thinking中進(jìn)行工具調(diào)用,但在Tau-Bench測評中表現(xiàn)良好,與OpenAI o1-high相當(dāng)。同時(shí),新模型在前端代碼生成、角色扮演等領(lǐng)域的能力也有所提升。

API方面,DeepSeek-R1-0528已同步更新,接口與調(diào)用方式保持不變,但增加了Function Calling和JsonOutput的支持。官方還調(diào)整了max_tokens參數(shù)的含義,用于限制模型單次輸出的總長度,包括思考過程。