国产精品久久久久久久久久新婚,久久久久成人精品,亚洲综合小说区

Kimi全新思考模型“月之暗面 Kimi K2 Thinking”發布

AI快訊蘇曉 2025-11-12 14:52:34 來源：中房網

??中房網訊 據“月之暗面Kimi”官微11月6日消息，月之暗面宣布發布Kimi K2 Thinking開源思考模型，并稱其為“Kimi 迄今能力最強的開源思考模型”。

??據悉，該模型基于「模型即 Agent」理念訓練的新一代 Thinking Agent，它原生掌握「邊思考，邊使用工具」的能力。在人類最后的考試（Humanity's Last Exam）、自主網絡瀏覽能力（BrowseComp）、復雜信息收集推理（SEAL-0）等多項基準測試中表現達到 SOTA 水平。

??Kimi K2 Thinking 模型無需人類干預，即可憑借持續穩定的深度思考能力自主實現高達 300 步的工具調用，從而幫助用戶解決更復雜的問題。

??月之暗面Kimi指出，該模型推理性能全面提升。Kimi K2 Thinking 模型在人類最后的考試（Humanity's Last Exam）中展現出強大的推理與問題解決能力。人類最后的考試是一項涵蓋 100 多個專業領域的終極封閉式學術測試。在允許使用工具——搜索、Python、網絡瀏覽工具的同等情況下，Kimi K2 Thinking 在這項基準評測中取得了 44.9% 的 SOTA 成績。

??自主搜索與瀏覽能力全面提升。在復雜搜索和瀏覽場景中，Kimi K2 Thinking 模型也表現出色。BrowseComp 是由 OpenAI 發布的一個專門評估 AI Agent 網絡瀏覽能力的基準測試，這項測試的初衷是衡量 AI Agent 在信息過載環境中展現出的堅持性與創造力，即能否像人類研究員一樣「刨根問底」。在這項極具挑戰的任務上，人類平均只能達到 29.2% 的成績。Kimi K2 Thinking 在這項基準測試中展現出極強的鉆研能力，以 60.2% 的成績成為新的 SOTA 模型。

??Agentic 編程能力持續精進。Kimi K2 Thinking 模型的編碼能力也得到了增強，在多語言軟件工程基準 SWE-Multilingual、SWE-bench 驗證集和 Terminal 終端使用等基準測試中的表現有了進一步提升。Kimi K2 Thinking 在處理 HTML、React 以及組件豐富的前端任務時性能有明顯提升，能將創意轉變為功能齊全、響應式的產品。在 Agentic Coding 場景中，Kimi K2 Thinking 能在調用各種工具的同時進行思考，靈活地融入 software agents 中，處理更復雜、多步驟的開發工作流。

??此外，通用基礎能力升級。Kimi K2 Thinking 顯著提升了寫作能力，它能將粗略的靈感轉化為清晰、動人且意圖明確的敘述，使其兼具韻律感和深度。它能輕松駕馭微妙的文風差異和模糊的結構，并在長篇大論中保持風格的連貫性。在創意寫作方面，它筆下的意象更生動，情感共鳴更強烈，將精準的表達與豐富的表現力融為一體。在學術研究和專業領域，Kimi K2 Thinking 在分析深度、信息準確性和邏輯結構方面均有顯著提升。它能有條不紊地剖析復雜的指令，并以清晰嚴謹的方式拓展思路。這使其尤其擅長處理學術論文、技術摘要，以及那些對信息完整性和推理質量要求極高的長篇報告。在回應個人或情感類問題時，Kimi K2 Thinking 的回答更富同理心，立場也更中正平和。它的思考深入周到且具體明確，能提供細致入微的觀點和切實可行的后續建議。它能清晰并關切地幫助用戶梳理復雜的決策，其語氣既腳踏實地又切實中肯，更有人情味。

??目前，Kimi K2 Thinking 模型已上線 kimi.com 和最新版 Kimi 手機應用的常規對話模式。Kimi Agent 模式的底層模型后續也將升級為 Kimi K2 Thinking 模型，帶來完整的多步思考和工具調用能力。

Kimi

2025-11-12 更多

中國城市住房價格288指數

(2023-02)

1571.9點

0.13%
-0.91%

日期	指數	環比	同比
2023.01	1569.9	-0.97%	-0.14%
2022.12	1572.1	-0.92%	-0.11%
2022.11	1573.9	-0.12%	-1.08%
2022.10	1575.8	-0.20%	-1.01%
2022.09	1579.0	-0.02%	-0.87%
2022.08	1579.3	-0.04%	-0.62%