作者:王吉偉
十篇AI Agent報告,看懂2025年全球智能體行業全景,附下載十篇AI Agent研報,2025年智能體行業的全球洞察與趨勢,附下載2025年AI Agent行業,十篇研報解讀智能體的全球發展藍圖,附下載十篇AI Agent研報,2025年智能體行業的關鍵趨勢與機遇,附下載2025年AI Agent行業全景,十篇研報解讀全球智能體新紀元,附下載十篇AI Agent研報,了解2025年智能體行業核心趨勢與挑戰,附下載
全文約7500字,閱讀時間15分鐘
文/王吉偉
差不多每個春節前后,科技界都會有些“大事件”發生,尤其是這幾年日新月異的AI領域。
往年都是國外產品吸引眼球,而今年換成了中國技術驚艷全球。
春節前幻方量化發布的大模型DeepSeek-R1,一經亮相便迅速炸場AI領域,全球的企業管理者、創業者、項目經理、分析師乃至相關部門領導人都現身說法,感慨DeepSeek-R1在大模型領域取得的突破性進展。
DeepSeek-R1在后訓練階段采用了大規模強化學習技術,使得在標注數據極少的情況下,依然能實現顯著提升推理能力。這一技術的進步使它在數學、代碼及自然語言推理等多項任務中,表現出可與OpenAI的最新版本相媲美的性能,真正實現了開源化。這意味著,AI領域正在朝著“低成本+高性能”方向邁進。
重要的是,基于DeepSeek-R1的browser-use 等很多智能體實操案例已經證明,DeepSeek能夠有效降低部署AI Agent的門檻,能夠大幅提升AI Agent性能和效率,增強場景適應能力。
在LLM Based AI Agent亟待落地的當下,一個高效且性價比可觀的大模型對于智能體的重要性可想而知??梢灶A見,接下來DeepSeek-R1等強化學習類大模型,將會極大地提升智能體的構建與應用效率,進一步加速AI Agent的落地應用。
當然,在智能體成為AI應用主旋律的當下,春節前后更精彩的仍然是AI Agent行業,產品研發與生態擴建方面全球技術廠商都在馬不停蹄。
谷歌于 2024 年 12 月發布了全新多模態大模型Gemini 2.0,其性能全面提升,支持圖片、視頻和音頻等多模態輸入與輸出?;贕emini 2.0架構,谷歌推出了三個新的AI智能體原型:通用大模型助手Project Astra、瀏覽器助手Project Mariner和編程助手Jules。其中,編程助手Jules能夠直接集成到GitHub的工作流程系統中,分析復雜代碼庫并實施修復。
微軟于2024年10月宣布在Dynamics 365中集成10個自主AI Agent,這些智能體能夠自動執行客服、銷售、財務、倉儲等業務流程。這些AI Agent支持 OpenAI的o1模型,具備自主學習能力,可以自動執行跨平臺的超復雜業務。例如,美國著名電信公司Lumen通過AI Agent每年能節省5000萬美元成本,相當于增加了 187 名全職勞動力。
OpenAI在2025年1月24日發布了其首款AI Agent——Operator,該系統能夠自動執行各種復雜操作,包括編寫代碼、預訂旅行、自動電商購物等。2月2日正式推出面向深度研究領域的智能體產品深度研究(Deep research)功能。該功能可在5-30分鐘完成專業報告,支持多領域高強度知識工作者,由o3模型提供支持,通過端到端強化學習訓練,由四模塊協同工作,已在ChatGPT上線,未來計劃擴展數據源和結合Operator執行復雜任務。
Anthropic于2025 年 1 月發布了Agent最佳實踐指南,旨在提升AI Agent在多個應用場景下的效率和靈活性。還計劃在2025年推出智能體“AI同事”(virtual collaborator),能夠編寫和測試代碼。其旗艦產品Claude 3.5 Sonnet升級版在OSWorld測試中電腦使用能力得分為AI模型中首位。
在國內,阿里云通義千問也于1月29日上線了超大規模的MoE模型Qwen2.5-Max。該模型預訓練數據超過20萬億tokens,在多個基準測試中表現優異,整體性能優于DeepSeek V3。
通義千問還開源了全新的視覺模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。Qwen2.5-VL和2.5MAX不僅在性能上取得了顯著提升,而且在AI Agent尤其是computer use方面展現出了強大的應用潛力。例如,Qwen2.5-VL能夠直接作為視覺Agent進行操作,推理并動態使用工具,支持在計算機和手機上完成多步驟的復雜任務,例如自動查詢天氣、預訂機票、發送消息等。
各大科技公司都在用快速迭代的產品與解決方案,對外彰顯其在AI Agent領域發展的絕對速度。從目前各領域的表現來看,2025年這個AI Agent商業化應用元年,智能體的落地應用比大家想象的要快得多,預示著AI Agent技術即將迎來爆發式增長,當然競爭也更為激烈。
這種情況下,自然會有很多朋友想要快速認知與掌握AI Agent。而了解一個行業最快的方式,莫過于先從閱讀各種各種行業研報資料開始。
為了幫助大家更好地了解、學習與應用AI Agent,在2025年春節假期歸來開工的第一天,王吉偉頻道精心準備了10份智能體行業研報。
這些研報涵蓋了AI Agent的最新技術進展、應用場景、行業趨勢以及面臨的挑戰等多個方面,旨在為大家提供全面、深入的參考。無論是企業決策者、技術開發者還是對AI Agent感興趣的讀者,都可以從這些研報中獲取有價值的信息,把握AI Agent帶來的發展機遇。
本文提到的所有研報資源已打包(包含翻譯版),后臺發消息 研報2025 ,獲取下載鏈接。
【PS:贈書福利見文末】
報告1:谷歌《Agents》白皮書
該白皮書探討了生成式人工智能(Generative AI)模型如何通過使用外部工具來擴展其功能,從而形成所謂的Agents(智能體)。詳細介紹了Agents的定義、認知架構、關鍵組件、工具使用、以及如何通過這些工具和架構來增強模型性能和實現生產應用。
它首先闡明了Agent區別于單純模型的關鍵在于其能夠利用工具訪問外部信息,并進行自主推理和行動規劃,而非僅僅依賴訓練數據進行單次預測。
白皮書詳細介紹了Agent的三個核心組成部分:模型(Language Model)、工具(Extensions, Functions, Data Stores)和編排層(Orchestration Layer)。編排層利用各種推理框架(如ReAct, Chain-of-Thought, Tree-of-Thoughts)指導Agent的決策過程。工具則賦予Agent與外部世界交互的能力:Extensions連接Agent與API,Functions允許客戶端控制API調用,Data Stores則提供對外部數據的訪問,支持RAG等應用。
最后介紹了在LangChain和Vertex AI平臺上構建和部署Agent的方法,并討論了如何通過各種學習方法(如上下文學習、基于檢索的上下文學習和微調)提升模型性能??偠灾摪灼荚谙到y性地講解生成式AI Agent的原理、架構和應用實踐,為開發者提供構建更強大、更靈活的AI系統的指導。
對于希望了解或構建Agents系統的朋友來說,是一份非常有價值的資源,推薦詳細研讀。
報告2:Anthropic《Building effective agents》
《Building effective agents》深入探討了構建大型語言模型(LLM)Agent的實踐經驗與洞見。文章開篇對“Agent”一詞進行了明確界定,并細致區分了工作流(Workflow)與Agent在架構上的不同之處。
工作流指的是對LLM和工具的預定義流程進行編排,而Agent則賦予了LLM動態調控其流程及工具使用的靈活性。還分析了在何種情境下以及如何有效運用Agent系統,并著重指出,在應用構建過程中,應優先采用最簡潔的方案,并根據實際需求逐步引入復雜功能。
文章深入探討了幾種構建Agent的常見模式,包括增強型LLM、提示鏈(Prompt Chaining)、路由(Routing)、并行化(Parallelization)、指揮者-工作者(Orchestrator-Workers)和評估器-優化器(Evaluator-Optimizer)等,并強調了簡潔性、透明度和周全的工具文檔和測試的重要性。
這些模式旨在指導開發者構建高效、可靠且易于維護的Agent系統,而非追求過度復雜的系統。文章還提供了在客戶支持和編碼領域使用Agent的實際案例,并附錄中詳細說明了工具的提示工程技巧,以幫助開發者創建更有效的Agent-計算機接口 (ACI)。
此外,文章介紹了多種框架,這些框架雖然簡化了實現過程,但也可能帶來額外的抽象層,影響調試。因此,文章建議開發者直接使用LLM API,并在必要時使用框架,同時確保理解底層代碼。最終目標是確保Agent系統的設計保持簡潔,優先考慮透明度,并通過工具文檔和測試精心設計Agent-計算機接口(ACI)。
《Building effective agents》報告能夠為對AI Agent感興趣的讀者提供了全面且實用的指導。它不僅解釋了AI Agent的核心概念和構建方法,還通過實際案例和建議,幫助讀者更好地理解和應用這些技術。對于希望深入了解和構建LLM Agent的讀者來說,這份報告是一份不可多得的參考資料。
報告3:LangChain《State of AI Agents》
報告通過調查超過1300名專業人士,揭示了2024年AI Agent的使用現狀,包括它們在不同行業中的應用情況、主要用途、面臨的挑戰以及未來的發展趨勢。
該報告將AI Agent的定義為使用大型語言模型(LLM)來決定應用程序控制流的系統。探討了了不同類型的Agent框架,如ReAct、多Agent編排器和LangGraph等,這些框架在業界獲得了廣泛的關注。提到了AI Agent在不同行業中的應用,以及它們在處理研究、總結、個人生產力任務、客戶服務等方面的具體用途。
報告發現,超過一半的受訪者正在生產環境中使用人工智能Agent,而絕大多數受訪者計劃在不久的將來部署AI Agent。主要的應用案例包括信息研究和總結以及提高個人生產力,而客戶服務也是一個重要的領域。報告強調了追蹤和可觀察性工具以及人工監督在控制AI Agent風險方面的重要性,并指出性能質量是部署AI Agent的最大障礙。
最后,報告分析了Cursor、Perplexity和Replit等成功的案例,并探討了多步驟任務管理、重復性任務自動化以及AI Agent的協作等新興主題。報告調查顯示,不同規模的公司在AI Agent的控制和優先事項方面存在差異,大型企業更注重安全性和合規性,而小型公司更關注追蹤和理解結果。
《LangChain AI Agent 狀態報告》提供了關于AI Agent現狀的全面概述,并深入探討了其應用場景、挑戰和未來趨勢。對于希望了解AI Agent技術并在實際中部署相關應用的讀者來說,具有很高的參考價值。
報告4:Langbase 《2024 State of AI Agents》
Langbase Research《 State of AI Agents》基于3400多位來自100多個國家的開發者的反饋,總結了AI智能體領域的最新趨勢。報告描繪了AI技術在2024年的新高峰,以及開發者如何利用不同大型語言模型(LLM)提供商構建AI Agent,并探討了在工作流程中采用AI Agent所面臨的挑戰和目標。
研究旨在了解AI Agent在2024年的發展情況,包括開發者如何使用不同的LLM提供商服務,以及在實際應用中遇到的挑戰和目標。研究還探討了AI在不同行業和公司規模中的應用情況,以及開發者對于AI開發平臺的偏好。
報告揭示了OpenAI在LLM提供商中占據主導地位,但Google和Anthropic緊隨其后;不同LLM提供商在不同行業應用中各有優勢??蓴U展性復雜性和數據隱私是阻礙AI智能體廣泛應用的兩大主要因素,而準確性是開發者選擇LLM時的首要考慮因素。
報告還指出,自動化和簡化是企業采用AI技術的首要目標,軟件開發是LLM最主要的應用領域。最后,報告強調了開發者對可定制的AI開發平臺和工具的需求,以及對版本控制和SDK生態系統的重視。
對于希望了解AI Agent技術的讀者來說,這是一份非常有價值的參考資料,可以幫助大家更好地了解市場動態和技術發展方向。
報告5:Insight Partners 《The state of the AI Agents ecosystem: The tech, use cases, and economics》
這份Insight Partners撰寫的報告探討了AI Agent生態系統的現狀、應用案例和經濟模式?;趯嫿ㄕ摺⑵髽I和研究人員的訪談,分析了AI Agent在企業架構中的實際部署情況,討論了不同使用案例的復雜性、購買特定功能Agent與構建自定義Agent工作流之間的權衡,以及價值衡量和歸屬的多樣性
報告首先定義了AI Agent,并闡述了其架構設計中的關鍵考量,特別是人機協同循環和任務規劃策略。接著,報告深入分析了AI Agent的參考架構,包括數據檢索(RAG、記憶、長上下文)、Agent計算機接口(函數/工具調用、計算機使用、集成)以及性能評估和安全防護(Guardrails)。
報告對AI Agent進行了類型劃分,包括垂直Agent、水平Agent平臺、多模態Agent和經典SaaS的Agent接口。報告還繪制了AI Agent市場圖譜,指出了基礎設施和垂直化平臺的機遇,并探討了構建與購買AI Agent的決策考量,以及新興的定價模式(平臺+雇傭Agent、平臺+結果導向定價、純結果導向定價)。
最后,報告總結了企業和構建者在AI Agent部署和發展中面臨的挑戰和最佳實踐,強調了合規性、數據準備、可靠性、ROI衡量、文化融合等重要方面。
報告認為,AI Agent的研究難點在于理解AI Agent的復雜性,包括它們如何獨立推理和行動,以及如何將它們集成到現有的企業系統中。研究者需要評估不同使用案例的復雜性,并確定在購買特定功能Agent與構建自定義Agent工作流之間的最佳權衡點。衡量和歸屬價值的多樣性也是一大挑戰,因為不同的企業可能有不同的評價標準和業務目標。
這份報告旨在為企業和AI Agent構建者提供對AI Agent生態系統全面而深入的理解,并為其發展戰略提供指導。不僅分析了 AI Agent 的技術細節,還深入探討了企業在部署 AI Agent 時需要考慮的實際問題,并為構建者提供了有價值的建議,推薦仔細研讀。
報告6:infoQ《中國 Al Agent應用研究報告》
InfoQ研究中?發布的《2024年中國AI Agent應用研究報告》,深入分析了AI Agent在中國的市場發展背景、特征、應用案例以及未來趨勢。報告基于技術專利數量、技術發展時間、技術輿論指數等指標,結合市場規模與融資事件等資料,繪制了2024年中國AI Agent應用的成熟度模型,并探討了AI Agent在不同領域的應用現狀與未來發展方向。
報告聚焦2024年第二季度中國AI Agent應用的研究。報告首先分析了AI Agent市場的背景和特征,以及當下中國人工智能的技術成熟度模型,其中特別強調了AI Agent作為連接大模型和應用層的橋梁作用。
報告深入探討了AI Agent的市場趨勢,包括單/多智能體協同發展、通用技術框架、典型應用場景(生活類、企業專業類)以及不同廠商的產品策略(大模型創業廠商、互聯網科技廠商、RPA廠商、數字化企業服務商)。還展望了AI Agent未來的發展趨勢,例如大模型能力提升、工具生態完善、多智能體協同,以及終端智能體(手機、電腦等)的興起將帶來的變革。
報告指出,AI Agent作為連接模型層與應用層的重要補充,正逐漸深入復雜任務,并在多個行業場景中展現出應用潛力。報告基于技術專利數量、技術發展時間、技術輿論指數等核心指標,結合市場規模與融資事件等公開資料,以及技術和市場專家的驗證,繪制了中國人工智能成熟度模型,并對AI Agent的市場特征、應用場景、產品發展、盈利模式等進行了詳細探討。
《2024年中國AI Agent應用研究報告》是一份極具前瞻性和深度的研究報告,對于關注人工智能技術發展、尤其是AI Agent應用的從業者、企業決策者、技術愛好者以及相關領域的研究人員來說,具有很高的參考價值。
報告7:愛分析《2024愛分析·AI Agent 應用實踐報告》
《2024愛分析·AI Agent 應用實踐報告》由愛分析撰寫,旨在探討AI Agent在企業中的應用現狀、市場洞察以及未來發展趨勢。
報告首先概述了AI Agent的核心能力——獨立思考、自主執行、持續迭代,以及其在市場中的興起和企業落地的主要挑戰:“落地難”和“應用難”。
核心內容聚焦于數據分析AI Agent和AI Agent開發管理平臺這兩個特定市場,分別分析了其落地實施的關鍵要點和成功案例,例如城商行利用數據分析AI Agent提升數據分析效率,飛鶴利用AI Agent開發管理平臺推進數字化轉型。
報告指出,AI Agent作為能夠感知環境、基于目標進行決策并執行動作的智能化應用,隨著大模型能力的增強和相關技術的成熟,其能力得到了質的飛躍。報告強調了AI Agent在企業中的三個核心能力:獨立思考、自主執行、持續迭代,并分析了企業在落地AI Agent項目時面臨的挑戰。
報告還特別關注了數據分析AI Agent市場和AI Agent開發管理平臺市場,提供了市場洞察和案例分析,為企業提供策略指導和實踐洞見。
該報告不僅分析了AI Agent的技術和應用,更深入探討了企業在落地AI Agent時面臨的挑戰和應對策略。報告強調了企業應從自身特性出發,建立AI Agent與新質生產力、數據要素的內在聯系,實現價值升華,并建立AI文化。該報告適合企業決策者、IT負責人以及對AI Agent應用感興趣的讀者閱讀。
報告8:頭豹研究《2024年中國AI Agent行業研究》
《2024年中國AI Agent行業研究:智能體落地千行百業,引領智能化革命的新引擎》報告,由頭豹研究院發布,深入分析了AI Agent(人工智能體)在中國的發展現狀、應用前景、市場趨勢以及行業生態。
報告首先定義了AI Agent,并將其與大模型區分開來,強調其自主決策和執行能力;然后,分析了AI Agent的關鍵特征、分類及發展歷程,并對國內外主流項目及產品進行了盤點;接著,報告探討了AI Agent的市場規模、驅動因素及行業生態圖譜,指出其在企業級應用(toB)方面擁有更廣闊的前景;最后,報告對AI Agent在不同行業領域的應用情況及發展趨勢進行了深入分析,并對未來發展方向進行了預測,特別指出金融行業是AI Agent應用最成熟的領域,而政務領域則由于數據獲取的限制,發展相對滯后??偠灾?,該報告旨在為投資者、企業和研究人員提供對中國AI Agent行業全面而深入的了解。
報告指出,AI Agent作為一種能夠感知環境、進行決策和執行動作的智能實體,與傳統人工智能相比,具備更強的自主性和適應性。詳細介紹了AI Agent的定義、基礎架構、特征分類、發展歷程、市場驅動因素、行業應用圖譜、商業模式以及消費級與企業級應用的對比。
還預測了AI Agent在不同行業中的應用發展情況,并提供了國內外AI Agent項目及產品的盤點。整體而言,AI Agent在企業級應用中前景廣闊,尤其在金融、電商零售、教育、醫療、制造、交通、媒體娛樂、能源、物流和政務等行業領域中展現出強大的滲透力和應用潛力。
該報告不僅指出了AI Agent在金融等領域的成熟應用,也探討了其在其他行業的潛力,為對AI Agent技術和市場感興趣的讀者提供了有價值的參考。該報告適合希望了解AI Agent如何落地并引領行業變革的讀者閱讀。
報告9:Letta 《The AI agents stack 》
《The AI agents stack 》本文探討了AI Agent棧的最新發展,特別是2024年末的AI Agent生態系統,包括Agents托管/服務、Agents框架和大型語言模型(LLM)模型及存儲三個關鍵層次。報告基于作者在開源AI領域超過一年的工作經驗以及7年以上的AI研究經驗,對現有的Agents技術棧分類提出質疑,并分享了他們自己的“Agents技術棧”模型。
報告探討了2024年末AI智能體(Agent)的軟件生態系統,并提出了作者自己基于多年經驗的“智能體堆棧”模型。
該模型將智能體系統分為三層:底層是大型語言模型(LLM)及其服務和存儲,包括各種API服務和向量數據庫;中間層是智能體框架,負責LLM調用、狀態管理、內存管理以及多智能體通信;頂層是智能體托管和服務,關注如何將智能體部署為服務,并通過REST APIs訪問。
報告強調,與簡單的LLM聊天機器人相比,智能體開發面臨著更大的工程挑戰,例如狀態管理和工具執行。作者認為,未來的智能體將作為服務部署,并期待出現類似于OpenAI ChatCompletion API的行業標準智能體API。
報告還提到了2022年和2023年興起的LLM框架和SDK,如LangChain和LlamaIndex,以及通過API消費LLM的標準平臺,如vLLM和Ollama。同時,文章也指出了2024年AI領域對“Agents”概念的轉變,以及如何從LLM發展到AI Agent的必要性。
這份報告主要面向軟件開發者,旨在幫助他們理解 AI Agent 技術棧的復雜性,并為他們提供構建垂直 Agent 應用的指導。報告強調了 AI Agent 與傳統 LLM 聊天機器人在工程方面的不同,并介紹了 Letta 提供的相關資源。該報告適合對 AI Agent 技術棧和實際應用感興趣的開發者閱讀。
報告10:德勤《Prompting for action How AI agents are reshaping the future of work》
該報告由德勤(Deloitte)人工智能研究所發布,探討了AI智能體和多智能體系統如何重塑未來工作。重點介紹了生成式AI(GenAI)的擴展能力和多智能體 AI系統的協同作用,以及這些技術如何影響企業并推動智能組織轉型。
報告圍繞“隨著AI技術的快速發展,企業如何利用AI Agent和多Agent AI系統來重塑業務流程,提高效率并實現自動化”這一問題,展開了詳細討論。
報告指出,AI智能體與傳統語言模型不同,具備推理、規劃、記憶和行動能力,能自動化工作流程。多智能體系統通過協同合作提高效率、學習能力和準確性,處理復雜任務。例如,在戰略洞察方面的應用展示了其在速度、效率和可擴展性方面的優勢。還探討了AI智能體對戰略、風險、人才和業務流程的影響,并建議領導者評估用例、制定戰略路線圖、投資基礎設施和人才培養以及加強數據治理和風險管理。
報告提到了當前企業廣泛使用的大型語言模型(LLMs)和GenAI工具,這些工具雖然能夠根據簡單提示生成輸出,但其交互通常是事務性的,且作用范圍有限。探討了AI Agent與傳統語言模型的不同之處,以及AI Agent如何通過理解上下文、規劃工作流程、連接外部工具和數據以及執行動作來實現目標,從而克服了傳統AI應用的局限性。
報告認為,如何克服傳統AI應用在理解復雜請求、規劃工作流程和執行多步驟任務方面的局限性,以及如何整合不同AI Agent以實現更高級別的自動化和優化,是需要關注的重點問題。
總體而言,該報告強調AI Agent和多智能體系統在推動智能化轉型方面的潛力,并指出前瞻性的企業和政府機構已經開始部署這些技術,適合對AI Agent的最新進展及其在各行業的實際應用感興趣的讀者閱讀。
全文完
王吉偉頻道新書《一本書讀懂AI Agent:技術、應用與商業》已出版,輕松讀懂系統掌握AI Agent技術原理、行業應用、商業價值及創業機會,歡迎大家關注。
【王吉偉頻道,關注AIGC與IoT,專注數字化轉型、業務流程自動化與AI Agent,歡迎關注與交流?!?/p>