<wbr id="bijqn"><pre id="bijqn"></pre></wbr>

      1. <wbr id="bijqn"></wbr>
        <em id="bijqn"></em>

        <sub id="bijqn"><listing id="bijqn"><nobr id="bijqn"></nobr></listing></sub>
        <sub id="bijqn"></sub>

        看過智譜現場演示,我覺得AI要開始卷“動手能力”了

        新視界作者 Alter / 砍柴網 / 2025-03-31 19:46
        "

        作者:Alter

        2025年最熱門的科技話題,大概率是AI Agent。

        僅僅是幾個KOL的評測文章,Manus就被捧上了神壇,邀請碼被炒到上萬元,淋漓盡致的詮釋了用戶對AI Agent的熱忱。

        產業界也出現了“2025年是AI Agent元年”的說法,認為AI將從被動響應走向主動規劃和執行,乃至跨場景的復雜任務。

        但對大多數人來說,在聽到“AI Agent”的名詞后,腦海中浮現出來問題的依然是:到底什么是AI Agent?

        3月31日的智譜OpenDay上,智譜發布了最新的Agent產品——AutoGLM沉思。作為全球首個集深度研究與實際操作能力于一體的Agent,AutoGLM沉思能夠像人一樣深度研究和反思、像人一樣感知世界、像人一樣使用工具。

        而且發布即上線,不需要邀請碼即可使用,為無數用戶打開了體驗AI Agent“神奇能力”的大門。

        01 現場接單寫稿,AI Agent的“魔力”變現了

        按照慣例,先來看下智譜官方給AutoGLM沉思的定義:“AutoGLM沉思是一個能探究開放式問題,并根據結果執行操作的自主智能體(AI Agent)。它能夠模擬人類的思維過程,完成從數據檢索、分析到生成報告。”

        如果還是似懂非懂,別急,智譜還在發布會上進行了現場演示。

        指令很簡單:“幫我在網上賺點錢”。沒有指定去什么平臺,也沒有說是什么方式,完全是一個開放問題。

        然后,奇跡發生了。

        AutoGLM沉思在網上搜索了相關信息,譬如問卷調研、有獎征稿以及一些賺傭金的網站,接下來思考自己擅長的能力,最終找到了《讀者》的征稿需求,自動撰寫了一篇題為《城市角落的溫暖》的稿件,并將稿件以郵件的形式發送給了征稿指定的郵箱。

        每一步都是AI通過連續、多步推理實現模型自主規劃,并通過反思實現動態調整,不需要提前設計工作流。

        坐在臺下的我們心情比較復雜:驚訝的是,AutoGLM沉思居然可以流暢執行這種復雜的任務,而且是現場演示,壓根沒有作假的可能;興奮的是,既然AI已經學會自己接單賺錢了,讓我們看到了打造被動收入的機會;忐忑的是,AI的能力已經這么強了,猛然間有種深深的職業危機。

        Manus走紅的時候,外界的情緒也曾被點燃,更多的是因為網站上的demo視頻,后續有不少真實評測出來,效果比預期中差了很多。智譜的現場演示,直接給出了更有說服力的“實戰”案例。

        沒等到發布會結束,我們就趕緊下載了智譜清言PC客戶端,打開“AutoGLM沉思”輸入了需求:

        幫我做一份蘇州兩日游攻略,要求:1、適合父母和孩子游玩,行程不能太累;2、推薦當地的美食和景點,最好去小紅書上看下評論。

        收到指令后,AutoGLM沉思先進行了深度思考,理解了問題里的需求,然后打開小紅書輸入關鍵詞,逐一閱讀了幾篇熱門內容,最后根據小紅書上的信息,輸出了一份3000多字的兩日游攻略。

        內容包含酒店推薦、景點介紹、推薦餐廳、交通信息等等,每個推薦的景點都提供了門票價格、開放時間、游玩時長、周邊特色美食和游覽建議,甚至還給出了親子游的注意事項,比如行程安排要適中、哪些要準備的裝備、景點要提前預約等,可以說既貼心又實用。

        過程中無需操作,可以直接智譜清言的瀏覽器窗口最小化,就像是一個“活生生的助理”,也讓我們對AI Agent有了更深刻的理解,用一句話來形容:AI有了動手執行的能力,可以一邊想、一邊干。

        其中“動手執行”能力是AutoGLM沉思和Deep Research等產品最大的區別,能夠像人類一樣思考解答步驟,像人類一樣打開并瀏覽網頁,完成從數據檢索、分析到生成報告,例如查看小紅書、公眾號、京東、知網、巨潮資訊等不對外開放API的優質信源。

        需要說明的是,本次上線的是AutoGLM沉思的preview版本,場景集中在research相關,智譜將在兩周內增加更多的Agent執行能力,包括推出“虛擬機”版本,進一步增強AI Agent的實際落地能力。

        02 發布即上線,一場技術硬實力的較量

        印象深刻的,還有智譜的“現貨交付”。不像Manus需要邀請碼才能體驗,也不像Open AI的Deep Research需要付費,AutoGLM沉思發布即上線,人人都可以免費使用,并且不限制使用次數。

        原因并不難解釋。

        首先是技術的自主性,直接關系到產品的研發模式和成本控制。

        讓市場“狂熱”的Manus,被曝出整合了Deep Research、Artifacts和Operator的能力。爭議點不在于是否有“套殼”的嫌疑,而是整合不同產品能力帶來的成本提升,“單任務成本約2美元”。

        AutoGLM沉思的不同在于:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination、智能體框架,每一個環節都是智譜自主研發的,可以根據需求對模型進行強化訓練,成本上也更加可控。

        比如推理模型GLM-Z1-Air,是智譜基于擴展強化學習技術訓練的新一代推理模型,面對復雜、開放問題,能夠進行推理和反思,為Agent提供了強大的推理、規劃與反思能力。性能比肩DeepSeek-R1,在速度提升最高8倍的同時,價格僅需DeepSeek-R1的1/30。

        32B的基座模型GLM-4-Air-0414,在預訓練階段加入了更多的代碼類、推理類數據,并在對齊階段針對智能體能力進行了優化,模型在工具調用、聯網搜索、代碼等智能體任務上的能力得到大大加強。

        在GLM-Z1-Air基礎上通過強化學習訓練的沉思模型GLM-Z1-Rumination,提升了模型結合工具使用完成長程推理的能力,打破了傳統AI單純依賴內部知識推理的局限,創新性地結合實時聯網搜索、動態工具調用、深度分析和自我驗證,能夠在復雜任務中不斷優化推理、反復驗證與修正假設。

        可以說,智譜技術自主的實力,撐起了AutoGLM沉思免費開放的底氣。

        其次是創新的連續性,創新不能被計劃,也不會無緣無故爆發。

        以往復盤Agent的進化歷程時,外界習慣性以海外產品為標桿。

        2023年7月問世的Code Interpreter,被視為工具使用的第一步;2024年6月底的Claude Artifacts,實現了從生成代碼到圖表的進化;2024年10月22日的Computer Use,代表了AI能像人類一樣“看見”屏幕并操作計算機……

        其實還有另外一個視角,即智譜的Agent布局。

        第一階段是工具使用和代碼編寫,標志性動作是智譜清言的Function Call能力;第二階段是工具流編排,可以追溯到智譜清言在2024年初上線的GLMs;第三個階段是設備操控和自主智能體,即2024年11月的智譜Agent OpenDay上推出的AutoGLM。

        剛剛發布的AutoGLM沉思,正是基于智譜自研的推理模型GLM-Z1-Air訓練的,融入了AutoGLM的動手操作能力,讓AI Agent再次向前邁了一步:不僅能夠思考,還能主動行動,實現“邊想邊干”的目標。

        正是“一步一個腳印”的連續創新,才有了比較成熟的AutoGLM沉思,給深度思考賦予了動手操作的能力,復雜問題也能輕松回答,進而帶來了更好、更快、更便宜的AI Agent體驗。

        技術世界的真相往往藏在熱鬧喧囂之下,AI Agent不存在捷徑,終歸還是一場技術硬實力的較量。

        03 AI Agent元年,從口號漸漸成為現實

        點燃AI Agent革命,可能只需要一個爆款產品;AI Agent在產業端星火燎原,則離不開協同進化的生態體系。

        在智譜清言PC客戶端上,“AutoGLM沉思”已經展示了不少使用用例,包括學術、新聞、金融資訊、旅游、穿搭、提醒等等,用一句話來概括:“你只需要把任務交給AI,它就能自己完成工作,AI真的能幫人類做事了。”

        從只能輸出答案的Chatbot,到自主決策、使用工具的Agent,對用戶價值的提升是指數級的,“動手能力”將成為AI分水嶺。

        特別是測試了AutoGLM沉思在更多場景下的表現后,我們更加確信:所謂的“AI Agent元年”絕非是一句口號,正漸漸成現實。

        之所以給出這樣的判斷,不單單是AutoGLM沉思的出色表現,還在于一個和開源有關的計劃:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination等,都將在4月14日正式開源,并且相關模型會在兩周內陸續上線Maas平臺(bigmodel.cn)。

        DeepSeek的開源,加速了深度推理的產業落地,智譜自研Agent模型矩陣的開源開放,勢必會催生AI Agent的應用浪潮。

        一方面,開源打通了千行萬業通向AI Agent的路。

        以往開發者構建一款智能體,需要從不同來源拼湊各種底層API,不僅耗時耗力,任何一個環節出錯都可能讓應用崩盤。智譜的全棧開源,直接簡化了AI Agent的邏輯、編排和交互,想要打造AI Agent的開發者,可以直接調用智譜的基座模型、推理模型和沉思模型,使用現成的智能體框架低成本打造Agent應用。

        另一方面,AI Agent的商業化可行性已經被驗證。

        影響新技術產業進程的因素,可以歸結為能力、成本和可控性。就實際體驗效果來看,智譜的Agent能力無需贅述;相較于國外動輒十幾元的單次任務成本,智譜給出了超高性價比的選項,甚至可以跑在消費級顯卡上;至于可控性,智譜的全棧自研、全面開源以及國產算力可用,幾乎滿足了“自主可控”的所用硬性要求。

        可以佐證的是,智譜已經進階為Agentic平臺和生態級玩家,一邊持續探索“自主智能體”的下一個階段,一邊幫助生態伙伴打造基于行業、地域和場景的智能體應用,目前已經開始攜手金融、教育、醫療、政務、企服等領域的合作伙伴,共同推進Agentic LLM的落地應用,并相繼與北京、杭州、上海、成都、珠海等城市達成合作,與當地龍頭企業攜手推動當地大模型應用生態的建設。

        做一個預判的話:2025年或將是千行萬業的Agentic LLM時刻,機器人、汽車、PC、智能眼鏡、銀行、政務等都將積極擁抱AI Agent。

        比如方興未艾的人形機器人賽道,比拼的將不單單是跳舞、后空翻等運動控制能力,能否在AI Agent的賦能下,幫助用戶解決實際問題,產生實實在在的生產力,將是人形機器人行業的下一個勝負手。

        04 寫在最后

        2025年以前,AI行業卷的是思考能力,賽點是誰能打造出更強大的模型、更復雜的聊天機器人;2025年以后,AI行業開始卷“動手能力”,賽點轉移到了推理、多模態、記憶、工具等全棧技術。

        智譜AutoGLM沉思的“出場”,不單單刷新了AI Agent體驗的上限,還通過開源抹平了千行萬業走向AI Agent的技術鴻溝,改寫了AI產業的技術路徑,讓我們看到了AGI躍遷而生的第一道曙光。

        分享到
        聲明:砍柴網尊重行業規范,任何轉載稿件皆標注作者和來源;砍柴網的原創文章,請轉載時務必注明文章作者和"來源:砍柴網",不尊重原創的行為將受到砍柴網的追責;轉載稿件或作者投稿可能會經編輯修改或者補充,有異議可投訴至:post@ikanchai.com
        您想第一時間獲取互聯網領域的資訊和商業分析,請在微信公眾號中搜索"砍柴網"或者"ikanchai",或用微信掃描左邊二維碼,即可添加關注,從此和砍柴網建立直接聯系。

        相關推薦

        熱文導讀

        1
        3
        免费观看性行为的视频网站