阿里開源創新大模型搜索引擎ZeroSearch，成本猛降80%

Lino 2025-05-09 10:23

阿里巴巴開源創新大模型搜索引擎ZeroSearch
昨日5月8日， $阿里巴巴 - W (09988. HK)$ 宣布開源一款創新的大模型搜索引擎框架——ZeroSearch。該系統基於強化學習技術，無需連接真實搜索引擎即可激發大型語言模型的內在檢索潛力，顯著降低運作成本並提升可控性。

核心技術原理

知識轉化機制
ZeroSearch通過輕量級監督微調，將大型語言模型在大規模預訓練中積累的知識轉化為內置檢索模塊。此模塊能根據輸入查詢生成相關內容，並動態調整生成文本的質量水平。此功能突破了傳統搜索引擎僅能提供固定結果的限制。
交互軌跡學習
研究團隊採用「真實搜索軌跡模擬」策略：
-- Ads by Google -- -- Ads by Google --
- 記錄模型與搜索引擎的多輪交互過程（包含查詢發起、文檔返回、答案生成）
- 標註正負樣本（正樣本對應正確答案的文檔組合，負樣本標記干擾性檢索結果）
- 通過調整提示模板中的關鍵詞（如加入「有用信息」「噪聲信息」），引導模型學習質量分級檢索

性能與成本優勢

基準測試表現
- 70億參數模型經ZeroSearch優化後，搜索效能達33.06
- 140億參數模型提升至33.97，超越Google搜索的32.47基準
運作成本對比
訓練方式設備配置單次訓練成本成本降幅
傳統Google搜索 SerpAPI調用 586.70美元基準值
ZeroSearch模擬 4×A100 GPU 70.80美元 87.9%↓

技術突破與產業意義

強化學習創新應用
- 整合近端策略優化（PPO）與組相對策略優化（GRPO），通過最大化獎勵函數訓練模型
- 設計基於F1分數的動態獎勵機制，平衡檢索精確度與覆蓋率
- 引入損失掩蔽技術，排除外部文檔標記的噪聲干擾
課程學習機制
採用漸進式難度調整策略：
- 初期訓練側重高質量文檔生成，建立基礎檢索框架
- 後期逐步增加噪聲文檔比例，強化模型抗干擾能力
- 通過概率函數動態控制噪聲注入強度
結構化交互模板
設計三階段標籤系統（<推理>、<搜索>、<回答>），實現：
- 內部思考過程可視化
- 檢索需求自主觸發
- 外部知識整合透明化

產業影響與應用前景

解決現有RAG技術痛點
早期檢索增強生成（RAG）技術高度依賴提示工程與模型推理能力，ZeroSearch透過強化學習框架降低對人工設計提示的依賴，同時減少約80%的運算資源消耗。
突破商業搜索依賴
相較於Search-R1、ReSearch等需結合Google搜索的混合方案，ZeroSearch完全基於模型內生能力，避免商業API授權限制與數據外流風險。
動態質量控制潛力
生成文檔質量可根據應用場景實時調整（如學術檢索需高精度，創意生成需多樣性），為個性化搜索服務奠定技術基礎。

此項開源成果預計將推動語言模型在垂直領域的深度應用，特別是醫療、法律等對檢索準確性與成本敏感的行業。未來研究方向包括跨語言檢索優化與多模態內容生成整合。

相關股票
09988.HK

相關主題
阿里

Disclaimer © 2025 TASTY MONEY
以上資訊僅供參考，相關內容純屬個人意見，不代表本台立場。投資涉及風險，股票和結構性產品如窩輪、牛熊證之價格可升可跌，投資者可能會損失全部本金，請自行注意風險。

-- Ads by Google -- -- Ads by Google --

訂閱及追蹤 Tasty Money 財經節目、主持人及專欄作家的最新動向
➤ https://www.tastymoney.hk/subscribe/

-- Ads by Google -- -- Ads by Google --

Tasty Money

Tasty Money，「添味財經」，一個財經資訊平台，意味搵錢是何其滋味、何其有趣，希望大家可以從數字上獲得趣味！

Tasty Money 創辦人梁心欣小姐及整個資深KOL團隊，Tasty KOL各有不同投資專長，以及嘉賓及節目主持實戰經驗豐富，將複雜的投資理論、心法及經驗，簡單地為大家演繹。逢交易日，各位節目主持人為大家探討港、美股市場及衍生工具等資訊。