張文鈿在其最新的分享中提到,去年底他參加了 Doug Turnbull 的課程「Cheat at Search with LLMs」,該課程針對如何將大型語言模型(LLM)整合進傳統搜尋系統進行了深入探討。課程的核心理念在於利用 LLM 來強化搜尋流程的各個環節,而非完全取代搜尋引擎。
具體來說,課程涵蓋了幾個重要的應用領域,包括查詢理解、內容豐富化和結果重排序。在查詢理解階段,明確的定義能提高結果的可控性,且設計具有描述性的標籤能提升 LLM 的理解能力。此外,課程建議讓 LLM 能夠表達不確定性,以避免分類錯誤影響搜尋結果。
在內容豐富化方面,LLM 可以從商品描述中提取缺失的屬性標籤,進一步完善索引。而在結果重排序階段,課程強調需考慮特徵互動,避免簡單的線性相加。最後,評估階段則建議使用完美分類器作為基準,並強調評估時應關注查詢的分佈情況。
張文鈿指出,這些方法的應用不僅提高了搜尋的準確度,也降低了成本,顯示出 LLM 在搜尋系統中的潛力。課程的名稱在下一期將改為「Cheat at Search with Agents」,預示著內容將有重大調整,重點將轉向代理搜尋。