Stanford Beyond LLM — 從 LLM 到 Agentic Workflow

Stanford Beyond LLM 課程(原 Stanford CS 課程)是由 Gary Chen 以影片導讀形式整理的核心 AI 系統課程,涵蓋從 LLM 基礎到 Multi-Agent 系統的完整知識框架。

核心框架:橫軸 vs 縱軸

  • 橫軸 — 換更強的 base model(GPT-4→GPT-5),這是 OpenAI/Anthropic 在做的事
  • 縱軸 — 在現有 LLM 上疊加工程技術(Augmenting LLM),這是一般人與團隊能施力的方向

LLM 的四大限制

  1. 缺乏 domain knowledge — 公司內部資料、產品規格 base model 不知道
  2. 資訊落後 — 新詞、新事件、新公司模型不認識
  3. 控制困難 — LLM 是機率性輸出,production 環境需要穩定行為
  4. 長 context 衰退 — Lost in the middle 現象

強化單一 LLM 的三大技術

1. Prompt Engineering

  • BCG 研究發現 Jagged Frontier 效應:AI 不是所有任務都加分,有些任務反而扯後腿
  • 接受過 prompt 訓練的組別表現顯著優於未訓練組
  • 不是職業,而是每個工程師的基本功

2. Fine-Tuning

  • PEFT(參數高效微調)、LoRA
  • 何時選 Fine-Tuning vs RAG 的決策框架

3. RAG(檢索增強生成)

  • Chunking 策略、Embedding 模型選型、Vector Search

Agentic Workflow(系統設計)

四種核心模式:

  1. Reflection(反思) — LLM 對自己的輸出進行自我檢查與修正
  2. Tool Use(工具使用) — 呼叫外部 API、資料庫、計算引擎
  3. Planning(規劃) — 拆解複雜任務、動態調整執行順序
  4. Multi-Agent(多智能體協作) — 多個 Agent 分工合作

Evaluation(評估方法)

  • 如何評估 RAG 管線的檢索品質
  • Agent 行為的穩定性測試
  • 端到端的任務完成率評估

Case Study:客服 Agent

從資料準備 → RAG 建置 → Agent 邏輯 → Evaluation 的完整實作串接。

關聯頁面