AI 整合應用的這條路線一直在變化,到今年的發展方向已與 ChatGPT 剛推出時大不相同(AI 模型的王者寶座似乎也換人坐了),作為一直處於略懂狀態的非 AI 專業開發者,看到眼花撩亂。我大概的理解是這樣:(如有錯歡迎指正)

終極目標始終沒變 - 讓 AI 取代人工完成各種複雜任務。但隨著 LLM 模型能力提升、新協定新標準的誕生,驅使 AI 執行任務做法有了很大改變。

最早期 LLM 應用開發以 LangChain 為代表,開發人員在框架上設計執行步驟及順序,準備向量資料庫、方法、功能,用 Memory 保存會話歷程,設計 Pipeline 在必要時調用 LLM 解決問題。

隨 LLM 模型能力不斷提升,面對複雜問題模型自己開始有能力拆解,決定該使用哪些工具,如何安排執行步驟,還能檢查結果反覆調整重試。在這種 Agent 模式下,人類漸漸從主角轉為配角,負責提供工具跟資訊 (在手術室裡遞手術刀、報心跳血壓的角色),剩下的交給 AI 大展身手。

對應到理論面,就是 LLM 推理能力從 Chain-of-Thought 進化到 Tree-of-Thought (分析推理、規劃路徑) 及 ReAct (Reason + Act,推理,使用工具,循環執行),而 LLM 支援多模態,看得懂圖片、影片,聽懂說話,能做的事超乎想像。

而隨著 MCP、Skill 標準的訂定,各式搭配 AI 應用的工具、功能,自此有了統一標準,可以方便地交流彙整,像程式庫一樣被 Hub/Gallery 整理收藏,隨裝隨用,用在各種軟體及 Agent 框架中,AI 應用生態發展迎來一次高峰。這陣子紅極一時的 OpenClaw (原 Moltbot/Clawdbot)便是這波浪潮的代表之作,OpenClaw 之所以功能強大,一方面來自對資源存取的充分授權(當然,這伴隨極大風險),以及應有盡有的 Skill,幾乎你想得到能串接 AI 的應用,都已經有人寫好 Skill,下載安裝後 OpenClaw 馬上能上網、爬文、查新聞、看股票... (這裡整理了 1700+ 個),但要留意,Skill 品質良莠不齊,不乏偷資料的惡意套件,使用需謹慎。

thumbnail
註:Skill 概念根本駭客任務電影情節的實現

這波 LLM Agent 化的趨勢,擔任領頭羊已非 OpenAI 而是 Anthropic (Claude 模型的公司)。整理幾個關鍵名詞:

  • Agent
    想像成「有具體職責的 AI 程式人員或助理」,Agent 通常會被賦與特定任務,例如:程式開發 Agent、旅遊行程規劃 Agent。
    Agent 具備自主作業能力,會自己決定下一步要做什麼,要不要查資料、呼叫哪個 Tool、要不要請別的 Agent 幫忙。同時 Agent 也有自己的行為策略,例如:失敗時如何重試、什麼情況該回報人類、什麼情況要分解子任務。
  • Tool
    Tool 是 Agent 可以呼叫的「外部能力」,通常以結構化參數函數存在。例如:run_tests(test_suite: string)search_tickets(query: string, project_id: string),Tool 背後可能串接到 REST API、DB 查詢、Shell Script... 等。Tool 的特色是會清楚定義輸入/輸出結構。
    Agent 運作時,需要我們提供可用 Tool 的清單,說明不同 Tool 的用途、輸入參數與輸出結果,Agent 會自行判斷為了回答問題或完成任務,需要先呼叫哪幾個 Tool 取得資訊或做動作。
  • MCP (Model Context Protocol)
    MCP 是 Anthropic Claude 在 2024 年 11 月推出的開放標準協議,目的是為 AI Agent 訂立統一的 Tool 整合介面,任何 Tool 只要提供符合 MCP 協定的介面,就能加入 Agent 的 Tool 清單,供 Agent 使用。可以想像成電腦的 USB 插孔標準,無線網卡、隨身碟、讀卡機,只要有 USB 插頭,就能插上成為可識別的裝置。
  • Skill
    Tool 通常著眼於傳入一組輸入參數得到一個結果的簡單功能,要讓 Agent 具備某項能力,涉及的邏輯往往會複雜許多,例如準備會議,這個能力涉及多項知識及子任務:如何蒐集準備簡報資料、發送會議通知、預訂會議室... 等,一個召開會議 Skill 可將執行提示 (Instructions)、範例資料、簡報與通知範本、必要的工具程式/腳本封裝成一個套件,Agent 會在需要時載入 Skill,將套件內容加入 AI 推理的上下文,適時呼叫引用,Agent 便具備應使用者要求召開會議的能力。

依目前的發展,Anthropic (Claude) 是 Agent/Skill 標準的主導者,Anthropic 在 2025-12-18 發佈 Agent Skills 開放標準,除了 Anthropic 自家的 Claude Desktop、Claude Code,眾家 AI 開發工具如 VSCode Github Copilot、Github Copilot CLI、Cursor、Windsurf、OpenAI 的 Codex 都已火速跟進,全力支援 Agent Skills 標準。(不跟進不行,沒人想被邊緣化) 而 OpenClaw 之所以無所不能,也歸功於 Agent Skills 標準讓各種 Skill 百花爭鳴。

光說不練心理不踏實,用一個超簡單 Skill 結束這回合。

我借用之前寫的 PowerShell CSV / Excel 轉換函式,寫了一個查詢 Windows 磁碟空間使用狀況,並可轉成 Excel 報表的 Skill。

Skill 檔案的結構如下:

最關鍵的是 SKILL.md,其中要交代 Skill 的名字,用途說明,以及提示 AI 模型怎麼使用 scripts 下的腳本:

---
name: disk-usage-report
description: This skill can get all disk usage info of Windows, and provide the data in CSV or Excel (.xlsx). 
---

## Disk Usage Report Skill

1. Run `scripts/Get-DiskUsage.ps1` to get CSV data of disk usage info.  
   This Get-DiskUsage.ps1 provides only CSV format data, but we can convert it to Excel with functions in .\CsvExcelConv.ps1.
   Find the CSV data exmaple in `examples/data.csv`
2. Ask the user if they need a Excel report, if so, execute
    ```powershell
    . .\CsvExcelConv.ps1
    $excelPath = [IO.Path]::Combine([IO.Path]::GetTempPath(), "df-rpt-$(Get-Date -Format HHmmssfff).xls")
    ConvertTo-Excel -csvFile <csv-path>  -excelFile $excelPath
    ```
    and give user the path of Excel file.
3. If user want JSON format report, run `scripts/Get-DiskUsage.ps1 | ConvertTo-Json` to convert CSV to JSON

Get-DiskUsage.ps1 也很簡單,幾行 PowerShell 搞定,結果輸出成 CSV。

# Get disk usage information for all Windows drives
$disks = Get-Volume | Where-Object {$_.DriveLetter} | Select-Object @(
    @{Name='Drive'; Expression={$_.DriveLetter + ':'}},
    @{Name='FileSystem'; Expression={$_.FileSystem}},
    @{Name='Capacity (GB)'; Expression={[math]::Round($_.Size/1GB, 2)}},
    @{Name='FreeSpace (GB)'; Expression={[math]::Round($_.SizeRemaining/1GB, 2)}},
    @{Name='Used (GB)'; Expression={[math]::Round(($_.Size - $_.SizeRemaining)/1GB, 2)}},
    @{Name='Usage %'; Expression={[math]::Round((($_.Size - $_.SizeRemaining)/$_.Size)*100, 2)}}
)

$disks | ConvertTo-Csv -NoTypeInformation

再來便是見證奇跡的時刻,在 Github Copilot CLI 中說我想要看磁碟使用狀況,Copilot 便會想到可以使用 disk-usage-report 這個 Skill,並聰明地調用它,將 CSV 轉成表格顯示,順便問我要不要轉成 Excel?

回答 Yes,Excel GET!!

要 Copilot 給 JSON 格式也不是問題:

學會這招,我們便能賦與 AI 各式各樣的超能力,今年應該會很精彩~~

Explains the evolution of AI application development from pipelines to autonomous agents, highlighting tools, MCP, and Skill standards. Demonstrates how agent ecosystems enable plug-and-play AI capabilities with a practical Skill example using GitHub Copilot.


Comments

Be the first to post a comment

Post a comment