建立 VLM 偵測

什麼是 VLM Playground?

VLM Playground 是一個互動式的測試環境,讓你可以跟 Vision-Language Model(VLM)玩在一起: 你可以丟圖片進來、寫指令、看輸出結果,覺得好用的設定還能存成 Template,之後在任務裡直接套用。

它主要用來:

  • 測試不同的問題 / 指令要怎麼問比較好

  • 観察 VLM 的回應內容與格式

  • 預先設計好可重複使用的 VLM Template,讓之後的工作流程更順

如何使用 VLM Playground

1. Upload Image(上傳圖片)

先選一張你想讓 VLM 分析的圖片,上傳到 Playground 裡。 這會是 VLM 推理的主要輸入之一。

2. Instruction(撰寫指令)

Instruction 欄位告訴 VLM: 「這一次你要做什麼?」

這裡可以:

  • 說明這個 VLM 的任務(例如:判斷天氣、數人、分類場景…)

  • 設計 input prompt

  • 明確定義參數(parameter keys)以及期望的輸出型態(例如:string、number、vec、boolean)

circle-check

Instruction Suggestion(輸出格式建議)

circle-info

為什麼要清楚定義輸出格式?

在 prompt 裡明確定義預期的輸出型態,可以帶來:

  • 一致性(Consistency) 未來任務在重複使用同一個 Template 時,輸出會是穩定的結構化格式,不會每次長得都不一樣。

  • 可靠性(Reliability) 降低「內容看得懂但格式亂掉」的情況,避免解析時各種意外。

  • 好做後續分析(Data Analysis) 結構穩定的資料,更容易做統計、可視化或接到其他系統。

3. Adjust Settings(調整模型設定)

你可以依需求微調:

  • Temperature:創造力 / 隨機程度(越高越活,越低越穩)

  • Token limit:輸出長度上限

這些設定會影響 VLM 的回應風格與長度。

4. Submit 送出執行分析

設定好圖片、指令和參數後,按下 Submit 執行。 你可以即時看到 VLM 的輸出結果,確認格式與內容是否符合預期。

6. Save as Template(儲存為 Template)

當你覺得:

  • prompt 已經寫得差不多穩定

  • 輸出格式也符合你後續要用的資料結構

就可以按 Save Template,把現在這組設定存起來,之後在任務裡直接重複使用。


VLM Templates List(Template 清單)

VLM Templates List 分頁裡,你可以:

  • 查看所有已儲存的 Templates

  • 編輯、更新或刪除不需要的 Template

  • 直接重複使用既有設定

清單中會依照:

  • Template 名稱

  • 參數 keys

  • 建立日期

來整理,方便搜尋與管理。

Templates 如何用在任務裡?

這些在 Playground 設計好的 Templates,可以直接套用到 VLM 任務中,用來自動化各種分析流程,例如:

  • 偵測場景細節:天氣狀態、物件種類、異常事件

  • 提供結構化輸出:人口密度、車流狀況、緊急事件相關資訊

  • 搭配 VLM Flow,讓事件不只告訴你 「有事發生」,還能附上 VLM 的語意描述與欄位化結果

建立 VLM Flow 流程偵測chevron-right

總結

VLM Playground 是你設計、測試、調整 VLM 行為的實驗場:

  • 可以用圖片+prompt 不斷試,

  • 把覺得「好用又穩定」的設定存成 Template,

  • 再在任務裡直接套用,做成自動化、標準化的 VLM 分析流程。

只要一開始就 清楚定義好輸出的結構與型態,後續在事件監控、報表分析、或串接其他系統時,就會輕鬆很多。

Last updated