模型轉換 (Beta)
最佳化 AI 模型以適應不同的部署環境
Last updated
最佳化 AI 模型以適應不同的部署環境
Last updated
模型轉換 (Model Convert) 功能允許使用者將 AI 模型轉換為不同的格式,以最佳化其性能、提高兼容性,並適應多種部署環境,包括邊緣設備、雲端服務及生產系統。
選擇要轉換的模型(從現有的專案中選擇),點擊「Model Convert」開始轉換。
支援格式:
可將模型轉換為 業界廣泛使用的格式:
FP16
INT8(ONNX)
TensorRT
每種格式皆適用於不同的硬體需求與部署環境。
可自訂參數:
信心閾值 (Confidence Threshold):設定最小可信度分數,以確保檢測結果的準確性。
NMS IoU 閾值 (NMS IoU Threshold):設定非極大值抑制 (Non-Maximum Suppression, NMS) 的 IoU 閾值,以減少重疊檢測框的影響。
TopK:調整每次推理 (Inference) 所返回的最大預測數量。
量化 (Quantization):針對 INT8 量化調整參數,以提升計算速度並降低記憶體使用量。
點擊「Convert Model」開始轉換。
模型效能結果提供 深入的評估報告,讓使用者了解轉換後模型的效能。此報告包含 關鍵資訊與分析工具,幫助您評估模型在不同配置下的 準確性 (accuracy) 與 運行效率 (efficiency)。
模型效能摘要 (Model Summary)
精度 (Precision):顯示量化類型(例如 INT8、FP16)。
類型 (Type):轉換後的格式(例如 TensorRT)。
批次大小 (Batch Size):執行推理時的批次大小。
推理吞吐量 (Throughput):每秒處理的推理次數(例如 8.6 次/秒)。
硬體配置 (Hardware Configuration):顯示測試時的硬體環境資訊,包括 CPU/GPU 規格。
狀態 (Status):顯示模型是否「已準備就緒 (Ready)」或仍在處理中。
效能圖表 (Performance Graphs)
整體效能 (Overall Performance)
顯示主要指標(例如 F1 分數、Precision、Recall、mAP)。
可調整信心閾值(透過滑動條調整)。
F1 分數 vs 信心閾值
繪製 F1 分數與不同信心閾值的變化圖,幫助分析 Precision(精度)與 Recall(召回率)之間的權衡。
依類別劃分的效能 (Performance by Class)
以長條圖顯示不同類別的 F1 分數、Precision、Recall、mAP。
依物件大小劃分的效能 (Performance by Class Object Size)
根據物件尺寸(小、小型、主體、大)進行細分,提供更精確的效能評估。
此 Model Convert 功能簡化了 AI 模型部署前的複雜準備工作,確保您的模型能夠輕鬆適應不同的部署環境,同時維持最佳效能與兼容性。