發佈時間: 2025-1-15 最近更新: 2025-11-1字數 404閱讀時間 2 分鐘

type
status
date
slug
summary
tags
category
icon
password
💡
文件拉正功能,實作平台玩看看

需求分析

  • 使用者輸入側面圖片,可以拉正為正面視圖
  • 自定義輸出檔名/無設定則以時間戳記命名
  • 自選 png 、 jpg 檔案格式
  • 提供標註視覺化預覽圖
  • 可消除目前已標記資料作初始化
  • 狀態提示區
  • 拉皮結果預覽圖
  • 新圖上傳要能覆蓋記錄

設計與實作技術

詢問 AI 實作可能性,選以 python 、 gradio 、 openCV 方式實作

開發問題筆記

  • 留意套件之間版本號是否相容
  • 標記視覺化區原本無法顯示角點的中文字詞(左上等字),因 OpenCV 的 cv2.putText 函式不支援中文文字。 OpenCV 內建的字型主要支援 ASCII 字符,對於非 ASCII 字符(如中文)無法正確顯示。
    • 解法
      • 使用套件 Pillow(PIL)來繪製中文標籤, Pillow 是一個支援多語言文字的圖像處理庫,可以與OpenCV結合使用來繪製中文標籤。
      • 自訂中文字型
      • 留意 openCV 三原色通道的順序是 BGR ,與 Pillow 的 RGB 不同
  • 輸入的圖大小解析度不一,連帶影響標記視覺化區的角點圈圈與標籤大小也不一
    • 解法
      • 利用公式以固定圖片比例去計算

測試DEMO

試以網路圖片複製至剪貼簿後,貼上平台輸入區使用。

部署於Hugging Face使用

贊助支持鼓勵

 
 
Loading...
小程式大學問:音訊/影片轉錄成逐字稿

小程式大學問:音訊/影片轉錄成逐字稿

使用者於平台輸入音檔或錄音,可以轉成逐字稿再以選定格式輸出


ChatGPT 新功能簡介與實作:任務排程( Scheduled Tasks )

ChatGPT 新功能簡介與實作:任務排程( Scheduled Tasks )