發佈時間: 2025-1-15 最近更新: 2025-4-25字數 405閱讀時間 2 分鐘

type
status
date
slug
summary
tags
category
icon
password
💡
文件拉正功能,實作平台玩看看

需求分析

  • 使用者輸入側面圖片,可以拉正為正面視圖
  • 自定義輸出檔名/無設定則以時間戳記命名
  • 自選png、jpg檔案格式
  • 提供標註視覺化預覽圖
  • 可消除目前已標記資料作初始化
  • 狀態提示區
  • 拉皮結果預覽圖
  • 新圖上傳要能覆蓋記錄

設計與實作技術

詢問AI實作可能性,選以python、gradio、openCV方式實作

開發問題筆記

  • 留意套件之間版本號是否相容
  • 標記視覺化區原本無法顯示角點的中文字詞(左上等字),因OpenCV的cv2.putText函式不支援中文文字。 OpenCV內建的字型主要支援ASCII字符,對於非ASCII字符(如中文)無法正確顯示。
    • 解法
      • 使用套件Pillow(PIL)來繪製中文標籤,Pillow是一個支援多語言文字的圖像處理庫,可以與OpenCV結合使用來繪製中文標籤。
      • 自訂中文字型
      • 留意openCV三原色通道的順序是BGR,與Pillow的RGB不同
  • 輸入的圖大小解析度不一,連帶影響標記視覺化區的角點圈圈與標籤大小也不一
    • 解法
      • 利用公式以固定圖片比例去計算

測試DEMO

試以網路圖片複製至剪貼簿後,貼上平台輸入區使用。

部署於Hugging Face使用

贊助支持鼓勵

 
 
Loading...
小程式大學問:音訊/影片轉錄成逐字稿

小程式大學問:音訊/影片轉錄成逐字稿

使用者於平台輸入音檔或錄音,可以轉成逐字稿再以選定格式輸出


ChatGPT 新功能簡介與實作:任務排程(Scheduled Tasks)

ChatGPT 新功能簡介與實作:任務排程(Scheduled Tasks)