科技

【教學】AI 影片字幕製造機 WhisperDesktop 廣東話、外語片製 CC 字幕 + Windows 免費用

Unwire.hk
發布於 9小時前

隨著語音辨識技術迅速進步,OpenAI 推出的「Whisper」已經成為眾多使用者心中的語音辨識首選。Whisper 以其強大的準確性和開源特性,成為免費且高效的自動生成字幕工具。然而安裝過程和操作方式仍然稍顯困難。今日小編會和大家分享一個全新的方法——WhisperDesktop。這個方法工具簡化原本繁瑣的操作流程,用戶無需再使用指令,也能輕鬆進行語音辨識,自動生成字幕、文字稿等。

廣告(請繼續閱讀本文)

▲原本沒有字幕的影片

▲使用今日介紹的 WhisperDesktop 後

廣告(請繼續閱讀本文)

▲即可一鍵影片語音轉文字,還可以幫你加上 Timecode

Step 1 下載 WhisperDesktop

廣告(請繼續閱讀本文)

要使用 WhisperDesktop GUI,首先需要在 GitHub 下載桌面程式,截稿前最新版本為 1.12。

▲請下載標明「Lastest」最新版本之程式

下載「WhisperDesktop.zip」壓縮檔(下圖綠框示)。

▲下載「WhisperDesktop.zip」

下載完畢後你需要解壓縮,解壓縮後你會看見文件夾內一共有 3 個檔案,其中有向日葵圖案的就是 WhisperDesktop 程式,不要移動其餘檔案,點擊即可開始設定,不過目前為止仍然未需要開啟「WhisperDesktop.exe」。

▲以後只需點擊「向日葵」圖案即可使用

Step 2 下載語言模組

下載完 WhisperDesktop 後,並不代表我們可以立即使用這個程式語音轉文字。接下來我們需要到 Hugging Face 下載相關語言模型。(下載連結)。甫打開模型庫會發覺琳瑯滿目,但如果你和小編一樣是業餘用途,就只需要選擇「Medium」模型。「Medium」模型兼顧準確性、生成速度及硬件需求,對一般用家來講算是夠用。

▲打開模型庫時的畫面

同時按下 Ctrl+F,輸入 medium 後就可以馬上找到全部 medium 模型。今次小編會示範使用 ggml-medium.bin,點擊下圖紅色箭嘴指住的下載鍵即可開始下載「ggml-medium.bin」。

▲點擊紅色箭嘴指住的下載鍵下載 ggml-medium.bin(綠框示)

下載完成後,將「ggml-medium.bin」檔案移動至剛才有向日葵圖案「WhisperDesktop.exe」的文件夾。

▲將 bin 檔移至 WhisperDesktop 的文件夾

Step 3 開始設定 WhisperDesktop

將「ggml-medium.bin」移動至 WhisperDesktop 文件夾後,你就可以開始設定 WhisperDesktop。

▲點擊「向日葵」圖案使用

接下來你需要點擊「…」(紅箭嘴示)開啟你的 ggml。

▲點擊「…」

載入剛才的 ggml-medium 模型。

▲雙擊選擇剛才的模型

現時回到 WhisperDesktop,檢查 Model Path 是否剛才選擇的 ggml 模型,如正確就不要調整任何設定,保留其他設定為預設值後點擊「ok」

▲檢查 Model Path 是否剛才選擇的 ggml 模型,如正確就點擊 ok

Step 4 開始使用

稍等一陣就可載入完模型,之後你會看見下圖畫面,點擊「Language」選項,選擇「Chinese」。

▲選擇「Chinese」

之後你可以在「Output Format」選擇輸出甚麼格式的文字稿:

  • 如果你要純文字逐字稿,可選擇「Text file」;
  • 如果你想要生成 YouTube 的「CC 字幕」(有 Time Code),那麼就需要選擇「Subrip subtitles」輸出 SRT 檔案。

▲選擇所需格式

之後點擊「…」,選擇你需要轉為文字的影片。

▲點擊「…」

▲選擇所需影片

▲選擇所需影片

選擇完影片後,點擊「Transcribe」開始語音轉文字。

▲點擊「Transcribe」開始語音轉文字

實測:轉換 15 分 25 秒 mp4 影片需時

以下小編會使用一條 15 分 25 秒的 MP4 測試 WhisperDesktop 語音轉換文字的速度。小編使用的電腦為 ASUS Zenbook Flip 14,採用內置顯示卡。

▲小編測試影片長度為 15:25

▲點擊「Transcribe」開始語音轉文字

▲可在進度條檢查轉換進度

完成後會彈出一個提示視窗,告訴你耗時多久。WhisperDesktop 主要使用 GPU 轉錄為純文字,而由於小編的電腦沒有獨立顯示卡,因此耗時約 14 分鐘方完成。如果你的電腦顯示卡比較厲害,那麼可以用更短時間完成轉錄工作。

▲完成後會彈出視窗提示你

現在開啟影片所在文件夾,你會看見 .srt 檔案,這個就是你的 CC 字幕檔。

▲生成的 .srt 字幕檔

普通點擊無法開啟 .srt 檔案,你需要選擇以「記事本」開啟。

▲選擇以「記事本」開啟 .srt 字幕檔

▲現在你就可以看見你的 CC 字幕文字稿了

總結:無須使用大量指令 圖形介面直觀完成工作

對於那些不熟悉終端機指令的用戶來說,WhisperDesktop 顯然是一個更具親和力的選擇。WhisperDesktop 簡化了安裝和操作過程,並將繁瑣的步驟圖像化,讓每個人都能輕鬆上手。

總結來說,Whisper GUI 是一款實用的工具,適合各類需求的用戶。如果你曾因為難度較高的安裝或操作流程而放棄使用 Whisper,那麼這款 GUI 介面將無疑大幅簡化你的使用體驗,讓語音辨識過程更加順暢,無需過高電腦技術。

======

加入 unwire thread 傾傾科技背後黑暗事

========

• 不想錯過新科技 ? 請 Follow unwire.hk FB 專頁http://facebook.com/unwirehk/
• 要入手生活科技潮物 即上 unwire store
https://store.unwire.hk/

更多 科技 相關文章

泰國總理用 AI 講普通話拍片 呼籲中國遊客到泰國旅遊
流動日報
Elon Musk 終承認付費代打機 要做遊戲之神
Unwire.hk
Android 平板都玩到 PC 遊戲?小米透露旗下平板將做到兼可支援 Steam
Unwire.hk
Elon Musk 上任 DOGE 即停止多元政策網站 網民稱「DEI 終結日」
Unwire.hk
NOKIA 內部文件揭密!曾諫言 iPhone 影響、指其為「應重現的高端競爭者」
Mobile Magazine
Netflix 公佈新價格方案 三大服務計劃全線漲價
流動日報
Apple 未允許 TikTok 重新上架 或需售予合規美企方可重返 App Store
Unwire.hk
YouTuber MrBeast 擬收購 TikTok 傳提出全現金收購要約
Unwire.hk
iPhone SE 4 或採用動態島開孔屏!傳配 A18 晶片、最快今年春季現身
Mobile Magazine
微信支付支援 Apple Pay 僅開放予非大陸身份認證用戶
Unwire.hk
RC 版正式發佈 iOS 18.3 新功能一覽
流動日報
【教學】AI 影片字幕製造機 WhisperDesktop 廣東話、外語片製 CC 字幕 + Windows 免費用
Unwire.hk
iOS 18.3 及 macOS Sequoia 15.3 將 Apple Intelligence 預設開啟
流動日報
iPhone, Mac 將預設開啟 Apple Intelligence 由 iOS 18.3、macOS Sequoia 15.3 開始
Unwire.hk
警察免費發放 AirTag 助減低汽車盜竊
流動日報
理想汽車升級「副駕下車衛士」功能 即時顯示後方盲點乘客下車更安全
Unwire.hk
特朗普:支持 Elon Musk 買 TikTok 「只要他願意便可」
Unwire.hk
「RAGEBLUE」與「Apex Legends」即將推出第2彈合作!舉辦合作款長袖T恤的抽獎活動
Saiga NAK
中國 DeepSeek 發佈推理型 AI 模型 R1 宣稱部份領域擊敗 OpenAI o1
流動日報
彩芒顯示及165W 總輸出,Xiaomi 自帶線行動電源 10000 165W 試玩!
Mobile Magazine
RC 版 macOS Sequoia 15.3 新功能一覽
流動日報
【評測】Sony A1 II 旗艦級相機 對焦、追蹤效能超強 + 高像素除雜訊超強
Unwire.hk
議員:香港虛擬貨幣發展遠遜新加坡 證監會:監管穩定性、安全性領先全球
Unwire.hk
利用 Amazon SageMaker JumpStart 微調 AI 模型實測 配置簡易且低成本高效益
Unwire.hk
【評測】vivo X200 Pro 港行詳細評測 單手操控體驗一般 + 相機表現理想 + 電量超「長氣」
Unwire.hk
WSJ:網信辦要小紅書監控「TikTok 難民」 降低中國用戶看到外國帖文機會
Unwire.hk
「勇者鬥惡龍3重製版」聯動活動「勇者鬥惡龍慶典in 日本橋」2月1日開幕!販賣原創周邊、飲食菜單,還有蓋章巡游!
Saiga NAK