將字幕檔使用 Google 翻譯時,有時候會出現單行數字,卻莫名奇妙被翻譯成「第幾章」的問題。使用支援正則表示式的文字編輯器,可以完成快速取代。
Photo by John-Mark Kuznietsov on StockSnap |
問題狀況
原始字幕檔 (WEBVTT) 檔案內容:字幕會以數字編號區分成不同段
1
00:00:01.123 --> 00:00:02.123
Okay.
有時候單行數字會被 Google 翻譯成:
第1章
00:00:01.123 --> 00:00:02.123
好的
解決方式
使用支援正則表示式的文字編輯器,這邊以 Sublime Text 編輯器為例,
1. 上方選單 Find -> Replace
2. 點選「.*」圖示,啟用 Regular expression 功能
3. Find: 輸入「^第(\d+)章」或者使用更嚴格的條件「^第(\d+)章$」
4. Replace 輸入「$1」
5. 點選 Replace All
完成取代
解決方式詳細說明
將帶有「第X章」的文字取代為只保留章節數字
1. Find:輸入模式為「^第(\d+)章」或者更嚴格的模式「^第(\d+)章$」:
- 「^」表示行的開始。
- 「第」是固定文字。
- 「(\d+)」是捕獲組 (capturing group),表示一個或多個數字,這些數字代表章節編號。
- 「章」是固定文字。
- 「$」表示行的結束(可選,用於更嚴格的匹配)。
2. Replace:輸入模式為「$1」:
- 「$1」是捕獲組的引用,這裡是第一個捕獲組中的數字,也就是章節編號。
留言
張貼留言