解決字幕翻譯時,出現單行數字變成第幾章的問題

將字幕檔使用 Google 翻譯時,有時候會出現單行數字,卻莫名奇妙被翻譯成「第幾章」的問題。使用支援正則表示式的文字編輯器,可以完成快速取代。

Photo by John-Mark Kuznietsov on StockSnap


問題狀況

原始字幕檔 (WEBVTT) 檔案內容:字幕會以數字編號區分成不同段

1

00:00:01.123 --> 00:00:02.123

Okay.

有時候單行數字會被 Google 翻譯成:

第1章

00:00:01.123 --> 00:00:02.123

好的

解決方式

使用支援正則表示式的文字編輯器,這邊以 Sublime Text 編輯器為例,

1. 上方選單 Find -> Replace

2. 點選「.*」圖示,啟用 Regular expression 功能

3. Find: 輸入「^第(\d+)章」或者使用更嚴格的條件「^第(\d+)章$」

4. Replace 輸入「$1」

5. 點選 Replace All

完成取代


解決方式詳細說明

將帶有「第X章」的文字取代為只保留章節數字

1. Find:輸入模式為「^第(\d+)章」或者更嚴格的模式「^第(\d+)章$」:

   - 「^」表示行的開始。

   - 「第」是固定文字。

   - 「(\d+)」是捕獲組 (capturing group),表示一個或多個數字,這些數字代表章節編號。

   - 「章」是固定文字。

   - 「$」表示行的結束(可選,用於更嚴格的匹配)。


2. Replace:輸入模式為「$1」:

   - 「$1」是捕獲組的引用,這裡是第一個捕獲組中的數字,也就是章節編號。



留言