硬字幕提取工具提供字幕識別功能,可以直接對視頻字幕區(qū)域截圖,隨后在軟件上對全部圖像識別,輕松獲取視頻字幕,如果你需要提取一個(gè)電視、電影的字幕作為新的文案使用就可以下載這款軟件識別字幕,可以導(dǎo)入任意視頻到軟件上截圖,全部圖像都可以預(yù)覽,使用百度OCR引擎就可以對全部圖像字幕識別,從而將全部文字顯示在軟件界面,方便預(yù)覽識別后的文字是否正確,文字都可以保存到SRT格式,方便以后在其他視頻軟件上加載字幕文件,需要就可以下載使用!
1、硬字幕提取工具提供字幕提取功能,直接從視頻上復(fù)制字幕
2、可以通過OCR的方式提取字幕,從而生成SRT字幕文件
3、軟件界面很簡單,配置百度OCR識別引擎就可以開始工作
4、可以在軟件截圖識別文字,對當(dāng)前視頻畫面的字幕內(nèi)容截取
5、任意視頻都可以添加到軟件截圖識別,可以在軟件顯示文字內(nèi)容
6、支持文字校對功能,可以修改識別后的字幕內(nèi)容
7、支持增強(qiáng)圖片功能,截圖識別的字幕圖像可以增強(qiáng)顯示效果
8、支持縮放圖像,可以在軟件調(diào)整縮放的比例,也支持字號顯示設(shè)置
1、硬字幕提取工具界面功能豐富,可以輕松,截圖識別字幕內(nèi)容
2、可以借助VideoSubFinder打開本地的視頻,從而提取字幕
3、可以在軟件界面顯示全部截圖,可以快速識別字幕內(nèi)容
4、附加幫助內(nèi)容,可以顯示官方的教程文檔,讓用戶快速上手
5、支持通用高清識別,支持多張字幕圖像合并為一張識別
6、識別的文字直接在軟件界面顯示,方便后期對錯誤的內(nèi)容修改,也可以中英混合識別
1、下載軟件以后打開文件夾,可以看到Word幫助文件和主程序,可以打開幫助文件查看教程
2、軟件界面如圖所示,您需要使用百度OCR識別工具,可以到https://ai.baidu.com/tech/ocr/general申請
3、其他的OCR識別引擎也可以自己設(shè)置,申請完畢輸入PID,輸入KEY調(diào)用識別引擎
4、隨后打開視頻,截圖識別字幕,將字幕顯示在軟件上
具體步驟如下所述:
步驟1、準(zhǔn)備百度OCR服務(wù)APP_ID / API_KEY / SECRET_KEY
到https://ai.baidu.com/tech/ocr/general 注冊獲取百度通用文字識別服務(wù)的APP_ID / API_KEY / SECRET_KEY,
一個(gè)手機(jī)號碼注冊一個(gè)賬號(須實(shí)名認(rèn)證)。
每賬號每天免費(fèi)識別次數(shù)有規(guī)定(依精度不同從每天500次到每月1000次不等,每次識別1張圖片,具體政策由廠家規(guī)定),如不夠用可多注冊幾個(gè)賬號,同時(shí)廠家經(jīng)常有優(yōu)惠活動(例如百度1元購1W次,訊飛0元購10W次,搜狗有道新注冊送50、100元等)。對于長期需求用戶,建議充點(diǎn)錢購買次數(shù)吧,價(jià)格不貴,還能支持國家高科技發(fā)展。
注冊步驟很簡單,可自行百度,獲得的APP_ID / API_KEY / SECRET_KEY信息先保存起來下面會用到。
類似的:
搜狗OCR到https://deepi.sogou.com/ 注冊。
有道OCR到https://ai.youdao.com/product-ocr-print.s 注冊。
訊飛OCR到https://www.xfyun.cn/service/textRecg 注冊。(如需要用W模式支持最佳空格識別效果,請選文字識別 -- 印刷文字識別(多語種),服務(wù)接口認(rèn)證信息為三項(xiàng):APPID、APISecret、APIKey)
步驟2、準(zhǔn)備工作流程中將會用到的APP1、APP2第三方軟件
到https://sourceforge.net/projects/videosubfinder/?stars=5 下載安裝VideoSubFinder_5.50_x64 作為APP1
到https://github.com/SubtitleEdit/subtitleedit/releases 下載安裝Subtitle Edit 3.5.18作為 APP2
注:APP2 不指定,可以選用戶熟悉的其他軟件,例如SubtitleEdit可換成Aegisub或 ArcTime
步驟3、設(shè)置硬字幕提取工具
打開工具,
點(diǎn)擊‘系統(tǒng)設(shè)置’
填入步驟1獲得的百度OCR服務(wù)APP_ID / API_KEY / SECRET_KEY
點(diǎn)Browse找到步驟2安裝好的APP的入口exe文件,APP1、APP2順序不要錯,然后Save保存設(shè)置。
這時(shí),主界面的APP1、APP2 按鍵將顯示剛才設(shè)置好的exe文件名
步驟4、用VideoSubFinder_5.50_x64生成RGBImages
點(diǎn)擊主界面VideoSubF按鍵,將啟動運(yùn)行VideoSubFinder_5.50_x64
點(diǎn)擊左上角File -> Open Video(FFMPEG),打開要提取字幕的視頻文件(本例為:倚天屠龍記之魔教教主-中字.mp4)
快速瀏覽全片,查看字幕區(qū)間矩形最大范圍(注意有些視頻是兩層字幕),用兩根豎線兩根橫線設(shè)置字幕截圖區(qū)間(四根線在視頻邊緣不容易發(fā)現(xiàn),試著點(diǎn)擊選中可以移動它)。注意:矩形邊框要比實(shí)際字幕稍大,不要為了節(jié)省圖片尺寸而把區(qū)間設(shè)置成緊貼字幕,如果字幕周邊余量太小,會影響后續(xù)百度OCR識別(當(dāng)然也沒必要設(shè)置得太大)。
點(diǎn)擊Search右邊的Settings,出現(xiàn)設(shè)置界面,我們只關(guān)心左邊這塊能影響Search字幕圖片的參數(shù)。
第一個(gè)參數(shù)‘Text Alignment’默認(rèn)設(shè)置是‘Center’,須要點(diǎn)擊設(shè)置成‘Any’。
其他眾多參數(shù)中,有一個(gè)參數(shù)至關(guān)重要,就是Use Filter Colors這項(xiàng),default值是空的,其他參數(shù)可以不設(shè),這個(gè)一定要設(shè)置上,特別是非純白字幕,例如黃色!如果不設(shè)置,有大幾率會漏字幕。
我們需要取色字幕文字的骨干顏色(骨干外則是字幕輪廓顏色,不要取偏了),然后將顏色值填入,將有助于VideoSubFinder判斷字幕出現(xiàn)和結(jié)束的時(shí)間,生成正確的時(shí)間軸信息,并防止丟時(shí)間軸。常見字幕顏色可能有白色的、黃色的,或者其他顏色,本例電影的字幕是白色。如果是多色字幕,可以按VSF要求取色多色填入。
具體的參數(shù)設(shè)置,可以參考Docs目錄下的readme_eng.txt,專業(yè)用戶精調(diào)參數(shù)可以提高Search字幕幀的準(zhǔn)確率,從而減少丟時(shí)間軸(少字幕圖片,致命)和假時(shí)間軸(空字幕圖片,影響不大)的情況,不過據(jù)筆者使用經(jīng)驗(yàn),如果沒弄明白參數(shù)含義和作用,隨意調(diào)整反而適得其反,普通用戶還不如不調(diào)的好。
在右邊界面先點(diǎn)一下Pixel Color
然后點(diǎn)擊字幕白色文字中心骨干取色,點(diǎn)不準(zhǔn)可以多點(diǎn)幾下。
取到了顏色,會顯示出來
本例將Lab: l:245 a:127 b:129 拷貝后雙擊填入U(xiǎn)se Filter Coloers,一般做了這步就可以基本保證不會有時(shí)間軸丟失的情況,算是完成了Search的設(shè)置。
點(diǎn)擊Search -> Clear Foders 清空RGBImages目錄,
然后點(diǎn) OCR Search,程序開始掃描視頻文件,生成RGBImages。
幾分鐘后掃描完成,可以關(guān)掉VideoSubFinder_5.50_x64,初次使用我們可以打開RGBImages目錄看一下
這些是剛才VideoSubFinder_5.50_x64 Search生成的1000多個(gè)字幕切片圖片文件,說明這個(gè)電影有1000多條字幕呢。文件名前段為時(shí)間軸信息。
打開文件看看,是RGB原色字幕截圖切片,很適合喂給百度AI過的OCR引擎做識別。
網(wǎng)友評論