為YouTube長片加AI字幕 | Episode 1

  Рет қаралды 54

warrenpier

warrenpier

Күн бұрын

Пікірлер: 2
@soarfung
@soarfung 5 ай бұрын
請問有冇工具可以將廣東話generate得準確啲? whisper jax 譯出嚟會變咗國語咁
@warrentier
@warrentier 5 ай бұрын
有,喺 Whisper-Jax 或 Faster-Whisper 入面嘅 transformer object 調 VAD_duration, length_penalty 等參數,不過準唔準(出廣東漢字,以及 timestamp 對齊),就視乎以下: 1) 你條聲 有冇 踏聲 (兩三個入對話,一個人講嘢時,其他人同時講嘢 或笑) 2)你講嘢嘅節奏(停頓位),我用 Faster-Whisper (with Whisper-large-v3 model),將 VAD_duration 度 set 停頓時長 ( in ms, millisecond)... 自己試吓不同語速 之下 邊個 duration 啱用,我用 200 ms 出得準唔代表其他人用 200 ms 出得準, default 係 500 ms 3) 用 length_penalty 嚟控制 顯示 字幕長度 (length_penalty 越長,字幕越短); length_penalty 同 VAD_duration 一齊用,嚟調節至 啱 自己語速 相對應字幕 (人人唔同,自己試) 基本上,你上網 download 人哋寫好嘅 whisper service,都係按呢個方向操作。 詳情可以 google 'whisper-jax' 或者 "faster-whisper" 嘅 GitHub 睇, 有 code snippet download,方便按自己需要微調 希望幫到手, good luck
«Жат бауыр» телехикаясы І 26-бөлім
52:18
Qazaqstan TV / Қазақстан Ұлттық Арнасы
Рет қаралды 434 М.
🎈🎈🎈😲 #tiktok #shorts
0:28
Byungari 병아리언니
Рет қаралды 4,5 МЛН
24 Часа в БОУЛИНГЕ !
27:03
A4
Рет қаралды 7 МЛН
【漫士】99%的人都会答错!为什么概率这么反直觉?
16:35
Путин ответил на ультиматум Трампа
7:25
Diplomatrutube
Рет қаралды 1,3 МЛН