愛用小工具及遊戲開發展示 • 太盛昌資訊服務有限公司

音訊工具坊

本地運算・隱私不上雲・支援多種音訊與影片格式

🎙️

音源聲音擷取

第五版

用途簡介

將上傳的音訊或影片自動解出聲音軌，做背景雜訊過濾與 人聲頻段提取，再以可視化波形精細裁切多段保留區間後合併導出。適合處理錄音現場底噪、會議錄音、口述影像或人聲擷取後製。

操作流程

支援格式

輸入：.wav .mp3 .m4a .flac .ogg 以及含音軌的影片（.mp4 等）。輸出：標準 16-bit WAV。

提示：降噪與帶通濾波是分開的兩條獨立音軌，可以同時導出比較。若降噪後音色變悶，建議改用「凸顯人聲」並把保留區間挑在說話段。

🎬

音軌字幕校正

第六版

用途簡介

以本地深度學習語音辨識模型（耳語 Whisper 系列），將音訊直接轉成文字，或將 既有文稿與音訊精確對齊時間軸，然後在網頁上互動式校對文字與秒數，最後一鍵匯出標準 SRT 字幕檔。適合影片上字幕、訪談逐字稿、Podcast 製作。

兩種模式

直接語音轉文字：沒有現成文稿時使用，模型自行辨識所有句子。
比對現有文稿：若已經有逐字稿，使用強制對齊以獲得最高文字精度。可選兩種切分模式：
- 依語音停頓切分 ・自動以說話停頓拆成自然句段。
- 依文稿換行對齊 ・嚴格按文稿中的換行做為每段邊界。

模型規模選擇

※ 首次使用該規模會自動下載模型權重，之後快取於伺服器再次調用免下載。

操作流程

提示：辨識耗時與音訊長度成正比；以 base 模型處理 10 分鐘音訊在 NAS（CPU 運算）約需 5–15 分鐘。建議先用 tiny 試跑檢查結果再決定是否升級模型。

所有運算在私人 NAS 本機完成，檔案不會上傳至任何雲端服務・回到入口頁

遊戲學苑

棋道・對弈

日本將棋・互動教學
v6.2.1 上帝教學模式

圍棋學堂・互動教學
v10 含 100 名局棋譜

音訊・工具坊

多軌降噪・人聲提取
波形精細裁切與導出

語音辨識・文稿對齊
標準 SRT 字幕導出