🎙️ Faster Whisper TransWithAI ChickenRice 是一款基于 Faster Whisper 和音声优化 VAD 的日文转中文优化版本,来自 AI汉化组的作品。
没想到吧,现在汉化组已经进化写AI工具,而不是用AI工具了。

核心功能:识别音视频中的日文,并翻译为中文字幕
使用了两款模型:
- 翻译为中文:chickenrice0721/whisper-large-v2-translate-zh-v0.2-st 日文转中文优化模型
- 识别日文发音:TransWithAI/Whisper-Vad-EncDec-ASMR-onnx 音声优化 VAD 模型
注意,海南鸡模型(chickenrice0721)没有输出日文的能力,所以只能输出中文。
使用的时候,将需要转录/翻译的音频或视频文件(或包含它们的文件夹)拖放到相应的批处理文件(.bat)上运行就行了。
仓库地址:GitHub,总大小约 4.4GB。
✨ 功能特性 / Features
- 🎯 高精度日文转中文翻译: 基于5000小时音频数据训练的”海南鸡v2″日文转中文优化模型
- 🚀 GPU加速: 支持CUDA 11.8/12.2/12.8,充分利用NVIDIA显卡性能
- ☁️ 云端推理: 支持 Modal 云端 GPU 推理,无本地显卡也能使用
- 📝 多格式输出: 支持SRT、VTT、LRC等多种字幕格式
- 🎬 音视频支持: 支持常见音频(mp3/wav/flac等)和视频格式(mp4/mkv/avi等)
- 💾 智能缓存: 自动跳过已处理文件,提高批量处理效率
- 🔧 灵活配置: 可自定义转录参数,满足不同场景需求
显卡的话,需要 N 卡,GTX10 系列也能用。慢就慢点呗。
| 显卡系列 | 推荐 CUDA 版本 |
|---|---|
| GTX 10/16系列 | CUDA 11.8 |
| RTX 20/30系列 | CUDA 11.8 或 12.2 |
| RTX 40系列 | CUDA 12.2 或 12.8 |
| RTX 50系列 | 必须使用 CUDA 12.8 |
问题来了:有什么用?
原文:https://www.appinn.com/faster-whisper-transwithai-chickenrice/