5000小时训练,自动识别日文视频,并翻译中文字幕的开源工具

🎙️ Faster Whisper TransWithAI ChickenRice 是一款基于 Faster Whisper 和音声优化 VAD 的日文转中文优化版本,来自 AI汉化组的作品。
没想到吧,现在汉化组已经进化写AI工具,而不是用AI工具了。

5000小时训练,自动识别日文视频,并翻译中文字幕的开源工具 1

核心功能:识别音视频中的日文,并翻译为中文字幕

使用了两款模型:

注意,海南鸡模型(chickenrice0721)没有输出日文的能力,所以只能输出中文。

使用的时候,将需要转录/翻译的音频或视频文件(或包含它们的文件夹)拖放到相应的批处理文件(.bat)上运行就行了。

仓库地址:GitHub,总大小约 4.4GB。

✨ 功能特性 / Features

  • 🎯 高精度日文转中文翻译: 基于5000小时音频数据训练的”海南鸡v2″日文转中文优化模型
  • 🚀 GPU加速: 支持CUDA 11.8/12.2/12.8,充分利用NVIDIA显卡性能
  • ☁️ 云端推理: 支持 Modal 云端 GPU 推理,无本地显卡也能使用
  • 📝 多格式输出: 支持SRT、VTT、LRC等多种字幕格式
  • 🎬 音视频支持: 支持常见音频(mp3/wav/flac等)和视频格式(mp4/mkv/avi等)
  • 💾 智能缓存: 自动跳过已处理文件,提高批量处理效率
  • 🔧 灵活配置: 可自定义转录参数,满足不同场景需求

显卡的话,需要 N 卡,GTX10 系列也能用。慢就慢点呗。

显卡系列推荐 CUDA 版本
GTX 10/16系列CUDA 11.8
RTX 20/30系列CUDA 11.8 或 12.2
RTX 40系列CUDA 12.2 或 12.8
RTX 50系列必须使用 CUDA 12.8

问题来了:有什么用?


原文:https://www.appinn.com/faster-whisper-transwithai-chickenrice/

写留言

Enable Notifications OK No thanks