14-day current streak·19-day longest streak
-
pyvideotrans
Translate the video from one language to another and embed dubbing & subtitles.
Python ★ 18k 2d agoExplain → -
clone-voice ▣
A sound cloning tool with a web interface, using your voice or any sound to record audio / 一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
Python ★ 9.0k 9mo agoExplain → -
ChatTTS-ui
一个简单的本地网页界面,使用ChatTTS将文字合成为语音,同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.
Python ★ 7.6k 6d agoExplain → -
stt
Voice Recognition to Text Tool / 一个离线运行的本地音视频转字幕工具,输出json、srt字幕、纯文字格式
Python ★ 4.6k 5mo agoExplain → -
vocal-separate ▣
an extremely simple tool for separating vocals and background music, completely localized for web operation, using 2stems/4stems/5stems models 这是一个极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网
Python ★ 2.0k 1y agoExplain → -
ott ▣
Api tool for local offline text translation supporting multiple languages/支持多语言的本地离线文字翻译api
Python ★ 482 1y agoExplain → -
gptsovits-api
适用于 GPT-SoVITS 的api调用接口
Python ★ 341 2y agoExplain → -
cosyvoice-api
一个用于CosyVoice的api接口项目
Python ★ 336 9mo agoExplain → -
zh_recogn
将音频或视频中的中文语音识别并导出为srt字幕,基于魔塔社区Paraformer模型
Python ★ 115 1y agoExplain → -
fireredasr-ui
一个中文语音转文字项目,封装自FireRedASR
Python ★ 86 1y agoExplain → -
ai2srt
利用 GeminiAI 一键为长视频创建解说短视频,并支持音视频转录字幕
Python ★ 68 1y agoExplain → -
f5-tts-api
一个用于F5-TTS的api和webui项目
Python ★ 63 1y agoExplain → -
ffmpegweb
基于ffmpeg.wasm的在线视频处理工具
JavaScript ★ 57 2y agoExplain → -
gemini-speech2srt
使用 Gemini AI 转写音视频为 SRT 字幕
Python ★ 56 1y agoExplain → -
translate-api
在cloudflare上基于m2m100创建完全免费的翻译API服务
JavaScript ★ 54 1y agoExplain → -
sense-api
用于SenseVoice的api项目,输出带时间戳字幕
Python ★ 47 1y agoExplain → -
remove-noise
一个简单的音频降噪工具,提高web UI界面和api接口
Python ★ 45 1y agoExplain → -
kokoro-uiapi
用于kokoro TTS的webui界面和兼容openai api
Python ★ 41 1y agoExplain → -
parakeet-api
一个基于 NVIDIA Parakeet-tdt-0.6b 模型的本地语音转录服务。它提供了一个与 OpenAI API 兼容的接口和一个简洁的 Web 用户界面
Python ★ 29 4mo agoExplain → -
format-cli
一个极简的音视频格式转换工具
Python ★ 22 2y agoExplain → -
gvs
基于 AI 视觉大模型 的视频硬字幕提取工具。
Python ★ 20 4mo agoExplain → -
speech2text-df
基于Dolphin模型的东方语言音视频转字幕api及webui
HTML ★ 19 1y agoExplain → -
chatterbox-api
一个基于 Chatterbox-TTS的文字转语音(TTS)服务。提供与 OpenAI TTS 兼容的 API 接口并支持声音克隆,附带简洁的 Web 用户界面。
HTML ★ 19 1mo agoExplain → -
The-Secret-of-the-Underlying-Computer ⑂
《计算机底层的秘密》在线阅读
★ 18 2y agoExplain → -
realtime-stt
一个极简的本地离线实时语音转文字工具
Python ★ 14 7mo agoExplain → -
whisperx-api
一个适用于WhisperX 的web界面,兼容 OpenAI API 转录接口
HTML ★ 11 1mo agoExplain → -
onJava8 ⑂
《On Java 8》中文版,又名《Java编程思想》 第5版
JavaScript ★ 4 2y agoExplain → -
investment_data ⑂
Scripts and doc for https://www.dolthub.com/repositories/chenditc/investment_data
Python ★ 2 1mo agoExplain → -
xxootools-web
在线工具
TypeScript ★ 2 1y agoExplain → -
astock ⑂
qlib助手, 每日自动预测a股 👇
Python ★ 1 2d agoExplain → -
VibeVoice ⑂
Open-Source Frontier Voice AI
Python ★ 1 4mo agoExplain → -
edgetts-ui
一个极简的 edgetts web界面
HTML ★ 1 5mo agoExplain → -
Confucius4-TTS
frok from netease-youdao/Confucius4-TTS
Python ★ 0 1d agoExplain → -
VoxCPM ⑂
VoxCPM2: Tokenizer-Free TTS for Multilingual Speech Generation, Creative Voice Design, and True-to-Life Cloning
Python ★ 0 1mo agoExplain → -
transformers ⑂
🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.
★ 0 4mo agoExplain → -
ostoolcode
No description.
Python ★ 0 6mo agoExplain → -
sherpa ⑂
Speech-to-text server framework with next-gen Kaldi
★ 0 6mo agoExplain → -
CloudFlare-ImgBed ⑂
基于 CloudFlare Pages 的开源文件托管解决方案,支持 Telegram Bot 、R2、S3 等多种存储方式!
★ 0 1y agoExplain →
No repos match these filters.