Gradio
Gradio是一个用于创建 机器学习 模型交互式界面的 Python 库。 通过Gradio,可以快速地为模型构建一个可视化的、易于使用的Web界面,无需编写任何Web前端代码。 Gradio 支持多种不同类型的输入(如文本、图像、音频等)...
GPT-SoVITS
功能 零样本文本到语音 (TTS): 输入 5 秒的声音样本, 即刻体验文本到语音转换. 少样本 TTS: 仅需 1 分钟的训练数据即可微调模型, 提升声音相似度和真实感. 跨语言支持: 支持与训练数据集不同语言的推理, 目前支持英语、日语...
CreatorBox
🎬 CreatorBox 是什么? CreatorBox 为创作者而生,专注于解决 视频翻译、跨语言配音、个性化配音 等内容创作流程中的高频重复工作。只需提供素材,将自动完成语音识别、翻译、合成、草稿导出,提升创作效率,释放创作潜力 ! ...
LobeHub
LobeChat 持续追踪前沿科技趋势,支持语音、图像等多种交互形式,构建 ChatGPT / OLLaMA 更直观、便捷、有趣的使用场景
ComfyUI
ComfyUI 是一个基于节点流程式的stable diffusion AI 绘图工具WebUI, 你可以把它想象成集成了stable diffusion功能的substance designer, 通过将stable diffusion的...