Note
ymupai 不是开源软件,本仓库用于提供软件下载、更新和反馈渠道。
ymupai 是一款 Windows 平台的 语音识别 和 字幕生成 以及 音频/视频处理 软件。
主要特性:
- 语音识别:支持从种视频文件、音频文件中提取语音信息并进行语音识别;支持实时从系统麦克风中接收语音数据并进行语音识别
- 语音转录:支持实时语音转录,基于麦克风实时输入的音频数据转录为文本字幕信息
- 字幕生成:支持将语音识别生成的文本数据,基于第三方API进行文本翻译,生成双语字幕数据,并进行同步播放展示
- 音视频处理:支持对音视频文件进行播放、格式转换、视频截图等操作
- 一键自动化处理:导入音视频文件,配置字幕参数,即可一键生成双语字幕数据
- 批量任务处理:支持批量进行字幕生成,可一次导入多个音视频文件,批量进行语音识别、字幕生成操作
- 硬件加速:数据处理支持CPU加速和GPU加速。对于安装有Nvidia系列GPU的Windows PC,支持基于Nvidia CUDA的GPU加速;对于未安装Nvidia GPU的Windows PC,支持基于OpenVINO的CPU加速
点击下载Windows安装程序,按安装引导程序完成安装操作之后,即可使用 点击下载ymupai软件Windows安装程序
请使用软件内置的设置 -> 模型文件管理功能下载对应的模型文件
本软件不是免费软件,需要使用软件授权码。请联系我们获取软件授权码,我们为早期用户提供试用授权码。
名称 | 大小 | 支持语言 | 下载链接 | 介绍 |
---|---|---|---|---|
Tiny | 77.7 MB | 96 种 | 下载 | 转换速度快,但识别精度低,一般不推荐使用。 |
Base | 148 MB | 96 种 | 下载 | 转换速度快,但识别精度低,一般不推荐使用。 |
Small | 488 MB | 96 种 | 下载 | 转换速度较快,但识别精度低,一般用于概览文稿时使用。 |
Medium | 1.53 GB | 96 种 | 下载 | 转换速度中等,识别效果较好,对于多数需求和机器配置,一般推荐使用。 |
Large(v1) | 3.09 GB | 96 种 | 下载 | 转换速度较慢,识别效果极佳,推荐需要转换字幕时使用。 |
Large(v2) | 3.09 GB | 96 种 | 下载 | 转换速度较慢,识别效果极佳,推荐需要转换字幕时使用。相比 V1 性能更好,但转换精度可能比 V1 差。 |
Tiny.en | 77.7 MB | 英文 | 下载 | 仅英文使用,转换速度非常快,但识别精度一般,一般用于概览文稿时使用。 |
Base.en | 148 MB | 英文 | 下载 | 英文转换速度较快,但识别精度一般,一般用于概览文稿时使用。 |
Small.en | 488 MB | 英文 | 下载 | 英文转换速度一般,但识别精度较好,推荐日常转英文使用。 |
Medium.en | 1.53 GB | 英文 | 下载 | 英文转换速度中等,但识别精度极佳,推荐转换字幕使用。 |
- 首次启动软件之后,请点击菜单栏设置 -> 功能设置,填写软件服务授权密码
点击播放按钮,打开音频/视频文件,然后点击一键语音识别
点击播放按钮,打开音频/视频文件,然后设置目标字幕语言类型,最后点击一键生成字幕
对于使用ymupai过程中遇到的问题,请联系我们协助解决。也欢迎提供你的宝贵意见和建议。