Skip to content
/ upai Public

ymupai 是一款Windows平台的语音识别和字幕生成 以及音频/视频处理软件。

License

Notifications You must be signed in to change notification settings

ymtagi/upai

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 

Repository files navigation

基于人工智能的语音识别、文本翻译、字幕生成软件

Website QQ 群

Note

ymupai 不是开源软件,本仓库用于提供软件下载、更新和反馈渠道。

YMUPAI

ymupai 是一款 Windows 平台的 语音识别字幕生成 以及 音频/视频处理 软件。

主要特性:

  • 语音识别:支持从种视频文件、音频文件中提取语音信息并进行语音识别;支持实时从系统麦克风中接收语音数据并进行语音识别
  • 语音转录:支持实时语音转录,基于麦克风实时输入的音频数据转录为文本字幕信息
  • 字幕生成:支持将语音识别生成的文本数据,基于第三方API进行文本翻译,生成双语字幕数据,并进行同步播放展示
  • 音视频处理:支持对音视频文件进行播放、格式转换、视频截图等操作
  • 一键自动化处理:导入音视频文件,配置字幕参数,即可一键生成双语字幕数据
  • 批量任务处理:支持批量进行字幕生成,可一次导入多个音视频文件,批量进行语音识别、字幕生成操作
  • 硬件加速:数据处理支持CPU加速和GPU加速。对于安装有Nvidia系列GPU的Windows PC,支持基于Nvidia CUDA的GPU加速;对于未安装Nvidia GPU的Windows PC,支持基于OpenVINO的CPU加速

安装

服务授权码

点击下载Windows安装程序,按安装引导程序完成安装操作之后,即可使用 点击下载ymupai软件Windows安装程序

模型文件

请使用软件内置的设置 -> 模型文件管理功能下载对应的模型文件

关于服务授权码

本软件不是免费软件,需要使用软件授权码。请联系我们获取软件授权码,我们为早期用户提供试用授权码。

关于模型文件

名称 大小 支持语言 下载链接 介绍
Tiny 77.7 MB 96 种 下载 转换速度快,但识别精度低,一般不推荐使用。
Base 148 MB 96 种 下载 转换速度快,但识别精度低,一般不推荐使用。
Small 488 MB 96 种 下载 转换速度较快,但识别精度低,一般用于概览文稿时使用。
Medium 1.53 GB 96 种 下载 转换速度中等,识别效果较好,对于多数需求和机器配置,一般推荐使用。
Large(v1) 3.09 GB 96 种 下载 转换速度较慢,识别效果极佳,推荐需要转换字幕时使用。
Large(v2) 3.09 GB 96 种 下载 转换速度较慢,识别效果极佳,推荐需要转换字幕时使用。相比 V1 性能更好,但转换精度可能比 V1 差。
Tiny.en 77.7 MB 英文 下载 仅英文使用,转换速度非常快,但识别精度一般,一般用于概览文稿时使用。
Base.en 148 MB 英文 下载 英文转换速度较快,但识别精度一般,一般用于概览文稿时使用。
Small.en 488 MB 英文 下载 英文转换速度一般,但识别精度较好,推荐日常转英文使用。
Medium.en 1.53 GB 英文 下载 英文转换速度中等,但识别精度极佳,推荐转换字幕使用。

使用方法

  • 首次启动软件之后,请点击菜单栏设置 -> 功能设置,填写软件服务授权密码

语音识别功能

点击播放按钮,打开音频/视频文件,然后点击一键语音识别

字幕生成功能

点击播放按钮,打开音频/视频文件,然后设置目标字幕语言类型,最后点击一键生成字幕

用户反馈

对于使用ymupai过程中遇到的问题,请联系我们协助解决。也欢迎提供你的宝贵意见和建议。

About

ymupai 是一款Windows平台的语音识别和字幕生成 以及音频/视频处理软件。

Resources

License

Stars

Watchers

Forks

Packages

No packages published