-
Notifications
You must be signed in to change notification settings - Fork 76
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
- Loading branch information
1 parent
b047b5b
commit 868777c
Showing
6 changed files
with
79 additions
and
38 deletions.
There are no files selected for viewing
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -48,10 +48,11 @@ | |
- **免费**:本项目所有代码开源,完全免费。 | ||
- **方便**:解压即用,离线运行,无需网络。 | ||
- **批量**:支持批量导入处理图片。也可以即时截屏识别。 | ||
- **高效**:采用 PaddleOCR / RapidOCR 识别引擎。只要电脑性能足够,可以比在线OCR服务更快。 | ||
- **高效**:自带高效的离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。 | ||
- **灵活**:支持定制界面,支持命令行、HTTP接口等多种调用方式。 | ||
|
||
![Preview1.png](https://tupian.li/images/2023/09/25/65119e87d359c.png) | ||
|
||
![Umi-OCR-截图页2.png](https://tupian.li/images/2023/10/18/652fed59f21c8.png) | ||
![i18n.png](https://tupian.li/images/2023/09/25/65119e87e8041.png) | ||
|
||
## 源码: | ||
|
@@ -68,23 +69,55 @@ | |
[Umi-OCR_plugins](https://github.com/hiroi-sora/Umi-OCR_plugins) --> | ||
|
||
#### v1.3.6 稳定版本 | ||
#### v1.3 稳定版本 | ||
|
||
[Umi-OCR 主仓库](https://github.com/hiroi-sora/Umi-OCR) | ||
|
||
## 主要功能: | ||
## 标签页 | ||
|
||
Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。 | ||
|
||
### 截图OCR | ||
|
||
![Umi-OCR-截图页1.png](https://tupian.li/images/2023/10/18/652fea30b095b.png) | ||
|
||
**截图OCR**:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。 | ||
- 左侧的图片预览栏,可直接用鼠标划选复制。 | ||
- 右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。 | ||
- 也支持在别处复制图片,粘贴到Umi-OCR进行识别。 | ||
|
||
--- | ||
|
||
### 批量OCR | ||
|
||
![Umi-OCR-批量页1.png](https://tupian.li/images/2023/10/18/652fefa69c9b8.png) | ||
|
||
**批量OCR**:这一页支持批量导入本地图片并识别。 | ||
- 识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。 | ||
- 支持`文本后处理`技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。 | ||
- 没有数量上限,可一次性导入几百张图片进行任务。 | ||
- 支持任务完成后自动关机/待机。 | ||
|
||
--- | ||
|
||
### 全局设置 | ||
|
||
![Umi-OCR-全局页1.png](https://tupian.li/images/2023/10/18/652ff116f0f15.png) | ||
|
||
**全局设置**:在这里可以调整软件的全局参数。 | ||
- 支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行) | ||
- 支持切换界面主题。Umi-OCR拥有多个亮/暗主题。 | ||
- 可以调整界面文字大小、文字字体。 | ||
- 切换OCR插件。 | ||
|
||
--- | ||
|
||
目前 Umi-OCR v2 具有两大主要功能: | ||
- **截图OCR**:用快捷键唤起截图,识别截图中的文字。也支持识别剪贴板中的图片。 | ||
- **批量OCR**:支持批量导入本地图片,将识别的内容保存为 txt / jsonl / md 等多种格式的文件。 | ||
|
||
一张标签页负责一种主要功能。您可按习惯,打开或关闭不同功能页。 | ||
|
||
## 辅助功能说明: | ||
|
||
- **多国语言界面**:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。 | ||
- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置` → `界面和外观` → `渲染器` 。N卡用户切换为`Opengl ES`可以达到不错的效果。`关闭硬件加速` 则可以解决大部分UI问题。 | ||
- **主题**:目前支持切换浅色/深色主题。后期会推出更多主题,及开放自定义主题系统。 | ||
- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置` → `界面和外观` → `渲染器` 。 | ||
- **文本块后处理(段落合并)** 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下: | ||
- **单行**:合并同一行的文字,适合绝大部分情景。 | ||
- **多行-自然段**:智能识别、合并属于同一段落的文字,适合绝大部分情景。 | ||
|
@@ -182,40 +215,36 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 | |
|
||
## 开发计划 | ||
|
||
##### 基础开发计划 | ||
|
||
<details> | ||
<summary>已全部完成。</summary> | ||
|
||
- 标签页框架。 | ||
- OCR API控制器。 | ||
- OCR 任务控制器。 | ||
- 主题管理器,支持切换浅色/深色主题主题。 | ||
- 实现 **批量OCR**。 | ||
- 实现 **截图OCR**。 | ||
- 快捷键机制。 | ||
- 系统托盘菜单。 | ||
- 文本块后处理(排版优化)。 | ||
- 引擎内存清理。 | ||
- 软件界面多国语言。 | ||
- 命令行模式。 | ||
- Win7兼容。 | ||
<summary>已完成的工作</summary> | ||
|
||
- 标签页框架。 | ||
- OCR API控制器。 | ||
- OCR 任务控制器。 | ||
- 主题管理器,支持切换浅色/深色主题主题。 | ||
- 实现 **批量OCR**。 | ||
- 实现 **截图OCR**。 | ||
- 快捷键机制。 | ||
- 系统托盘菜单。 | ||
- 文本块后处理(排版优化)。 | ||
- 引擎内存清理。 | ||
- 软件界面多国语言。 | ||
- 命令行模式。 | ||
- Win7兼容。 | ||
- Excel(csv)输出格式。 | ||
- `Esc`中断截图操作 | ||
- 外置主题文件 | ||
- 字体切换 | ||
- 加载动画 | ||
|
||
</details> | ||
|
||
##### 近期工作 | ||
|
||
- [x] `Esc`中断截图操作 | ||
- [x] 外置主题文件 | ||
- [ ] 字体切换 | ||
- [ ] 加载动画 | ||
|
||
##### 近期开发计划 | ||
|
||
近期准备进行的工作,将会在 v2 头几个版本内逐步上线。 | ||
|
||
- [ ] 制订软件界面翻译的开源协作机制。 | ||
- [ ] Excel输出格式。 | ||
- [ ] 快捷键权限优化。 | ||
- [ ] 允许隐藏托盘图标。 | ||
- [ ] 截图联动/截图翻译。 | ||
|
@@ -248,15 +277,15 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 | |
|
||
## 构建项目 | ||
|
||
### clone | ||
### 第一步:下载代码 | ||
|
||
强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。 | ||
|
||
``` | ||
git clone --branch main --single-branch [email protected]:hiroi-sora/Umi-OCR_v2.git | ||
``` | ||
|
||
### 运行环境 | ||
### 第二步:运行环境 | ||
|
||
根据下列文档,完成对应平台的开发/运行环境部署。 | ||
|
||
|
@@ -265,8 +294,20 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 | |
|
||
## 更新日志 | ||
|
||
##### v2.0.0 dev `2023.10.18` | ||
- 新增:截图前自动隐藏窗口。 (#26) | ||
- 新增:更改字体功能。 (#25) | ||
- 新增:截图预览面板 支持显示结果文本、划选文本。 | ||
- 新增:截图预览面板 支持将图片复制到剪贴板。 | ||
- 新增:结果记录面板 支持跨文本框划选文本。 (#18) | ||
- 新增:结果记录面板 支持删除一条或多条记录。 (#10) | ||
- 新增:支持用Esc或右键中断截图。 | ||
- 优化:更改插件目录结构和导入机制。 | ||
- 修正:文件重复导致无法添加开机自启。 (#27) | ||
|
||
|
||
##### v2.0.0 dev `2023.10.10` | ||
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7) | ||
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题。 (#7) | ||
- 新功能:初步实现插件机制,切换引擎等组件更加便捷。 | ||
- 新功能:支持调整界面比例(文字大小)。 | ||
- 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 (#8) | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
|
@@ -9,6 +9,6 @@ | |
# 预发布阶段 | ||
PRE_RELEASE = "dev" | ||
# 预发布版本号 | ||
PRE_RELEASE_VERSION = 20231010 | ||
PRE_RELEASE_VERSION = 20231018 | ||
|
||
# TODO: 补充更多信息 |
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.