Skip to content

Commit

Permalink
update 20231018
Browse files Browse the repository at this point in the history
  • Loading branch information
hiroi-sora committed Oct 18, 2023
1 parent b047b5b commit 868777c
Show file tree
Hide file tree
Showing 6 changed files with 79 additions and 38 deletions.
115 changes: 78 additions & 37 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -48,10 +48,11 @@
- **免费**:本项目所有代码开源,完全免费。
- **方便**:解压即用,离线运行,无需网络。
- **批量**:支持批量导入处理图片。也可以即时截屏识别。
- **高效**采用 PaddleOCR / RapidOCR 识别引擎。只要电脑性能足够,可以比在线OCR服务更快。
- **高效**自带高效的离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
- **灵活**:支持定制界面,支持命令行、HTTP接口等多种调用方式。

![Preview1.png](https://tupian.li/images/2023/09/25/65119e87d359c.png)

![Umi-OCR-截图页2.png](https://tupian.li/images/2023/10/18/652fed59f21c8.png)
![i18n.png](https://tupian.li/images/2023/09/25/65119e87e8041.png)

## 源码:
Expand All @@ -68,23 +69,55 @@
[Umi-OCR_plugins](https://github.com/hiroi-sora/Umi-OCR_plugins) -->

#### v1.3.6 稳定版本
#### v1.3 稳定版本

[Umi-OCR 主仓库](https://github.com/hiroi-sora/Umi-OCR)

## 主要功能:
## 标签页

Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。

### 截图OCR

![Umi-OCR-截图页1.png](https://tupian.li/images/2023/10/18/652fea30b095b.png)

**截图OCR**:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。
- 左侧的图片预览栏,可直接用鼠标划选复制。
- 右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。
- 也支持在别处复制图片,粘贴到Umi-OCR进行识别。

---

### 批量OCR

![Umi-OCR-批量页1.png](https://tupian.li/images/2023/10/18/652fefa69c9b8.png)

**批量OCR**:这一页支持批量导入本地图片并识别。
- 识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
- 支持`文本后处理`技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。
- 没有数量上限,可一次性导入几百张图片进行任务。
- 支持任务完成后自动关机/待机。

---

### 全局设置

![Umi-OCR-全局页1.png](https://tupian.li/images/2023/10/18/652ff116f0f15.png)

**全局设置**:在这里可以调整软件的全局参数。
- 支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行)
- 支持切换界面主题。Umi-OCR拥有多个亮/暗主题。
- 可以调整界面文字大小、文字字体。
- 切换OCR插件。

---

目前 Umi-OCR v2 具有两大主要功能:
- **截图OCR**:用快捷键唤起截图,识别截图中的文字。也支持识别剪贴板中的图片。
- **批量OCR**:支持批量导入本地图片,将识别的内容保存为 txt / jsonl / md 等多种格式的文件。

一张标签页负责一种主要功能。您可按习惯,打开或关闭不同功能页。

## 辅助功能说明:

- **多国语言界面**:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。
- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置``界面和外观``渲染器` 。N卡用户切换为`Opengl ES`可以达到不错的效果。`关闭硬件加速` 则可以解决大部分UI问题。
- **主题**:目前支持切换浅色/深色主题。后期会推出更多主题,及开放自定义主题系统。
- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置``界面和外观``渲染器`
- **文本块后处理(段落合并)** 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下:
- **单行**:合并同一行的文字,适合绝大部分情景。
- **多行-自然段**:智能识别、合并属于同一段落的文字,适合绝大部分情景。
Expand Down Expand Up @@ -182,40 +215,36 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函

## 开发计划

##### 基础开发计划

<details>
<summary>已全部完成。</summary>

- 标签页框架。
- OCR API控制器。
- OCR 任务控制器。
- 主题管理器,支持切换浅色/深色主题主题。
- 实现 **批量OCR**
- 实现 **截图OCR**
- 快捷键机制。
- 系统托盘菜单。
- 文本块后处理(排版优化)。
- 引擎内存清理。
- 软件界面多国语言。
- 命令行模式。
- Win7兼容。
<summary>已完成的工作</summary>

- 标签页框架。
- OCR API控制器。
- OCR 任务控制器。
- 主题管理器,支持切换浅色/深色主题主题。
- 实现 **批量OCR**
- 实现 **截图OCR**
- 快捷键机制。
- 系统托盘菜单。
- 文本块后处理(排版优化)。
- 引擎内存清理。
- 软件界面多国语言。
- 命令行模式。
- Win7兼容。
- Excel(csv)输出格式。
- `Esc`中断截图操作
- 外置主题文件
- 字体切换
- 加载动画

</details>

##### 近期工作

- [x] `Esc`中断截图操作
- [x] 外置主题文件
- [ ] 字体切换
- [ ] 加载动画

##### 近期开发计划

近期准备进行的工作,将会在 v2 头几个版本内逐步上线。

- [ ] 制订软件界面翻译的开源协作机制。
- [ ] Excel输出格式。
- [ ] 快捷键权限优化。
- [ ] 允许隐藏托盘图标。
- [ ] 截图联动/截图翻译。
Expand Down Expand Up @@ -248,15 +277,15 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函

## 构建项目

### clone
### 第一步:下载代码

强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。

```
git clone --branch main --single-branch [email protected]:hiroi-sora/Umi-OCR_v2.git
```

### 运行环境
### 第二步:运行环境

根据下列文档,完成对应平台的开发/运行环境部署。

Expand All @@ -265,8 +294,20 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函

## 更新日志

##### v2.0.0 dev `2023.10.18`
- 新增:截图前自动隐藏窗口。 (#26)
- 新增:更改字体功能。 (#25)
- 新增:截图预览面板 支持显示结果文本、划选文本。
- 新增:截图预览面板 支持将图片复制到剪贴板。
- 新增:结果记录面板 支持跨文本框划选文本。 (#18)
- 新增:结果记录面板 支持删除一条或多条记录。 (#10)
- 新增:支持用Esc或右键中断截图。
- 优化:更改插件目录结构和导入机制。
- 修正:文件重复导致无法添加开机自启。 (#27)


##### v2.0.0 dev `2023.10.10`
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7)
- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7)
- 新功能:初步实现插件机制,切换引擎等组件更加便捷。
- 新功能:支持调整界面比例(文字大小)。
- 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 (#8)
Expand Down
2 changes: 1 addition & 1 deletion UmiOCR-data/version.py
Original file line number Diff line number Diff line change
Expand Up @@ -9,6 +9,6 @@
# 预发布阶段
PRE_RELEASE = "dev"
# 预发布版本号
PRE_RELEASE_VERSION = 20231010
PRE_RELEASE_VERSION = 20231018

# TODO: 补充更多信息
Binary file added docs/images/Umi-OCR-全局页1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docs/images/Umi-OCR-截图页1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docs/images/Umi-OCR-截图页2.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docs/images/Umi-OCR-批量页1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.

0 comments on commit 868777c

Please sign in to comment.