update 20231018

hiroi-sora · Oct 18, 2023 · 868777c · 868777c
1 parent b047b5b
commit 868777c
Show file tree

Hide file tree

Showing 6 changed files with 79 additions and 38 deletions.
diff --git a/README.md b/README.md
@@ -48,10 +48,11 @@
 - **免费**：本项目所有代码开源，完全免费。
 - **方便**：解压即用，离线运行，无需网络。
 - **批量**：支持批量导入处理图片。也可以即时截屏识别。
-- **高效**：采用 PaddleOCR / RapidOCR 识别引擎。只要电脑性能足够，可以比在线OCR服务更快。
+- **高效**：自带高效的离线OCR引擎。只要电脑性能足够，可以比在线OCR服务更快。
 - **灵活**：支持定制界面，支持命令行、HTTP接口等多种调用方式。
 
-![Preview1.png](https://tupian.li/images/2023/09/25/65119e87d359c.png)
+
+![Umi-OCR-截图页2.png](https://tupian.li/images/2023/10/18/652fed59f21c8.png)
 ![i18n.png](https://tupian.li/images/2023/09/25/65119e87e8041.png)
 
 ## 源码：
@@ -68,23 +69,55 @@
 
 [Umi-OCR_plugins](https://github.com/hiroi-sora/Umi-OCR_plugins) -->
 
-#### v1.3.6 稳定版本
+#### v1.3 稳定版本
 
 [Umi-OCR 主仓库](https://github.com/hiroi-sora/Umi-OCR)
 
-## 主要功能：
+## 标签页
+
+Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好，打开需要的标签页，并锁定标签栏。
+
+### 截图OCR
+
+![Umi-OCR-截图页1.png](https://tupian.li/images/2023/10/18/652fea30b095b.png)
+
+**截图OCR**：打开这一页后，就可以用快捷键唤起截图，识别图中的文字。
+- 左侧的图片预览栏，可直接用鼠标划选复制。
+- 右侧的识别记录栏，可以编辑文字，允许划选多个记录复制。
+- 也支持在别处复制图片，粘贴到Umi-OCR进行识别。
+
+---
+
+### 批量OCR
+
+![Umi-OCR-批量页1.png](https://tupian.li/images/2023/10/18/652fefa69c9b8.png)
+
+**批量OCR**：这一页支持批量导入本地图片并识别。
+- 识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
+- 支持`文本后处理`技术，能识别属于同一自然段的文字，并将其合并。还支持代码段、竖排文本等多种处理方案。
+- 没有数量上限，可一次性导入几百张图片进行任务。
+- 支持任务完成后自动关机/待机。
+
+---
+
+### 全局设置
+
+![Umi-OCR-全局页1.png](https://tupian.li/images/2023/10/18/652ff116f0f15.png)
+
+**全局设置**：在这里可以调整软件的全局参数。
+- 支持更改界面语言。（翻译校对工作将在第一个正式版发布后进行）
+- 支持切换界面主题。Umi-OCR拥有多个亮/暗主题。
+- 可以调整界面文字大小、文字字体。
+- 切换OCR插件。
+
+---
 
-目前 Umi-OCR v2 具有两大主要功能：
-- **截图OCR**：用快捷键唤起截图，识别截图中的文字。也支持识别剪贴板中的图片。
-- **批量OCR**：支持批量导入本地图片，将识别的内容保存为 txt / jsonl / md 等多种格式的文件。
 
-一张标签页负责一种主要功能。您可按习惯，打开或关闭不同功能页。
 
 ## 辅助功能说明：
 
 - **多国语言界面**：软件界面支持多国语言。目前预览阶段为AI翻译生成，可能词义和排版不好，或者有错漏的情况。正式发布时会进行人工校对。
-- **渲染器**：软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况，请调整 `全局设置` → `界面和外观` → `渲染器` 。N卡用户切换为`Opengl ES`可以达到不错的效果。`关闭硬件加速` 则可以解决大部分UI问题。
-- **主题**：目前支持切换浅色/深色主题。后期会推出更多主题，及开放自定义主题系统。
+- **渲染器**：软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况，请调整 `全局设置` → `界面和外观` → `渲染器` 。
 - **文本块后处理（段落合并）** 可以整理OCR结果的排版和顺序，使文本更适合阅读和使用。预设方案如下：
   - **单行**：合并同一行的文字，适合绝大部分情景。
   - **多行-自然段**：智能识别、合并属于同一段落的文字，适合绝大部分情景。
@@ -182,40 +215,36 @@ Umi-OCR 允许通过命令行调用每一个标签页（模块）上的任意函
 
 ## 开发计划
 
-##### 基础开发计划
-
 <details>
-<summary>已全部完成。</summary>
-
--  标签页框架。
--  OCR API控制器。
--  OCR 任务控制器。
--  主题管理器，支持切换浅色/深色主题主题。
--  实现 **批量OCR**。
--  实现 **截图OCR**。
--  快捷键机制。
--  系统托盘菜单。
--  文本块后处理（排版优化）。
--  引擎内存清理。
--  软件界面多国语言。
--  命令行模式。
--  Win7兼容。
+<summary>已完成的工作</summary>
+
+- 标签页框架。
+- OCR API控制器。
+- OCR 任务控制器。
+- 主题管理器，支持切换浅色/深色主题主题。
+- 实现 **批量OCR**。
+- 实现 **截图OCR**。
+- 快捷键机制。
+- 系统托盘菜单。
+- 文本块后处理（排版优化）。
+- 引擎内存清理。
+- 软件界面多国语言。
+- 命令行模式。
+- Win7兼容。
+- Excel（csv）输出格式。
+- `Esc`中断截图操作
+- 外置主题文件
+- 字体切换
+- 加载动画
 
 </details>
 
-##### 近期工作
-
-- [x] `Esc`中断截图操作
-- [x] 外置主题文件
-- [ ] 字体切换
-- [ ] 加载动画
 
 ##### 近期开发计划
 
 近期准备进行的工作，将会在 v2 头几个版本内逐步上线。
 
 - [ ] 制订软件界面翻译的开源协作机制。
-- [ ] Excel输出格式。
 - [ ] 快捷键权限优化。
 - [ ] 允许隐藏托盘图标。
 - [ ] 截图联动/截图翻译。
@@ -248,15 +277,15 @@ Umi-OCR 允许通过命令行调用每一个标签页（模块）上的任意函
 
 ## 构建项目
 
-### clone
+### 第一步：下载代码
 
 强烈建议只 clone 主分支，因为某些分支含有体积很大的二进制库，会让你花费很长时间下载。
 
 ```
  git clone --branch main --single-branch [email protected]:hiroi-sora/Umi-OCR_v2.git
 ```
 
-### 运行环境
+### 第二步：运行环境
 
 根据下列文档，完成对应平台的开发/运行环境部署。
 
@@ -265,8 +294,20 @@ Umi-OCR 允许通过命令行调用每一个标签页（模块）上的任意函
 
 ## 更新日志
 
+##### v2.0.0 dev `2023.10.18`
+- 新增：截图前自动隐藏窗口。 (#26)
+- 新增：更改字体功能。 (#25)
+- 新增：截图预览面板 支持显示结果文本、划选文本。
+- 新增：截图预览面板 支持将图片复制到剪贴板。
+- 新增：结果记录面板 支持跨文本框划选文本。 (#18)
+- 新增：结果记录面板 支持删除一条或多条记录。 (#10)
+- 新增：支持用Esc或右键中断截图。
+- 优化：更改插件目录结构和导入机制。
+- 修正：文件重复导致无法添加开机自启。 (#27)
+
+
 ##### v2.0.0 dev `2023.10.10`
-- 新功能：第一次启动软件时，根据系统情况，选择最恰当的渲染器。解决截图闪烁问题 (#7)
+- 新功能：第一次启动软件时，根据系统情况，选择最恰当的渲染器。解决截图闪烁问题。 (#7)
 - 新功能：初步实现插件机制，切换引擎等组件更加便捷。
 - 新功能：支持调整界面比例（文字大小）。
 - 优化：调整截图页UI，提高屏占比。优化标签栏阴影。 (#8)

diff --git a/UmiOCR-data/version.py b/UmiOCR-data/version.py
@@ -9,6 +9,6 @@
 # 预发布阶段
 PRE_RELEASE = "dev"
 # 预发布版本号
-PRE_RELEASE_VERSION = 20231010
+PRE_RELEASE_VERSION = 20231018
 
 # TODO: 补充更多信息
diff --git a/docs/images/Umi-OCR-全局页1.png b/docs/images/Umi-OCR-全局页1.png
diff --git a/docs/images/Umi-OCR-截图页1.png b/docs/images/Umi-OCR-截图页1.png
diff --git a/docs/images/Umi-OCR-截图页2.png b/docs/images/Umi-OCR-截图页2.png
diff --git a/docs/images/Umi-OCR-批量页1.png b/docs/images/Umi-OCR-批量页1.png