diff --git a/README.md b/README.md index 88d88e92..90f11096 100644 --- a/README.md +++ b/README.md @@ -48,10 +48,11 @@ - **免费**:本项目所有代码开源,完全免费。 - **方便**:解压即用,离线运行,无需网络。 - **批量**:支持批量导入处理图片。也可以即时截屏识别。 -- **高效**:采用 PaddleOCR / RapidOCR 识别引擎。只要电脑性能足够,可以比在线OCR服务更快。 +- **高效**:自带高效的离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。 - **灵活**:支持定制界面,支持命令行、HTTP接口等多种调用方式。 -![Preview1.png](https://tupian.li/images/2023/09/25/65119e87d359c.png) + +![Umi-OCR-截图页2.png](https://tupian.li/images/2023/10/18/652fed59f21c8.png) ![i18n.png](https://tupian.li/images/2023/09/25/65119e87e8041.png) ## 源码: @@ -68,23 +69,55 @@ [Umi-OCR_plugins](https://github.com/hiroi-sora/Umi-OCR_plugins) --> -#### v1.3.6 稳定版本 +#### v1.3 稳定版本 [Umi-OCR 主仓库](https://github.com/hiroi-sora/Umi-OCR) -## 主要功能: +## 标签页 + +Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。 + +### 截图OCR + +![Umi-OCR-截图页1.png](https://tupian.li/images/2023/10/18/652fea30b095b.png) + +**截图OCR**:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。 +- 左侧的图片预览栏,可直接用鼠标划选复制。 +- 右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。 +- 也支持在别处复制图片,粘贴到Umi-OCR进行识别。 + +--- + +### 批量OCR + +![Umi-OCR-批量页1.png](https://tupian.li/images/2023/10/18/652fefa69c9b8.png) + +**批量OCR**:这一页支持批量导入本地图片并识别。 +- 识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。 +- 支持`文本后处理`技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。 +- 没有数量上限,可一次性导入几百张图片进行任务。 +- 支持任务完成后自动关机/待机。 + +--- + +### 全局设置 + +![Umi-OCR-全局页1.png](https://tupian.li/images/2023/10/18/652ff116f0f15.png) + +**全局设置**:在这里可以调整软件的全局参数。 +- 支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行) +- 支持切换界面主题。Umi-OCR拥有多个亮/暗主题。 +- 可以调整界面文字大小、文字字体。 +- 切换OCR插件。 + +--- -目前 Umi-OCR v2 具有两大主要功能: -- **截图OCR**:用快捷键唤起截图,识别截图中的文字。也支持识别剪贴板中的图片。 -- **批量OCR**:支持批量导入本地图片,将识别的内容保存为 txt / jsonl / md 等多种格式的文件。 -一张标签页负责一种主要功能。您可按习惯,打开或关闭不同功能页。 ## 辅助功能说明: - **多国语言界面**:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。 -- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置` → `界面和外观` → `渲染器` 。N卡用户切换为`Opengl ES`可以达到不错的效果。`关闭硬件加速` 则可以解决大部分UI问题。 -- **主题**:目前支持切换浅色/深色主题。后期会推出更多主题,及开放自定义主题系统。 +- **渲染器**:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整 `全局设置` → `界面和外观` → `渲染器` 。 - **文本块后处理(段落合并)** 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下: - **单行**:合并同一行的文字,适合绝大部分情景。 - **多行-自然段**:智能识别、合并属于同一段落的文字,适合绝大部分情景。 @@ -182,40 +215,36 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 ## 开发计划 -##### 基础开发计划 -
-已全部完成。 - -- 标签页框架。 -- OCR API控制器。 -- OCR 任务控制器。 -- 主题管理器,支持切换浅色/深色主题主题。 -- 实现 **批量OCR**。 -- 实现 **截图OCR**。 -- 快捷键机制。 -- 系统托盘菜单。 -- 文本块后处理(排版优化)。 -- 引擎内存清理。 -- 软件界面多国语言。 -- 命令行模式。 -- Win7兼容。 +已完成的工作 + +- 标签页框架。 +- OCR API控制器。 +- OCR 任务控制器。 +- 主题管理器,支持切换浅色/深色主题主题。 +- 实现 **批量OCR**。 +- 实现 **截图OCR**。 +- 快捷键机制。 +- 系统托盘菜单。 +- 文本块后处理(排版优化)。 +- 引擎内存清理。 +- 软件界面多国语言。 +- 命令行模式。 +- Win7兼容。 +- Excel(csv)输出格式。 +- `Esc`中断截图操作 +- 外置主题文件 +- 字体切换 +- 加载动画
-##### 近期工作 - -- [x] `Esc`中断截图操作 -- [x] 外置主题文件 -- [ ] 字体切换 -- [ ] 加载动画 ##### 近期开发计划 近期准备进行的工作,将会在 v2 头几个版本内逐步上线。 - [ ] 制订软件界面翻译的开源协作机制。 -- [ ] Excel输出格式。 - [ ] 快捷键权限优化。 - [ ] 允许隐藏托盘图标。 - [ ] 截图联动/截图翻译。 @@ -248,7 +277,7 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 ## 构建项目 -### clone +### 第一步:下载代码 强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。 @@ -256,7 +285,7 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 git clone --branch main --single-branch git@github.com:hiroi-sora/Umi-OCR_v2.git ``` -### 运行环境 +### 第二步:运行环境 根据下列文档,完成对应平台的开发/运行环境部署。 @@ -265,8 +294,20 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函 ## 更新日志 +##### v2.0.0 dev `2023.10.18` +- 新增:截图前自动隐藏窗口。 (#26) +- 新增:更改字体功能。 (#25) +- 新增:截图预览面板 支持显示结果文本、划选文本。 +- 新增:截图预览面板 支持将图片复制到剪贴板。 +- 新增:结果记录面板 支持跨文本框划选文本。 (#18) +- 新增:结果记录面板 支持删除一条或多条记录。 (#10) +- 新增:支持用Esc或右键中断截图。 +- 优化:更改插件目录结构和导入机制。 +- 修正:文件重复导致无法添加开机自启。 (#27) + + ##### v2.0.0 dev `2023.10.10` -- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题 (#7) +- 新功能:第一次启动软件时,根据系统情况,选择最恰当的渲染器。解决截图闪烁问题。 (#7) - 新功能:初步实现插件机制,切换引擎等组件更加便捷。 - 新功能:支持调整界面比例(文字大小)。 - 优化:调整截图页UI,提高屏占比。优化标签栏阴影。 (#8) diff --git a/UmiOCR-data/version.py b/UmiOCR-data/version.py index ae6170cd..346462b7 100644 --- a/UmiOCR-data/version.py +++ b/UmiOCR-data/version.py @@ -9,6 +9,6 @@ # 预发布阶段 PRE_RELEASE = "dev" # 预发布版本号 -PRE_RELEASE_VERSION = 20231010 +PRE_RELEASE_VERSION = 20231018 # TODO: 补充更多信息 diff --git "a/docs/images/Umi-OCR-\345\205\250\345\261\200\351\241\2651.png" "b/docs/images/Umi-OCR-\345\205\250\345\261\200\351\241\2651.png" new file mode 100644 index 00000000..89a551a1 Binary files /dev/null and "b/docs/images/Umi-OCR-\345\205\250\345\261\200\351\241\2651.png" differ diff --git "a/docs/images/Umi-OCR-\346\210\252\345\233\276\351\241\2651.png" "b/docs/images/Umi-OCR-\346\210\252\345\233\276\351\241\2651.png" new file mode 100644 index 00000000..7fca5986 Binary files /dev/null and "b/docs/images/Umi-OCR-\346\210\252\345\233\276\351\241\2651.png" differ diff --git "a/docs/images/Umi-OCR-\346\210\252\345\233\276\351\241\2652.png" "b/docs/images/Umi-OCR-\346\210\252\345\233\276\351\241\2652.png" new file mode 100644 index 00000000..0a3966a4 Binary files /dev/null and "b/docs/images/Umi-OCR-\346\210\252\345\233\276\351\241\2652.png" differ diff --git "a/docs/images/Umi-OCR-\346\211\271\351\207\217\351\241\2651.png" "b/docs/images/Umi-OCR-\346\211\271\351\207\217\351\241\2651.png" new file mode 100644 index 00000000..2eeba8eb Binary files /dev/null and "b/docs/images/Umi-OCR-\346\211\271\351\207\217\351\241\2651.png" differ