UMIOCR识别工具

UMIOCR识别工具

  • 大小128M类型应用工具更新2026-02-02
举报
软件简介

umiocr github离线版最新版本是电脑文本识别工具软件,支持屏幕截图或者拖入图片,即可快捷转文字;也支持批量导入文档,识别文字,支持pdf、xps等文件,还可以生成二维码或者识别二维码,包括条形码等,完全免费使用,无需登录或者付费!

numi-OCR识别软件介绍

umiocr最新版本用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取字幕区域的文本,而避免提取到水印和UI文本。本软件可设置忽略某些区域内的文字,来实现这一目的。尤其是,特别适合用于批量提取Galgame截图中的台词。当有大量的影视和游戏截图需要整理归档,或者想翻找包含某一段台词/字幕的截图;将这些图片提取出文字、然后Ctrl+F是一个很有效的方法。这是开发本软件的初衷。

UMIOCR识别工具功能

灵活:支持命令行、HTTP接口等外部调用方式。

功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

免费:本项目所有代码开源,完全免费。

方便:解压即用,离线运行,无需网络。

高效:自带高效率的离线OCR引擎,内置多种语言识别库。

umiocr官方下载安装教程

软件发布包下载为.7z.exe自解压包,解压后,运行umiocr.exe即可;

弹出解压目录,建议放到c盘以外;

解压完成后,去解压目录,点击 Umi-OCR.exe 即可启动程序。

umiocr使用说明

界面语言

Umi-OCR 支持的界面多国语言。在第一次打开软件时,将会按照你的电脑的系统设置,自动切换语言。

如果需要手动切换语言,请参考下图,全局设置→语言/Language 。

标签页

Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页。

标签栏左上角可以切换窗口置顶。右上角能够锁定标签页,以防止日常使用中误触关闭标签页。

截图OCR

截图OCR:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。

左侧的图片预览栏,可直接用鼠标划选复制。

右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。

也支持在别处复制图片,粘贴到Umi-OCR进行识别。

关于 公式识别 功能

文本后处理

关于 OCR文本后处理 - 排版解析方案: 可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案:

多栏-按自然段换行:适合大部分情景,自动识别多栏布局,按自然段规则进行换行。

多栏-总是换行:每段语句都进行换行。

多栏-无换行:强制将所有语句合并到同一行。

单栏-按自然段换行/总是换行/无换行:与上述类似,不过 不区分多栏布局。

单栏-保留缩进:适用于解析代码截图,保留行首缩进和行中空格。

不做处理:OCR引擎的原始输出,默认每段语句都进行换行。

上述方案,均能自动处理横排和竖排(从右到左)的排版。(竖排文字还需要OCR引擎本身支持)

批量OCR

批量OCR:这一页用于批量导入本地图片进行识别。

支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。

保存识别结果的支持格式:txt, jsonl, md, csv(Excel)。

与截图OCR一样,支持文本后处理功能,整理OCR文本的排版和顺序。

没有数量上限,可一次性导入几百张图片进行任务。

支持任务完成后自动关机/待机。

如果要识别像素超大的长图或大图,请调整:页面的设置→文字识别→限制图像边长→【调高数值】。

拥有特殊功能 忽略区域 。

忽略区域

关于 OCR文本后处理 - 忽略区域: 批量OCR中的一种特殊功能,适用于排除图片中的不想要的文字。

在批量识别页的右栏设置中可进入忽略区域编辑器。

如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。

按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。

请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。

注意,只有处于忽略区域框内部的整个文本块(而不是单个字符)会被忽略。如下图所示,黄色边框的深色矩形是一个忽略区域。那么只有key_mouse才会被忽略。pubsub_connector.py、pubsub_service.py 这两个文本块得以保留。

文档识别

文档识别:

支持格式:pdf, xps, epub, mobi, fb2, cbz。

对扫描件进行OCR,或提取原有文本。可输出为 双层可搜索PDF 。

支持设定 忽略区域 ,可用于排除页眉页脚的文字。

可设置任务完成后 自动关机/休眠 。

二维码

扫码:

截图/粘贴/拖入本地图片,读取其中的二维码、条形码。

支持一图多码。

支持19种协议,如下:

Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE

生成码:

输入文本,生成二维码图片。

支持19种协议和纠错等级等参数。

全局设置

全局设置:在这里可以调整软件的全局参数。常用功能如下:

一键添加快捷方式或设置开机自启。

更改界面语言。Umi支持繁中、英语、日语等语言。

切换界面主题。Umi拥有多个亮/暗主题。

调整界面文字的大小和字体。

切换OCR插件。

渲染器:软件界面默认支持显卡加速渲染。如果在你的机器上出现截屏闪烁、UI错位的情况,请调整界面和外观 → 渲染器 ,尝试切换到不同渲染方案,或关闭硬件加速。

更新内容

新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。指定级别以上(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。

修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。

修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。

修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。

修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。

修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。

修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。

修复:Linux版本截图后,主窗口的位置与操作前不一致。

新增:大部分标签页能手动切换左右/上下双栏模式。

新增:Esc键隐藏主窗口。

新增:调整二维码生成相关参数后,自动刷新二维码生成。

新增:命令行指令 --reload ,用于重新加载配置文件。

优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。

Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0

新增UI语言:俄语

软件信息
意见反馈
  • UMIOCR识别工具截图1
  • UMIOCR识别工具截图2
  • UMIOCR识别工具截图3
  • UMIOCR识别工具截图4
  • UMIOCR识别工具截图5
热门软件
游戏攻略
明日方舟辞岁行玩法介绍

明日方舟辞岁行玩法介绍

斗破苍穹手游异火怎么玩

斗破苍穹手游异火怎么玩

最新软件
lxmusic洛雪音乐助手pc版

lxmusic洛雪音乐助手pc版

查看
芒果tvmac版

芒果tvmac版

查看
epsonlq615kii安装驱动

epsonlq615kii安装驱动

查看
epsonlq610kii针式打印机驱动

epsonlq610kii针式打印机驱动

查看
魔兽争霸3冰封王座中文版

魔兽争霸3冰封王座中文版

查看
Bandizip便携破解版

Bandizip便携破解版

查看
悟饭游戏厅电脑版

悟饭游戏厅电脑版

查看
同花顺苹果电脑版

同花顺苹果电脑版

查看