🖼️ 图像识别分类器

智能奖状分类工具 - 让分类变得简单高效

🎯 智能识别 📁 多格式支持 🔍 模糊匹配 ⚡ 批量处理

🚀 立即下载

点击下方按钮下载最新版本的图像识别分类器
支持 Windows 10/11 系统

📥 下载安装包
📄

多种文件格式

支持 PDF、JPG、PNG、BMP、TIFF 等多种常见文件格式,满足各种奖状文档的分类需求。

🔍

智能文本识别

利用 OCR 光学字符识别技术,自动从图像中提取文字内容,准确识别姓名、年份、奖项等关键信息。

🎯

高识别精度

PDF文件:直接提取文本,精度极高
图片文件:清晰扫描件识别精度达95%以上,支持自动预处理(灰度转换、二值化)提高识别效果
奖状文档:格式规范的奖状识别精度可达98%以上

🧠

智能分类条件

支持按姓名、年份、奖项类型、颁发机构、奖项级别等多种条件分类,模糊输入也能准确理解您的意图。

批量高效处理

一键批量分类处理,快速将大量奖状文件按照指定条件自动分类到相应文件夹,提高工作效率。

🎨

美观简洁界面

现代化设计风格,简洁直观的操作界面,无需复杂设置,开箱即用。

📦

易于分发部署

独立可执行文件,无需安装 Python 环境,下载后即可在 Windows 系统上运行。

📋 支持的文件格式

PDF
JPG
PNG
BMP
TIFF
JPEG

📖 快速开始

1
下载并解压

下载图像识别分类器.zip文件并解压到任意位置

2
运行安装程序

双击"安装程序.bat"进行初始化配置

3
选择文件夹

点击"浏览"按钮选择包含奖状的源文件夹

4
设置分类条件

输入分类条件,如"姓名"、"年份"、"省级"等

5
开始分类

点击"开始分类"按钮,软件将自动完成分类

6
查看结果

在目标文件夹中查看分类好的奖状文件

⚠️ 重要提示:首次使用需安装 Tesseract OCR

由于软件使用 OCR 技术识别图片文字,首次使用需要安装 Tesseract OCR 引擎

  1. 访问 GitHub 下载页面:点击访问
  2. 下载 tesseract-ocr-w64-setup-5.4.0.20240606.exe(或最新版本)
  3. 运行安装程序,务必勾选安装中文语言包(Chinese Simplified)
  4. 安装完成后,按照安装程序的提示创建桌面快捷方式

详细安装说明请查看压缩包内的 安装说明.txt 文件

🔧 Tesseract OCR 详细安装指南

1
下载安装程序

访问 GitHub 下载页面,选择最新的 Windows 安装程序(.exe 文件)

2
运行安装程序

双击下载的 .exe 文件,按照提示进行安装

3
选择组件

重要!在安装组件页面,务必勾选以下语言包:
- English(默认已勾选)
- Chinese Simplified(简体中文)

4
完成安装

点击 "Install" 开始安装,安装完成后点击 "Finish"

5
设置环境变量

将 Tesseract 安装目录添加到系统环境变量 PATH 中:
1. 右键 "此电脑" → "属性" → "高级系统设置" → "环境变量"
2. 在 "系统变量" 中找到 "Path",双击编辑
3. 点击 "新建",添加 Tesseract 安装目录(如:C:\Program Files\Tesseract-OCR)
4. 点击确定保存,重启电脑

6
验证安装

打开命令提示符,输入:tesseract --version
如果显示版本信息,说明安装成功

常见问题与解决方案

问题 1:下载语言包时出现 "Download error"

解决方法:点击 "OK" 继续安装,安装完成后手动下载语言包:

  1. 访问 tessdata 仓库
  2. 下载需要的语言包:eng.traineddata 和 chi_sim.traineddata
  3. 将语言包复制到 Tesseract-OCR\tessdata 文件夹
问题 2:命令行提示 "tesseract 不是内部或外部命令"

解决方法:检查环境变量是否正确设置,确保 Tesseract 安装目录已添加到 PATH 中

问题 3:识别精度低

解决方法:

  • 确保图片清晰,光线充足
  • 使用高质量的扫描件
  • 确保已安装中文语言包