赛酷OCR是一款图片转WORD,图片提取文字,pdf转word并且是集文字识别、表格识别、公式识别于一体的办公软件,可直接识别扫描仪、数码相机、一体化机、拍照手机扫描的各类文档图像或PDF,并对识别结果进行版面重构,是国内首款网络OCR软件。个人感觉赛酷文档秘书软件非常不错.
赛酷功能介绍
1、首款基于互联网的OCR识别软件,拥有领先的中英文OCR识别技术。支持文字识别、表格2、识别、公式识别、局部图像插入
3、支持多种图像文件格式(BMP、JPG、TIF、多页TIF、PDF等)
4、支持宋、黑、楷、圆、仿宋等多种字体识别
5、支持所有扫描仪,支持数码相机微距拍摄的图片
6、复杂版面自动分析、自动倾斜校正、表格自动测定、公式人工辅助设定
7、支持识别文档重构,最大限度接近于原始图像版面结构
8、一键进入WORD/WPS
9、支持MATHTYPE,识别的数学公式可直接嵌入WORD/WPS,由MATHTYPE编辑修改
10、可由用户设定识别区域,设定竖版、单栏、图像、表格、公式局部定义
11、可去除印章,图像修正(擦除、连线、图像平衡)
12、在线专家支持,您在使用中的任何问题,都会得到迅速准确耐心的解答
赛酷使用说明
把图片转换成文字
(1)打开图像(例如打开SAMPLES里的文档照片1.JPG)
(2)点识别(打开的图像将被识别到软件的下部窗口)
(3)点插入(识别的文档将被插入到WORD中)
若是原图倾斜,可以点校正
赛酷其他功能
使用扫描仪扫描图像识别
在软件菜单里点“文件/选择扫描仪”,选择已安装的扫描仪,再点工具条中大扫描按钮,出现扫描窗口,
设置分辨率为300DPI,灰度图像或彩色图像模式,点扫描按钮,可将纸质文档扫入到软件中。“设置分辨率为
300DPI,灰度图像或彩色图像模式”非常重要,不适当的设置,会严重影响识别结果。
表格识别
如图像中含有表格,点布局按钮,可看到表格线(青色的线)被测定,如有表格线与文字粘连,则应将粘连的部分切割开,如有断线,可用工具中的画笔把断线连上。
公式识别
(1)安装好mathtype后首先要启动word,然后选择相信mathtype的宏
(2)在赛酷文档秘书中的设置里,其他选项中,点恢复mathtype默认初始设置
(3)要设置windows的默认输入方法为英文
用户圈选公式区域后,出现红色区域框,在区域内单击右键,弹出菜单,左键单击“公式”,区域框变成绿色,
即完成一个公式的选定 。以此类推,可以把文档中所有公式都选定后进行识别。
圈选公式时注意:
1,公式识别以单行公式为基础,对于方程组等,需一次把一个方程组圈选为一个公式
2,圈选公式要保证公式内容完全包含在公式区域内,防止公式内容丢失。
3,当文字和公式在同一行时,要避免把文字圈选到公式区域内,防止文字无法识别。
4,目前版本还不支持矩阵,行列式识别。