软件开发

赛智(合肥)信息科技有限公司

地址1:安徽省合肥市高新区创新大道666号中科卫星空天产业基地13层

地址2:合肥市高新区望江西路800号合肥软件园一期A3栋401-404室

电话:0551-65318178 65326960

网址:www.ceresoft.com.cn

邮箱:ceresoft-hr@ceresoft.com.cn

 赛智通用文档表格处理系统

 系统概述
    《赛智通用文档表格处理系统》利用电子录入设备,如:扫描仪、传真机等,将普通的、非数字化的纸质文档和图表,输入到赛智文档表格处理系统中,使用赛智公司自主开发、具有国际领先水平的手写体字符识别引擎,进行大批量、多批次的海量识别,高效率地获得用户所需要的重要数据,然后直接输入各类ODBC兼容的数据库(如Access、SQL Server等),供进一步的数据统计、分析和挖掘。此系统可有效地处理目前较难识别的表格文件,可应用于各种手写体或印刷体填写的表格。它可以提高工作效率、节约成本、降低工作强度,将人员从繁杂的手工录入和数据统计分析中解脱出来。
    工作流程


    一、制定文档模板、建立系统环境
    根据客户表格数据的具体格式和需求,开发出OCR识别的脚本控件,并为该客户配置一套工作流系统。
    二、文档输入
    将客户表格扫描成图片,压缩加密后传输到数据处理中心,系统根据图片格式信息自动分图,并提供纠错功能。
    三、文档自动识别
    OCR引擎对模板图片进行自动识别,准确提取结构化文档或非结构化的动态表格文档中的内容。OCR引擎能自动对图像进行旋转、纠偏、去噪等图像增强处理,并提供字典功能对识别结果进行更准确的判断。
    四、人机结合校对
    录入工具将识别结果和原始图像进行对照,提供人工校对和录入,自动校对或双机录入校对等功能对数据进行处理。
    1、人工校对:提供界面对OCR结果中可信度较低的字段进行校对;
                进行人工双机录入校对;
    2、自动校对:提供各种水平/垂直公式自动校对;
                根据业务规则自动校对;
                根据客户提供的数据进行自动匹配校对;
    五、数据输出
    数据可以转换成客户需要的任意格式。XML/Excel/TXT/database或者其它指定格式。
    主要用户
   《赛智通用文档表格处理系统》特别适用于日常处理大量文字、数字和表格文件的政府部门、企事业单位,如:统计局、工商局、税务局、海关、银行、保险、医疗卫生、电信、运输等部门和行业。
    应用案例

Top↑