帮助中心
Flexicapture Sdk
Benefits 175B 01

高质量的数据输出

FlexiCapture SDK采用屡获殊荣的 OCR 技术,并提供内置的验证规则,确保出色的数据准确性。

Benefits 175B 02

与应用程序紧密集成

FlexiCapture SDK使开发人员能够将数据捕获无缝集成到其应用程序中,并保持对文档处理,提取的数据和文档路由的完全控制。

Benefits 175B 03

简化的自动文档处理

为了实现高效率,FlexiCapture SDK提供了一套完整的技术和工具,可简化结构化和非结构化表单和文档的处理,包括数据校验,高级文档分类,通过反馈学习以及导出以进行后端处理和归档。

Benefits 175B 04

在熟悉的环境中编程

SDK API符合COM标准,可轻松用于C / C ++、Visual Basic、Java或任何其他支持COM组件的开发工具

快速启动指南

ABBYY FlexiCapture SDK快速启动指南

img not found

ABBYY FlexiCapture SDK→主要功能

主要功能

行业领先的技术

业界领先的OCR和全球最广泛的语言基础

ABBYY FlexiCapture SDK包含最新版本的ABBYY OCR / ICR技术。它为包括阿拉伯文、中文、日文和韩文在内的209种OCR语言提供了最佳的识别质量,以简化应用程序开发的本地化,使开发人员可以更轻松地满足全球客户的需求。

数据提取精度高

ABBYY FlexiCapture SDK为某些字段提供智能数据提取。该技术在文档中查找字段并分析它们周围的区域。为了提高结果,开发人员可以使用内置字段提取训练来更准确地定义结构化或半结构化文档页面上的字段和重复组的位置。培训在最终用户开始使用文档时立即开始。

通过反馈学习

FlexiCapture SDK使开发人员可以实施有关字段提取和分类技术的培训,以提高字段提取和分类的准确性。 该技术基于最终用户提供的反馈进行学习。该反馈可以收集在任何第三方组件中以进行校验,由开发人员实施,并且包含有关正确的视场区域(以训练场提取技术)和正确的图像类别(以训练分类技术)的信息。

图像增强和质量控制

现在,开发人员可以手动和自动改善图像,包括移动设备捕获的图像。该功能允许开发人员处理ID,保险单等文件的复杂背景。例如,可以应用以下图像校正:

  • 自动校正分辨率
  • 将图像的分辨率覆盖为指定的分辨率
  • 基于黑色分隔符,黑色正方形或文本的图像歪斜角校正
  • 将图像转换为黑白
  • 图像的旋转,反转和镜像
  • 降低ISO噪点
  • 去除色标和垃圾
  • 自动裁剪图像

也可以将预配置的图像增强配置文件应用于图像。

高级分类

高级文档分类可使用可通过API使用的预配置分类器,将传入文档分类为类别。分类技术具有高度的灵活性,可以用来区分

  • 单据类型,如发票,银行对帐单,税表,索赔等。
  • 文档类型内的文档变化,例如来自不同供应商的发票
  • 文档边界,例如每种类型的文档的第一页和后续页

分类技术使用两种方法:

  • 图像分类利用卷积神经网络,并在视觉上不同的文档之间进行区分。
  • 文本分类依赖于统计和语义文本分析,并且需要OCR

同时使用这两种方法可以实现最可靠的分类结果。

FlexiCapture SDK提供了API,可以从头开始训练分类器,并在应用程序内部使用经过训练的分类器来加速文档处理。

开箱即用的发票、收据和订单处理

发票、收据和订单处理自动化是用于实施到第三方系统中的最受欢迎的方案之一。 ABBYY FlexiCapture SDK提供了用于开箱即用的发票、收据和订单处理的API。它基于智能文档分析和字符识别技术,以透明、可管理、高效和自动化的数据捕获代替了劳动密集型数据输入任务。它包括预定义的设置,验证规则和专门为处理发票量身定制的高级数据库查找功能。该技术可以识别绝大多数发票、收据和订单上的数据字段,使用户可以立即开始处理。智能的基于反馈的学习技术可改进具有非标准布局的文件数据的提取。

FlexiCapture SDK为很多国家提供现成的发票、收据和订单​项目。发票项目可以通过FlexiCapture开发人员软件包中的图形用户界面创建,也可以直接通过FlexiCapture SDK中的API创建

支持国家的完整列表可以在这里找到 ›

自然语言处理

最新发布的带有自然语言处理(NLP)的FlexiCapture SDK版本扩展了其捕获能力,将非结构化文档(如合同、租约、条款和协议)都包括在捕获范围中。您可以利用NLP技术,将更多需要手动输入数据的业务流程都推向以自动化的方式来处理,快速地从重要文档中提取数据并应用到业务程序中,大大节省了时间、金钱和人力。通过用户反馈的方式对NLP模型进行另外附加训练,提取数据的质量不断提升的同时也减少了文档验证的成本和时间。

高性能与快速响应

通过创建并行运行在不同进程上的处理器池,我们可以改进服务器应用程序的性能和响应能力。客户端请求由不同的 CPU 核心独立处理,无须在队列中等待,服务器应用程序因此响应更快。另外,单一长任务拆分成多个小任务并行处理,能够合理利用多核 CPU 的运行能力,从而提高性能。

无缝整合

基于API的设置

FlexiCapture SDK提供了两种创建项目的选项-使用FlexiCapture开发人员软件包中的图形用户界面或通过API。这在文档管理系统的开发中很重要,在该系统中,开发人员可能需要修改元数据,该元数据可以直接从其解决方案中提取并用于每个文档。拥有许多FlexiCapture项目的业务流程外包商可能需要自动调整特定字段的设置,而无需遍历每个项目。

开发者套餐

为了简化数据捕获过程的初始设置,分布式开发人员将与FlexiCapture 12 SDK一起使用FlexiCapture 12开发人员软件包。它包括FlexiCapture项目设置站和FlexiLayout Studio。开发人员软件包可用于设置FlexiCapture项目,以便在FlexiCapture SDK中进一步使用。在FlexiCapture开发人员软件包中创建并随FlexiCapture SDK一起提供的所有FlexiCapture项目都可以在FlexiCapture SDK中使用,反之亦然。

多功能的解决方案

捕获不同类型文档的数据

ABBYY FlexiCapture SDK提供了用于从固定格式以及半结构化和非结构化文档中提取数据的工具。所有必需的数据字段都可以快速找到并以适当的格式提取。

处理数字出生的文档

ABBYY FlexiCapture SDK可处理所有常用格式的办公文档。可以以相同的流程处理所有文档,而无需将图像格式与文本格式分开。 SDK支持DOC、DOCX、RTF、HTML、TXT和ODT格式的文本文档; XLS、XLSX和ODS表;以及PPT、PPTX和ODP中的演示。

任何环境支持

ABBYY FlexiCapture SDK支持虚拟机,容器(包括Docker容器)和公共云服务等所有现代环境,从而允许构建高度可扩展的解决方案,例如由容器编排器支持的基于云的Web服务。

灵活的出口选择

使用FlexiCapture导出选项,可以管理输出文件的大小和质量,以在数据存储策略中实现最大效率。

导出选项包括将所有相关数据保存到后端应用程序中,以及将分析后的文档转换为可搜索的PDF或PDF / A格式以进行存档的功能。数据捕获技术将数据导出到结构化格式(例如XML或CSV)或其他存储位置。对于某些格式,还可以保存原始文档的图像,以便在需要时易于查找和比较。

广泛的代码样本库

 

广泛的代码示例库

开始使用FlexiCapture Engine的最快方法是通读帮助文件,并查看该软件随附的示例代码。全面的代码示例集说明了如何使用SDK进行编程。每个库部分都有代码片段,并附有有关如何执行相关任务的逐步说明。开发人员可以在他们的应用程序中使用重用示例代码来节省开发时间。

  • 入门: 如果这是你第一次使用 ABBYY FlexiCapture 引擎,想知道如何识别文档并导出识别结果,那么从这里开始阅读最合适
  • 开发 web 服务: 开发数据采集方案,然后以 web 服务的形式提供。
  • 使用高级技术: 适合 ABBYY FlexiCapture SDK的高级用户,你可以了解到如何创建、编辑文档定义,如何预处理图像,以及如何扫描。
  • 在脚本语言中使用 FlexiCapture SDK: 教你如何在脚本语言中使用 ABBYY FlexiCapture SDK。
  • 实现常见的处理场景: 你可以在这里找到各种技巧,教你如何实现常见的处理场景,比如自定义图像源、浏览已识别的文档,又或是实现已识别数据的存储。
  • 有效利用高性能计算机的资源: 教你在程序中使用 ABBYY FlexiCapture 引擎创建多线程服务器应用。

ABBYY FlexiCapture SDK→主要功能

技术参数

系统要求

硬件

配备x86兼容处理器(1GHz或更高)的PC

操作系统

与最新的Service Pack兼容:
  • Windows Server 2019, 2016, 2012, 2008 R2
  • Windows 10, 8.1

经过测试的技术

云计算平台:
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
虚拟环境
  • Microsoft Hyper-V Server 2008, 2008 R2 SP1, 2012, 2012 R2, 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware: ESXi 6.5, Workstation Player 12.5, Workstation Pro 14.0.0
ABBYY FlexiCapture SDK也可以在支持的平台上的Docker容器中运行。Java开发套件Oracle Java SE Development Kit 12.0.1, 11.0.3, 8u212, 8u211

储存器

  • 用于处理单页文档 - 最小400 MB RAM,建议1 GB RAM
  • 用于处理多页文档 - 最小1 GB RAM,建议使用1.5 GB RAM

硬盘空间

  • 库安装为2 GB,程序操作为100 MB。处理多页文档时,每页需要额外的15MB。
  • 另外,用于OfficeConverters模块的最大400 MB

其他需求

  • TWAIN兼容的扫描仪、数码相机或传真调制解调器,用于扫描或图像导入
  • 用于模式训练、字典编辑,通过GUI扫描:视频卡和监视器(最小分辨率1024×768)
  • 键盘、鼠标或其他输入设备
  • 应该可以从工作站访问以下注册表分支:
    • "HKEY_CURRENT_USER\Software\ABBYY\SDK\12\FlexiCapture Engine" — full control
    • "HKEY_CURRENT_USER\Software\ABBYY\SDK\12" — full control for installation only
    • "HKEY_LOCAL_MACHINE\Software\ABBYY\SDK\12" — full control for installation only
  • 应该可以从工作站访问以下文件夹:
    • Folder with ABBYY FlexiCapture Engine binary files — access for reading
    • Folder %TEMP% — full control access
    • Folder %ProgramData%\ABBYY\SDK\12\FlexiCapture Engine — full control access
    • Folder %ProgramData%\ABBYY\SDK\12\Licenses — full control access
  • 应安装以下组件:
    • .NET mework 4.5
    • Microsoft Internet Explorer 8.0或更高版本

硬件

配备x86兼容处理器(1GHz或更高)的PC

操作系统

  • Windows Server 2016, 2012, 2008 R2
  • Windows 10, 8.1

经过测试的技术

虚拟环境:
  • Microsoft Hyper-V Server 2008, 2008 R2 SP1, 2012, 2012 R2, 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware: ESXi 6.5, Workstation Player 12.5, Workstation Pro 14.0.0
ABBYY FlexiCapture SDK也可以在支持的平台上的Docker容器中运行。

硬盘空间

25 MB的可用硬盘空间

其他需求

  • 文件夹 %ProgramData%\ABBYY\SDK\12\Licenses — 完全控制访问
  • 对于激活/停用许可证:
    • 目的地址: http://registration2.abbyy.com
    • 港口: 80
    • Protocol: http
  • 如果使用代理服务器,VPN或拨号连接,则必须在Internet Explorer设置中自定义:工具-Internet选项-连接

兼容性

ABBYY FlexiCapture SDK 12适用于在ABBYY FlexiCapture 12 Release 2, Build 12.0.2.1356或更早版本中创建的项目。 保存在当前版本的ABBYY FlexiCapture SDK 12中的项目可用于ABBYY FlexiCapture 12 Release 2, Build 12.0.2.1356或更高版本。

开发工具

ABBYY FlexiCapture SDK应用程序编程接口符合COM标准,可以在C / C ++、Visual Basic、.NET或任何支持COM组件的开发工具中轻松使用。 SDK可以适用于VBS、JS和Perl./8/等脚本语言。

OCR

ABBYY FlexiCapture SDK 12可识别207种OCR语言,包括54种语言(标有×)with full built-in dictionary support, 153种语言没有词典支持,创建用具定义语言的工具。

自然语言

  • 阿布哈兹语
  • 阿迪格語
  • 南非荷兰语
  • 阿古尔语
  • 阿尔巴尼亚语
  • 阿尔泰语
  • 阿拉伯语(沙特阿拉伯)×
  • 亚美尼亚语 (东部)×
  • 亚美尼亚语(格拉巴)×
  • 亚美尼亚语(西部)×
  • 阿瓦尔语
  • 艾马拉语
  • 阿塞拜疆语(西里尔)
  • 阿塞拜疆语(拉丁)×
  • 巴什基尔语×
  • 巴斯克语
  • 白俄罗斯语
  • 本巴语
  • 布莱克福特语
  • 布列塔尼语
  • 布哥图语
  • 保加利亚语×
  • 缅甸语
  • 布里亚特语
  • 加泰隆语×
  • 宿雾语
  • 查莫罗语
  • 车臣语
  • 简体中文
  • 繁体中文
  • 楚克其语
  • 楚瓦什语
  • 科西嘉语
  • 克里米亚鞑靼语
  • 克罗地亚语×
  • 克罗语
  • 捷克语×
  • 丹麦语×
  • 达尔格瓦语
  • 东干语
  • 丹麦语(荷兰)×
  • 丹麦语(比利时)
  • 英语×
  • 爱斯基摩语(西里尔)
  • 爱斯基摩语(拉丁)
  • 爱沙尼亚语×
  • 鄂温语
  • 鄂温克语
  • 法罗语
  • 波斯语×
  • 斐济语
  • 芬兰语×
  • 法语×
  • 弗里西亚语
  • 弗留利语
  • 加告兹语
  • 加利西亚语
  • 干达语
  • 格鲁吉亚语
  • 德语(卢森堡)
  • 德语(新的拼写规则)×
  • 德语(旧的拼写规则)×
  • 希腊语×
  • 瓜拉尼语
  • 哈尼语
  • 豪萨语
  • 夏威夷语
  • 希伯来语×
  • 匈牙利语×
  • 冰岛语
  • 印度尼西亚语×
  • 印古什语
  • 爱尔兰语
  • 意大利语×
  • 日语×
  • 日语(现代)×
  • 景颇语
  • 卡巴尔达语
  • 卡尔梅克语
  • 恰伊-巴尔卡尔语
  • 卡拉卡尔帕克语
  • 卡舒比语
  • 卡瓦语
  • 哈萨克语
  • 哈卡斯语
  • 汉特语
  • 吉库犹语
  • 吉尔吉斯语
  • 刚果语
  • 朝鲜语×
  • 韩国语(韩文字母)×
  • 科尔雅克语
  • 克佩勒语
  • 库梅克语
  • 库尔德语
  • 拉克语
  • 拉丁语×
  • 拉脱维亚语×
  • 拉脱维亚语(哥特式)×
  • 列兹金语
  • 立陶宛语×
  • 卢巴语
  • 马其顿语
  • 马拉加斯语
  • 马来语(马来西亚语)
  • 马林凯语
  • 马耳他语
  • 曼西语
  • 毛利语
  • 马里语
  • 玛雅语
  • 苗语
  • 米南卡堡语
  • 莫霍克语
  • 蒙古语
  • 莫尔多瓦语
  • 纳瓦特尔语
  • 涅涅茨语
  • 尼夫赫语
  • 诺盖语
  • 挪威语(博克马尔)×
  • 挪威语(尼诺斯克)×
  • 尼昂加语
  • 奥克西当语
  • 欧吉蓓语
  • 旧式拼写英语×
  • 旧式拼写法语×
  • 旧式拼写德语×
  • 旧式拼写意大利语×
  • 古斯拉夫语×
  • 旧式拼写西班牙语×
  • 奥塞梯语
  • 帕皮阿门托语
  • 拼音
  • 波兰语×
  • 葡萄牙语×
  • 葡萄牙语(巴西)×
  • 克丘亚语
  • 列托-罗曼斯语
  • 罗马尼亚语×
  • 罗马尼亚语(摩尔达维亚)
  • 罗姆语
  • 隆迪语
  • 俄语×
  • 俄语(旧式拼写)×
  • 俄语(带重音)×
  • 卢旺达语
  • 萨米语
  • 萨摩亚语
  • 苏格兰盖尔语
  • 塞尔库普语
  • 塞尔维亚语(西里尔)
  • 塞尔维亚语(拉丁)
  • 修纳语
  • 斯洛伐克语×
  • 斯洛文尼亚语×
  • 索马里语
  • 索布语
  • 索托语
  • 西班牙语×
  • 巽他語
  • 斯瓦希利语
  • 史瓦济语
  • 瑞典语×
  • 塔巴萨兰语
  • 塔加洛语
  • 塔希提语
  • 塔吉克语
  • 鞑靼语×
  • 泰国语×
  • 托克皮辛语
  • 汤加语
  • 茨瓦纳语
  • 侗族语
  • 土耳其语×
  • 土库曼语(西里尔)
  • 土库曼语(拉丁)
  • 图瓦语
  • 乌德穆尔特语
  • 维吾尔语(西里尔)
  • 维吾尔语(拉丁)
  • 乌克兰语×
  • 乌茲别克(西里尔)
  • 乌茲别克(拉丁)
  • 越南语×
  • 威尔士语
  • 沃洛夫语
  • 科萨语
  • 雅库特语
  • 依地语
  • 萨巴特克语
  • 祖鲁语

人工语言

世界语
国际语
伊多语
西方国际语

特殊语言

CMC7
OCR-A
E13B
OCR-B

编程语言

Basic
COBOL
Fortran
JAVA
C/C++
Pascal

发票,采购订单和收据的国家支持

下面列出的国家,所有必要的设置已经预先配置:

发票:

  • 澳大利亚
  • 匈牙利
  • 西班牙
  • 奥地利
  • 波兰
  • 法国
  • 比利时
  • 大不列颠
  • 加拿大
  • 意大利
  • 荷兰
  • 德国
  • 爱尔兰
  • 捷克共和国
  • 新西兰
  • 瑞士
  • 日本
  • 美国

订单

  • 法国
  • 德国
  • 西班牙
  • 美国

收据:

  • 澳大利亚
  • 奥地利
  • 加拿大
  • 芬兰
  • 法国
  • 德国
  • 英国
  • 意大利
  • 荷兰
  • 波兰
  • 俄罗斯
  • 新加坡
  • 西班牙
  • 瑞典
  • 瑞士
  • 土耳其
  • 美国

支持的图像格式(打开、保存)

Format Extension Input Export
PDF
(Version 1.7 or earlier), including PDF/Archive (PDF/A)
pdf
BMP:
uncompressed black and white,
uncompressed gray,
uncompressed color
bmp
DCX, PCX:
2-bit – black and white
4- and 8-bit – gray
TrueColor
dcx, pcx
PNG:
black and white, gray, color
png
JPEG 2000:
gray, 8-bit
color, RGB or YCC colorspace, 8 bit per channel
color, encoded using 8-bit palette in RGB colorspace
jp2, jpc
JPEG:
gray, color
jpg, jpeg, jfif
TIFF:
black and white – uncompressed, CCITT4, Packbits, ZIP, LZW
gray – uncompressed, Packbits, JPEG, ZIP, LZW
TrueColor – uncompressed, JPEG, ZIP, LZW
Palette – uncompressed, Packbits, ZIP
multi image TIFF
tif, tiff
GIF:
black and white – LZW-compressed
gray – LZW-compressed
TrueColor – LZW-compressed
gif
DjVu:
black and white, gray, color
djvu, djv
JBIG2 jb2
WDP Wdp

支持的文档保存格式

ABBYY FineReader Engine可以使用以下格式保存已识别的文本:

  • Microsoft Office Excel Workbook (*.XLS)
  • DBase file (*.DBF)
  • Comma Separated Values File (*.CSV)
  • Simple text (*.TXT)
  • XML Document (*.XML)
  • Australia Post
  • Aztec
  • Codabar
  • Codabar with checksum
  • Code 128
  • Code 32
  • Code 39
  • Code 93
  • DataMatrix
  • EAN 13
  • EAN 8
  • IATA 2 of 5
  • Industrial 2 of 5
  • Intelligent Mail
  • Interleaved 2 of 5
  • Interleaved 2 of 5 with checksum
  • Matrix 2 of 5
  • Patch
  • PDF417
  • Postnet
  • QR Code
  • UCC-128
  • UPC-Az
  • UPC-E

请求试用版