ABBYY FlexiCapture SDK
FlexiCapture SDK使软件开发人员能够快速创建从文档中提取含义的应用程序。 FlexiCapture SDK非常适合希望将强大的数据捕获功能集成到其解决方案中的系统集成商,RPA供应商和服务提供商。通过使用ABBYY的机器学习和AI,最终客户能够更快地处理更多交易,并减少错误,从而改善客户服务,降低成本并制定更明智的流程决策。
作为FlexiCapture平台的交付选件,FlexiCapture SDK为开发人员提供了强大而灵活的工具包,以平滑地集成ABBYY的行业领先的数据捕获技术,从而根据垂直市场的需求为其产品和服务提供支持。
主要特点
高质量的数据输出
FlexiCapture SDK采用屡获殊荣的 OCR 技术,并提供内置的验证规则,确保出色的数据准确性。
与应用程序紧密集成
FlexiCapture SDK使开发人员能够将数据捕获无缝集成到其应用程序中,并保持对文档处理,提取的数据和文档路由的完全控制。
简化的自动文档处理
为了实现高效率,FlexiCapture SDK提供了一套完整的技术和工具,可简化结构化和非结构化表单和文档的处理,包括数据校验,高级文档分类,通过反馈学习以及导出以进行后端处理和归档。
在熟悉的环境中编程
SDK API符合COM标准,可轻松用于C / C ++、Visual Basic、Java或任何其他支持COM组件的开发工具

主要功能
行业领先的技术
业界领先的OCR和全球最广泛的语言基础
ABBYY FlexiCapture SDK包含最新版本的ABBYY OCR / ICR技术。它为包括阿拉伯文、中文、日文和韩文在内的209种OCR语言提供了最佳的识别质量,以简化应用程序开发的本地化,使开发人员可以更轻松地满足全球客户的需求。
数据提取精度高
ABBYY FlexiCapture SDK为某些字段提供智能数据提取。该技术在文档中查找字段并分析它们周围的区域。为了提高结果,开发人员可以使用内置字段提取训练来更准确地定义结构化或半结构化文档页面上的字段和重复组的位置。培训在最终用户开始使用文档时立即开始。
通过反馈学习
FlexiCapture SDK使开发人员可以实施有关字段提取和分类技术的培训,以提高字段提取和分类的准确性。 该技术基于最终用户提供的反馈进行学习。该反馈可以收集在任何第三方组件中以进行校验,由开发人员实施,并且包含有关正确的视场区域(以训练场提取技术)和正确的图像类别(以训练分类技术)的信息。
图像增强和质量控制
现在,开发人员可以手动和自动改善图像,包括移动设备捕获的图像。该功能允许开发人员处理ID,保险单等文件的复杂背景。例如,可以应用以下图像校正:
也可以将预配置的图像增强配置文件应用于图像。
高级分类
高级文档分类可使用可通过API使用的预配置分类器,将传入文档分类为类别。分类技术具有高度的灵活性,可以用来区分
分类技术使用两种方法:
同时使用这两种方法可以实现最可靠的分类结果。
FlexiCapture SDK提供了API,可以从头开始训练分类器,并在应用程序内部使用经过训练的分类器来加速文档处理。
开箱即用的发票、收据和订单处理
发票、收据和订单处理自动化是用于实施到第三方系统中的最受欢迎的方案之一。 ABBYY FlexiCapture SDK提供了用于开箱即用的发票、收据和订单处理的API。它基于智能文档分析和字符识别技术,以透明、可管理、高效和自动化的数据捕获代替了劳动密集型数据输入任务。它包括预定义的设置,验证规则和专门为处理发票量身定制的高级数据库查找功能。该技术可以识别绝大多数发票、收据和订单上的数据字段,使用户可以立即开始处理。智能的基于反馈的学习技术可改进具有非标准布局的文件数据的提取。
FlexiCapture SDK为很多国家提供现成的发票、收据和订单项目。发票项目可以通过FlexiCapture开发人员软件包中的图形用户界面创建,也可以直接通过FlexiCapture SDK中的API创建
自然语言处理
最新发布的带有自然语言处理(NLP)的FlexiCapture SDK版本扩展了其捕获能力,将非结构化文档(如合同、租约、条款和协议)都包括在捕获范围中。您可以利用NLP技术,将更多需要手动输入数据的业务流程都推向以自动化的方式来处理,快速地从重要文档中提取数据并应用到业务程序中,大大节省了时间、金钱和人力。通过用户反馈的方式对NLP模型进行另外附加训练,提取数据的质量不断提升的同时也减少了文档验证的成本和时间。
无缝整合
基于API的设置
FlexiCapture SDK提供了两种创建项目的选项-使用FlexiCapture开发人员软件包中的图形用户界面或通过API。这在文档管理系统的开发中很重要,在该系统中,开发人员可能需要修改元数据,该元数据可以直接从其解决方案中提取并用于每个文档。拥有许多FlexiCapture项目的业务流程外包商可能需要自动调整特定字段的设置,而无需遍历每个项目。
多功能的解决方案
处理数字出生的文档
ABBYY FlexiCapture SDK可处理所有常用格式的办公文档。可以以相同的流程处理所有文档,而无需将图像格式与文本格式分开。 SDK支持DOC、DOCX、RTF、HTML、TXT和ODT格式的文本文档; XLS、XLSX和ODS表;以及PPT、PPTX和ODP中的演示。
任何环境支持
ABBYY FlexiCapture SDK支持虚拟机,容器(包括Docker容器)和公共云服务等所有现代环境,从而允许构建高度可扩展的解决方案,例如由容器编排器支持的基于云的Web服务。
广泛的代码样本库
广泛的代码示例库
开始使用FlexiCapture Engine的最快方法是通读帮助文件,并查看该软件随附的示例代码。全面的代码示例集说明了如何使用SDK进行编程。每个库部分都有代码片段,并附有有关如何执行相关任务的逐步说明。开发人员可以在他们的应用程序中使用重用示例代码来节省开发时间。
请求试用版
技术参数
系统要求
硬件
操作系统
经过测试的技术
储存器
- 用于处理单页文档 - 最小400 MB RAM,建议1 GB RAM
- 用于处理多页文档 - 最小1 GB RAM,建议使用1.5 GB RAM
硬盘空间
- 库安装为2 GB,程序操作为100 MB。处理多页文档时,每页需要额外的15MB。
- 另外,用于OfficeConverters模块的最大400 MB
其他需求
硬件
操作系统
经过测试的技术
硬盘空间
其他需求
兼容性
ABBYY FlexiCapture SDK 12适用于在ABBYY FlexiCapture 12 Release 2, Build 12.0.2.1356或更早版本中创建的项目。 保存在当前版本的ABBYY FlexiCapture SDK 12中的项目可用于ABBYY FlexiCapture 12 Release 2, Build 12.0.2.1356或更高版本。
开发工具
ABBYY FlexiCapture SDK应用程序编程接口符合COM标准,可以在C / C ++、Visual Basic、.NET或任何支持COM组件的开发工具中轻松使用。 SDK可以适用于VBS、JS和Perl./8/等脚本语言。
OCR
ABBYY FlexiCapture SDK 12可识别207种OCR语言,包括54种语言(标有×)with full built-in dictionary support, 153种语言没有词典支持,创建用具定义语言的工具。
自然语言
- 阿布哈兹语
- 阿迪格語
- 南非荷兰语
- 阿古尔语
- 阿尔巴尼亚语
- 阿尔泰语
- 阿拉伯语(沙特阿拉伯)×
- 亚美尼亚语 (东部)×
- 亚美尼亚语(格拉巴)×
- 亚美尼亚语(西部)×
- 阿瓦尔语
- 艾马拉语
- 阿塞拜疆语(西里尔)
- 阿塞拜疆语(拉丁)×
- 巴什基尔语×
- 巴斯克语
- 白俄罗斯语
- 本巴语
- 布莱克福特语
- 布列塔尼语
- 布哥图语
- 保加利亚语×
- 缅甸语
- 布里亚特语
- 加泰隆语×
- 宿雾语
- 查莫罗语
- 车臣语
- 简体中文
- 繁体中文
- 楚克其语
- 楚瓦什语
- 科西嘉语
- 克里米亚鞑靼语
- 克罗地亚语×
- 克罗语
- 捷克语×
- 丹麦语×
- 达尔格瓦语
- 东干语
- 丹麦语(荷兰)×
- 丹麦语(比利时)
- 英语×
- 爱斯基摩语(西里尔)
- 爱斯基摩语(拉丁)
- 爱沙尼亚语×
- 鄂温语
- 鄂温克语
- 法罗语
- 波斯语×
- 斐济语
- 芬兰语×
- 法语×
- 弗里西亚语
- 弗留利语
- 加告兹语
- 加利西亚语
- 干达语
- 格鲁吉亚语
- 德语(卢森堡)
- 德语(新的拼写规则)×
- 德语(旧的拼写规则)×
- 希腊语×
- 瓜拉尼语
- 哈尼语
- 豪萨语
- 夏威夷语
- 希伯来语×
- 匈牙利语×
- 冰岛语
- 印度尼西亚语×
- 印古什语
- 爱尔兰语
- 意大利语×
- 日语×
- 日语(现代)×
- 景颇语
- 卡巴尔达语
- 卡尔梅克语
- 恰伊-巴尔卡尔语
- 卡拉卡尔帕克语
- 卡舒比语
- 卡瓦语
- 哈萨克语
- 哈卡斯语
- 汉特语
- 吉库犹语
- 吉尔吉斯语
- 刚果语
- 朝鲜语×
- 韩国语(韩文字母)×
- 科尔雅克语
- 克佩勒语
- 库梅克语
- 库尔德语
- 拉克语
- 拉丁语×
- 拉脱维亚语×
- 拉脱维亚语(哥特式)×
- 列兹金语
- 立陶宛语×
- 卢巴语
- 马其顿语
- 马拉加斯语
- 马来语(马来西亚语)
- 马林凯语
- 马耳他语
- 曼西语
- 毛利语
- 马里语
- 玛雅语
- 苗语
- 米南卡堡语
- 莫霍克语
- 蒙古语
- 莫尔多瓦语
- 纳瓦特尔语
- 涅涅茨语
- 尼夫赫语
- 诺盖语
- 挪威语(博克马尔)×
- 挪威语(尼诺斯克)×
- 尼昂加语
- 奥克西当语
- 欧吉蓓语
- 旧式拼写英语×
- 旧式拼写法语×
- 旧式拼写德语×
- 旧式拼写意大利语×
- 古斯拉夫语×
- 旧式拼写西班牙语×
- 奥塞梯语
- 帕皮阿门托语
- 拼音
- 波兰语×
- 葡萄牙语×
- 葡萄牙语(巴西)×
- 克丘亚语
- 列托-罗曼斯语
- 罗马尼亚语×
- 罗马尼亚语(摩尔达维亚)
- 罗姆语
- 隆迪语
- 俄语×
- 俄语(旧式拼写)×
- 俄语(带重音)×
- 卢旺达语
- 萨米语
- 萨摩亚语
- 苏格兰盖尔语
- 塞尔库普语
- 塞尔维亚语(西里尔)
- 塞尔维亚语(拉丁)
- 修纳语
- 斯洛伐克语×
- 斯洛文尼亚语×
- 索马里语
- 索布语
- 索托语
- 西班牙语×
- 巽他語
- 斯瓦希利语
- 史瓦济语
- 瑞典语×
- 塔巴萨兰语
- 塔加洛语
- 塔希提语
- 塔吉克语
- 鞑靼语×
- 泰国语×
- 托克皮辛语
- 汤加语
- 茨瓦纳语
- 侗族语
- 土耳其语×
- 土库曼语(西里尔)
- 土库曼语(拉丁)
- 图瓦语
- 乌德穆尔特语
- 维吾尔语(西里尔)
- 维吾尔语(拉丁)
- 乌克兰语×
- 乌茲别克(西里尔)
- 乌茲别克(拉丁)
- 越南语×
- 威尔士语
- 沃洛夫语
- 科萨语
- 雅库特语
- 依地语
- 萨巴特克语
- 祖鲁语
人工语言
特殊语言
编程语言
发票,采购订单和收据的国家支持
下面列出的国家,所有必要的设置已经预先配置:
发票:
- 澳大利亚
- 匈牙利
- 西班牙
- 奥地利
- 波兰
- 法国
- 比利时
- 大不列颠
- 加拿大
- 意大利
- 荷兰
- 德国
- 爱尔兰
- 捷克共和国
- 新西兰
- 瑞士
- 日本
- 美国
订单
- 法国
- 德国
- 西班牙
- 美国
收据:
- 澳大利亚
- 奥地利
- 加拿大
- 芬兰
- 法国
- 德国
- 英国
- 意大利
- 荷兰
- 波兰
- 俄罗斯
- 新加坡
- 西班牙
- 瑞典
- 瑞士
- 土耳其
- 美国
支持的图像格式(打开、保存)
Format | Extension | Input | Export |
---|---|---|---|
PDF (Version 1.7 or earlier), including PDF/Archive (PDF/A) |
✓ | ✓ | |
BMP: uncompressed black and white, uncompressed gray, uncompressed color |
bmp | ✓ | ✖ |
DCX, PCX: 2-bit – black and white 4- and 8-bit – gray TrueColor |
dcx, pcx | ✓ | ✓ |
PNG: black and white, gray, color |
png | ✓ | ✓ |
JPEG 2000: gray, 8-bit color, RGB or YCC colorspace, 8 bit per channel color, encoded using 8-bit palette in RGB colorspace |
jp2, jpc | ✓ | ✓ |
JPEG: gray, color |
jpg, jpeg, jfif | ✓ | ✓ |
TIFF: black and white – uncompressed, CCITT4, Packbits, ZIP, LZW gray – uncompressed, Packbits, JPEG, ZIP, LZW TrueColor – uncompressed, JPEG, ZIP, LZW Palette – uncompressed, Packbits, ZIP multi image TIFF |
tif, tiff | ✓ | ✓ |
GIF: black and white – LZW-compressed gray – LZW-compressed TrueColor – LZW-compressed |
gif | ✓ | ✖ |
DjVu: black and white, gray, color |
djvu, djv | ✓ | ✖ |
JBIG2 | jb2 | ✓ | ✖ |
WDP | Wdp | ✓ | ✖ |
支持的文档保存格式
ABBYY FineReader Engine可以使用以下格式保存已识别的文本:
- Australia Post
- Aztec
- Codabar
- Codabar with checksum
- Code 128
- Code 32
- Code 39
- Code 93
- DataMatrix
- EAN 13
- EAN 8
- IATA 2 of 5
- Industrial 2 of 5
- Intelligent Mail
- Interleaved 2 of 5
- Interleaved 2 of 5 with checksum
- Matrix 2 of 5
- Patch
- PDF417
- Postnet
- QR Code
- UCC-128
- UPC-Az
- UPC-E