•  C# OCR 库

    适用于.NET的快速、精确且经济实惠的OCR库,您可以使用几行代码将扫描的PDF转换为可搜索的文档

     

    不仅仅是PDF。将JPEG、多页TIFF或PNG转换为可搜索的PDF到您的应用程序现在只需几分钟

    # 将扫描的PDF转换为可搜索的文档

    # 快速精确的基于神经网络的引擎

    # 纠正低质量扫描

    # 120多种语言

    # .Net 2.0+、.Net 5、标准、核心

     

     

     

    产品优势

    01

    阅读120多种语言的多种图像格式

    Tesseract.NET SDK可以准确识别120多种语言的文本,支持多语言文本,并且可以通过训练使用以前未知的语言。标准支持的有英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

    02

    正确的低质量扫描

    例如,去歪斜输入过滤器会自动旋转图像,因此它是正确的向上和正交的。如果页面过于倾斜,则Tesseract的线分割质量会显着降低,这会严重影响OCR的质量。

     

    Patagames OCR SDK内置的用于增强OCR性能的输入过滤器包括:二值化、对比度和对比度标准化、去偏斜、增强分辨率、腐蚀和扩张、膨胀和放气、反转、移除边框、旋转、ToGray和白色背景。

    03

    配备OCR功能的优秀方式

    Tesseract是优秀的OCR库,但Tesseract.NET SDK是为您的应用程序配备文本识别功能的优秀方式之一。

     

    Tesseract.Net SDK结合了易于部署、出色的识别精度、快速OCR和各种输出选项(包括PDF、HOCR、UNLV和纯文本),提供灵活简单的API以及许多高级和低级文本识别程序。

     

     

    TESSERACT.NET SDK 的主要特点

    01

    扫描的PDF到可搜索的PDF

    再也不会遇到有损或损坏的扫描文本。由增强的OCR算法提供支持TESSERACT.NET SDK即使在质量差或难以阅读的来源上也能提供精确的文本识别。

    02

    无与伦比的OCR准确性

    再也不会遇到有损或损坏的扫描文本。由增强的OCR算法提供支持TESSERACT.NET SDK即使在质量差或难以阅读的来源上也能提供精确的文本识别。

    03

    业内超快的识别

    该库将所有可用的CPU功率引导到识别任务,使您能够在更短的时间内接收准确的OCR输出。得益于优化的算法和强化训练,TESSERACT.NET SDK的整体性能轻松击败竞争对手。

    04

    阅读60多种语言

    TESSERACT.NET SDK可以准确识别60多种语言的文本,支持多语言文本,并且可以训练以使用以前未知的语言。标准支持的有英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

    05

    几分钟内可搜索的PDF

    只需4行代码,TESSERACT将其OCR引擎的所有功能倾注到您的应用程序中。多亏了它,将JPEG、TIFF或PNG转换为可搜索的PDF现在只需几分钟,而不是几小时或几天。

    06

    轻松部署

    TESSERACT.NET SDK不需要安装额外的软件,也不需要许可证服务器。您只需部署它并开始开发由可用于.NET平台的优秀的OCR引擎驱动的应用程序。

    07

    经济实惠的OCR库

    TESSERACT.NET SDK不仅比竞争解决方案便宜20-30倍,而且没有任何经常性费用、版税和基于订阅的成本。您只需购买许可证并终身使用。

    08

    支持异步读取

    我们有丰富的文档。本文档旨在让初学者和高级用户大致了解TESSERACT.NET SDK的功能。

     

    该文档包含1000多个详细的、面向开发人员的、MSDN风格的主题,包括概念概述、术语定义、解决方法和工作代码示例。

     

     

    识别二维码关注我们

    如果您有任何产品疑问,请随时向我们咨询:021—58996110或邮箱sales@51component.com

    我们会根据您的需求,提供相应的软件版本推荐


    识别二维码进入小程序

    一站式查询和采购平台