文字识别 | 腾讯云

tencent cloud

简介

文字识别（Optical Character Recognition，OCR），基于腾讯优图实验室世界领先的深度学习技术，将图片上的文字内容，智能识别成为可编辑的文本。支持身份证、名片等卡证类和票据类的印刷体识别，也支持运单等手写体识别，支持提供定制化服务，可以有效地代替人工录入信息。

特性

准确性高

腾讯云文字识别 OCR 可自动从图片中定位并识别字段，印刷体的平均准确率可达95%以上，手写体的识别平均准确率高达90%以上，鲁棒性强。

适用性高

腾讯优图实验室自研，涵盖了整个证件检测识别框架的所有核心算法，支持横向、竖向拍摄，适应透视畸变、光照不均、部分遮挡的情况，具备非常高的复杂环境可用性。

简单易用

腾讯云文字识别 OCR 除了可直接调用的全面的 API 接口，还提供了丰富多样的 SDK 供开发者使用，服务使用简单便捷，兼容性强。

功能

通用印刷体识别

支持图像整体文字的检测和识别，通用性较强：

支持多种语言的识别，包含中文、英文，日语、韩语、西班牙语、法语、德语、葡萄牙语等19种语言，且各种语言均支持与英文混合的文字识别。
自动检测语言类型，返回文本框坐标信息以及识别内容。
支持倾斜文本的自动旋转纠正。

通用印刷体识别（高精度版）

支持图像整体文字的检测和识别，具备更高的准确性：

通用印刷体识别（高精度版）支持中文、英文、中英文、数字和特殊字符号的识别，在通用印刷体识别的基础上，为您提供更高精度的文字识别服务。
支持复杂类型的文字识别，在文字较多、长串数字、小字、模糊字、倾斜文本等困难场景下，通用印刷体识别（高精度版）的准确率和召回率更高。

马来西亚身份证识别

支持马来西亚身份证识别，快速识别关键信息：

快速识别身份证文字信息并进行输出结构化字段，包括身份证号、姓名、性别、地址。
支持识别多种证件类型，包括MyKad （身份证）、MyPR （永居证）、MyTentera （军官证）、MyKAS （临时身份证）、POLIS （警察证）、IKAD （劳工证）。
具备护照人像照片的裁剪功能。
具备对翻拍证件照、复印证件照以及证件照被遮挡3种类型的告警功能。

中国香港身份证识别

支持中国香港身份证人像面识别，快速识别关键信息：

快速识别身份证文字信息并进行输出结构化字段，包含：中文姓名，英文姓名，姓名电码，出生日期，性别，首次签发日期，最近领用日期，身份证号。
提供是否属于永久性居民的判断，方便您进行归档。

护照识别

支持中国港澳台地区以及其他国家、地区的护照识别，提供详细准确的护照信息：

快速识别身份证文字信息并进行输出结构化字段，包括护照ID、姓名、出生日期、性别、有效期、发行国、国籍。
具备护照人像照片的裁剪功能。
具备对翻拍证件照、复印证件照以及证件照被遮挡3种类型的告警功能。

应用场景

用户身份认证

护照通行认证

文字违规识别

出版物图像转文本

金融行业身份识别

身份证识别可广泛应用在银行、保险、证券行业等需要验证用户身份的场景中，帮助减少用户的信息输入，提升效率，提高用户体验。

互联网行业身份识别

在视频直播或网约车场景中，可以通过身份证识别进行主播或乘客的身份认证，降低违规和犯罪风险。

出入境旅游护照识别

护照识别可以广泛应用在酒店、边防检查站、通关口岸、海关、机场、旅行社等场景，OCR技术可以帮助用户快速获得通行证明，提升用户体验。

教育行业护照识别

护照识别可应用于留学申请机构、学校等场景，OCR技术可以帮助机构快速获取学生身份信息，有助于减少人工的信息录入，提升效率。

电商广告图识别

在电商行业中，通用文字识别技术可以智能识别广告图中的文字信息，过滤广告中的违规文字，降低违规风险。

视频字幕识别

在各类视频场景中，通用文字识别技术可以快速识别视频中的字幕信息，有效地区分文字内容是否合规。

传统新闻媒体

通用文字识别技术可以将大量纸质文档转换成可编辑的文本，为文字排版、信息检索提供极大的便利。

出版物图片

通用文字识别技术可以将出版物的图像转成可编辑的文本，在出版物的归类、检索等方面，极大地降低人力投入成本。

定价

腾讯云文字识别采用后付费方式（月结）计费，每月接口调用总量达到某个阶梯后，所有调用量按该阶梯的单价进行计费，阶梯越高，单价越低。每月账单会在次月1-3日结算。更多定价描述详见计费概述。