tencent cloud

文字识别
支持印刷体、手写体及定制化场景的图片文字识别服务,有效提升信息录入效率
简介

文字识别(Optical Character Recognition,OCR),基于腾讯优图实验室世界领先的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。

特性
准确性高

腾讯云文字识别 OCR 可自动从图片中定位并识别字段,印刷体的平均准确率可达95%以上,手写体的识别平均准确率高达90%以上,鲁棒性强。

适用性高

腾讯优图实验室自研,涵盖了整个证件检测识别框架的所有核心算法,支持横向、竖向拍摄,适应透视畸变、光照不均、部分遮挡的情况,具备非常高的复杂环境可用性。

简单易用

腾讯云文字识别 OCR 除了可直接调用的全面的 API 接口,还提供了丰富多样的 SDK 供开发者使用,服务使用简单便捷,兼容性强。

功能
通用印刷体识别

支持图像整体文字的检测和识别,通用性较强:

  • 支持多种语言的识别,包含中文、英文,日语、韩语、西班牙语、法语、德语、葡萄牙语等19种语言,且各种语言均支持与英文混合的文字识别。
  • 自动检测语言类型,返回文本框坐标信息以及识别内容。
  • 支持倾斜文本的自动旋转纠正。
通用印刷体识别(高精度版)

支持图像整体文字的检测和识别,具备更高的准确性:

  • 通用印刷体识别(高精度版)支持中文、英文、中英文、数字和特殊字符号的识别,在通用印刷体识别的基础上,为您提供更高精度的文字识别服务。
  • 支持复杂类型的文字识别,在文字较多、长串数字、小字、模糊字、倾斜文本等困难场景下,通用印刷体识别(高精度版)的准确率和召回率更高。
马来西亚身份证识别

支持马来西亚身份证识别,快速识别关键信息:

  • 快速识别身份证文字信息并进行输出结构化字段,包括身份证号、姓名、性别、地址。
  • 支持识别多种证件类型,包括MyKad (身份证)、MyPR (永居证)、MyTentera (军官证)、MyKAS (临时身份证)、POLIS (警察证)、IKAD (劳工证)。
  • 具备护照人像照片的裁剪功能。
  • 具备对翻拍证件照、复印证件照以及证件照被遮挡3种类型的告警功能。
中国香港身份证识别

支持中国香港身份证人像面识别,快速识别关键信息:

  • 快速识别身份证文字信息并进行输出结构化字段,包含:中文姓名,英文姓名,姓名电码,出生日期,性别,首次签发日期,最近领用日期,身份证号。
  • 提供是否属于永久性居民的判断,方便您进行归档。
护照识别

支持中国港澳台地区以及其他国家、地区的护照识别,提供详细准确的护照信息:

  • 快速识别身份证文字信息并进行输出结构化字段,包括护照ID、姓名、出生日期、性别、有效期、发行国、国籍。
  • 具备护照人像照片的裁剪功能。
  • 具备对翻拍证件照、复印证件照以及证件照被遮挡3种类型的告警功能。
应用场景

金融行业身份识别

身份证识别可广泛应用在银行、保险、证券行业等需要验证用户身份的场景中,帮助减少用户的信息输入,提升效率,提高用户体验。


互联网行业身份识别

在视频直播或网约车场景中,可以通过身份证识别进行主播或乘客的身份认证,降低违规和犯罪风险。

出入境旅游护照识别

护照识别可以广泛应用在酒店、边防检查站、通关口岸、海关、机场、旅行社等场景,OCR技术可以帮助用户快速获得通行证明,提升用户体验。


教育行业护照识别

护照识别可应用于留学申请机构、学校等场景,OCR技术可以帮助机构快速获取学生身份信息,有助于减少人工的信息录入,提升效率。

电商广告图识别

在电商行业中,通用文字识别技术可以智能识别广告图中的文字信息,过滤广告中的违规文字,降低违规风险。


视频字幕识别

在各类视频场景中,通用文字识别技术可以快速识别视频中的字幕信息,有效地区分文字内容是否合规。

传统新闻媒体

通用文字识别技术可以将大量纸质文档转换成可编辑的文本,为文字排版、信息检索提供极大的便利。


出版物图片

通用文字识别技术可以将出版物的图像转成可编辑的文本,在出版物的归类、检索等方面,极大地降低人力投入成本。

定价

腾讯云文字识别采用后付费方式(月结)计费,每月接口调用总量达到某个阶梯后,所有调用量按该阶梯的单价进行计费,阶梯越高,单价越低。每月账单会在次月1-3日结算。更多定价描述详见计费概述