オプティカルキャラクターレコグニション

tencent cloud

概要

Optical Character Recognitionは、Tencent YouTuラボの世界先端のディープラーニング技術に基づき、画像にある文字内容を、編集可能なテキストに認識することです。身分証明書、名刺等証明書や帳票類の印刷体の認識、送り状等の筆記体の認識、及びカスタムサービスの提供をサポートしており、人工による情報入力を有効的に代替することが可能です。

特徴

高い正確性

Tencent Cloud Optical Character Recognition(OCR)は、自動的に画像からフィールドを特定し認識することができます。活字の平均認識精度は95%以上、手書き文字の平均認識精度は90%以上に達し、高い堅牢性を備えています。

幅広い適用範囲

Tencent Youtu Labが独自開発したもので、証明書の検出、認識フレームワークのすべてのコアアルゴリズムをカバーしています。水平・垂直方向の撮影をサポートし、遠近法の歪み、不均一な照明、部分的なオクルージョンといった状況に対応し、複雑な環境下でも非常に高い可用性を備えています。

使いやすくシンプル

OCRは、直接呼び出すことのできる包括的なAPIインターフェースに加えて、開発者向けにさまざまなSDKも数多く提供しています。サービスはシンプルで使いやすく、強力な互換性を備えています。

機能

汎用的な活字の認識

高い汎用性を備えた、画像と文字全体の検出および認識をサポートしています。

中国語、英語、日本語、韓国語、スペイン語、フランス語、ドイツ語、ポルトガル語など19言語を含む多言語認識をサポートし、さらにそれぞれの言語で英語混在の文字認識をサポートしています。
言語タイプを自動的に検出し、テキストボックスの座標情報と認識した内容を返すことができます。
傾いた文書の自動回転補正をサポートしています。

汎用的な活字の認識（高精度）

さらに高い正確性を備えた、画像と文字全体の検出および認識をサポートしています。

汎用的な活字の認識（高精度）は、中国語、英語、英語と中国語の混在、数字および特殊記号の認識をサポートし、汎用的な活字の認識に基づいて、より高精度な文字認識サービスを提供します。
複雑なタイプの文字認識をサポートしています。大量の文字数、長い文字列、小さな文字、不鮮明な文字、傾いた文書といった認識困難なシーンにおいて、汎用的な活字の認識（高精度）はより高い精度と再現率を発揮します。

マレーシアのID証明書の認識

マレーシアのIDの証明書の認識をサポートしており、重要な情報をすばやく認識できます。

ID証明書番号、氏名、性別、住所を含む、ID証明書の文字情報をすばやく認識し、構造化フィールドを出力します。
MyKad（ID証明書）、MyPR（永住者証明書）、MyTentera（士官証明書）、MyKAS（臨時ID証明書）、POLIS（警察証明書）、IKAD（労働者証明書）など、さまざまな証明書タイプの認識をサポートしています。
パスポート写真のトリミング機能を備えています。
複製、コピーされた証明写真および隠れた箇所がある証明写真といった3タイプに対するアラーム機能を備えています。

中国香港のID証明書の認識

中国香港のID証明書写真の認識をサポートしており、重要な情報をすばやく認識できます。

中国語氏名、英語氏名、氏名コード、生年月日、性別、初回発行日、直近の取得日、ID証明書番号を含む、ID証明書の文字情報をすばやく認識し、構造化フィールドを出力します。
永住者かどうかを判断して、整理・保管の利便性を向上させます。

パスポート認識

中国香港、マカオ、台湾地域およびその他の国と地域のパスポート認識をサポートして、詳細で正確なパスポート情報を提供します。

パスポートID、氏名、生年月日、性別、有効期間、発行国、国籍など、身分証明書の文字情報をすばやく認識し、構造化フィールドを出力します。
パスポート写真のトリミング機能を備えています。
複製、コピーされた証明写真および隠れた箇所がある証明写真といった3タイプに対するアラーム機能を備えています。

ユースケース

ユーザーの身分認証

パスポート認証

違法文字の認識

出版物画像のテキスト変換

金融業界における身分認識

ID証明書の認識は、銀行、保険、証券業界などユーザーの身元を検証する必要のあるシーンで幅広く応用されています。ユーザーによる情報入力の手間を省き、効率を高め、ユーザーエクスペリエンスの向上に役立ちます。

インターネット業界における身分認識

ライブブロードキャストやオンラインでのカーブッキングといったシーンでは、身分認識によりホストや乗客の身分認証を行い、違法行為や犯罪のリスクを低減することができます。

出入国時のパスポート認識

パスポート認識は、ホテル、国境検問所、通関港湾、税関、空港、旅行代理店などのシーンで幅広く応用されています。OCR技術は、ユーザーが通行証明書を速やかに取得するのに役立ち、ユーザーエクスペリエンスを向上させることができます。

教育業界におけるパスポート認識

パスポート認識は、留学申請機関や学校などのシーンで応用されています。OCR技術は、教育機関が学生の身元情報をすばやく取得できるように助け、手作業による情報入力を減らして効率アップに役立ちます。

Eコマース広告の画像認識

Eコマース業界においては、OCR技術によって、広告画像における文字情報をインテリジェントに認識し、広告の違法文字をフィルタリングして、違法リスクを低減することができます。

動画字幕の認識

OCR技術は、さまざまな動画シーンにおいて、動画の字幕情報をすばやく識別して、文字のコンテンツが準拠しているかどうかを効果的に判断することができます。

従来のニュースメディア

OCR技術は、大量の紙文書を編集可能なテキストに変換することができ、文字のレイアウトや情報検索に大きな利便性を提供します。

出版物画像

OCR技術は、出版物の画像を編集可能なテキストに変換することができ、出版物の分類や検索などの面で、人的コストを大幅に削減することができます。

料金

Tencent Cloud Optical Character Recognitionは、後払い（月次決済）課金方式を採用しています。 API呼び出しの月間合計がある段階に達すると、すべての呼び出しはその段階の単価で課金されます。段階が高くなるほど、単価は下がります。各月の計算書は翌月の1～3日に決済されます。定価の詳細については、課金の概要をご覧ください。