文字認識ライブラリ
サーバーやWebアプリに文字認識機能を持たせたい
特殊文書(地図、図面、公図・地積図)の自動認識をしたい
隷書体やCADフォントのような特殊フォントの文書を認識したい

 マニュアル
 アプリケーション価格表
 ライブラリ価格表
 利用アルゴリズム

■特殊文書対応

縦書き横書きに加えて任意角度のテキストも自動認識可能
図面(機械、建築土木)地積図相続税路線価図住宅地図、コミック、 新聞、書籍、雑誌もOK

2022年のバージョンアップ内容

深層学習対応エンジンによって認識率大幅向上
32bit動作可能。GPU無しでの認識速度は100文字~200文字/秒を達成。
マルチスレッド処理可能。ノートPCで500文字/秒。デスクトップPCで1500文字/秒。
15,750のフォント画像パターン(データサイズ200GB超)で学習
旧エンジンとのハイブリッド処理が可能。今まで登録したユーザーパターンも利用可
学習機能(ユーザー文字登録)は瞬時に反映。
詳細は画面左の「トピックス」参照
グレイスケール/カラー対応 深層学習対応に伴ってグレイスケール/カラー画像にライブラリレベルで対応しました
機械学習言語辞書をさらに増強(18.9メガバイト→55.3メガバイト→99.5メガバイト) 専門用語辞書(専門用語等に強くなる辞書)を追加可能(数百語~数十万語まで)

2009年~2016年のバージョンアップ内容

新接触文字処理、 入れ子段落処理、 自動反転文字処理、 自動イタリック体認識、 罫線・アンダーライン接触文字処理、 3つのエンジンによる多数決高精度認識、 ngram言語辞書を3倍に増強(18.9メガバイト→55.3メガバイト)、 形態素解析用言語辞書を追加可能(数百語~数十万語まで)

テロップ文字認識

テロップ文字を認識するライブラリを提供します。
ニュース番組だけでなくバラエティ番組にも対応。
カラー文字、反転文字、縁取り文字など多様な文字表現に対応

多彩な段落指定

90度、180度回転したテキストも一発指定任意形状の段落指定など多彩な指定方法

充実した修正機能

ワンクリックで、縦書き横書き、文字種、イタリック体、段落サイズ変更+再認識

段落数無制限

数千~数万段落対応、A0地形図の1記号に1段落を割り当て可能

フォント識別(オプション)

明朝、ゴシック、丸ゴシック、教科書、楷書、CADフォント+フォント幅・サイズ識別

辞書コンパイラ(オプション)

任意のWindowsフォントから認識辞書作成可能