概要

ALPRIM Ver1.0は1999年10月にリリースされた、モノクロ文書画像処理ライブラリです。文書画像を処理するために必要な数多くの機能が提供されます。通常の文書画像の他に、図面、地図などテキストと画像が混在した複雑なレイアウトの文書画像にも対応することができます。Ver.1.0では、以下の機能が提供されます。
  1. 段落認識機能
    縦書き、横書き以外に360度あらゆる角度の斜めの行や段落も抽出することができます。新聞のような複雑なレイアウトが斜めに入力されていても、極めて高い精度で段落を抽出することができます。傾き自動測定、傾き補正機能も提供されています。

  2. 表認識機能
    破線枠の表、外枠の無い表、手書きの表、時刻表のように巨大な細かい表も処理することができます。プログラムのフローチャートや状態遷移表なども広義の表として処理することができます。

  3. 図形認識機能
    テキストの認識以外に、表枠、線図形、面図形、円といった基本的な図形を認識する機能もあります。
機能概要
こうした機能は、ライブラリで提供される以下の機能を用いて実現します。
  1. モノクロビットマップ画像をプリミティブに変換する機能
    4連結あるいは8連結で連結しているbit1あるいはbit0の領域をプリミティブと定義しています。通常のモノクロの文書画像は数万〜数十万個のプリミティブで表現することができます。
    プリミティブ
    4連結と8連結

  2. プリミティブの大きさ等の条件に合致する隣接するプリミティブをまとめてクラスタとして抽出する機能。
    クラスタ=テキスト段落として考えても問題有りません。
    「隣接」の定義は、プリミティブ間の距離などの複数のパラメータによってコントロールすることができるので段落以外のプリミティブ集合を自分で定義することもできます。
    クラスタ抽出

  3. クラスタを構成するプリミティブを囲む最小矩形を計算する機能
    角度を自動推定するバージョンと、あらかじめ指定するバージョンの二つの関数で提供しています。

  4. 表抽出機能
    1つ以上のクラスタを含む罫線で区切られた領域(表)を抽出する機能
    表の例
    表の例1単一のセルからなる表
    表の例2通常の表
    表の例3外枠のない表
    表の例4手書きの表
    表の例5これも表

  5. ユーザーが選択した一つ以上のプリミティブを255のレイヤに移動する機能。
    選択の方法として以下のものが提供されています。

    1. ユーザーが指定した長方形に完全に含まれるプリミティブを選択。
      枠に接触するプリミティブは選択されません。
      例1
    2. ユーザーが指定した長方形に接触するプリミティブを選択。
      枠に接触するプリミティブも選択されます。
      例2
    3. ユーザーが指定した矩形(斜めも含む)に完全に含まれるプリミティブを選択。
      枠に接触するプリミティブは選択されません。
      例3
    4. ユーザーが指定した矩形(斜めも含む)に接触するプリミティブを選択。
      枠に接触するプリミティブも選択されます。
      例4
    5. ユーザーが指定した直線に接触するプリミティブを選択。
      例5
    6. ユーザーが指定した直線に接触するプリミティブと、プリミティブが構成する外接矩形領域に含まれるプリミティブを選択。
      いわゆる直線によって1行の文字列を選択する機能に相当します。
      例6

  6. プリミティブの、面積、周囲長、重心の計算
    全てのプリミティブに対して、面積、周囲長、重心などの特徴を計算します。

  7. 特徴によるプリミティブの分類
    特徴の値の範囲によってプリミティブを分類します。
    図形自動分類機能

  8. 特定のレイヤのプリミティブを削除する機能

  9. 特定のレイヤのプリミティブを別レイヤに移動する機能
    たとえばテキストをレイヤ1へ移動してレイヤ1を削除すると、テキストに対応する画像だけを消去したビットマップが得られます。

  10. 特定のレイヤをビットマップ画像に逆変換する機能
    たとえばテキストをレイヤ1へ移動してレイヤ1をビットマップに逆変換すると、テキストに対応する画像だけのビットマップが得られます。
    画像のレイヤ分類

  11. 特定のレイヤの指定領域のビットマップ画像を任意倍率で取得する機能
    モノクロ画像で取得する関数と、255カラー画像で取得する関数の2種類を提供。レイヤ0〜255へ移動したプリミティブを、それぞれ異なるカラーで表示することができます。
    データ量はモノクロ画像のままで、255色擬似カラー画像を作ることもできます。
    擬似カラー画像

  12. 破線認識(新機能)
    文書画像の中から破線部分を分離して、別レイヤへ移動する機能

  13. 文書認識用パラメータ自動推定機能
    文書画像を認識するためのパラメータを自動的に推定する機能。 自動推定したパラメータを用いて段落を取り出すことができます。

  14. ラスタ編集機能
    プリミティブの削除、挿入、移動、切断が可能。文字画像を、認識した文字フォントの画像に置換する。 手書き線図形を真っ直ぐな直線に置換する。枠に接触した文字画像を切り離すなどの処理が可能となります。


特長

  1. 高速
    サポートCPUとして最低スペックのPentium 166MHzでも、A4、400dpiの画像から1秒以内でプリミティブ作成+クラスタ抽出。
    Pentium-M 1.5GHz(Pentium-4 2.2GHz相当)で、1秒間にA1、400dpi程度の密集した図面をプリミティブ変換
  2. 省メモリ
    元のビットマップ画像のデータを全く損なわずに全てをプリミティブ表現。
    プリミティブ変換した画像は、通常は元画像よりも少ないメモリで格納できます。
  3. 大型画像対応
    座標系は4バイト。A0長尺にも余裕で対応。
ユーザーズマニュアル

リファレンスマニュアル