知的情報システム学科張 暁華准教授が、「第19回先端画像技術国際会議(IWAIT2016)」において、Best Paper Awardを受賞しました!

本学情報学部知的情報システム学科張 暁華准教授が、韓国で開催された「第19回先端画像技術国際会議(IWAIT2016)」において、Best Paper Awardを受賞しました!

Best Paper Awardとは、国際会議で発表される論文の中から、特に優れた論文に贈られる賞です。今回は、172編の発表論文の中から、張准教授の論文を含む12編がBest Paper Awardに選ばれました。

受賞した論文では、文書画像にある不均一な陰影を除去し、素早くかつシンプルに、テキストストローク(文字の形をコンピュータ上で表現するデータ形式)を抽出する手法を提案しています。

  • 受賞論文タイトル
  • 不均一陰影を持った文書画像からのテキストストロークの快速抽出
    (Fast Restoration of Text Strokes from a Document Image with Uneven Shading)

  • 受賞者
  • 張 暁華(広島工業大学情報学部知的情報システム学科 准教授)
    謝 寧(同済大学 [中国])、黄 鶴鳴(青海師範大学 [中国])、辛 月蘭(青海師範大学 [中国])※以上3名は共同研究者

  • 論文概要
  • 文書画像の2値化(※1)は、文字認識や文書解析のための重要な前処理です。しかし、照明が十分に照らされないといった悪条件で撮影された文書画像の場合、画像に不均一な陰影が含まれてしまいます。この場合、文書画像から文字を抽出することが難しくなり、文字認識や文書解析ができなくなることがあります。
    そこで、今回新たな手法を設計し、提案しました。具体的な手法は以下のとおりです。

    まず、「定数時間重み付きメディアンフィルタ(※2)」を用いて画素ごとの局所的な陰影を推測します。
    次に、人間の脳が色や光をどのようにとらえるかをモデル化した「レティネックス理論」に基づいて陰影を除去することにより、画素ごとの反射率を計算します。
    さらに、画素を白か黒のいずれかに決定する通常の二者択一方式ではなく、分類に幅をもたせて、ある条件にあてはまるかどうかを判断する「バンドパスレスホールディング法」をこのたび新たに設計し、これを用いて、陰影除去後の画像を部分的に2値化します。
    最終的に、この方法で2値化されなかった画素を、画像コントラストマップとグラフカット手法(※3)を用いて分類します。

    論文発表に至るまでには、提案手法の有効性を確認するための実験を数多く行い、文字認識率は他の手法より高く、かつ実行時間が短いことを検証できました。

    今回の提案手法による文字認識率がさらに高まり、実用化が期待されます。


    ※1)濃淡のある画像を白と黒の2階調に変換する処理のこと
    ※2)フィルタのサイズに左右されることなく、特定の領域における濃度値を大きさ順に並べた時、その中央値を注目画素の濃度値とする手法
    ※3)画像から特定の領域のみ抽出する手法

第19回先端画像技術国際会議にて論文発表をする張先生。

第19回先端画像技術国際会議にて論文発表をする張先生。

表彰状とともに。「論文の内容を今は十分に理解できないかもしれませんが、画像処理に興味のある人は、ぜひ私のゼミで一緒に勉強しましょう」

表彰状とともに。「論文の内容を今は十分に理解できないかもしれませんが、画像処理に興味のある人は、ぜひ私のゼミで一緒に勉強しましょう」

張 暁華准教授

関連情報