Tesseract OCRを使って3つの画像の文字を正しく認識できるか実験してみました。

(赤地に白)プレゼント員(惜しい!)
(黒地に白)レル2かさ(ぜんぜんダメ)
(白地に黒)プレゼント中(正しく認識できる)

白地の場合は正しく認識されましたが、黒地と赤地はうまくいきませんでした。黒地にいたっては全然ダメです。

そこで背景を白地に変換するにはどうすればいいかを考えます。

まず白黒にすることを考えましょう。

このサイトを参考にしました。

2値化して、1bppの白黒画像を作成する – .NET Tips (VB.NET,C#…)

白黒のビットマップはBitmapクラスのコンストラクタにPixelFormat.Format1bppIndexedを指定することで作成できます。しかし、

Bitmap srcBitmapを白黒化するとして

これはいいのですが、

コンパイルはできるのですが、実行すると例外が発生します。

これもコンパイルはできるのですが、実行すると例外が発生します。

1bppのBitmapに色を付けるには、Bitmap.LockBitsメソッドを使うしかありません。

白黒化するにはピクセルの色の明るさが設定した閾値を越えれば白くし、越えなければ黒くするという方法をとります。色の明るさはColor.GetBrightnessメソッドで取得できます。

リンク先の記事の丸写しではおもしろくないので、白黒反転もできるようにしました。

実験してみると赤のGetBrightnessを調べてみると0.5を超えているため、第二引数に0.5を指定すると、生成される画像は真っ白になります。適切な値に調整する必要があります(赤なら0.52以上にするとよい)。

これも実験してみました。

処理なし

なにも表示されない。

閾値50%で処理

当然、なにも表示されない。

閾値80%で処理

本日は5のつく日
EDZEI:生|
またはヤフーカード
ご利用額の+ %

閾値80%で処理して白黒反転

本日は5のつく日
PayPay残高
または ヤフーカード
ご利用額の+ %

白黒をはっきりさせたほうが精度はよくなります。また背景が黒の場合はあまりうまくいかないようです。