Tesseract OCR をWindowsにインストールして使う

Tesseract OCR をWindowsにインストールする方法 | ガンマソフト株式会社

を参考にしてTesseract OCR をWindowsにインストールしてみました。

ここまでは普通にすすめます。次が重要。

Additional script data(download)の項目を展開します。

Additional script data(download)の項目を展開したら、Japanese vertical scriptとJapanese scriptにチェックをいれます。

つぎに、Additional language data(download)の項目を展開します。

Additional language data(download)の項目を展開したら、Javanese、Japanese、Japanese(vertical)にチェックをいれます。

あとは特筆することはありません。Nextを押し続けるとインストールが始まります。おわったらNextをクリックします。

最後にFinishをクリックして完了です。

では実際に使ってみましょう。

コマンドラインで、D:\test.pngに保存している画像からテキストファイル D:\test.txtに出力するのであれば

C:\>"C:\Program Files\Tesseract-OCR\tesseract.exe" D:\test.png D:\test -l jpn

1	C:\>"C:\Program Files\Tesseract-OCR\tesseract.exe" D:\test.png D:\test -l jpn

出力先のテキストファイルの拡張子は不要です。-l jpnは日本語でという意味です。

前回やった

Tesseractを使って文字認識 C#でやってみる

とこれを使った場合では違いはあるでしょうか？

ややこちらのほうが精度がよいといえます。

つぎにC#で動かしてみましょう。

ProcessStartInfo pInfo = new ProcessStartInfo();
pInfo.FileName = 実行ファイルのパス;
pInfo.Arguments = 引数;
pInfo.UseShellExecute = true;
pInfo.WindowStyle = ProcessWindowStyle.Hidden;

Process p = Process.Start(pInfo);

ProcessStartInfo pInfo = new ProcessStartInfo();

pInfo.FileName = 実行ファイルのパス;

pInfo.Arguments = 引数;

pInfo.UseShellExecute = true;

pInfo.WindowStyle = ProcessWindowStyle.Hidden;

Process p = Process.Start(pInfo);

とやればC#から実行させることができます。引数は画像ファイルがある場所とテキストファイルの出力先です。半角スペースでつなげばいいのですが、パスのなかに半角スペースがある可能性もあるので

string arguments = String.Format("\"{0}\" \"{1}\"  -l jpn", filePath, outputPath);
pInfo.Arguments = arguments;

1 2	string arguments = String.Format("\"{0}\" \"{1}\" -l jpn", filePath, outputPath); pInfo.Arguments = arguments;

とやっています。

Process p = Process.Start(pInfo);

1	Process p = Process.Start(pInfo);

のあと、処理が終わるまで待つには

p.WaitForExit();

1	p.WaitForExit();

生成されたファイルを開いてテキストを読み出しています。

StreamReader sr = new StreamReader(outputPath + ".txt");
string str = sr.ReadToEnd();
sr.Close();

StreamReader sr = new StreamReader(outputPath + ".txt");

string str = sr.ReadToEnd();

sr.Close();

string GetText(string filePath)
{
    string tempFolder = Application.StartupPath + "\\text";

    // なければ作る
    if(! Directory.Exists(tempFolder))
        Directory.CreateDirectory(tempFolder);

    string outputPath = tempFolder + "\\output";

    ProcessStartInfo pInfo = new ProcessStartInfo();
    pInfo.FileName = @"C:\Program Files\Tesseract-OCR\tesseract.exe";
    string arguments = String.Format("\"{0}\" \"{1}\"  -l jpn", filePath, outputPath);
    pInfo.Arguments = arguments;
    pInfo.UseShellExecute = true;
    pInfo.WindowStyle = ProcessWindowStyle.Hidden;
    Process p = Process.Start(pInfo);

    p.WaitForExit();

    StreamReader sr = new StreamReader(outputPath + ".txt");
    string str = sr.ReadToEnd();
    sr.Close();
    return str;
}

string GetText(string filePath)

{

string tempFolder = Application.StartupPath + "\\text";

// なければ作る

if(! Directory.Exists(tempFolder))

Directory.CreateDirectory(tempFolder);

string outputPath = tempFolder + "\\output";

ProcessStartInfo pInfo = new ProcessStartInfo();

pInfo.FileName = @"C:\Program Files\Tesseract-OCR\tesseract.exe";

string arguments = String.Format("\"{0}\" \"{1}\" -l jpn", filePath, outputPath);

pInfo.Arguments = arguments;

pInfo.UseShellExecute = true;

pInfo.WindowStyle = ProcessWindowStyle.Hidden;

Process p = Process.Start(pInfo);

p.WaitForExit();

StreamReader sr = new StreamReader(outputPath + ".txt");

string str = sr.ReadToEnd();

sr.Close();

return str;

}

ドラッグするだけでWeb上の画像を保存できるようにする方法

の方法で画像を効率よく取得してGetTextメソッドで渡していけば文字起こしの作業も少しは楽になるかもしれません。

Tesseract OCR をWindowsにインストールして使う

関連記事

鳩でも分かるC#管理人からのお願い

コメントについて

管理人のモチベーションアップのために

コメントをどうぞ