📖 OCRReader とは?
OCRReader は、画像ファイルからテキストを抽出する Windows 向けコマンドラインツールです。Windows 10/11 に標準搭載されている高精度な OCR エンジンを活用し、日本語・英語の文字認識を高速に実行します。
⚡
高速処理
Windows 標準 OCR で素早くテキスト化
📄
JSON 出力
座標情報付きで構造化データとして保存
🔄
ChatAI 連携
AI と組み合わせて業務自動化
💾 インストール方法
-
ダウンロード
上部の「OCRReader をダウンロード」ボタンから ocrreader.zip をダウンロード
-
解凍
ダウンロードした ocrreader.zip を任意のフォルダに解凍
-
完了
OcrReader.exe が使用可能になります。追加のインストールは不要です。
注意: Windows 10 バージョン 1903 以降、または Windows 11 が必要です。OCR エンジンは Windows 標準機能を使用します。
🚀 基本的な使い方
起動方法
OcrReader.exe [画像ファイルパス]
使用例 1: 単純な OCR 実行
OcrReader.exe document.png
画像を読み込みました: document.png
OCR エンジン: 日本語
OCR 結果を出力しました: document.json
検出されたテキスト行数: 42
使用例 2: 絶対パス指定
OcrReader.exe C:\Documents\invoice.png
使用例 3: バッチ処理で複数画像を処理
for %%f in (*.png) do (
echo 処理中: %%f
OcrReader.exe "%%f"
)
echo すべての画像の処理が完了しました
出力される JSON の構造
{
"Text": "画像全体から抽出されたテキスト",
"TextAngle": 0,
"Lines": [
{
"Text": "1行目のテキスト",
"Words": [
{
"Text": "単語",
"BoundingRect": {
"X": 100,
"Y": 50,
"Width": 80,
"Height": 30
}
}
]
}
]
}
🖼️ 対応画像形式
| 形式 |
拡張子 |
推奨用途 |
| PNG |
.png |
スクリーンショット、テキスト画像 |
| JPEG |
.jpg, .jpeg |
写真、スキャン画像 |
| BMP |
.bmp |
Windows ペイント画像 |
| TIFF |
.tif, .tiff |
高品質スキャン画像 |
ヒント: OCR 精度を向上させるには、高解像度(300 DPI 以上)で、コントラストが明瞭な画像を使用してください。
実践例: 請求書を OCR → AI で CSV 化
OcrReader.exe invoice.png
(
echo 以下はOCRで読み取った請求書のJSONデータです。
echo このデータから以下の情報を抽出し、CSV形式で出力してください:
echo 発行日,請求番号,請求元会社名,請求先会社名,小計,消費税,合計金額
echo.
echo ※ヘッダー行も含めてください
echo ※CSVデータのみを出力してください
echo.
echo OCRデータ:
type invoice.json
) > prompt.txt
ChatAI.exe prompt.txt result.json
powershell -Command "$json = Get-Content result.json -Raw | ConvertFrom-Json; $json.generated_text | Out-File -Encoding UTF8 'invoice.csv'"
echo 処理完了: invoice.csv を確認してください
pause
この例で実現できること
- 📸 請求書をスキャンまたは写真撮影
- 🔍 OCRReader で自動テキスト化
- 🤖 ChatAI で必要な情報を抽出
- 📊 CSV ファイルとして会計ソフトに取り込み可能
❓ よくある質問
Q: インターネット接続は必要ですか?
A: いいえ。OCRReader は Windows 標準機能を使用するため、オフラインで動作します。
Q: 認識精度はどのくらいですか?
A: Windows 標準 OCR エンジンの精度に依存します。明瞭な印刷文字であれば 95% 以上の精度が期待できます。
Q: 手書き文字は認識できますか?
A: 手書き文字の認識精度は印刷文字より低くなります。楷書で丁寧に書かれた文字であれば、ある程度認識可能です。
Q: PDF ファイルは処理できますか?
A: 直接は対応していません。PDF を画像形式(PNG/JPEG)に変換してから処理してください。
Q: 認識言語を変更できますか?
A: 現在は日本語モードで固定されています。日本語と英語が混在したテキストも認識可能です。
Q: 料金はかかりますか?
A: OCRReader は完全無料です。回数制限もありません。
🔧 トラブルシューティング
問題: 「画像ファイルが見つかりません」エラー
解決策:
- ファイルパスが正しいか確認してください
- ファイル名にスペースが含まれる場合は、ダブルクォートで囲んでください
- 対応している画像形式か確認してください(PNG, JPEG, BMP, TIFF)
問題: OCR の精度が低い
解決策:
- 画像解像度を 300 DPI 以上に上げてください
- 画像のコントラストを調整してください(文字を濃く、背景を明るく)
- 画像が傾いている場合は、事前に回転補正してください
- ぼやけている場合は、シャープネス処理を適用してください
問題: JSON ファイルが出力されない
解決策:
- 書き込み権限のあるフォルダで実行してください
- ディスク容量が十分にあるか確認してください
- 他のプロセスが同名ファイルを開いていないか確認してください
問題: 日本語が文字化けする
解決策:
- コマンドプロンプトで
chcp 65001 を実行してから使用してください
- 出力された JSON ファイルは UTF-8 エンコーディングで開いてください
📋 技術仕様
| 項目 |
仕様 |
| 対応 OS |
Windows 10 (1903以降) / Windows 11 |
| 実行環境 |
ランタイム不要(単一実行ファイル) |
| ファイルサイズ |
約 40 MB |
| OCR エンジン |
Windows.Media.Ocr(Windows 標準) |
| 認識言語 |
日本語(英語も同時認識可能) |
| 入力形式 |
PNG, JPEG, BMP, TIFF |
| 出力形式 |
JSON(UTF-8) |
| 処理速度 |
約 1〜3 秒/画像(解像度依存) |
| 料金 |
完全無料・回数制限なし |
💡 活用例
📝 名刺管理の自動化
名刺を撮影 → OCR → ChatAI で氏名・会社名・電話番号を抽出 → CSV で管理
📋 議事録のデジタル化
手書き議事録をスキャン → OCR → テキストデータとして保存
🧾 レシート管理
レシート撮影 → OCR → ChatAI で日付・金額・店名を抽出 → 家計簿アプリに連携
📚 書籍のテキスト化
書籍ページを撮影 → OCR → テキストファイルとして保存
🏢 請求書処理の自動化
請求書スキャン → OCR → ChatAI で必要項目を抽出 → 会計ソフトに取り込み