「OCR代行、高すぎる」を解決した話。AIツール3つを比較検証した記録

物理の問題集105ページをデジタル化したい。OCR代行の見積もりは高額だった。そこで、既に契約していたAIツールを活用する方向に切り替え。GenSpark、Gemini、NotebookLMを比較検証。プロンプト最適化と裁断機の活用で、精度を高める設計を提案した記録。

Thursday, January 15, 2026

DXIT | 一人社長の裏方エンジニア/03自動化・効率化/「OCR代行、高すぎる」を解決した話。AIツール3つを比較検証した記録

「問題集をデジタル化したいんです」

2026年1月、オンラインプラットフォームでこんな相談を受けた。

物理の問題集(105ページ)をデジタル化したいという依頼だった。iPadのGoodNotesで学習するため、問題集を持ち歩かなくて済むようにしたいとのこと。

当初はOCR処理を検討されていた。しかし、精度とコストの観点から、既に契約していたAIツールを活用する方向に切り替えた。

この判断が、どう導き出されたのか。その記録を残しておきたい。

【Before】OCR代行の見積もりと、その課題

問題集のデジタル化には、いくつかの選択肢がある。

1. OCR代行サービスを使う

従来の方法は、OCR代行業者に依頼することだ。105ページの問題集を文字起こししてPDF化すると、開発費を含めて一定のコストがかかる。

精度は高いが、個人で負担するには高額だ。

2. プリンターでスキャンして自分で管理

自宅のプリンターでスキャンして、GoodNotesに取り込む方法もある。

しかし、相談者からは「背景が濃くなって文字が見にくくなる」という課題が挙がっていた。見開きでスキャンすると精度が落ちる問題もある。

補足: スキャン精度を上げるには、本を裁断して1ページずつスキャンする方法があります。カール(CARL)ブランドの裁断機を使えば、50枚程度まで対応可能です。

【Notice】AIツールの比較検証という選択肢

今回の提案は、「AI活用サポート」だった。

相談者は既にGenSparkという有料AIツールを契約していた。だったら、そのツールを最大限活用する方法を一緒に探す方が、コストも時間も節約できる。

テストした3つのAIツール

セッション中に、以下の3つのAIツールを実際に試した。

1. GenSpark(既に有料契約中)

結果:最も有望な選択肢

  • 5ページのテストで良好な精度を確認
  • PDF出力機能あり
  • 既に契約済みなので追加コスト不要

課題:

  • 一部の選択肢が省略される場合あり
  • 処理に15-20分程度かかる可能性
  • モデル選択機能が現在利用不可(UI変更の可能性)

2. Gemini Pro(無料枠あり)

結果:精度が高く、数式も綺麗に表示

  • Chrome拡張機能「GoFullPage」でPDF出力可能
  • 従来のOCRよりはるかに高精度

課題:

  • 無料版は1日の使用回数に制限あり

3. NotebookLM(無料)

結果:問題の読み込みは可能だが、数式の文字起こしが不完全

  • 無料で50ファイルまで対応可能
  • スマホ・iPadでも使用可能
  • フラッシュカード、学習ガイドなどの機能あり

推奨したアプローチ

検証の結果、以下のアプローチを提案した。

主要な方法:GenSparkでプロンプト最適化

  • 問題部分のみを文字起こし
  • PDF1ページにつき設問1つ
  • 選択肢や本文を省略しない
  • 画像は必要に応じて含める

プロンプトは2ステップに分ける:

  1. AIが内容を理解して文字起こし
  2. それをPDF化

最初は5-10ページの小規模テストから始めて、出力を確認して調整。徐々にページ数を増やす。

代替案:Gemini + スクリーンショット

  • Gemini Proで問題を表示
  • GoFullPage拡張機能でPDF化、またはスクリーンショットを撮影
  • GoodNotesに直接貼り付け

【After】「次も自分でできる」仕組みが手に入る

このサポートの価値は、「次も自分でできる」という点にある。

OCR代行に依頼すれば、確かに105ページは綺麗にデジタル化される。でも、次の問題集が出てきたら、また依頼する必要がある。

一方、AI活用サポートなら、プロンプトの書き方とツールの使い方を一度学べば、次からは自分で対応できる。

この事例から得られる教訓
  • 既に持っているツールを最大限活用する: 新しいツールを契約するのではなく、既存のツールの使い方を最適化する方がコスト効率が良い
  • 複数のツールを比較検証する: GenSpark、Gemini、NotebookLMを実際に試して、それぞれの強みと課題を確認。その上で、目的に合った選択肢を提案する
  • 小規模テストから始める: いきなり105ページ全部を処理するのではなく、5-10ページでテストして精度を確認。プロンプトを調整してから本番に入る
  • 「次も自分でできる」が重要: 代行サービスは一度きりの解決。AI活用は、次からも自分で対応できる仕組みを提供する

AIは「使い方」で精度が変わる

AIツールは、プロンプトの書き方で精度が大きく変わる。

「問題集をPDF化して」と指示するだけでは、選択肢が省略されたり、数式が崩れたりする。

でも、「問題部分のみを文字起こし」「PDF1ページにつき設問1つ」「選択肢や本文を省略しない」と具体的に指示すれば、精度は上がる。

この「使い方」を知っているかどうかが、AI時代の分かれ目だ。

毎日面倒な作業を繰り返して、
本当にやりたい仕事ができていないなら。

それは、あなたの能力の問題ではなく、「圧縮できる仕組み」がないだけです。

手作業を自動化して、社長の時間を取り戻す。
どこから始めるべきか、30分の無料診断で一緒に見つけませんか?

customer1 png
customer1 png

サエ|裏方エンジニア

バックオフィス11年の経験で「終わらない手作業」の辛さを痛感。その原体験から、社長の"思考"そのものをNotionとAIで仕組み化する専門家として独立。
単なるツール導入ではなく、事業全体の情報の流れを設計し、あなたの時間を創り出します。

🎁 無料プレゼント

頭の中がごちゃごちゃな社長へ。
​事業の「設計図」を描き出す7つの魔法の質問。

🆘 個別相談(無料)

「ツール習得の時間はない、丸投げしたい」という方はこちら。

Notion・AI・システム開発のサポート

お客様の声

お客様の声
お客様の声
お客様の声
お客様の声

その他の記事

JSLAB Co., LtdはJUN SUZUKI CEOにより立ち上げられたマーケティングサポート会社です。クリックファネル等のWEBツールによるマーケティングオートメーションをサポートしています。米国ClickFunnels社の正式なパートナーシップを結んでるわけではなく、あくまでもJUN SUZUKIのClickFunnelsに対する愛情でサービスが成り立っていることをご了承ください。