


Xのポストに、「「AI」でサムネを作る時、 いきなり画像生成から入ると かなり失敗します」という書き込みがあって、数百のハート❤️がついています。
けれども、この話って、別に”サムネ”だけのことじゃないんですよね〜。
ChatGPT、Claude、GeminiやCopilotでも、AIチャット入力窓の脇には必ず[ファイル添付]の意味を表す+(プラス)アイコンがあるでしょう?
ここに手持ちのExcelブックを上げて、資料の加工をAIへ依頼してみたけれど、「全然見当ちがいな回答だった」という経験はありませんか?
それは、AIの問題じゃなくて、「前処理」の問題なんです。
この記事では、「AIにExcelブックをわたす前のととのえ方ひとつで、AIからのフィードバックは大きく変わります」という前提に立って、AI活用のためのExcel前処理の基本をお伝えします。
Excel前処理とは?
Excel前処理とは、生成AIや各種分析ツールへデータを渡す時に、表の形をそろえたり、不要な列や空白を整理したり、表記ゆれをなくしたりする作業のことです。
たとえば、年月日表記が統一されておらず、「2024/1/1」「2024-01-01」「1月1日」などのレコードが混在していると、AIは同じ日付だと判断しにくくなります。金額欄にカンマや文字、¥マークが混じっている場合も、同様に集計ミスの原因となります。
Excel前処理のメリットとデメリット
Excel前処理を行う最大のメリットは、AIからの回答精度が上がり、指示しなおしの反復が減ることです。データの粒度がそろうため、要約・分類・異常値発見・グラフ化などの作業も、スムーズになります
。
さらに、同じととのえ方を明文化しておけば、毎回の作業時間が速くなり、属人化も防止しやすくなるでしょう。
一方、(生データの粒度よしあしにもよりますが)、Excel前処理をするデメリットには、「手作業の手間と時間が余計にかかる」ことがあげられます。
特に、元データが複数の部署から集まっている場合などは、整形ルールを決めるだけでも、調整に時間がかかりそうです。
前処理をしすぎると、うっかり元の情報を消してしまうリスクもあります。
Excel前処理あり・なしで、AIの回答はどう変わるでしょうか?
それでは、Excel前処理をすると、どのような相違点が生じるのでしょうか?
サンプル・データを元に、実際の行程を見てみましょう。
たとえば、別々の担当者や複数の部署から、ただ単に「かき集めた」だけのログデータを生成AIにかけてみると、どのような回答が得られるでしょうか?
具体的には、コレ↓を、Google Geminiに上げてみました。


※上記サンプル・データも生成AIからダミー生成したもので、
氏名等は実在する特定の個人を指す資料ではありません。


AIからの回答は次の通りです。


末尾に、ピリリとからいお説教付きの回答チャットでした。


つぎに、Excelワークシート上で前処理したデータを、Google Geminiの同じチャット・スレッドへ上げてみました。


AIからお説教をくらうくらいなら、痛くもかゆくもありません。
ただし、わずか10レコード程度のサンプルをAIに渡しただけでも、初回データでは「周辺機器系が全体の売上金額を牽引」という非常にあいまいな分析結果しか得られていないものが、修正後データの解析では、「モバイルバッテリーとイヤホン2品目だけで全体売上の4割以上」という、説得力あるフィードバックになっていますね。
リポートや報告書に採用する分析結果として、どちらのコメントの方が扱いやすいかは、一目瞭然です。これも、前処理で、金額や日付表記などを丁寧に修正したからこそ得られたAI回答なのです。
前処理では、Excel関数が大活躍
上記の「前処理」を行うにあたって、Excelで実行したことが以下の通りです。


まず、集計の主キーになりそうな日付については、表記ゆれや文字列などを、汎用的なISO(ISO 8601)形式に関数で書き換えます。
(関数例) =IFERROR(TEXT(DATEVALUE(“2026/5/1″),”yyyy-mm-dd”),”要確認”)
次に、生成AIへ個人名を直接渡すことを避けるため、顧客名はすべて匿名番号に変換しました。
(関数例) =”Anon_” & TEXT(ROW()-1,”000″)
さらに、金額列に関しても、数値、文字列が入り乱れていますので、不要な”円”や”¥”をカットして、集計に使える数値データへ一括変換します。
(関数例) =IFERROR(VALUE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(F2,”円”,””),”¥”,””),”,”,””)),””)
必要であれば、「空白レコード検索」(例; =COUNTIF(A:A,””)-1)や、「トランザクションIDの重複検索」(例; =SUMPRODUCT((COUNTIF(B2:B1000,B2:B1000)>1)) )なども用意しておけば、さらに精度の高い前処理済テーブルが出来上がります。
ここまでの作業をしてみて、気づくことはありませんか?
これは、単に生成AIへ渡すテーブルを作るためだけに必要なことではなく、一般的な汎用データベースへのインポート前など、ごく普通にやっている作業なんです。
生成AIは「多少あいまいな資料を渡してもフィードバックをくれる」と思い込んで、雑な資料を投げかけると、AI側も知らん顔をして、平気でウソをつきます。「多少時間と手間がかかっても、調べものや分析前には、きちんと前処理をしておくことが、後から困らない秘訣」だということは、AI以前も、AI以後も変わらない、ということなんですね。
まとめ;生成AIへ渡すExcel資料は、ていねいに前処理しておきましょう
AI回答の真偽や具体性が、大きくちがってきます
今回の記事では、ChatGPTやClaude、Geminiなどの生成AIへExcelブック(もしくはCSV)を渡して、できる限り的確な回答をすばやくゲットできる前処理方法の一例をご紹介しました。事前にアップロード・データを整える”ひと手間”があるだけで、その後の集計や分析結果は真実味が高まり、より具体的な回答内容となります。IFERRORやTEXT、SUBSTITUTE、COUNTIF、SUMPRODUCTなど、”普段づかい”のExcel関数をうまく組み合わせれば、表記ゆれ修正や日付をISO形式へ直すことなどにも、落ち着いて対応できるんです。
そして、この事例からもあらためて確認できた最大のポイントは(AI活用のみならず)、
何か調査やお仕事を依頼する時には、雑な資料の丸投げではいけませんぞ!!
ということですね。



ホント、どっかの上司に教えてやりたいっ!!(泣)
■ 「VBA健康診断」始めます。
私たちが長年培ってきた「現場の知見」を掛け合わせ、「VBA健康診断・仕様書化パック」という新サービスを正式にリリースしました。
- 仕様書のないマクロのドキュメント化
- 隠れたバグや「2025年の崖」リスクの洗い出し
- 将来的なWebシステム化への移行ロードマップ作成
これらを、従来の常識を覆すスピードと価格で提供します。
\ まずは無料診断から /















