CSVファイルは、Excelやシステム間でデータをやり取りする際に非常に便利なファイル形式です。しかし、いざCSVファイルを保存したり開いたりすると、「文字化けして読めない!」という問題に遭遇することがあります。
この「文字化け」は、単なる表示上の問題にとどまらず、データの信頼性や業務プロセスに大きな影響を与えかねません。
本記事では、CSVファイルで文字化けが起きる原因、具体的な対処法、作成時・読み込み時の注意点を体系的に解説します。
CSVファイルを扱うすべての人にとって、役立つ保存版ガイドです。
目次
- そもそもCSVとは?なぜ文字化けが起きるのか
- 文字コードとは?
- CSVファイルで文字化けが起きる典型パターン
- ・ Excelで保存したCSVを他のアプリで開いたら文字化け
- ・ WebシステムにCSVをアップロードしたらエラーに
- ・ メール添付で送ったら相手側で文字化け
- CSVファイルの文字化けを防ぐ保存方法
- ・ 「CSV UTF-8(コンマ区切り)」形式で保存する方法
- ・ メモ帳でUTF-8として再保存する方法
- CSVファイルを正しく開く・読み込む方法
- ・ Excelで直接開かず、インポートする方法
- ・ テキストエディタで確認する方法
- CSV文字化け対策のまとめチェックリスト
- 実務でよくあるQ&A
- まとめ:文字コードを理解して、CSV文字化けを未然に防ごう
そもそもCSVとは?なぜ文字化けが起きるのか
まず、CSVファイルの基本を押さえておきましょう。
CSV(Comma Separated Values)ファイルは、カンマで区切ったテキストデータのみを保存する極めてシンプルなファイル形式です。書式、数式、グラフなどの情報は一切持たず、純粋なテキスト情報だけを記録します。
ではなぜ、単純なテキストなのに文字化けが起こるのでしょうか?
それは、文字コード(エンコーディング)の違いが原因です。
【Excel】CSVファイルをExcelで開く設定方法|正しく開いて文字化けやデータ崩れを防ぐ
文字コードとは?
文字コードとは、「テキスト情報をコンピュータ上でどのように数値として表現するか」というルールのことです。たとえば、同じ「あ」という文字でも、使う文字コードによって数値の割り当てが変わります。
日本ではこれまで、
Shift_JIS(シフトJIS)
EUC-JP
などが広く使われてきましたが、世界的には
UTF-8(ユーティーエフエイト)
が標準になりつつあります。
この文字コードが書き手と読み手で異なっていると、文字化けが発生するのです。
CSVファイルで文字化けが起きる典型パターン
・ Excelで保存したCSVを他のアプリで開いたら文字化け
Excelは、バージョンによってはデフォルトでShift_JIS形式でCSVを保存します。しかし、ブラウザベースのシステムや海外製アプリケーションはUTF-8形式を期待していることが多く、文字コードのズレで文字化けが起こります。
・ WebシステムにCSVをアップロードしたらエラーに
Webシステムは基本的にUTF-8ベースで動いています。そのため、Shift_JIS形式のCSVをアップロードすると、日本語の部分だけが文字化けしてしまうケースがあります。
・ メール添付で送ったら相手側で文字化け
送信側では正常に見えても、受信側の環境(OS、アプリケーション、設定)が異なる場合、文字化けが発生することがあります。特に、MacユーザーとWindowsユーザー間で起こりやすいトラブルです。
CSVファイルの文字化けを防ぐ保存方法
・ 「CSV UTF-8(コンマ区切り)」形式で保存する方法
ExcelでCSVファイルを作成する際、保存時にファイルの種類を必ず
「CSV UTF-8(コンマ区切り)(*.csv)」
に設定しましょう。
手順
ファイル → 名前を付けて保存
ファイルの種類から「CSV UTF-8(*.csv)」を選択
保存
これだけで、国際標準のUTF-8形式で安全に保存できます。
・ メモ帳でUTF-8として再保存する方法
もし間違ってShift_JIS形式で保存してしまった場合でも、Windows標準のメモ帳を使ってUTF-8に変換できます。
手順
メモ帳でCSVファイルを開く
ファイル → 名前を付けて保存
エンコードを「UTF-8」に指定して保存
これにより、UTF-8形式のCSVファイルに変換できます。
【Excel】CSVに変換できない時の対処方法|原因別チェックリストと解決策まとめ
CSVファイルを正しく開く・読み込む方法
・ Excelで直接開かず、インポートする方法
CSVファイルをExcelで「ダブルクリックして開く」と、Excelが自動的に文字コードを判定してしまい、間違った解釈をすることがあります。
これを防ぐには、データタブからインポートする方法がおすすめです。
手順
Excelを開き、「データ」タブ → 「テキスト/CSVから」
ファイルを選択
インポートウィザードで文字コード「UTF-8」を指定
データ形式(文字列、数値など)も適切に設定して読み込む
これにより、文字化けせず正しくデータを取り込めます。
・ テキストエディタで確認する方法
ファイルの中身を確認したいだけなら、メモ帳、Notepad++、Visual Studio Codeなどのテキストエディタを使うのも有効です。
これらのツールでは、現在の文字コードを確認・変更できる機能が備わっています。
CSV文字化け対策のまとめチェックリスト
チェック項目 | 推奨対応 |
---|---|
ファイル保存時の形式 | 「CSV UTF-8(*.csv)」を選択 |
既存CSVファイルの変換 | メモ帳などでUTF-8で再保存 |
開くときの注意 | データタブのインポート機能を使用 |
システム要件確認 | UTF-8が要求されているか事前確認 |
メール送信時 | 添付前に文字コードを再確認 |
実務でよくあるQ&A
Q1:Shift_JISのCSVでも問題ない場合は?
社内システムや、Shift_JISベースのソフトウェアを使用している場合は、無理にUTF-8に変換する必要はありません。ただし、外部とのデータ連携がある場合は基本UTF-8を優先しましょう。
Q2:BOM付きUTF-8とBOMなしUTF-8の違いは?
BOM(Byte Order Mark)とは、ファイルの先頭に付加される数バイトの特別なデータです。
BOM付きUTF-8:古いソフトでも認識しやすい
BOMなしUTF-8:Web系システムではこちらが好まれる
Excelの「CSV UTF-8」で保存すると、BOM付きになります。BOMなしが必要な場合は、VS Codeなどで保存形式を指定する必要があります。
まとめ:文字コードを理解して、CSV文字化けを未然に防ごう
CSVファイルでの文字化けは、
保存時の文字コード
読み込み時の解釈
システム側の要求仕様
この3点が一致していないことが原因です。
Excelだけで完結する場合はShift_JISでも問題ありませんが、
外部システムとのやりとりや国際標準を意識するなら、必ずUTF-8で保存・管理する癖をつけましょう。