PythonでCSVファイルの文字コードを変換する方法【初心者向け】

初心者向けにPythonでCSVファイルの文字コードを変換する方法について解説しています。文字や文字列はコンピューター上では数値として扱われています。異なった文字コードに変換することをエンコードと言います。

TechAcademyマガジンはオンラインのプログラミングスクールTechAcademy [テックアカデミー]が運営する教育×テクノロジーのWebメディアです。初心者でもすぐ勉強できる記事が2,000以上あります。

PythonでCSVファイルの文字コードを変換する方法について解説します。

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事をまずご覧ください。

 

なお本記事は、TechAcademyのPythonオンライン講座の内容をもとにしています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

CSVファイルの文字コードを変換する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

エンコードとは

エンコード(encode)とは、データを一定の規則に従い目的に応じた情報に変換することです。
日本語では、符号化を指します。対義語は復号(デコード、decode)です。

 

文字コードとは

文字コードとは、文字や記号をコンピューターで扱えるよう、個々に割り当てられた固有の符号です。英数字を表す文字コードにはASCIIがあり、1バイトで1文字を表します。

日本語には仮名、カタカナ、漢字などがあり、1バイトでは表現しきれません。そのため、マルチバイト(複数バイト)の文字コードを用います。Shift_JIS、EUC-JPなどの文字コードがあります。

UTF-8とは、ユニコード定義された文字集合を表現できる方式の一つです。1文字を1~6バイトの可変長で表現し、世界的に普及しています。
 

[PR] Pythonで挫折しない学習方法を動画で公開中

Pythonの標準エンコーディングとは

Pythonの標準エンコード方式はUTF-8です。
以下、公式ドキュメントからの抜粋です。

Python の文字列型は文字表現のためのUnicode標準を使っていて、Pythonプログラムは有り得る様々な文字を全て扱えます。
(中略)
UTF-8 is one of the most commonly used encodings, and Python often defaults to using it.
 

CSVファイルの文字コードを変換する方法(例:UTF-8からShift_JISへの変換)

サンプルコード

import csv

with open('utf8.csv', 'w', newline='', encoding='utf8') as f:
  writer = csv.writer(f)
  writer.writerow(['氏名','年齢'])
  writer.writerow(['太郎','10'])
  writer.writerow(['花子','20'])

with open('utf8.csv', encoding='utf8') as f_in:
    with open('sjis.csv', 'w', encoding='cp932') as f_out:
        f_out.write(f_in.read())

 

実行結果

カレントディレクトリに、UTF-8のCSVファイルutf8.csvと、Shift_JISのファイルsjis.csvが作成されました。

 

解説

  • CSVファイルの読み書きを行うため、csvモジュールをインポート
  • utf8.csvファイルにCSVデータを書き込み
  • エンコードに明示的にutf8と指定
  • utf8.csvファイルを読み込みモード、sjis.csvファイルを書き込みモードで開く
  • それぞれencodingキーワードで、エンコードを指定
  • utf8.csvファイルから読み込んだデータを、sjis.csvファイルに書き込み

 

監修してくれたメンター

橋本紘希

システムインテグレータ企業勤務のシステムエンジニア。

開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

オンラインのプログラミングスクールTechAcademyではPythonを使って機械学習の基礎を学ぶPythonオンライン講座を開催しています。

初心者向けの書籍を使って人工知能(AI)や機械学習について学ぶことができます。

現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、最短4週間で習得することが可能です。

また、現役エンジニアから学べる無料のプログラミング体験会も実施しているので、ぜひ参加してみてください。