Python : テキストデータの読み込み、見出しの設定
pythonでテキストデータを読み込む際、
1列目から使いたいときにそのままだと1列目を見出しにしてしまったり、
文字列が数列あると、読み込めなかったりする場合に、見出しを設定してやると
うまくいく場合が多いということがありますので、
見出しを設定する方法についてです。
ちなみにテキストデータの読み込みは下記に乗せてあります。
まずはモジュールはpandasを使うので、
import pandas as pd
見出しを設定します。
設定は[]でくくったリストをつくればいいだけです。
col_names = ['C01','C02','C03']
今回はC01,C02,C03という名前にしています。
後は、name = col_namesというのを入れてあげればよいです。
data_text = pd.read_table('text_123.txt',sep=',',names=col_names)
こんな感じのデータフレームになります。
後は、文字コードによって読み取れないことがあるので、よく使うのは
この2つだと思いますが、
shift-jis
こんな感じで書きます。
data_text1 = pd.read_table('text_123.txt',sep=',',names=col_names,encoding='shift-jis')
data_text2 =
pd.read_table('text_123.txt',sep=',',names=col_names,encoding='utf-8')
詳細のプログラムは下記です。
#モジュールのインポート
import pandas as pd
#見出しの名前を設定
col_names = ['C01','C02','C03']
#テキストデータの読み込み
data_text = pd.read_table('text_123.txt',sep=',',names=col_names)
#shift-jisの場合
data_text1 = pd.read_table('text_123.txt',sep=',',names=col_names,encoding='shift-jis')
#utf-8の場合
data_text2 = pd.read_table('text_123.txt',sep=',',names=col_names,encoding='utf-8')
今までにpythonについて書いた記事はここにリンクを貼ってあります。
興味があればぜひご覧ください。