Python : テキストデータの読み込み、見出しの設定

pythonでテキストデータを読み込む際、

1列目から使いたいときにそのままだと1列目を見出しにしてしまったり、

文字列が数列あると、読み込めなかったりする場合に、見出しを設定してやると

うまくいく場合が多いということがありますので、

見出しを設定する方法についてです。

ちなみにテキストデータの読み込みは下記に乗せてあります。

kangkang1981.hatenablog.com

まずはモジュールはpandasを使うので、

import pandas as pd

見出しを設定します。

設定は[]でくくったリストをつくればいいだけです。

col_names  = ['C01','C02','C03'] 

今回はC01,C02,C03という名前にしています。

 

後は、name = col_namesというのを入れてあげればよいです。

data_text = pd.read_table('text_123.txt',sep=',',names=col_names)

 

こんな感じのデータフレームになります。

f:id:Kangkang1981:20200705191519j:plain

 

後は、文字コードによって読み取れないことがあるので、よく使うのは

この2つだと思いますが、

utf-8

shift-jis

こんな感じで書きます。

data_text1 = pd.read_table('text_123.txt',sep=',',names=col_names,encoding='shift-jis')

 

data_text2 =

pd.read_table('text_123.txt',sep=',',names=col_names,encoding='utf-8')

 

 詳細のプログラムは下記です。

#モジュールのインポート
import pandas as pd
#見出しの名前を設定
col_names = ['C01','C02','C03']
#テキストデータの読み込み
data_text = pd.read_table('text_123.txt',sep=',',names=col_names)
#shift-jisの場合 data_text1 = pd.read_table('text_123.txt',sep=',',names=col_names,encoding='shift-jis') #utf-8の場合 data_text2 = pd.read_table('text_123.txt',sep=',',names=col_names,encoding='utf-8')

今までにpythonについて書いた記事はここにリンクを貼ってあります。

興味があればぜひご覧ください。