Pandasで詰まったところ
初めに
今月はオライリーから出ている”scikit-learn、Keras、TensorFlowによる実践機械学習”を使用して勉強していました。
演習問題であるタイタニックの生存予想をする前にPandasで戸惑った場面があったのでメモ程度に残しておきます。
詰まったところ
csvファイルから読み込んだデータのクリーニング最中に以下の関数を作成していました。
上のコードの該当箇所のcolumnsでcolumnを指定しているのにも関わらず、何故かPclass,Fare,Sex,Ageの順でデータフレームが作成されています。
pipe_lineの順番が悪いのかと思い、col_keysの順番と同じにしてみても変化なし、col_keysをリストにしてみてもダメ、おまけにデバックするたびにcolumnの順番がランダムに変更されてしまう。
解決方法
pandasのdocumentを読んでみると、”columns : Index or array-like”って書いてあったのでとりあえず以下のように変更
とりあえずcol_keysと同じ並びにはなったけど、col_keysをリストにしてcolumns=col_keysにしてもダメだったのはなんでだろう?
コメント入力