pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

豊富:

私は「Python for Data Analysis」の本を読んでいて、「例:2012年の連邦選挙委員会データベース」セクションでデータをDataFrameに読み取るのに問題があります。問題は、index_col引数がNoneに設定されている場合でも、データの列の1つが常にインデックス列として設定されていることです。

:ここでは、データへのリンクですhttp://www.fec.gov/disclosurep/PDownload.doが

これはロードコードです(チェックの時間を節約するために、nrows = 10を設定します)。

import pandas as pd
fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None)

短くするために、データ列の出力を除外していますが、これが私の出力です(インデックス値は使用しないでください)。

In [20]: fec

Out[20]:
<class 'pandas.core.frame.DataFrame'>
Index: 10 entries, C00410118 to C00410118
Data columns:
...
dtypes: float64(4), int64(3), object(11)

そして、これが本の出力です(ここでもデータ列は除外されています)。

In [13]: fec = read_csv('P00000001-ALL.csv')
In [14]: fec
Out[14]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1001731 entries, 0 to 1001730
...
dtypes: float64(1), int64(1), object(14)

出力のインデックス値は、実際にはファイル内のデータの最初の列であり、残りのデータはすべて1つ左に移動しています。このデータ列がインデックスとしてリストされるのを防ぐ方法を知っている人はいますか?インデックスを+1する整数だけ増やしたいと思います。

私はpythonとpandasにかなり慣れていないので、ご不便をおかけして申し訳ありません。ありがとう。

クレイグ:

素早い回答

各行の終わりに区切り文字がある場合は、index_col = Noneではなくindex_col = Falseを使用して、インデックス列の推論をオフにし、最後の列を破棄します。

もっと詳しく

データを見た後、各行の終わりにコンマがあります。そして、この引用(この記事が作成されたときからドキュメントは編集されています):

index_col:結果のDataFrameのインデックス(行ラベル)として使用する列番号、列名、または列番号/名前のリスト。デフォルトでは、ヘッダーよりもデータ列が1つ多い場合を除いて、列を使用せずに行に番号が付けられます。この場合、最初の列がインデックスとして使用されます。

ドキュメントからパンダはあなたがn個のヘッダーとn + 1個のデータ列を持っていると信じており、最初の列をインデックスとして扱っていることを示しています。


EDIT 10/20/2014-詳細情報

後続のリミッターと、それらを単に無視する方法についての別の貴重なエントリを見つけました。

ファイルに列名の数よりも1列多いデータがある場合、最初の列がDataFrameの行名として使用されます。...

通常、この動作はindex_colオプションを使用して実現できます。

各データ行の終わりに区切り文字を含むファイルが準備されていると、パーサーを混乱させるいくつかの例外的なケースがあります。インデックス列の推論を明示的に無効にし、最後の列を破棄するには、index_col = False:...を渡します。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

分類Dev

パンダでの異なるread_csv index_col = None / 0 / False

分類Dev

Pandas read_excelは、index_col = Noneの場合でもインデックスを作成することがあります

分類Dev

pandas index_col = "datetime"により、df ['datetime']が使用できなくなります

分類Dev

index_colを使用するとパンダのread_sql列が機能しない-代わりにすべての列を返します

分類Dev

Python Pandas read_csvで複数の文字区切り文字を使用する

分類Dev

Pandas: read_csv の区切り文字としての新しい行を無視する

分類Dev

python-パンダread_excelがindex_colの間違った番号を取得する

分類Dev

jsonをcsvに変換しようとしています、index_colエラー

分類Dev

Pandasのread_csv関数を使用する場合、いくつかのセルは全文ではなく「...」で終わります。助言がありますか?

分類Dev

pandas read_csvでこのタブ区切りファイルを読み取ると、行が失われます

分類Dev

pandas read_csvを使用する場合は、区切り文字を一部のタブのみに制限してください

分類Dev

C# Pandas read_csv Equivalent

分類Dev

Pandas read_csv only first comma

分類Dev

Python / Pandas-区切り文字が期待どおりに機能しないため、タブ付きのcsvファイルを読み取ります

分類Dev

Dictionary to CSV with Pandas to_csv and reload it with read_csv

分類Dev

モジュール 'pandas'には属性 'read_csvがありません

分類Dev

AttributeError:モジュール 'pandas'には属性 'read_csv'がありません

分類Dev

read_csvは、すべての数値列の代わりにcol_double()を使用します

分類Dev

pandas read_csv()とpythonイテレータを入力として

分類Dev

readr :: read_csvの末尾の区切り文字を無視する

分類Dev

複数の区切り文字のパンダread_csv()

分類Dev

pandas.read_csvがセミコロン区切り文字でデータを分割しない

分類Dev

Pandas read_csv not recognizing ISO8601 as datetime dtype

分類Dev

Pandas read_csv reads rows wrongfully as dictionaries

分類Dev

Pandas, importing JSON-like file using read_csv

分類Dev

Manually set the keys in Pandas DataFrame built with read_csv

分類Dev

pandas read_csvヘッダーを文字列型として解析しますが、整数が必要です

分類Dev

Pandas.read_csv「予期しないデータの終わり」エラー

Related 関連記事

  1. 1

    pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

  2. 2

    パンダでの異なるread_csv index_col = None / 0 / False

  3. 3

    Pandas read_excelは、index_col = Noneの場合でもインデックスを作成することがあります

  4. 4

    pandas index_col = "datetime"により、df ['datetime']が使用できなくなります

  5. 5

    index_colを使用するとパンダのread_sql列が機能しない-代わりにすべての列を返します

  6. 6

    Python Pandas read_csvで複数の文字区切り文字を使用する

  7. 7

    Pandas: read_csv の区切り文字としての新しい行を無視する

  8. 8

    python-パンダread_excelがindex_colの間違った番号を取得する

  9. 9

    jsonをcsvに変換しようとしています、index_colエラー

  10. 10

    Pandasのread_csv関数を使用する場合、いくつかのセルは全文ではなく「...」で終わります。助言がありますか?

  11. 11

    pandas read_csvでこのタブ区切りファイルを読み取ると、行が失われます

  12. 12

    pandas read_csvを使用する場合は、区切り文字を一部のタブのみに制限してください

  13. 13

    C# Pandas read_csv Equivalent

  14. 14

    Pandas read_csv only first comma

  15. 15

    Python / Pandas-区切り文字が期待どおりに機能しないため、タブ付きのcsvファイルを読み取ります

  16. 16

    Dictionary to CSV with Pandas to_csv and reload it with read_csv

  17. 17

    モジュール 'pandas'には属性 'read_csvがありません

  18. 18

    AttributeError:モジュール 'pandas'には属性 'read_csv'がありません

  19. 19

    read_csvは、すべての数値列の代わりにcol_double()を使用します

  20. 20

    pandas read_csv()とpythonイテレータを入力として

  21. 21

    readr :: read_csvの末尾の区切り文字を無視する

  22. 22

    複数の区切り文字のパンダread_csv()

  23. 23

    pandas.read_csvがセミコロン区切り文字でデータを分割しない

  24. 24

    Pandas read_csv not recognizing ISO8601 as datetime dtype

  25. 25

    Pandas read_csv reads rows wrongfully as dictionaries

  26. 26

    Pandas, importing JSON-like file using read_csv

  27. 27

    Manually set the keys in Pandas DataFrame built with read_csv

  28. 28

    pandas read_csvヘッダーを文字列型として解析しますが、整数が必要です

  29. 29

    Pandas.read_csv「予期しないデータの終わり」エラー

ホットタグ

アーカイブ