numpy genfromtxt / pandas read_csv; 引用符内のコンマは無視してください

アトム33ls

次のa.dat内容のファイルを考えてみましょう

address 1, address 2, address 3, num1, num2, num3
address 1, address 2, address 3, 1.0, 2.0, 3
address 1, address 2, "address 3, address4", 1.0, 2.0, 3

でインポートしようとしていnumpy.genfromtxtます。ただし、関数は行3に追加の列を表示します。同様のエラーが発生しpandas.read_csvます。

np.genfromtxt('a.dat',delimiter=',',dtype=None,skiprows=1)

ValueError: Some errors were detected !
    Line #3 (got 7 columns instead of 6)

そして

pandas read_csv sort of works - but it gives me an unaligned data structure:

pd.read_csv('a.dat')

pandas.parser.CParserError: Error tokenizing data. C error: Expected 6 fields in line 3, saw 7

これを補うための入力パラメータを見つけようとしています。numpyndarrayまたはpandasデータフレームで終わってもかまいません。

内に設定できるパラメータgenfromtxtread_csv、スピーチマーク内のカンマを無視できるパラメータはありますか?

このように定義さread_csvれたquotechar='"'パラメータ含まれていることに注意しください。

quotechar:文字列(長さ1)引用符で囲まれた項目の開始と終了を示すために使用される文字。引用されたアイテムには区切り文字を含めることができ、無視されます。

これは、read_csvがデフォルトで私の場合に機能するはずのように私に読みますが、そうではありません。

ファイルを前処理してコンマを取り除くことができることがわかります-可能であればそれを避けたいのですが、これが唯一の方法である場合は提案を歓迎します。

アトム33ls

なんとかこれを見つけることができました

私が見逃していた重要なパラメータはskipinitialspace=True-これは「コンマ区切り文字の後のスペースを処理する」です

a=pd.read_csv('a.dat',quotechar='"',skipinitialspace=True)

   address 1  address 2            address 3  num1  num2  num3
0  address 1  address 2            address 3     1     2     3
1  address 1  address 2  address 3, address4     1     2     3

これは動作します:-)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

csvファイルを読み取るためにpandas.read_csvの代わりにnumpy.genfromtxtを使用する必要があるのはいつですか?

分類Dev

pandas.read_csvを使用するときは、無関係なコンマを無視してください

分類Dev

numpy.genfromtxtのdtype引数

分類Dev

numpy.genfromtxtを使用して1行のCSVを読み取る

分類Dev

numpy.genfromtxtはdtypeを無視しているようです

分類Dev

numpy read txtエラー(loadtxt、genfromtxt)

分類Dev

Python Pandas read_csv():誤って読み込まれたcsv

分類Dev

numpy.genfromtxtを使用して、コンマを含む文字列を含むcsvファイルを読み取る

分類Dev

C# Pandas read_csv Equivalent

分類Dev

Pandas read_csv only first comma

分類Dev

numpy genfromtxtがcsvの最初の値を欠落していると読み取っていますか?

分類Dev

Pandas: read_csv の区切り文字としての新しい行を無視する

分類Dev

Dictionary to CSV with Pandas to_csv and reload it with read_csv

分類Dev

pandas read_csvを使用する場合は、区切り文字を一部のタブのみに制限してください

分類Dev

pandas read_csv()とpythonイテレータを入力として

分類Dev

モジュール 'pandas'には属性 'read_csvがありません

分類Dev

AttributeError:モジュール 'pandas'には属性 'read_csv'がありません

分類Dev

Python Pandas read_csvで複数の文字区切り文字を使用する

分類Dev

Pandas read_csvは、名前が指定されている場合、不良行の例外を発生させません

分類Dev

Pandas read_csv not recognizing ISO8601 as datetime dtype

分類Dev

Pandas read_csv reads rows wrongfully as dictionaries

分類Dev

Pandas, importing JSON-like file using read_csv

分類Dev

Manually set the keys in Pandas DataFrame built with read_csv

分類Dev

np.genfromtxtを使用してcsvファイルからnumpy配列を直接キャストするにはどうすればよいですか?

分類Dev

numpy genfromtxtコンバーターがUnicodeで機能しない(Python 3)

分類Dev

pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

分類Dev

pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

分類Dev

genfromtxtは、カンマで区切られていないnumpy配列を返します

分類Dev

Pandas read_csv()によって読み込まれたdtypeの辞書を取得します

Related 関連記事

  1. 1

    csvファイルを読み取るためにpandas.read_csvの代わりにnumpy.genfromtxtを使用する必要があるのはいつですか?

  2. 2

    pandas.read_csvを使用するときは、無関係なコンマを無視してください

  3. 3

    numpy.genfromtxtのdtype引数

  4. 4

    numpy.genfromtxtを使用して1行のCSVを読み取る

  5. 5

    numpy.genfromtxtはdtypeを無視しているようです

  6. 6

    numpy read txtエラー(loadtxt、genfromtxt)

  7. 7

    Python Pandas read_csv():誤って読み込まれたcsv

  8. 8

    numpy.genfromtxtを使用して、コンマを含む文字列を含むcsvファイルを読み取る

  9. 9

    C# Pandas read_csv Equivalent

  10. 10

    Pandas read_csv only first comma

  11. 11

    numpy genfromtxtがcsvの最初の値を欠落していると読み取っていますか?

  12. 12

    Pandas: read_csv の区切り文字としての新しい行を無視する

  13. 13

    Dictionary to CSV with Pandas to_csv and reload it with read_csv

  14. 14

    pandas read_csvを使用する場合は、区切り文字を一部のタブのみに制限してください

  15. 15

    pandas read_csv()とpythonイテレータを入力として

  16. 16

    モジュール 'pandas'には属性 'read_csvがありません

  17. 17

    AttributeError:モジュール 'pandas'には属性 'read_csv'がありません

  18. 18

    Python Pandas read_csvで複数の文字区切り文字を使用する

  19. 19

    Pandas read_csvは、名前が指定されている場合、不良行の例外を発生させません

  20. 20

    Pandas read_csv not recognizing ISO8601 as datetime dtype

  21. 21

    Pandas read_csv reads rows wrongfully as dictionaries

  22. 22

    Pandas, importing JSON-like file using read_csv

  23. 23

    Manually set the keys in Pandas DataFrame built with read_csv

  24. 24

    np.genfromtxtを使用してcsvファイルからnumpy配列を直接キャストするにはどうすればよいですか?

  25. 25

    numpy genfromtxtコンバーターがUnicodeで機能しない(Python 3)

  26. 26

    pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

  27. 27

    pandas read_csv index_col = Noneが各行の終わりの区切り文字で機能しない

  28. 28

    genfromtxtは、カンマで区切られていないnumpy配列を返します

  29. 29

    Pandas read_csv()によって読み込まれたdtypeの辞書を取得します

ホットタグ

アーカイブ