csvからの読み取り中にデータセットの上の行を検出して削除するにはどうすればよいですか？

debugcn 投稿 Dev

RustyShackleford

私は次のようなcsvを持っています：

name: john
date modified: 2018-09
from: jane
colum1 column2 column3
data    data    data

csvから読み取るときに表形式のデータが始まる前に行を削除する、適用できる関数はありますか？現在、上記の行columnを読んだとき、奇妙な文字のように見えます。

新しいテーブルは次のようになります。

colum1 column2 column3
data    data    data

AGN Gazer

私はこのようなことをします：

from io import StringIO
with open('filename.csv') as f:
    lines = f.readlines()
s = StringIO(''.join((l for l in lines if ':' not in l)))
pd.read_csv(s)

または：

with open('filename.csv') as f:
    lines = f.readlines()
skip_rows_idx = [i for i, l in enumerate(lines) if ':' in l]
pd.read_csv('filename.csv', skiprows=skip_rows_idx)

ヘッダーにコロンがない場合は、上記のコード（最初の例）を適応させて、次のように最初の行を削除できます。

import itertools
s = StringIO(''.join(itertools.dropwhile(lambda l: ':' in l, lines)))

（ヘッダーの後に「悪い」行がないと仮定します）。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-1

コメントを追加

サインイン

分類Dev

パンダを使用してヘッダーを含まないCSVファイルを読み取り、最初の列のみのデータをキャプチャして削除を実行するにはどうすればよいですか？

分類Dev

SQLiteデータベースからすべてのテーブルを読み取り、Rにデータセット/変数として保存するにはどうすればよいですか？

分類Dev

データベースからの読み取り中に重複する値をキャプチャしてメッセージボックスを表示するにはどうすればよいですか？

分類Dev

すべてのタイプの区切りファイルを読み取るようにコードを変更するにはどうすればよいですか？現在、csvファイルのみを読み取り、それらを比較します

分類Dev

SAPのテーブルIDを知るにはどうすればよいですか？VBAを使用してSAPからデータを読み取ります

分類Dev

Azureデータセットを、日付パーティションのある寄木細工のフォルダーから読み取る時系列データセットとしてマークするにはどうすればよいですか？

分類Dev

Rの2つの日付の比較に基づいて、データセットから行を削除するにはどうすればよいですか？

分類Dev

時系列予測のために、最大40GBのcsvからデータを読み取って使用するにはどうすればよいですか？

分類Dev

google fit android sdkを使用してすべてのデータソースからデータを読み取るにはどうすればよいですか？

分類Dev

ddrescueを使用して、ディスクの端から不良セクタを読み取ろうとするにはどうすればよいですか？

分類Dev

Racketのファイルからセットを読み取るにはどうすればよいですか？

分類Dev

複数の読み取りを実行しているときにディレクトリを除外するにはどうすればよいですか？

分類Dev

スキーマSparkでcsvを読み取っているときに不正な形式の行を削除するにはどうすればよいですか？

分類Dev

USBからFireWire（IEEE 1394）形式のデータを読み取るにはどうすればよいですか？

分類Dev

csvを使用してPythonに、最初の文字ではなく行の最初の単語を読み取らせるにはどうすればよいですか？

分類Dev

Rを使用して、特定の文字で始まるファイルのみをディレクトリからcsvを読み取り、最後の4文字に基づいてdf名を割り当てるにはどうすればよいですか？

分類Dev

これらのjsonデータを読み取るにはどうすればよいですか？

分類Dev

SQLデータベースからいくつかの特別な行のみを読み取るにはどうすればよいですか？

分類Dev

特定のフォルダー内のすべてのSASデータセットを読み取り、それぞれに個別のPDF出力を作成するにはどうすればよいですか？

分類Dev

Pythonを使用して、リストからデータを読み取り、特定の値をElasticsearchにインデックス付けするにはどうすればよいですか？

分類Dev

Linuxグループを使用して、他のユーザーによるディレクトリへの読み取り、書き込み、実行アクセスを制限するにはどうすればよいですか？

分類Dev

アセンブリで28ビットPIOを使用して、ディスクから複数のセクターを正しく読み取るにはどうすればよいですか？

分類Dev

CAPLを使用してExcelからデータを読み取るにはどうすればよいですか

分類Dev

ソケットから読み取るときにread（）呼び出しのブロックを処理するにはどうすればよいですか？

分類Dev

画像上の特定のドットを読み取り、値をhtmlに自動的にエクスポートするにはどうすればよいですか？

分類Dev

数字のシーケンスを読み取り、-1を入力してデータ入力を停止するにはどうすればよいですか？

分類Dev

読み取り行の変数に式を割り当てるにはどうすればよいですか？

分類Dev

改行が含まれている場合にのみ、文字列ストリームから行を読み取るにはどうすればよいですか？

分類Dev

あるデータソースからオブジェクトを読み取り、Springデータを使用して別のデータソースに書き込むにはどうすればよいですか？

Related 関連記事

記事