タブ区切りのパイプ出力の最初の列をgrepする方法は？サブセット？

debugcn 投稿 Dev

ShanZhengYang

他の操作の後、私は基本cat的にファイルを作成しています。このファイルはタブ区切り形式で出力されます。

列があります

$ cat file.txt 
longstring1:with:semicolons    ERFVBNMNBFGHNMKJHNMH    1:2:2:2:2    -
secondline:is:here    VHNBVFTYHNBGHJMKJHJMN    0:0:0:0:0    -
third:canbefound:here    VFTYHBVFGHJNJGVGHJKMNGB    4:1:0:1:0    -

（1）この出力をgrepにパイピングします。最初の列のみをgrepして、

$ cat file.txt | grep first_column > new_out.txt

この場合、grepのパイプ出力から最初の列の各行を処理するcat file.txtので、ファイルnew_out.txtはと同じである必要がありますfile.txt。

（2）コマンドラインツールを使用して、何らかの条件に基づいて最初の列でgrepを実行する方法はありますか？

3番目の列にゼロ以外の要素が含まれている場合にのみ、最初の列の行をgrepしたいと思います。これは可能ですか、それともスクリプト言語（Pythonなど）を使用する必要がありますか？

この場合、操作は次のようになります。

$ cat file.txt | grep first_column if some_condition > new_out.txt

この場合、new_out.txtは1行目と3行目のみが含まれます。

ランダム

awk 救助へ。

ケース（1）、最初の列（$1）の値に従ってフィルタリング：

$ awk -F'\t' '$1~"here" {print}' file
secondline:is:here    VHNBVFTYHNBGHJMKJHJMN    0:0:0:0:0    -
third:canbefound:here    VFTYHBVFGHJNJGVGHJKMNGB    4:1:0:1:0    -

（最初の列、$1にパターン/文字列が含まれている場合、行全体を印刷しますhere。）

ケース（2）、最初の列の値に従ってフィルタリングしますが、3番目の列にゼロ以外の要素が少なくとも1つ含まれている場合に限ります。

$ awk -F'\t' '$3~/(^|:)[1-9]+(:|$)/ && $1~"here" {print}' file
third:canbefound:here    VFTYHBVFGHJNJGVGHJKMNGB    4:1:0:1:0    -

（前のケースの条件に加えて、3番目の列に$3パターンが含まれていることを確認します。値の開始と終了の開始:<one_or_more_digits_except_zero>:コロン:は省略されます。）

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-2

コメントを追加

サインイン

分類Dev

最初の行の最初のタブ区切りの列を選択するには?

分類Dev

最初の行のサブ文字列に一致するタブ区切りの列を削除します

分類Dev

awk：最初の行のサブ文字列に一致するタブ区切りの列を抽出します

分類Dev

区切り文字のセットの最初の文字列を検索する効率的な方法は何ですか？

分類Dev

タブ区切りの「CSV」をインポートする方法

分類Dev

タブ区切りファイルを特定の形式で出力する方法

分類Dev

ハイブのパイプ区切り文字の後にN番目の文字列を取得する方法

分類Dev

リストからコンマ区切りの文字列をサブセット化する

分類Dev

タブ区切りのテキストLinuxファイルの特定の列に定数を追加する方法

分類Dev

perlのgrepタブ区切り文字列

分類Dev

タブ区切りの列を出力するための簡単なコマンドはありますか？

分類Dev

両方のファイルの最初の列に基づいて2つのタブ区切りファイルを比較し、出力ファイルに一致するエントリと一致しないエントリを出力します

分類Dev

データファイルの列の各セットの最初のサブセットを削除するにはどうすればよいですか？

分類Dev

サブプロセスからのキャリッジリターン区切り出力の読み取り

分類Dev

タブレットのパンを無効にする方法はありますか-ウェブサイト？

分類Dev

テキストファイルで列を2つのタブ区切り列に分割する方法

分類Dev

パンダ-データのサブセットでforループの実行を並列化する方法

分類Dev

文字区切り文字に基づいてリストをサブリストに分割するときに空の部分文字列をスキップする方法

分類Dev

区切り文字を使用してRuby配列をサイズの異なるサブ配列に分割する方法

分類Dev

PostgreSQLサブセットを除くカンマ区切り値列の個別の値を選択します

分類Dev

タブ区切りのテキストファイルからのファイルパスをbash配列に保存する方法

分類Dev

「文字列はウィジェットタイプのサブタイプではない」を修正する方法は？

分類Dev

Excelデータをパイプ区切りファイルに抽出する-他のブックを参照する方法

分類Dev

Stataでデータのサブセットをプロットする方法は？

分類Dev

String.split（）-タブ区切りの値とカンマ区切りの値を区別する方法は？

分類Dev

列でグループ化し、タブで区切られた複数の列を出力する方法-Python

分類Dev

パンダの列のサブセットから行のサブセットを選択する方法

分類Dev

ORACLEでタブ区切り値を個々の列に適切に分割する方法

分類Dev

Qtはタブ区切りのテキストファイルの特定の列を読み取ります

Related 関連記事

記事