ASCII文字のみを含むファイル内の行を検索して、それらを処理するにはどうすればよいですか?

質問者

次のようなテキストファイルがあります。

English words only
English and 日本語
日本語のみ
English words only
English and 日本語
日本語のみ
English words only
Also English words only
English and 日本語
日本語のみ
English words only
English and 日本語
日本語のみ

真ん中には2本の線がEnglish words onlyありAlso English words only、次々線が引かれていることに注意してください

私がする必要があるのは、これらの2つの行を取得し/、次のように区切られた1つの行に結合することです。

English words only
English and 日本語
日本語のみ
English words only
English and 日本語
日本語のみ
English words only / Also English words only
English and 日本語
日本語のみ
English words only
English and 日本語
日本語のみ

次の正規表現を使用してASCII文字を含む行を検索したり[[:ascii:]]、を使用して非ASCIIを検索したりできることがわかりました[^[:ascii:]]ただし、検索する必要があるの非ASCII文字のない行であるため、正規表現を使用して条件に一致しないインスタンスを見つけるのに少し問題があります

「逆マッチング」についてこの質問を見つけましたが、答えは私を超えています。

そして、もちろん、お互いの関係に基づいて線を一致させることは別の問題です。これらの行が次々にある場合、これらの行を一致させることはできますか?それが可能かどうかさえわかりません。

非ASCII文字を含まないすべての行を検索し、LibreOffice、Gedit、またはコマンドラインを使用してそれらを組み合わせる方法はありますか?

ファイルの長さは数千行であり、私にはわかりませんが、3つまたは4つのグループにある英語のみの行が発生する可能があることに注意してください

ザンナ

キャラクタークラスをsed知らなくても、この仕事に使えるようです[[:ascii:]]その代わりにまたはロケールを使用する限り、エスケープシーケンスの 範囲ですべてのASCII文字を指定できます[\d0-\d127]CPOSIX

信頼できるはずのコマンドは次のとおりです。

LC_ALL=C sed -r ':a;N;s|^([\d0-\d127]+)\n([\d0-\d127]+)$|\1 / \2|;ta' file

ノート

  • LC_ALL=CCこのコマンドにのみロケール設定を使用してください(そうしないとエラーが発生します)
  • -r拡張正規表現を使用して、コマンドを読みやすくします(必要なバックスラッシュを少なくします)(GNUsed-E同じ意味で認識します)。
  • :a ラベル-ループはここから始まります
  • ; シェルのようにコマンドを分離します
  • N 次の行をパターンスペースに読み込んで、置き換えることができます \n
  • s|old|new|交換するoldnew
  • ^([\d0-\d127])\n([\d0-\d127]+)$-ASCIIのみで2行を照合し、の最初の行\1との2番目の行をキャプチャ\2ます。^ラインの開始され、\n改行され、$行の終わりであるので、^line 1\nline 2$全体をテストline 1してline 2
  • \1 / \2 / 改行の代わりに区切られた1行目と2行目
  • ta-最後の検索と置換コマンドが成功した場合は、ループを再実行してください。これにより、ファイルのすべての行を処理し、3つ以上のすべてのASCII行が一緒にあるインスタンスを処理できます。

感謝Eliahケーガンのための方法をASCII文字に一致するようにエスケープシーケンスを使用するために私を示します

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

ASCII文字のみを含むファイル内の行を検索して、それらを処理するにはどうすればよいですか?

分類Dev

多くのファイル内で特定の文字列を検索し、その文字列を含むすべてのファイルの名前を返すにはどうすればよいですか?

分類Dev

特定の検索文字列を含むファイル名とその文のリストを取得するにはどうすればよいですか?

分類Dev

文字列を含む行にBashを使用して別のファイルで見つかった番号も含まれている場合にのみ、ファイル内の文字列を置き換えるにはどうすればよいですか?

分類Dev

grepを使用して、ファイルの最初の行でのみ特定の文字列を検索するにはどうすればよいですか?

分類Dev

2つの特定の文字列を含むすべてのファイルを検索するにはどうすればよいですか?

分類Dev

ファイル内の行を反復処理しながらファイルから行を削除するにはどうすればよいですか?

分類Dev

特定の単語を含むファイルを検索するにはどうすればよいですか?

分類Dev

ファイル内の文字列を検索し、その上に文字列を配置するにはどうすればよいですか?

分類Dev

検索語を含む複数のzipファイルからすべてのPDFを見つけるにはどうすればよいですか?

分類Dev

行のクラスタでファイルを検索し、それらの行を削除するにはどうすればよいですか?

分類Dev

grep を使用して、テキスト ファイル内の特定の順序のないリスト内のすべての単語を含む行を検索するにはどうすればよいですか?

分類Dev

ファイルを読み込んでから、このファイルから各要素を取得し、別のファイルを検索して、その要素が含まれているかどうかを確認するにはどうすればよいですか。Python。

分類Dev

WindowsのDIRコマンドを使用して、数値の範囲を含むファイルを検索するにはどうすればよいですか?

分類Dev

ファイル内のテキストを検索し、OS Xのターミナルを使用してそれぞれの一致する行のみを保持するにはどうすればよいですか?

分類Dev

Rubyでは、フォルダ内のすべての.csvファイルを検索し、「meh」という単語を含むファイルへのパスを出力するにはどうすればよいですか?

分類Dev

ファイルを1行ずつ検索し、特定の文字列が含まれている場合はその行をリストにコピーするにはどうすればよいですか?

分類Dev

Linuxコマンドラインを使用して、特定のタイプ(* .txt)内のファイル名にxyz(大文字と小文字を区別しない)などの部分文字列を含むすべてのファイルを検索するにはどうすればよいですか?

分類Dev

特定の文字列を含むすべての行をテキストファイルから削除するにはどうすればよいですか?

分類Dev

複数のデータフレームをループして文字列のリストを取得し、文字列を含む列を検索して、複数の新しいファイルを作成するにはどうすればよいですか?

分類Dev

フィールド内の特殊文字を含む Mysql フィールド内の文字列を検索するにはどうすればよいですか?

分類Dev

検索リストの順序で別のファイルのリストから文字列を含むテキストファイルから行を抽出するにはどうすればよいですか?

分類Dev

ファイルの順序で複数のファイルから文字列を含む行を取得するにはどうすればよいですか?

分類Dev

ターミナルで特定の文字を終了/開始/含むファイルを検索するにはどうすればよいですか?

分類Dev

sed(またはawkまたはperlワンライナー)を使用してファイルAの特定の列から値を取得し、それを使用してファイルBの行を検索するにはどうすればよいですか?

分類Dev

文字列行を含むファイルを、その行の特定の記号の番号で並べ替えるにはどうすればよいですか?

分類Dev

特定の文字列を含む各行について、その下の行をHashMapに保存するようにファイルを読み込むにはどうすればよいですか?

分類Dev

%やその他の特殊文字を含むテキストを含むOracleの行を検索/置換するにはどうすればよいですか?

分類Dev

ディレクトリの+記号を含むすべてのファイルを再帰的に検索するにはどうすればよいですか?

Related 関連記事

  1. 1

    ASCII文字のみを含むファイル内の行を検索して、それらを処理するにはどうすればよいですか?

  2. 2

    多くのファイル内で特定の文字列を検索し、その文字列を含むすべてのファイルの名前を返すにはどうすればよいですか?

  3. 3

    特定の検索文字列を含むファイル名とその文のリストを取得するにはどうすればよいですか?

  4. 4

    文字列を含む行にBashを使用して別のファイルで見つかった番号も含まれている場合にのみ、ファイル内の文字列を置き換えるにはどうすればよいですか?

  5. 5

    grepを使用して、ファイルの最初の行でのみ特定の文字列を検索するにはどうすればよいですか?

  6. 6

    2つの特定の文字列を含むすべてのファイルを検索するにはどうすればよいですか?

  7. 7

    ファイル内の行を反復処理しながらファイルから行を削除するにはどうすればよいですか?

  8. 8

    特定の単語を含むファイルを検索するにはどうすればよいですか?

  9. 9

    ファイル内の文字列を検索し、その上に文字列を配置するにはどうすればよいですか?

  10. 10

    検索語を含む複数のzipファイルからすべてのPDFを見つけるにはどうすればよいですか?

  11. 11

    行のクラスタでファイルを検索し、それらの行を削除するにはどうすればよいですか?

  12. 12

    grep を使用して、テキスト ファイル内の特定の順序のないリスト内のすべての単語を含む行を検索するにはどうすればよいですか?

  13. 13

    ファイルを読み込んでから、このファイルから各要素を取得し、別のファイルを検索して、その要素が含まれているかどうかを確認するにはどうすればよいですか。Python。

  14. 14

    WindowsのDIRコマンドを使用して、数値の範囲を含むファイルを検索するにはどうすればよいですか?

  15. 15

    ファイル内のテキストを検索し、OS Xのターミナルを使用してそれぞれの一致する行のみを保持するにはどうすればよいですか?

  16. 16

    Rubyでは、フォルダ内のすべての.csvファイルを検索し、「meh」という単語を含むファイルへのパスを出力するにはどうすればよいですか?

  17. 17

    ファイルを1行ずつ検索し、特定の文字列が含まれている場合はその行をリストにコピーするにはどうすればよいですか?

  18. 18

    Linuxコマンドラインを使用して、特定のタイプ(* .txt)内のファイル名にxyz(大文字と小文字を区別しない)などの部分文字列を含むすべてのファイルを検索するにはどうすればよいですか?

  19. 19

    特定の文字列を含むすべての行をテキストファイルから削除するにはどうすればよいですか?

  20. 20

    複数のデータフレームをループして文字列のリストを取得し、文字列を含む列を検索して、複数の新しいファイルを作成するにはどうすればよいですか?

  21. 21

    フィールド内の特殊文字を含む Mysql フィールド内の文字列を検索するにはどうすればよいですか?

  22. 22

    検索リストの順序で別のファイルのリストから文字列を含むテキストファイルから行を抽出するにはどうすればよいですか?

  23. 23

    ファイルの順序で複数のファイルから文字列を含む行を取得するにはどうすればよいですか?

  24. 24

    ターミナルで特定の文字を終了/開始/含むファイルを検索するにはどうすればよいですか?

  25. 25

    sed(またはawkまたはperlワンライナー)を使用してファイルAの特定の列から値を取得し、それを使用してファイルBの行を検索するにはどうすればよいですか?

  26. 26

    文字列行を含むファイルを、その行の特定の記号の番号で並べ替えるにはどうすればよいですか?

  27. 27

    特定の文字列を含む各行について、その下の行をHashMapに保存するようにファイルを読み込むにはどうすればよいですか?

  28. 28

    %やその他の特殊文字を含むテキストを含むOracleの行を検索/置換するにはどうすればよいですか?

  29. 29

    ディレクトリの+記号を含むすべてのファイルを再帰的に検索するにはどうすればよいですか?

ホットタグ

アーカイブ