を使用して一致させようとしているパターンがありますre.compile
。ただし、スクリプトを取得して目的の結果を得ることができません。以下は、私がスクレイプしたいと思っているいくつかのHTMLコードの例です。以下のHTMLから、2つのリストアイテムを作成したいと思っています。
また、以下は2つのリスト項目を選択するための私の試みです。
import re
def getData():
trans_array = "" ##HTML data here
pattern2 = re.compile('<table width="100%" border="0" class="tbl t3 mobile-collapse">(.*)</table>')
print re.findall(pattern2, trans_array)
getData()
私が使用したコードは機能するはずですが、機能していません。アドバイスやコメントをいただければ幸いです。
デフォルト.
では、正規表現は改行文字と一致しません。にflags=re.S
パラメータを追加するre.compile
と、正規表現が機能します。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加