bs4でGoogle検索結果を正しく印刷するにはどうすればよいですか？

debugcn 投稿 Dev

シルカ

最初に検索タイトルを出力し、次にURLを出力する作業コードがありますが、Webサイトのタイトル間に多くのURLを出力します。しかし、これらをこのような形式で印刷し、同じURLをそれぞれ10回印刷しないようにする方法は次のとおりです。

1) Title url
2) Title url
and so on...

私のコード：

search = input("Search:")

page = requests.get(f"https://www.google.com/search?q=" + search)

soup = BeautifulSoup(page.content, "html5lib")

links = soup.findAll("a")

heading_object = soup.find_all('h3')

for info in heading_object:
    x = info.getText()
    print(x)
    for link in links:
        link_href = link.get('href')
        if "url?q=" in link_href:
            y = (link.get('href').split("?q=")[1].split("&sa=U")[0])
            print(y)

簡単

タイトルとリンクを別々に取得する場合は、zip()それらをペアでグループ化するために使用できます

for info, link in zip(heading_object, links):
    info = info.getText()

    link = link.get('href')
    if "?q=" in link:
        link = link.split("?q=")[1].split("&sa=U")[0]

    print(info, link)

ただし、タイトルまたはリンクがページに存在しない場合は、間違ったペアが作成されるため、問題が発生する可能性があります。タイトルと次の要素のリンクをペアにします。タイトルとリンクの両方を保持する要素を検索し、すべての要素内で単一のタイトルと単一のリンクを検索してペアを作成する必要があります。タイトルまたはリンクがない場合は、デフォルト値を設定でき、間違ったペアが作成されることはありません。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-22

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

bs4でGoogle検索結果を正しく印刷するにはどうすればよいですか？

bs4でGoogle検索結果を正しく印刷するにはどうすればよいですか？

ASP.NET MVCでの検索結果をPDFに印刷するにはどうすればよいですか？

Python正規表現-re.searchを使用して検索結果を印刷するにはどうすればよいですか？

Googleの検索結果に検索バーを追加するにはどうすればよいですか？

bs4 / pythonを使用してウィキペディアサイトからtxtファイル内の単語の検索結果を取得するにはどうすればよいですか？

検索結果をすばやく取得するにはどうすればよいですか？

Google Place Geocompleteで英語の検索結果を取得するにはどうすればよいですか？

Firefoxのような新しいタブでOperaが検索結果を開くようにするにはどうすればよいですか？

特定の文字列を含むBS4のタグを検索するにはどうすればよいですか？

Android Studioが常に「検索ウィンドウ」で検索結果を開くようにするにはどうすればよいですか？

完全外部結合の結果を正しく使用するにはどうすればよいですか？

VBAを使用してGoogle検索の最初の検索結果リンクを取得するにはどうすればよいですか？

多数の結果をDTOに正しく保存するにはどうすればよいですか？

Elasticsearchで重複する検索結果を削除するにはどうすればよいですか？

Firefoxで開いているタブを検索するときに、より多くの結果を表示するにはどうすればよいですか？

結果で検索された文字列を強調表示するにはどうすればよいですか？

正規表現を使用して検索結果を処理するにはどうすればよいですか？

Azure検索からすべての結果を取得するにはどうすればよいですか？

PyCharmで、入力してリストを検索する場合、検索結果間をジャンプするにはどうすればよいですか？

DuckDuckGo APIに基づいて検索結果を取得するにはどうすればよいですか？

Visual Studio 2017で結果の検索形式を変更するにはどうすればよいですか？

検索結果を作成日で整理するにはどうすればよいですか？

odooでカスタム検索結果を表示するにはどうすればよいですか？

odooでカスタム検索結果を表示するにはどうすればよいですか？

Elastic Searchで検索結果の順序を変更するにはどうすればよいですか？

Smartsheet Python SDKで検索結果を使用するにはどうすればよいですか？

tmuxで検索結果を強調表示するにはどうすればよいですか？

ActiveRecordで検索結果を除外するにはどうすればよいですか？

Eclipseでの検索結果を取得するにはどうすればよいですか？

React-Native FlatListで検索結果を強調表示するにはどうすればよいですか？