日付範囲でグーグルをこすり取ろうとしている結果の数が間違っている

user8708316

私はグーグルで特定の日付範囲内の結果の数をこすり取ろうとしてきました。私はグーグル検索クエリに日付を挿入することによってこれを行いました。しかし、私が書いたコードは、日付範囲外の検索結果の数を取得しています。私のコードは次のとおりです。

query='Kevin Spacey prima:14-01-2020 dopo:14-01-2020'

for url in search(
            query, 
            tld='it',
            lang='it',
            num=20,
            start=0,
            stop=None,
            pause=2.0
      ):
            try: 
                r = requests.get(url, timeout=None)
                r.headers
                r.status_code
                urls.append(url)              
            except: 
                pass

グーグル検索から私は13結果を得ています。私のコードを使用します39問題は、「my」の結果がgoogleの結果と一致しないことです。問題はクエリ、特に日付範囲にあると思いますが、修正方法が完全にはわかりません。たぶん、私がまだ見つけていない別のエラーもあります。私が間違っていることを教えていただければ幸いです。

お手数をおかけしますが、よろしくお願いいたします。

ここでグーグルからの結果と私のコードからの出力をください

https://tv.zam.it/programmi_in_tv_stasera.php
https://www.paramountnetwork.it/video/v5ln5t/film-paramount-network-gli-highlights-per-la-settimana-del-2-marzo-2020
https://www.davidemaggio.it/archives/181396/programmi-tv-di-stasera-martedi-14-gennaio-2020-su-rai2-il-film-amore-cucina-e-curry-al-posto-de-il-molo-rosso-spostato-in-seconda-serata
https://www.davidemaggio.it/archives/181401/ascolti-tv-lunedi-13-gennaio-2020
https://www.mymovies.it/film/2016/elvisnixon/pubblico/?id=778281
https://www.ilfoglio.it/siteMapVideo.jsp
http://www.starpolitics.it/author/redazione/page/2/
http://www.zorrolaleggenda.rai.it/dl/RaiTV/programmi/media/ContentItem-4acbbd88-0529-4ca5-a390-96cb38dd2317.html
https://www.lagazzettadellospettacolo.it/cinema/26473-nicholas-hoult-giurati-giffoni-film-festival-2016/
https://www.viaggiareleggeri.com/cerca/x/i
https://www.lagazzettadellospettacolo.it/musica/30431-peter-cincotti-live-italia/
https://www.viaggiareleggeri.com/cerca/x/-?ref=28250
https://www.audible.it/pd/Harry-Potter-e-il-Prigioniero-di-Azkaban-Harry-Potter-3-Audiolibri/B077HVX4WM
https://www.hfw.com/Briefings
http://www.inmediarex.it/cinema-tv/cinema-tv-recensioni/american-gods-la-serie-niente-di-cosi-divino/
http://america24.com/sitemapArticles.xml
https://www.weenjoy.net/sitemap/
https://ierioggidomaniblog.com/2017/06/02/e-arrivata-la-promo-shock-universal-su-amazon-tante-offerte-fino-al-2-luglio/
https://ierioggidomaniblog.com/2018/01/13/universal-pictures-baby-driver-barry-seal-linganno-e-madre/
https://www.glartent.com/IT/Rome/112229858801846/giovani-artisti-associati-srl
https://tubestar.it/breakingitaly
https://www.freeforumzone.com/d/1543749/Oggi-ho-visto-in-TV/discussione.aspx/18
https://mjj.freeforumzone.com/discussione.aspx?idd=662389
https://www.diariodelweb.it/tuttosu/tag/?q=4750
https://civiltascomparse.wordpress.com/category/p-greco/?ak_action=reject_mobile
https://www.ubook.com/audiobook/348309/copy-persuasivo-di-andrea-lisi
https://ipersphera.org/category/attrice/
https://www.luogocomune.net/28-opinione/4827-svezia-laboratorio-per-il-nwo
https://www.globalnpo.org/IT/Salerno/1382814642039640/La-Bottega-Di-Will
https://www.qoop.it/osvaldo-raschi-pugile?page=1
https://www.qoop.it/pugile-al-cogan?filter=lastyear
http://www.caminantes.it/page-16/index.php?categories=giornalisti
https://www.altadefinizione01.tel/10495-terminator-destino-oscuro-stream-ita.html
https://www.emailers.it/codice-sconto-del-50-cibdol-10-promozione-limitata/
https://aimatrabolmeicher.com/2014/03/03/oscar-2014-and-the-winner-is/
https://aimatrabolmeicher.com/goodbye/page/2365/
http://scandalissimi.it/home-archive.php
https://picnano.com/tags/prossimieventi
https://vilook.com/video/9E0I69VkXFc/il-lento-declino-dellitalia-qual-%C3%A8-il-vero-problema-breakingitaly-news

ウェブサイトの総数:39(HTTPエラーを含む)

更新:

調査をカスタマイズした後のすべての結果を含むURLは次のとおりです。

https://www.google.co.uk/search?q=Kevin%20Spacey&lr=lang_it&cr=countryIT&hl=it&as_qdr=all&tbs=lr:lang_1it,ctr:countryIT,cdr:1,cd_min:1/14/2020,cd_max: 1/14/2020&ei = WiRtXpLRH8Wb1fAPgMuTiAI&start = 0&sa = N&ved = 2ahUKEwiS5tj_zZroAhXFTRUIHYDlBCE4ChDy0wN6BAgEEC4

コードに実装するために確認する必要のあるフィールド:

www.google.co.uk ; I would prefer to look at www.google.it
q=Kevin+spacey
lr=lang_it
cr=countryIT
hl=it
tbs=lr:lang_1it,ctr:countryIT,cdr:1,cd_min:1/14/2020,cd_max:1/14/2020
クリストス・ライトラス

クエリ返すこと13結果は、使用するtbs日付の制限はなく、インラインクエリを指定するPARAMをprima:14-01-2020 dopo:14-01-2020googlesearchサポートしtbsget_tbs使用して渡すことができるヘルパー関数もdatetime.date fromありtoます。またクエリcountrycountryIT同じように指定する必要があります

動作するスクリプト全体:

from googlesearch import search, get_tbs
import datetime

# query='Kevin Spacey prima:14-01-2020 dopo:14-01-2020'
query='Kevin Spacey'

urls = []
index = 0

for url in search(
    query, 
    tld='it',
    lang='it',
    country='countryIT',
    num=20,
    start=0,
    stop=None,
    pause=2.0,
    tbs=get_tbs(
        datetime.date(2020, 1, 14),
        datetime.date(2020, 1, 14))
):
    urls.append(url)
    print("%d: %s" % (index, url))
    index += 1

print("\nTotal results found: %d\n" % (len(urls)))

出力します:

0: https://www.cinematown.it/2020-01-oscar-2020-previsioni-scommesse/
1: https://www.cinematown.it/2020-01-notte-sul-pianeta-terra-trailer/
2: https://blog.italiansubs.net/critics-choice-awards-2020-i-vincitori/
3: https://www.amazon.it/Patrick-DVD/dp/B07J33SHLC
4: http://www.viraland.it/2020/01/14/cinema-e-gioco-i-migliori-film-ispirati-al-gaming/
5: https://www.altadefinizione01.tel/catalog/t/
6: https://www.altadefinizione01.tel/10495-terminator-destino-oscuro-stream-ita.html
7: https://www.sentieridelcinema.it/oscar-2020-tutte-le-nomination/
8: https://www.dailymood.it/2020/01/14/nomination-oscar-2020-comanda-joker-tarantino-e-scorsese-lo-tallonano/
9: https://www.cineblog.it/post/932961/bloodshot-nuovo-trailer-vin-diesel-film
10: https://www.cineblog.it/post/932933/black-widow-film-nuovo-trailer
11: https://www.davidemaggio.it/archives/181403/la-guerra-non-e-finita
12: https://www.davidemaggio.it/archives/181385/festival-di-sanremo-2020-donne-chi-sono
13: https://www.rossinavi.it/column/money/2408/

Total results found: 14

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

2つの日付を比較するJavascriptの結果が間違っている

分類Dev

Forループ範囲が機能しない:引数の数が間違っているか、プロパティの割り当てが無効です

分類Dev

グーグルから画像をこすり取ろうとしています

分類Dev

phpでxpathを使用すると、結果の数が間違っています

分類Dev

動的なTestNGXMLの作成。間違ったXMLを取得しています。私が間違っているところ

分類Dev

このプログラムを実行しようとしていますが、「コンパイルエラー、引数の数が間違っている、またはプロパティの割り当てが無効です」というエラーが発生します

分類Dev

美しいスープを使用してグーグル検索結果をこすり取ることができません

分類Dev

2つの日付パラメーターを範囲として受け取り、その間の日付が回文であるかどうかを確認する関数を作成する方法がわかりません

分類Dev

重複する複数の日付範囲を結合して新しい日付範囲を作成するにはどうすればよいですか?

分類Dev

次の場合、配列要素を日付ごとにグループ化する際に間違いを犯しているのはどこですか?

分類Dev

グループごとに範囲内の欠落している日付を入力する方法

分類Dev

グーグルdaterangefilterの日付範囲境界を取得しようとしています

分類Dev

私はこれをforループで間違って書いていることを知っていますが、複数の文字を受け入れることができるように正しく書くにはどうすればよいですか?

分類Dev

SQLの日付の日数の違い結果が間違っている

分類Dev

日付の配列を指定すると、「週」の範囲のグループ内に結果を表示します

分類Dev

日付がデータ範囲内にあることを確認しようとしています

分類Dev

シンプルなジャージの安らかなWebサービスHelloWorldを実行しようとしていますが、機能しません。誰かが私が間違っているところを確認できますか?

分類Dev

週ごとに日付を追加すると、間違った日付が生成されます。なんでこんなことが起こっているの?

分類Dev

グループに基づいて日付範囲の間にあるかどうかをカウントします

分類Dev

SQL Serverを使用して、このクエリの結果を日ごとにグループ化するにはどうすればよいですか?

分類Dev

PHFetchResults日付フィルターが時間範囲に対して正しい結果を生成しない

分類Dev

日付を手動で入力すると、SQLの日付の違いが間違った結果を返します

分類Dev

関数の日付の引数のデータ型が間違っているか、結果が小さすぎるか大きすぎるエラー

分類Dev

Java-ユーザーが日付範囲を選択できるようにして、日付範囲が7日または14日であることを確認するにはどうすればよいですか?

分類Dev

BigQuery:テーブル範囲デコレータが間違った結果を返すことがあるのはなぜですか?

分類Dev

日付がデータベースに保存されていなくても、日付の戻り結果が間違っている

分類Dev

間違ったローカルDNSの結果がどこから来ているのかをどのように把握できますか?

分類Dev

Python Bokehを0.12.4にアップグレードしたところ、JSONオブジェクトの型文字列が間違っているというエラーが表示されます

分類Dev

日付の結果を日ごとに分割してグループ化できるMySQLで利用可能な関数はありますか?

Related 関連記事

  1. 1

    2つの日付を比較するJavascriptの結果が間違っている

  2. 2

    Forループ範囲が機能しない:引数の数が間違っているか、プロパティの割り当てが無効です

  3. 3

    グーグルから画像をこすり取ろうとしています

  4. 4

    phpでxpathを使用すると、結果の数が間違っています

  5. 5

    動的なTestNGXMLの作成。間違ったXMLを取得しています。私が間違っているところ

  6. 6

    このプログラムを実行しようとしていますが、「コンパイルエラー、引数の数が間違っている、またはプロパティの割り当てが無効です」というエラーが発生します

  7. 7

    美しいスープを使用してグーグル検索結果をこすり取ることができません

  8. 8

    2つの日付パラメーターを範囲として受け取り、その間の日付が回文であるかどうかを確認する関数を作成する方法がわかりません

  9. 9

    重複する複数の日付範囲を結合して新しい日付範囲を作成するにはどうすればよいですか?

  10. 10

    次の場合、配列要素を日付ごとにグループ化する際に間違いを犯しているのはどこですか?

  11. 11

    グループごとに範囲内の欠落している日付を入力する方法

  12. 12

    グーグルdaterangefilterの日付範囲境界を取得しようとしています

  13. 13

    私はこれをforループで間違って書いていることを知っていますが、複数の文字を受け入れることができるように正しく書くにはどうすればよいですか?

  14. 14

    SQLの日付の日数の違い結果が間違っている

  15. 15

    日付の配列を指定すると、「週」の範囲のグループ内に結果を表示します

  16. 16

    日付がデータ範囲内にあることを確認しようとしています

  17. 17

    シンプルなジャージの安らかなWebサービスHelloWorldを実行しようとしていますが、機能しません。誰かが私が間違っているところを確認できますか?

  18. 18

    週ごとに日付を追加すると、間違った日付が生成されます。なんでこんなことが起こっているの?

  19. 19

    グループに基づいて日付範囲の間にあるかどうかをカウントします

  20. 20

    SQL Serverを使用して、このクエリの結果を日ごとにグループ化するにはどうすればよいですか?

  21. 21

    PHFetchResults日付フィルターが時間範囲に対して正しい結果を生成しない

  22. 22

    日付を手動で入力すると、SQLの日付の違いが間違った結果を返します

  23. 23

    関数の日付の引数のデータ型が間違っているか、結果が小さすぎるか大きすぎるエラー

  24. 24

    Java-ユーザーが日付範囲を選択できるようにして、日付範囲が7日または14日であることを確認するにはどうすればよいですか?

  25. 25

    BigQuery:テーブル範囲デコレータが間違った結果を返すことがあるのはなぜですか?

  26. 26

    日付がデータベースに保存されていなくても、日付の戻り結果が間違っている

  27. 27

    間違ったローカルDNSの結果がどこから来ているのかをどのように把握できますか?

  28. 28

    Python Bokehを0.12.4にアップグレードしたところ、JSONオブジェクトの型文字列が間違っているというエラーが表示されます

  29. 29

    日付の結果を日ごとに分割してグループ化できるMySQLで利用可能な関数はありますか?

ホットタグ

アーカイブ