ボードゲームギークのためのPythonWebscrapper

debugcn 投稿 Dev

結晶

Scrapperの目標は、どのボードゲームが最も高く評価されたかを分析し、並べ替えられたリストに出力することです。基本的に「名前：いいね」の辞書。並べ替えたいゲームのリストは次のとおりです：https：//boardgamegeek.com/geeklist/268396/20-most-anticipated-games-2020-11th-year-nominatio

PythonでFrameworkScrapyを使用しています。次のコマンドは、タイトルとイマイチを抽出するのに適していることがわかりました。

response.css('.fl > a:nth-child(2)::text').getall()
response.css('.recs a::text').getall()

ゲームの親指が0の場合に問題が発生し、Scrapyはその親指をスキップします。タイトルのリストが賛成のリスト以上であることを意味します。たとえば、上記のコマンドを使用して、25のタイトルのリストと20の親指のアップのリストを取得できます。名前のリストとサムズアップのリストが等しくなるように、空の文字列をデフォルト値の0に変換する方法はありますか？お気に入り：

response.css('.recs a::text').getall(default="0")

高く評価されていない場合は、次のようになります。

<a aria-label="Recommendations and tip info" class="js-score" href="javascript://" onclick="RecSpy( 'listitem', '7520669', 'tippers' ); return false;"></a>

クリス

各ボードゲームとそのいいねをメインのDOMとは別に収集する代わりに、いいねとボードゲームの名前の両方を含むすべてのセレクターをフェッチすることができます。

games = response.css('.mb5') # fetch every selector with class "mb5"
for game in games:
  name = game.css('.fl > a:nth-child(2)::text').get()
  likes = game.css('.recs a::text').get() or 0
  ...

擬似コードですが、あなたがその考えを理解してくれることを願っています。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

ボードゲームギークのためのPythonWebscrapper

ボードゲームギークのためのPythonWebscrapper

Quartoゲームボードのユニークな配置のためのPythonイテレータ

クアルトボードゲームのピースを表現するための最良の方法

簡単なボードゲームレビューのためのUML

ゲームスコアボードのAPIを実装するための最適なデータ構造

JavaのLudoゲームボード

Javaの戦艦ゲームボード

Androidボードゲームの実装

ゲームでのハードスタッター、HDDの障害、またはボトルネック？

処理用のゲームパッド制御+ Arduinoロボットを制御するためのAndroid

GooglePlayゲームのリーダーボードカスタム

ゲームボードフィルワードゲームの生成

コーダーのためのUnity3Dゲーム

Pythonゲームの内部リーダーボード

Javaでのゲームのキーボード入力

ゲーム用のC＃WPFキーボードの動き

スクラブルのゲーム実装のための柔軟で拡張可能なボーナスシステムの設計

画像内のクリック可能な要素-ウェブボードゲーム

ゲームボードの作成のためにPythonでpygameを使用して複数の線のすべての交点を見つける

基本的なカードゲームを構築するためのfirebase

ゲームの解決のために広告をクリックする

Bashのメモリと時間をベンチマークするためのバギー自家製コード

ターゲットのSwiftUI（カスタムキーボード）

ゲームのキーボード入力とイベント

ヘックスゲームボードの内容を正しく印刷する

iOS9のゲームセンターサンドボックス

Javaでのボードゲームの実装

ロンボク島でのEclipse - ゲッターとセッターの用途のための検索

Androidボードゲーム：多くのビューまたは1つの大きなビュー？

ぼやけた効果のためのシームレスなボックスシャドウ