这是我的代码,我正在尝试从该站点访问评论,但显示错误。
class DomainCrawlSpider(BaseSpider):
name = "Spider"
allowed_domains = ["www.smahavarkar.wordpress.com"]
start_urls = "http://smahavarkar.wordpress.com/"
def parse(self, response):
hxs = HtmlXPathSelector(response)
titles = hxs.select("//p")
items = []
for titles in titles:
item = DItem()
item ["address"] = titles.select("a/text()").extract()
item ["review1"] = titles.select("p/text()").extract()
item.append(item)
return item
start_urls
应该是列表,请尝试更改为:
start_urls = ["https://www.zomato.com/cs/mumbai/restaurace?q=pop%20tates"]
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句