我在Google电子表格中有1000个Facebook页面的唯一ID。我想抓取所有页面以获取其信息(喜欢,电子邮件等),我该怎么办?我也无法在浏览器中以及在哪里运行脚本的情况下运行搜索查询。请尽可能详细。感谢你 :)
我试图为此制作一个python脚本,但它仅适用于第一项。
import urllib as url2
import json
f=open('ids.txt')
for i in f:
url="http://graph.facebook.com/"+str(int(i))+"?fields=likes"
data = url2.urlopen(url).read()
print data
data2=json.loads(data)
print "number of likes on page with id "+str(data2["id"])+" has "+str(data2["likes"])+" likes !"
f.close()
ids.txt文件包含Facebook页面的ID。
1 493343230696447
2 1767379894975
3 122116091270024
4 545044065615713
文件对象是行迭代器,而不是单词迭代器。因此,您需要更改:
for i in f:
url="http://graph.facebook.com/"+str(int(i))+"?fields=likes"
到:
for i in f:
# i holds the line, not the index
index, page_id = i.strip().split()[:2]
url="http://graph.facebook.com/"+page_id+"?fields=likes"
# ...
这样,您可以在删除换行符('\n'
)之后将行拆分为index
和page_id
。
无需将page_id
字符串转换为整数再返回字符串。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句