我想从这个权益表中抓取实时数据并将其粘贴到 excel 文件中
我曾尝试使用 Python 的 beautifulsoup4 包,但是,数据并不直接驻留在页面 html 中,相反,它似乎是使用一些 javascript 或类似方法加载的
这是如何做到的
在 chrome 中打开页面。现在在 chrome 中打开开发者控制台。单击“网络”选项卡。现在刷新页面。
此选项卡显示您提出的请求(您可以看到大约 8 个项目)。
手动检查为我们提供了我们想要的:
https://www.nseindia.com/live_market/dynaContent/live_watch/stock_watch/niftyStockWatch.json
这是数据所在的链接。
现在,要将其放入 csv(可以在 excel 中打开),请使用 R 的 rvest 包:
library(rvest)
library(jsonlite)
url <- "https://www.nseindia.com/live_market/dynaContent/live_watch/stock_watch/niftyStockWatch.json"
page_html <- read_html(url)
data <- html_nodes(page_html, "p")
data <- html_text(data)
data <- fromJSON(data)
write.csv(data$data, "scrapedData.csv", row.names=FALSE)
如果您希望这是“实时”数据,您可以以(例如)5 秒的间隔运行抓取。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句