我正在寻找一种在Clojure中解析HTML的好方法。
正是我想做的是使用搜寻器获取网页的内容,然后获取某些HTML标记或其属性的内容。
所以我有该页面的URL,并且我将html作为字符串获取,但是如何获取所需的数据呢?
使用https://github.com/cgrand/enlive它允许您使用类似CSS的选择器进行选择和检索。
或https://github.com/nathell/clj-tagsoup
我没有标签汤的经验,但是我可以说enlive对于大多数抓取都有效。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句