搜索

搜索

Web搜寻器类不起作用

debugcn 发表于 Dev

7

诺亚·胡伯·费利（Noah Huber-Feely）

最近，我开始着手构建一个简单的Web搜寻器。我刚迭代两次的初始代码可以完美地工作，但是当我尝试将其转换为具有错误异常处理的类时，便不再进行编译。

import re, urllib
class WebCrawler:
    """A Simple Web Crawler That Is Readily Extensible"""
    def __init__():
        size = 1
    def containsAny(seq, aset):
        for c in seq:
            if c in aset: return True
        return False

    def crawlUrls(url, depth):
        textfile = file('UrlMap.txt', 'wt')
        urlList = [url]
        size = 1
        for i in range(depth):
            for ee in range(size):
                if containsAny(urlList[ee], "http://"):
                    try:
                        webpage = urllib.urlopen(urlList[ee]).read()
                        break
                    except:
                        print "Following URL failed!"
                        print urlList[ee]
                    for ee in re.findall('''href=["'](.[^"']+)["']''',webpage, re.I):
                        print ee
                        urlList.append(ee)
                        size+=1
                        textfile.write(ee+'\n')

myCrawler = WebCrawler

myCrawler.crawlUrls("http://www.wordsmakeworlds.com/", 2)

这是生成的错误代码。

Traceback (most recent call last):
  File "C:/Users/Noah Huber-Feely/Desktop/Python/WebCrawlerClass", line 33, in <module>
    myCrawler.crawlUrls("http://www.wordsmakeworlds.com/", 2)
TypeError: unbound method crawlUrls() must be called with WebCrawler instance as first argument (got str instance instead)

米帕迪

你有两个问题。这一行是一：

myCrawler = WebCrawler

您不是在创建的实例WebCrawler，而只是将名称绑定myCrawler到WebCrawler（基本上是为该类创建别名）。您应该改为这样做：

myCrawler = WebCrawler()

然后，在此行上：

def crawlUrls(url, depth):

Python实例方法将接收方作为该方法的第一个参数。它通常称为self，但从技术上讲，您可以随心所欲地调用它。因此，您应该将方法签名更改为：

def crawlUrls(self, url, depth):

（您还需要对定义的其他方法执行此操作。）

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-10

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

TYPO3缓存预热，且搜寻器不起作用

来自分类Dev

如果更改属性，我自己的搜寻器不起作用

来自分类Dev

Web搜寻器尝试

来自分类Dev

Web搜寻器在列表之间提取

来自分类Dev

Web搜寻器网址错误

来自分类Dev

Web搜寻器-以下链接

来自分类Dev

Python Web搜寻器，深度问题

来自分类Dev

识别搜寻器

来自分类Dev

识别搜寻器

来自分类Dev

Web搜寻器中原子的惯用用法

来自分类Dev

Scrapy Web搜寻器教程中的错误

来自分类Dev

Web搜寻器设计中的DFS与BFS

来自分类Dev

运行Scrapy Web搜寻器时出错

来自分类Dev

Web搜寻器设计中的DFS与BFS

来自分类Dev

Scrapy Web搜寻器教程中的错误

来自分类Dev

Web搜寻器中的Python重复项

来自分类Dev

运行Scrapy Web搜寻器时出错

来自分类Dev

Web搜寻器从列表元素中提取

来自分类Dev

PHP Web搜寻器，检查URL的路径

来自分类Dev

Web搜寻器：Web内容未显示在html代码中

来自分类Dev

来自其他类库的基本控制器在Web API中不起作用

来自分类Dev

来自其他类库的基本控制器在Web API中不起作用

来自分类Dev

网络搜寻器无法正常工作

来自分类Dev

Python搜寻器验证图片

来自分类Dev

搜寻器返回空结果

来自分类Dev

Scrapy递归链接搜寻器

来自分类Dev

Google是否使用BLEXBot搜寻器？

来自分类Dev

关于Cookie搜寻器的想法？

来自分类Dev

如何保持网络搜寻器运行？

Related 相关文章

文章

热门标签

归档