Python 爬虫问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› Pocoo

值得关注的项目

› PyPy

› pyenv

Python 编程

› pep8 Checker

Styles

› PEP 8

这是一个创建于 2770 天前的主题，其中的信息可能已经有所发展或是发生改变。

我有 7 个网站需要爬，但是每个网站抓的数据很少很少，这个 scrapy 里面是 7 个 spider 处理还是放在 start_urls 里面处理比较好

3 条回复 • 2018-06-20 17:46:55 +08:00

Leigg

2018 年 6 月 19 日

网站结构差不多就在一个 spider 文件中完成，解析代码肯定是爬完一个又得改一下的，丢一个 start_urls 列表也没啥问题

airhunter

2018 年 6 月 20 日

怎么简单怎么做，目前来看丢 start_urls 比较简单

beforeuwait

2018 年 6 月 20 日

支持 1 楼