V2EX › chendajun 的所有回复 › 第 11 页 / 共 12 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 ... 3 4 5 6 7 8 9 10 11 12

❮

❯

2016 年 10 月 21 日

回复了 init 创建的主题 › Python › Windows 下 pip 安装 scrapy 出现问题

最经常出错的地方： lxml ， cffi ， pywin32 ， vc++forpython2.7 ，这几个库安装好了基本就差不多成功了，其中 lxml 和 cffi 又是每次必须报错的地方。 lxml 可以安装 wheel 文件，可以爬过这个大坑。

2016 年 10 月 20 日

回复了 coderjoy 创建的主题 › Python › 请问今日头条数据如何采集？

firebug

2016 年 10 月 20 日

回复了 coderjoy 创建的主题 › Python › 请问今日头条数据如何采集？

要学会用 firebu 等工具

2016 年 10 月 18 日

回复了 chendajun 创建的主题 › 程序员 › 春节都是回老家和家人团聚吗？今年春节假期打算出去旅游。不知道有多少人跟我有相同的想法。

@orderc 我想去日本玩，冬天的北京没什么好玩的，春节那会的北京就是一座空城，连吃饭的地方都没有。

2016 年 10 月 18 日

回复了 chendajun 创建的主题 › 程序员 › 春节都是回老家和家人团聚吗？今年春节假期打算出去旅游。不知道有多少人跟我有相同的想法。

@halmstad 同感，回去就是谁家买了多少万的车，生了几个孩子，挣了多少钱。

2016 年 10 月 14 日

回复了 chendajun 创建的主题 › Python › 怎么抓取今日头条视频（ http://www.toutiao.com/video/），用 firebug 可以找到视频的 URL，但找不到 URL 拼接规律。

@backto17 个人也感觉通过分析 js 拿到 URL 比较好，用模拟浏览器的方法效率不高，太粗暴，不够优雅。

2016 年 10 月 13 日

回复了 chendajun 创建的主题 › Python › 怎么抓取今日头条视频（ http://www.toutiao.com/video/），用 firebug 可以找到视频的 URL，但找不到 URL 拼接规律。

@jzp113 r 值是 17 位，估计有一定的规则生成。
@wang9571 V 站里没有头条员工吧？

2016 年 10 月 13 日

回复了 chendajun 创建的主题 › Python › 怎么抓取今日头条视频（ http://www.toutiao.com/video/），用 firebug 可以找到视频的 URL，但找不到 URL 拼接规律。

@jzp113 非常感谢！！！

2016 年 7 月 4 日

回复了 strahe 创建的主题 › Python › 请教一个爬虫问题

@strahe requests 拿到源码，再通过 json 或正则提取需要的元素即可

2016 年 7 月 4 日

回复了 chendajun 创建的主题 › Python › 用 pycrypto 解密报错， python2.7 中可以正常解密，但在 python3.3 和 python3.5 中报错。

@Crossin @lonelinsky 谢谢两位大牛的帮助，已经可以了。祝好！！！

2016 年 7 月 4 日

回复了 chendajun 创建的主题 › Python › 用 pycrypto 解密报错， python2.7 中可以正常解密，但在 python3.3 和 python3.5 中报错。

@Crossin 对，我也试了 bytedes_key 转成 bytes 后长度是 29 ，谢谢大兄弟！

2016 年 6 月 24 日

回复了 hippoboy 创建的主题 › Python › 有个爬虫的疑问

把抓过的 URL md5 一下，写到 redis ， mongo 等。每来一个 URL 就与库里比较一下

2016 年 6 月 19 日

回复了 chendajun 创建的主题 › Python › Python3.x urllib 或 requests 可以 post 中文吗？

@RTNelo json 是按照服务器端规定的格式拼接的，之前用 Python2.x 的时候直 post 中文。

2016 年 6 月 17 日

回复了 DingYuanfang 创建的主题 › Python › 初学爬虫，设计一个定向爬虫策略，请大家帮我看看，是否合理？

定向爬虫的话还是用开源爬虫吧。在用 Scrapy ，目前大概 400 个爬虫任务，基本稳定。

1 ... 3 4 5 6 7 8 9 10 11 12

❮

❯