V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wangleineo  ›  全部回复第 36 页 / 共 40 页
回复总数  783
1 ... 28  29  30  31  32  33  34  35  36  37 ... 40  
2014-11-02 14:09:31 +08:00
回复了 wangtai 创建的主题 Python 推荐给玩 Django 的小伙伴一个开发插件
@wangtai 有意思,原来url dispatch还可以这样玩。
2014-11-01 01:47:00 +08:00
回复了 luw2007 创建的主题 奇思妙想 是否已经存在爬虫库交易网站, 类似极客网站
@luw2007 我觉得更有价值的是爬虫规则的人工维护。
写过爬虫的都知道,面对网页的结构调整和特征变化(比如元素id,className变了),爬虫很容易失效,解决这个问题有两个办法:1. 写出非常智能、健壮的爬虫;2. 人肉更新爬虫规则。现在看起来1似乎不太乐观,2可以用软件反复测试来发现失效,但是更新规则还是需要人的参与。所以如果有这样一个平台,提供爬虫源码(或者语言无关的抓取规则),同时鼓励所有用户自主更新已经失效的规则,用wikipedia众包的模式尽最大可能维持爬虫的有效性,还是蛮有价值的。
但是悖论在于,如果被爬的网站不希望被爬,那这个平台让爬虫变透明了,网站会故意打破抓取规则,最后变成‘看谁改的快’的游戏;如果网站希望自己被扒,那就开放API好了,爬取多麻烦。
2014-10-31 23:50:45 +08:00
回复了 fbxshit 创建的主题 奇思妙想 一个代替你做各种选择的公司
想起来‘分歧终端机’
范伟会投资这个项目的
Cool.
codewars的链接没加target='_blank'.
2014-10-26 20:47:24 +08:00
回复了 cbsw 创建的主题 分享发现 又发现一个好玩的东西 Windows93
开始菜单-find有惊喜
2014-10-26 00:28:20 +08:00
回复了 20140930 创建的主题 奇思妙想 我觉得腾讯出的这个视频信息量很大
当年看到也觉得不错,真相帝与和谐社会的故事,很容易抓住网民的心理。
工作室都没了?做游戏可真是九死一生啊
2014-10-26 00:13:54 +08:00
回复了 wengang285 创建的主题 分享创造 少年来一发,分享一个抓取豆瓣妹子的代码
@wengang285 代理地址是在哪里抓的?稳定吗?
2014-10-25 13:45:51 +08:00
回复了 Exin 创建的主题 Chrome 最近 Chrome 变差了只是我一个人遇到吗?
最近版本的chrome一直有问题,页面内有gif的话,内存泄露快速飙升到过G。
2014-10-21 22:28:56 +08:00
回复了 dfguo 创建的主题 酷工作 当我们谈招聘,我们谈谈信仰
一直挺关注Strikingly,不过好像产品主要面向国际市场的。
对国内怎么看,是不是用户没有付费意愿?
2014-10-19 22:31:12 +08:00
回复了 wangleineo 创建的主题 问与答 有没有人开发微信的第三方客户端?
@oott123 Atom-Shell开发跨平台看起来很不错,不知道和Adobe Air比起来怎样
2014-10-19 22:28:47 +08:00
回复了 wangleineo 创建的主题 问与答 有没有人开发微信的第三方客户端?
@oott123 这就是微信网页版加一个壳吧

@broadliyn
@tyhunter
@zts1993
@9hills
现在搜一下“微信协议版”,有好多款,已经发展成黑产了;没见腾讯有啥动作,可能影响还不大。
2014-10-19 15:09:10 +08:00
回复了 xhacker 创建的主题 分享创造 Miracle Board - 快速查看你的网站是不是挂了
Flask果然好简约,50行代码
2014-10-19 11:01:02 +08:00
回复了 wangleineo 创建的主题 问与答 求推荐一个 Django 的开源 blog 程序
找到一个: https://github.com/ichuan/djblog
应该够用了。
2014-10-18 13:15:32 +08:00
回复了 wangleineo 创建的主题 问与答 『传送门』是怎样获取到公众号刚刚发布的文章的?
(之前的有些微信公众号没有被传送门收录)
@0zero0 是的,收录的只是‘提交’到传送门的公众号。作者的初衷是让读者不通过微信就可以看自己关注的公众号。
2014-10-18 12:48:12 +08:00
回复了 wangleineo 创建的主题 问与答 『传送门』是怎样获取到公众号刚刚发布的文章的?
http://www.leiphone.com/news/201409/XQuYLvsTO0clyAnc.html
这篇文章说道:
“那么,百度收录这些公众号文章又是怎样做到的呢?
目前来看,方法有两个。一个就是因为有用户将公众号的文章分享到互联网上,从而暴露了链接,百度可以通过链接收录到这篇文章。另外一个,可以通过Sogou的微信搜索功能实现对公众号文章的抓取。从百度收录的具体特点来看,目前应该主要通过前者实现。”

传送门显然不是通过链接爬取,如果不是爬搜狗,难道有什么黑科技?
2014-10-18 12:29:01 +08:00
回复了 wangleineo 创建的主题 问与答 『传送门』是怎样获取到公众号刚刚发布的文章的?
难道微信的文章有RSS?
2014-10-17 20:57:25 +08:00
回复了 bobopu 创建的主题 程序员 从百毒下载的 Notepad++是不是有问题?
这还算好的,有一次下载Firefox,链接直接被重置成百度卫士的安装包。卫个头!
2014-10-17 19:12:36 +08:00
回复了 wangzhangwei 创建的主题 云计算 IDC 的一些事儿吧:IDC 机房参观指南?
上海的世纪互联21viacloud机房算啥水平?
2014-10-17 17:10:36 +08:00
回复了 deben 创建的主题 分享创造 神创意,微信的公众号还可以这样玩!
@oott123 黑科技无疑
2014-10-17 10:44:12 +08:00
回复了 fx 创建的主题 问与答 DOOM 启世录 这本书哪有卖的?
十年前看过,很鸡血的。现在卡马克去搞虚拟现实了,Oculus Rift。
http://www.baidu.com/link?url=0mDNdrx31yxS5DrGqbBMXbZqm5NUryTiepBkv-B5PVrDtEvR_5ztuBBESfRxvBsH
1 ... 28  29  30  31  32  33  34  35  36  37 ... 40  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2484 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 04:53 · PVG 12:53 · LAX 20:53 · JFK 23:53
♥ Do have faith in what you're doing.