V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Justin3go  ›  全部回复第 3 页 / 共 5 页
回复总数  86
1  2  3  4  5  
@xyxc0673 OKOK ,感谢,我再看看怎么调整起来更好看一些
@timnottom 哈哈哈哈对,就是这个,感谢收录
@kilvn 主要就是爬虫部分,收集数据,像普通搜索引擎一样放个爬虫到互联网上去爬取,只是提取的是带有云盘链接的文本,然后就存入到使用了倒排索引的数据库比如 ElasticSearch 之类的,最后就是写个网站调用 API 就可以了

(扩展一下:其实不一定是云盘搜索,也可以是书籍搜索、PDF 之类的搜索,只是存的资源不同而已)

前面写过一篇博客[浅谈搜索引擎原理]( https://justin3go.com/%E5%8D%9A%E5%AE%A2/2023/08/17%E6%B5%85%E8%B0%88%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E5%8E%9F%E7%90%86)可以瞧瞧
@xyxc0673 谢谢肯定,提升空间可以具体一点吗,接下来不是很忙,可以继续优化优化这个网站
@chanChristin 遭,怎么还是有这个问题,我再看看
324 天前
回复了 Justin3go 创建的主题 分享创造 做一个微信小程序版的短链接平台?
@cmlanche
@ao99
@gongquanlin

好吧,这个想法打住了
@yiyun223 @wu529778790 感谢肯定
@easymbol 从未受到过如此二字评价,谢谢🥳
@hack21 感谢感谢
@abcdecsf OKOK ,感谢
@gkinxin 还没看内容,不过交互挺有意思,感谢推荐
2023-09-06 14:01:37 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@silverzidan 可以,是一个不错的地方
2023-09-06 11:50:34 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@Tyrant1984 hhhh ,喜欢就好,请耐心等待,它会变得更好的
2023-09-06 11:49:52 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@GeekAsher 目前感觉优化爬虫策略效果大于增加资源,因为从后台来看爬取了太多无用的资源进行分析了,互联网的网页太多了,得找一个合适的策略进行提前过滤,比如最简单的根据 url 后缀判断是不是静态资源,是就跳过爬取之类的就可以节省很多资源
2023-09-05 13:50:21 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@justincnn 哈哈哈哈,你这比喻,妙啊
2023-09-05 09:22:43 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@GeekAsher 没钱整不起这么多服务器资源
2023-09-04 23:12:37 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@GeekAsher 确实是一个痛点,后续会逐步迭代优化爬虫策略以获取更多资源
2023-09-04 17:27:32 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@sunnicholas 感谢反馈,后续优化
2023-09-04 11:44:02 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@lycpang hhhh ,能帮助到大家我也很开心
2023-09-02 09:48:06 +08:00
回复了 Justin3go 创建的主题 分享创造 做了一个阿里云盘的搜索引擎
@PecanBrant 目前还能用,不过要看攻击者啥时候攻击了,一攻击就会导致服务器拒绝服务。
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2725 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 10:20 · PVG 18:20 · LAX 02:20 · JFK 05:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.