好吧,我承认这是我自己弄的一个测试版本搜索引擎
稍微介绍一下
本人是一个老站长,也是一个 php 程序员
注册到了一个看着不错的搜索域名,就尝试搞一个搜索引擎出来
前期肯定没有实力投入硬件成本去爬取全网段互联网数据,所以目前采用国外几个搜索引擎资源整合渲染的页面。
先不谈有没有实力开发一个搜索引擎出来,我主要是想解决几个痛点
1 、现在各个站长的站点已经很难被大型搜索引擎收录,如百度几乎变成了一个综合性信息网站,基本是自己产品的信息,可以说已经不是一个真正的搜索引擎。
2 、普通网友是不得不使用百度,因为基本已经垄断,即使存在其他搜索引擎,但由于各大资本介入,发展方向几乎一模一样,就是各种 app 绑定流量入口,形成各自的信息孤岛。
3 、原创,伪原创,内容农场的观点我一直存在非主流观点;如百度强调发布的内容必须原创,但站长也是个人创业,很难保证所有信息都是完全原创,即使是百度自家的自媒体,或者其他家的各种某某号发布的内容,也是为了构造所谓原创内容,瞎编乱造,AI 构建等等为了原创而原创的内容而已。这样的信息垃圾何尝不是另外一种形式的内容农场呢?
总之,
ffsou.com 现在只是一个简单的爬虫过滤系统,目前先解决一个没有广告,不跟踪不记录任何个人隐私的简单搜索程序而已。
但后期会转移到国内公司化运营,并尝试联合各个站长共同讨论发展方向。
我理解的中文互联网并不是这样的,个人站长存在的价值也不是靠原创来定义的。
本质上目前的互联网还是一个以查询资料为准的资料互联网,首先需要一个流量入口,然后能链接到各个虚拟世界,每个站点可以理解就是一个虚拟世界。而非孤立的信息孤岛。所以内容当然以发布者原创为最小单位,但资源的整合,数据完整性等等都是个人站长存在的价值所在。
也就是互联网要丰富,必然少不了整理资料,优化资源,提供服务的个人站长存在。
所以原创是主流,但非唯一标准。只要是提供给网友有价值的内容都可以加入搜索引擎。
至于排名权重,将会弱化权重概念,特别是新闻,技术资料等领域的内容,并不是发布时间越久,点击次数越多,就是最高权重。反而是更新日期为标准,以用户点赞参与讨论热度为标准。
所以我是想构造一个完全与当前主流搜索引擎思维不一样的搜索引擎出来。
特别是收录这一块的规则。
目前新站点,小型站点,即使是原创,但由于大型站点默认权重高,导致大型站点爬取就有排名,新站点和小型站点却毫无办法。
包括什么 api 提交,sitemap 提交等等都是掩耳盗铃的做法。
提供一个网址+时间 有什么意义?
爬虫蜘蛛不来读取,而先去读取大型站点的内容,最后再来读取小站点提交的内容后再判断原创是否合理?
所以完全就是歧视或者忽略各个艰苦奋斗的小型网站作者。
还有很多想法会逐步去实现,目前只是来发布一个内测地址,希望大家多提意见和建议。