V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
nicoljiang
V2EX  ›  分享创造

继上次满月后,今天是多吉搜索发布的第 100 天,单月搜索量达到了 600 万...

  nicoljiang · 2019-09-23 13:02:19 +08:00 · 40410 次点击
这是一个创建于 1874 天前的主题,其中的信息可能已经有所发展或是发生改变。

今天是多吉搜索正式发布的第 100 天,不打算畅谈多吉搜索的未来,只是想记录一下目前的情况和总结一些感想。

现状:

  1. 继一个月左右( 35 天)搜索破百万后,目前单月搜索量达到了 600 万;
  2. 持续与攻击对抗(已经开始遇到刷关键词的黑产团队了);
  3. 新增了 天气搜索,可使用「天气、天气预报、北京天气」等关键词得到相应地区的 7 天每 3 小时天气预报;
  4. 新增了 四种贵金属的报价:黄金、铂金、巴金、白银;
  5. 成本持续提高(由于流量增长的超预期,目前自然搜索就已经把 7 月份用来对抗攻击的冗余部署充分榨干了);
  6. 从上上周开始,已经开始接触部分投资人了(有个人、有机构)。

感想:

  1. 要做好一种工具,而且是高频使用的工具,那么稳定持续、稳定地提供服务会增加用户地信任感(尤其对于没背景地野鸡工具而言),也许是 3 个月、也许半年,但这种时间的沉淀是必要的;
  2. 要管理用户的预期,要做到这一点首先要管理好自己的预期,不要盲目地认为自己的产品是某种救世主。这能帮助自己更好地对抗落差感,从而让用户更客观地使用;
  3. 要管理好曝光,不能不曝、也不能过爆,若产品有价值,那么一些有节奏地曝光就应该能走出一个不错的增长曲线,切忌用过多地市场行为来掩盖产品价值不足的核心问题,骗谁也不要骗自己;
  4. 不管多忙、多焦虑,都要主动接触美好的东西(漂亮的房子、网站、APP、景色),它们可以帮助你保持热情并对抗所有阴暗和负面的东西;
  5. 努力地做以前所想过地事情,努力地想未来可能要做的事,好的机会是为有准备的人而存在的(母上从小到大的教诲)。

最后

https://www.dogedoge.com —— 不追踪,不误导

再最后

期望少一些恶意的攻击。

第 1 条附言  ·  2019-09-23 16:38:10 +08:00
有人反馈遇到 503。

看了一下,又被攻击了,攻击 IP 是 211.95.52.34

恶意满满啊
第 2 条附言  ·  2019-09-23 18:02:48 +08:00

刚才的攻击,不知道得罪哪位大佬。瞬间拉了5-6倍的请求。 攻击

第 3 条附言  ·  2019-09-24 10:56:58 +08:00
看到有一些鞭策,也有更多的鼓励,非常感谢大家。
想跟大家大概聊一下关于广告:
多吉可能不会主打「无广告」,实际上也无法做到「无广告」,但希望能尝试出误导性不那么强,又能满足营收需求的广告。
目前来看多吉可能有一个不错的优势是:多吉几年内很难有「巨头效应」电商以及各个金主爸爸不至于因为站队问题而针对性屏蔽多吉。故,或许多吉可以有机会涉及更多更高价值的广告题材,而降低普通广告的打扰性。
307 条回复    2023-06-05 13:14:07 +08:00
1  2  3  4  
83f420984
    1
83f420984  
   2019-09-23 13:05:14 +08:00 via iPhone
最近 google 上不去了,就换成了多吉
MikeV2EX
    2
MikeV2EX  
   2019-09-23 13:07:55 +08:00 via iPhone
必须支持
iyaozhen
    3
iyaozhen  
   2019-09-23 13:15:27 +08:00 via Android
感觉天气预报的卡片出现的比较突兀
SteveZou
    4
SteveZou  
   2019-09-23 13:16:29 +08:00 via Android
我也换了多吉哈哈
NullException
    5
NullException  
   2019-09-23 13:16:33 +08:00
希望楼主不忘初心,支持。
Exia
    6
Exia  
   2019-09-23 13:16:50 +08:00
一直在用,就是因为你的那个口号,赞
wssy
    7
wssy  
   2019-09-23 13:23:45 +08:00 via Android
我用了大概一个月了吧,目前的主力搜索引擎。
对搜索语法的支持还可以进一步完善,比如 insite/intitle 这些不是很准确
just1
    8
just1  
   2019-09-23 13:26:51 +08:00
好奇怪,搜同一个东西,多搜几次顺序不一样,开关中文顺序也不一样。内容:司法考试
youthfire
    9
youthfire  
   2019-09-23 13:29:10 +08:00
最近正好特殊时期,确实是扩大知名度的好时机
Aliennnnnn
    10
Aliennnnnn  
   2019-09-23 13:36:23 +08:00
提个 bug,搜索框输入字母 a ,下拉提示框里会报错,其他字母正常
Parse error: syntax error, unexpected ';', expecting ',' or ')' in /data/wwwroot/default/index.php on line 375
NastyAir
    11
NastyAir  
   2019-09-23 13:43:26 +08:00
七月底在某次元看见的,除了前段时间会间歇性访问失败外,基本上很稳定。
万事开头难,中间难,结尾更难。
愿勿忘初心。
Shazoo
    12
Shazoo  
   2019-09-23 13:57:16 +08:00
还说有空一起八卦呢……结果外派了……
melonzzz
    13
melonzzz  
   2019-09-23 14:03:19 +08:00
狗哥牛皮
fengtalk
    14
fengtalk  
   2019-09-23 14:15:11 +08:00
不忘初心,继续加油!
Sornets
    15
Sornets  
   2019-09-23 14:17:45 +08:00
LZ 能否分享一下技术栈?
Tink
    16
Tink  
   2019-09-23 14:43:54 +08:00 via iPhone
我在博客做了个推荐
nicoljiang
    17
nicoljiang  
OP
   2019-09-23 14:45:25 +08:00
@iyaozhen 是出来的比较慢么?
@wssy 能否给我一些例子呢?可以邮件发我 [email protected]
@Aliennnnnn 这个问题我一直定位不到,也复现不了,目前清理了一下缓存,你试试还有报错么?
@NastyAir 因为那段时间有三次比较厉害的攻击。现在基本上每月都有很多次大大小小的攻击
@Shazoo 啊?
@MikeV2EX
@SteveZou
@NullException
@Exia
@NastyAir
@melonzzz
@fengtalk 多谢各位。
Ansen
    18
Ansen  
   2019-09-23 14:50:38 +08:00
自从知道这个以后,没 google 的地方都换成这个了
fengbjhqs
    19
fengbjhqs  
   2019-09-23 14:51:28 +08:00
非常好用,已经是我的主力搜索了,就是域名不好记
find456789
    20
find456789  
   2019-09-23 14:58:50 +08:00
建议 支持 计算器, 比如我 输入 1+2+3。 希望可以计算出结果等于 6, 请参考百度谷歌
Morriaty
    21
Morriaty  
   2019-09-23 15:04:24 +08:00
我也是做搜索的,楼主是多少人的团队啊,有技术博客或者技术群吗,对于一些具体的功能实现很好奇。
villivateur
    22
villivateur  
   2019-09-23 15:07:30 +08:00 via Android
居然搜到了我的垃圾博客,赞一个
v2elephant
    23
v2elephant  
   2019-09-23 15:20:08 +08:00 via iPhone
攻击其根本原因是动了那块蛋糕
Buges
    24
Buges  
   2019-09-23 15:24:08 +08:00 via Android
想知道这个是套壳其他搜索的前端还是整个引擎都是自己的。
i4oolish
    25
i4oolish  
   2019-09-23 15:31:56 +08:00
提个问题,目前在论文搜索方面做的不是很好,输入论文标题后,很难搜出来对应的 arxiv,ieee 等网址链接。
nicoljiang
    26
nicoljiang  
OP
   2019-09-23 15:40:17 +08:00
@Tink 多谢搞机男
@find456789 这个有在调研,但目前肯能还有一些优先级更高的,比如翻译
@Morriaty
@Buges 不是套壳,精力有限目前也没有技术博客和技术群
@i4oolish 能否给一些关键词看看
Sanko
    27
Sanko  
   2019-09-23 15:40:27 +08:00 via Android
感觉很厉害
feiffy
    28
feiffy  
   2019-09-23 15:42:30 +08:00 via Android
不忘初心,方得始终
cmlanche
    29
cmlanche  
   2019-09-23 15:42:42 +08:00
我顶🆙
koodai
    30
koodai  
   2019-09-23 15:47:58 +08:00 via iPhone
用着很好,向同事安利了,反馈较好。 期间报过两次 bug,楼主都有积极解决,赞一个 👍
LongLights
    31
LongLights  
   2019-09-23 15:48:19 +08:00
hewelzei
    32
hewelzei  
   2019-09-23 15:54:17 +08:00
我想问一下,样式和 HTML 结构都是 Copy DuckDuckGo 的,没问题吗?
lazyrm
    33
lazyrm  
   2019-09-23 16:03:18 +08:00
上次得帖子用到现在这个帖子,并持续用下去
Buges
    35
Buges  
   2019-09-23 16:15:31 +08:00
@nicoljiang #26 那就是说海量的数据都是自己爬取,整理,建立索引?这成本简直不可想象...
keith1126
    36
keith1126  
   2019-09-23 16:18:12 +08:00
居然搜到了我的博客,有点意外
kidcracker1
    37
kidcracker1  
   2019-09-23 16:23:40 +08:00
支持 度娘和 doge 都在使用
jkjoke
    38
jkjoke  
   2019-09-23 16:28:28 +08:00
搜索就 503.。。
jkjoke
    39
jkjoke  
   2019-09-23 16:30:39 +08:00
重新打开又好了,搜一些偏门小网站都能搜出来,厉害了
nicoljiang
    40
nicoljiang  
OP
   2019-09-23 16:31:09 +08:00
@jkjoke
@lazyrm 一直 503 吗?还是?
stoneabc
    41
stoneabc  
   2019-09-23 16:31:54 +08:00
似乎出问题了…?
503 502
junan008
    42
junan008  
   2019-09-23 16:32:37 +08:00
503
chunchu
    43
chunchu  
   2019-09-23 16:33:00 +08:00
为什么我这边是 503 ?

503
Service Unavailable

Error Times: Mon, 23 Sep 2019 08:32:11 GMT
IP: 119.98.144.88Node information:fxz39:15
URL: https://www.dogedoge.com/results?q=tinc&p=2
Check: Details
f94388
    44
f94388  
   2019-09-23 16:33:01 +08:00
还是喜欢谷歌,国内还是百度,做的小的时候可以说不追踪啥的,等有投资进来要变现的时候就不一样了
mogazheng
    45
mogazheng  
   2019-09-23 16:36:23 +08:00
看这贴第一次接触,试了下好像 503 的频率有点高,是流量突然太高了?
differentPlayer
    46
differentPlayer  
   2019-09-23 16:38:49 +08:00
第一次搜索必定 503.。。
nicoljiang
    47
nicoljiang  
OP
   2019-09-23 16:39:20 +08:00
@jkjoke
@junan008
@chunchu
@mogazheng

被攻击了,210.13.72.106 这个 IP。
Aether
    48
Aether  
   2019-09-23 16:39:43 +08:00
能否换一个简单点的,老年人也都简单易懂的域名?
Counter
    49
Counter  
   2019-09-23 16:40:46 +08:00
谢谢楼主,你的程序很好用
i4oolish
    50
i4oolish  
   2019-09-23 16:43:21 +08:00
@nicoljiang googlenet alexnet,其他有些模型即使是排在首页,也是很靠后的位置,靠前的更多的是知乎的帖子,或者简书的,比如 vgg,yolo,resnet。
heiheidewo
    51
heiheidewo  
   2019-09-23 16:56:59 +08:00
有点像集成了多种搜索,然后去掉了竞价广告。
jaaazzz
    52
jaaazzz  
   2019-09-23 16:59:01 +08:00
win10 ie11,无法输入中文
jaaazzz
    53
jaaazzz  
   2019-09-23 16:59:51 +08:00
不对,win10 ie11,整个输入框都有问题
admol
    54
admol  
   2019-09-23 17:06:51 +08:00
建议添加个搜索工具 刚刚想按时间搜一下最近的 发现没有
ffeii
    55
ffeii  
   2019-09-23 17:08:30 +08:00
有 PWA 的吗?
手机上 Safari 不能添加为搜索引擎,我就想着有没有 PWA 的,直接添加到手机桌面。
songsong
    56
songsong  
   2019-09-23 17:11:28 +08:00
我为什么不用 DuckDuckGo? 你这个完全是模仿的 duckduckgo
asche910
    57
asche910  
   2019-09-23 17:13:12 +08:00
可以问问搭了多少服务器吗
nicoljiang
    58
nicoljiang  
OP
   2019-09-23 17:16:10 +08:00   ❤️ 1
@ffeii 我回头研究一下这个。
@admol 后期会做
@jaaazzz 这么夸张?
@songsong DuckDuckgo 非常优秀,如果能满足需求,那十分推荐使用。
redford42
    59
redford42  
   2019-09-23 17:17:46 +08:00
可以
搜了一下我的詹叔叔
发现出来的信息蛮有诚意
alwaystest
    60
alwaystest  
   2019-09-23 17:20:28 +08:00 via Android   ❤️ 1
请问有 TG 讨论群么?
ivanyin
    61
ivanyin  
   2019-09-23 17:24:08 +08:00
支持
qyc0129
    62
qyc0129  
   2019-09-23 17:30:58 +08:00
支持祝好
love
    63
love  
   2019-09-23 17:31:29 +08:00 via Android
感觉质量比百度高,这是套壳的吧,不然百度的这么多人白忙了
l00t
    64
l00t  
   2019-09-23 17:35:17 +08:00
非常不错,我现在主力就用这个了
heheda0
    65
heheda0  
   2019-09-23 17:37:48 +08:00
界面和结果页很清爽,大多时候都用的这个,希望拉到投资后也能坚持
est
    66
est  
   2019-09-23 17:41:19 +08:00
牛逼了。
amwyyyy
    67
amwyyyy  
   2019-09-23 17:48:52 +08:00
已经作为默认搜索引擎两个月了,感觉良好。
zdnet
    68
zdnet  
   2019-09-23 17:51:01 +08:00
真的很好用哦。!!!
Wassermelone
    69
Wassermelone  
   2019-09-23 18:24:06 +08:00
看起来像 duckuckgo
shuson
    70
shuson  
   2019-09-23 18:26:40 +08:00
很好奇怎么做到的。学习学习
wlwlwan
    71
wlwlwan  
   2019-09-23 18:27:55 +08:00 via iPhone
@fengbjhqs ➕1
huihuilang
    72
huihuilang  
   2019-09-23 18:29:02 +08:00 via Android
很不错,搞一个捐赠入口吧,开发维护不容易
woshichuanqilz
    73
woshichuanqilz  
   2019-09-23 18:33:18 +08:00
不怎么用天气这个能不能搞个自定义啊, 不需要可以删除
xrr2016
    74
xrr2016  
   2019-09-23 18:34:48 +08:00   ❤️ 1
搜我的博客居然排到了第一位,太棒了吧!赞一个 👍
sepit
    75
sepit  
   2019-09-23 18:38:39 +08:00
搜索结果没有分页显示?
neqhqrim
    76
neqhqrim  
   2019-09-23 18:39:12 +08:00
搜索结果页右下角那个百度搜索有点碍眼。
JunoNin
    77
JunoNin  
   2019-09-23 18:39:46 +08:00 via Android
域名能有短域名更好
fengci
    78
fengci  
   2019-09-23 18:39:49 +08:00
@Sornets #15 搜索结果是好像是几个站的结果合并好像 找个偏门的关键字能对比 我看到了 bing google duckduckgo 的搜索结果。
ChrisYoung
    79
ChrisYoung  
   2019-09-23 18:56:20 +08:00 via iPhone
目前在用,感觉还不错,不过当遇到字符的时候效果不太好,比如^。
Very0ldMan
    80
Very0ldMan  
   2019-09-23 19:03:47 +08:00
挺好的,已经撤掉百度,用多吉搜索做主力搜索引擎了
littlewing
    81
littlewing  
   2019-09-23 19:16:38 +08:00
厉害,这个数据爬取和索引都是了楼主自己做的吗?
zhouwei520
    82
zhouwei520  
   2019-09-23 19:33:13 +08:00
支持下!
hydyy
    83
hydyy  
   2019-09-23 19:37:52 +08:00
只想说楼主牛逼!
laoyur
    84
laoyur  
   2019-09-23 19:39:56 +08:00
备案号字体大小和颜色好评
ik
    85
ik  
   2019-09-23 19:40:26 +08:00 via iPhone
我的一个 3 篇帖子的博客也收录了,感动😹
sephinh
    86
sephinh  
   2019-09-23 19:41:00 +08:00 via iPhone
谷歌搜中文有些还是有点水土不服,手机端的度娘简直无力吐槽,还好有 dogdog
Zeonjl
    87
Zeonjl  
   2019-09-23 19:43:51 +08:00 via iPhone
ok,帮你推广一下,希望好用,中文搜索
FS1P7dJz
    88
FS1P7dJz  
   2019-09-23 19:48:38 +08:00
号称不追踪的搜索引擎关闭了 cookies 居然不能用

劝你看看人家鸭鸭狗怎么做的
hyserendipity
    89
hyserendipity  
   2019-09-23 20:03:21 +08:00 via iPhone
确实不错,logo 问题一直没解决啊,哈哈哈
Felldeadbird
    90
Felldeadbird  
   2019-09-23 20:11:24 +08:00 via iPhone
我的网站也有收录,不错呀。敏感时期我试用一下!百度真的太糟糕了
stabc
    91
stabc  
   2019-09-23 20:11:51 +08:00
这个应该属于『元搜索引擎』吧,就是集合多家搜索结果。 比如: https://github.com/asciimoo/searx
maxxfire
    92
maxxfire  
   2019-09-23 20:17:06 +08:00
这么好的东西,会不会合乎当地法律法规呢?
AngryPanda
    93
AngryPanda  
   2019-09-23 20:18:16 +08:00
作死。
nicoljiang
    94
nicoljiang  
OP
   2019-09-23 20:21:18 +08:00
@FS1P7dJz 必须支持 Cookies 并非为了追踪,只是为了防止一些不必要的攻击。也许除了攻击外,支持无 Cookies 确实有重大意义,但我目前显然无力支撑。
nicoljiang
    95
nicoljiang  
OP
   2019-09-23 20:26:35 +08:00
@stabc
@fengci
@littlewing

数据来源并不 100%独立,但跟元搜索或者套壳有本质区别的。
反而 DuckDuckgo 的自然搜索结果倒完全算是套壳。
hyserendipity
    96
hyserendipity  
   2019-09-23 20:31:20 +08:00 via iPhone
@love 我也挺好奇的,搜索速度和匹配度都很不错,百度几万员工都在干嘛,就这么被吊打了?
stabc
    97
stabc  
   2019-09-23 20:32:21 +08:00
@nicoljiang 不清楚你说的『本质区别』是指什么,但是如果你用到了开源软件需要说明一下。另外感觉你这个有一定的 ZZ 风险。比如搜索『 reddit hongkong 』。
nicoljiang
    98
nicoljiang  
OP
   2019-09-23 20:57:35 +08:00   ❤️ 5
@stabc
这个区别一下子说不清楚,但我显然没有用 Searx,用了 SearX 的一眼就能看出来(知道 SearX 的人太多了)。
我可以简单说一下:倒排是 Solr,爬虫是自己的(没有独特的 ua,因为不支持 robot.txt ),分词是 ik 二开的,存储是 pika+mongodb。目前后端有 5 台服务器( 16c 128g 3t SSD )
想长期做的自然不只能套壳,但自己的数据积累需要时间,这很正常。头条搜索爆出来抓取百度的搜索结果,你要去抨击头条搜索也用 SearX 吗?是否稍显刻薄,而且 SearX 真的不算什么高质量的东西。

另外:「 reddit hongkong 」感谢提醒,回头处理一下。
chinesestudio
    99
chinesestudio  
   2019-09-23 21:25:31 +08:00
盈利了么 成本可以覆盖么 感谢分享
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2600 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 33ms · UTC 04:54 · PVG 12:54 · LAX 20:54 · JFK 23:54
Developed with CodeLauncher
♥ Do have faith in what you're doing.