V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  iseki  ›  全部回复第 3 页 / 共 48 页
回复总数  945
1  2  3  4  5  6  7  8  9  10 ... 48  
@laminux29 PG 的这个 trigram + GIN 很粗暴,不会有假阴性问题,缺点就是读放大有点大。
这个需求最大的问题是,如果不加其他限定条件,那就必须考虑当输入的 keyword 很短时,召回特别大量数据以至于几乎无法使用的现实问题。
@lambdaq PostgreSQL 有个日本人写的扩展,bigm ,2gram
@laminux29 不会有错误结果,现实中都是使用 like %keyword% 搜索,数据库会在使用基于 k-gram 分词的 GIN 索引基础上再做一次 recheck 。
trigram 就是分词,索引是 GIN 或者 GiST 。我们这边线上在用,没什么大问题。
@sagaxu pg 一般这种场景直接用 like ,系统会自动加一个 recheck 解决假阳性
@laminux29 non-word 是指空白符什么的,数字属于 word ,虽然我也不知道这是哪里的规定
107 天前
回复了 abstime 创建的主题 Java 文件上传后解压缩的问题
@wnpllrzodiac 7Z 格式怎么就非标了,主要是 Zip 格式太老了,字符编码都没统一,确实风险有点大。
123 天前
回复了 firhome 创建的主题 职场话题 闻所未闻的倒计时思路。。。。。
这功能挺好玩的。
你不能因为自己做着麻烦就说人家需求逆天啊。
@xuanbg 我何时说跟前端有关系了?
考虑找找无绳电话?(但是这种东西安全性存疑),正常点的方案家用的没听过,商用的…部署门槛就很高吧
即使这样我觉得用 JWT 也不是不行:
1. JWT 有标准化的规格说明,IETF RFC ;
2. 没必要为了节省传递 token 的那点流量把自己的路堵死,日后万一需要无状态降级也有机会;
@BarackLee 移动路障不危险吗
132 天前
回复了 Jackiee007 创建的主题 问与答 大伙 微软服务喜欢走直连还是代理
Windows 更新和 Store 直连,其他代理
就怕微信的备份丢三落四,到时候东西没了就好玩了
132 天前
回复了 winterbells 创建的主题 Kotlin 屎山代码一则
这已经不是什么语言的问题了😩不过我大概猜测,是不是哪里一直持有这个 activity 的引用啊,要不然怎么会想到干这种事
134 天前
回复了 baobao1270 创建的主题 Cloudflare Cloudflare 关闭 ECH 的方法
话说关这个是为了解决什么问了?因为 ECH 只有在 DNS 都工作正常的情况下才可能用,大陆显然工作不正常······
138 天前
回复了 donggua997 创建的主题 职场话题 组内有一些很恶心的人,怎么办
其实有很多事都没这么复杂,比如我会直接对领导讲:你给我的这点钱,只够我做到这个程度,某某自己偷懒,我不会替他擦屁股,你可以考虑换个人接手这块的工作。
1  2  3  4  5  6  7  8  9  10 ... 48  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2853 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 12:37 · PVG 20:37 · LAX 04:37 · JFK 07:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.