V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  msg7086  ›  全部回复第 192 页 / 共 1022 页
回复总数  20422
1 ... 188  189  190  191  192  193  194  195  196  197 ... 1022  
@dawniii 几百 GB 的数据表,做过滤查询的时候只查出一部分不是很正常吗?
如果你用 JOIN,能保证充分利用索引做高速连接,我觉得是没有问题的。
不过这里主要讨论的是不做连接的时候性能会受到多大影响的问题。
实际开发环境中有很多查询,在使用 JOIN 时无法充分利用索引,或者至少 MySQL 会比较笨不去用索引,这种时候做简单查询然后手动去处理,可能会比依赖数据库内部查询优化速度更快一些。毕竟查询优化并不一定能洞悉你最终的意图,并不一定能给出最佳的查询计划。

楼上#187 里也举了很多相关的例子,提到的这些其实也就是我们上面提到的,服务器更容易扩展,更容易利用查询缓存,减少锁等等。我个人并不反对使用简单的 JOIN 查询,但是对于应用层简单而数据库层复杂的查询,我是绝对会放在应用层做的。
冒号前面是 key 冒号后面是 value,你再帮他说一遍,你等于……(走错片场了

一般用 2 就行了,如果 key 重复的话也可以用[[k1, v1], [k2, v2]]这样的结构。
@hackingwu #173 你说得没错,很多公司写项目是提前考虑读写分离数据延迟的。
但是反过来看,没有提前考虑数据延迟的项目,在遇到数据库瓶颈的时候就要抓瞎了,得返工回去重新做结构。
这种把数据库当 KV 表的做法,可以看成是缓解数据库瓶颈的「另一种」做法。

@dawniii 所以你还是没说为什么呀。
「然后要在内存里组装一个巨大的 sql 出来吗」
所以就让数据库在内存里组装两个巨大的 joined dataset 出来吗?
一个 ID 撑死也就几字节,几万个 ID 也就占用巨大的几十 KB 内存。
几百 GB 的数据表,几十 MB 的索引,放在数据库内存里组装数据集你一点不心疼,几十 KB 反倒是那么心疼?

「如果数据量更大呢」
如果数据量更大,你会发现 MySQL 做 JOIN 或者子查询会更慢……

子查询也好,JOIN 也好,能用上索引和查询缓存的情况只会比单句查询更少。如果是 Oracle 或者 Postges 这些质量比较高的数据库引擎,可能还靠谱点。如果是 MySQL,放在几年前,你查询稍稍写偏一点,或者索引建得让引擎不舒服了,立马 扫·全·表。现在其实也没好到哪里去,但是因为 MySQL 本身速度还挺快的,所以扫全表就扫全表吧,眼不见为净了。
@starcraft #10 我们这种 211 水平的菜鸡学校没有这种作业。
顺便我们编译原理课大作业,全学院 95%的人是百度回来改改就交的。
2020-06-04 15:27:18 +08:00
回复了 pmispig 创建的主题 程序员 hive 每天数据清洗后导入 mysql 产生大量无意义 binlog
变动 binlog 本来就要高权限,你又不愿给高权限……
2020-06-04 15:25:53 +08:00
回复了 a2532521 创建的主题 Java 这段代码中,位运算,和 byte 是用来做什么的
用来拆字为字节。
@dawniii #167 取几万个 ID 然后再用 IN 查询为什么会慢,兄弟能不能说说看?
@hackingwu #97 数据库 Slave 可以集群,但是数据库集群是有一致性问题的,你往 Master 写数据然后回头从 Slave 读,读出来的不一定是新的值。维护一个 100 台 Slave 的集群比维护 100 台 App server 要难得多。
@ping2 ext4 小文件本来就没有太大优势,不如直接上 reiserfs 了。
@love 应用服务器跑满了堆机器就行,数据库跑满了咋办?改用读写分离又要改一堆代码还要保证数据一致性,还不如省事让 ORM 把数据装配完得了。
@hakono 各个大厂的小文件 FS 难道不是为了做大型集群?
楼主要是打算搞起一柜子存储服务器放个几百 TB 的图,那用小文件 FS 是挺好的。
如果只是单机的话,ReiserFS 或者 Reiser4 不能胜任吗?

@xchaoinfo 如果要考虑这种单文件迁移的话,可以看看 tar 包或者无压缩 zip 包,因为没有压缩所以串流起来很方便,可以直接定位便宜然后读数据。
2020-06-03 14:29:33 +08:00
回复了 xmge 创建的主题 程序员 golang 面试题之 为什么这种更快呢?
@yutou527 @lewis89
也不算完全不行吧,编译器也可以静态分析行为然后重写代码的。
我之前有些代码写完以后,用 clang 编译完发现出来的汇编和我写的完全不是一码事,而且性能还快得多。
就算没有这种重写级别的优化,基本的 unrolling 和并行化还是可以做的。
文件系统就是一个效率很高的数据库了。
你说的这些难道不需要同等的存储空间?不需要消耗那么多 I/O ?
2020-06-03 14:21:25 +08:00
回复了 sadfQED2 创建的主题 VPS 445 端口在国内全部被封了??
国外也封了,只有机房里还开着。你去国外用家宽试试就知道了。
2020-06-03 13:34:50 +08:00
回复了 jeblur 创建的主题 问与答 rsyslog 本身支持配置自动归档吗?
看看能不能定制一下 logrotate 之类的。
还可以想办法改用 GPU 。显卡同价位下性能可不是强一点点。
单线程占用多个 CPU 线程不是很正常的吗…
操作系统让这个线程在多个核心里切换啊。

比如 4 个核心线程,每个线程负责 25%的工作呗。
分散是标准操作,可以降低单个核心的负载,凉快,不至于一小块地方特别热。
至于 ryzen,因为有单核睿频差异,所以需要优先使用最优的核心。
2020-06-03 04:04:24 +08:00
回复了 PMR 创建的主题 问与答 购买外国区域的 license 在国内使用这种行为正确么?
看条款,条款没禁止即可为。当然不可描述行为本身是比较灰色的方式,毕竟绕过了地域检测,行为和那些国外卖的可描述工具绕国家看网络电视差不多。

大多数软件是没有明令禁止的,比如我 steam 国区账号买游戏在美国玩也没人说。
2020-06-02 18:14:25 +08:00
回复了 yjxjn 创建的主题 问与答 面试用 zoom,微信视频的,不怕候选者在线查么??
普通的公司面试根本不 care 你是否查资料。
甚至我之前做的在线考题直接明说,浏览器请关闭无关页面,只保考题页和一个用于查资料的页面。
2020-06-02 18:11:55 +08:00
回复了 Smash 创建的主题 输入法 大家好,历时 2 天,我放弃了小鹤双拼。
@SkYouth 是,所以我现在也很少会主动安利别人去学。
我这位朋友是看我这么打字以后主动想要学,所以我才跟进的。普通人日常打字,简拼够用了。
1 ... 188  189  190  191  192  193  194  195  196  197 ... 1022  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1042 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 85ms · UTC 21:29 · PVG 05:29 · LAX 13:29 · JFK 16:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.