V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  la0wei  ›  全部回复第 6 页 / 共 39 页
回复总数  761
1 ... 2  3  4  5  6  7  8  9  10  11 ... 39  
2023 年 6 月 21 日
回复了 la0wei 创建的主题 Python Python + mysql 多条相似 sql 语句查询如何加速?
@wxf666 这个不能说,police 相关的内容,表结构我都不能说。
2023 年 6 月 21 日
回复了 la0wei 创建的主题 Python Python + mysql 多条相似 sql 语句查询如何加速?
@TimePPT csv 是查询条件。这个操作不会……压根就不知道有这个操作。待我搜索看看,谢谢提醒
2023 年 6 月 21 日
回复了 la0wei 创建的主题 Python Python + mysql 多条相似 sql 语句查询如何加速?
@colinlikepotatos 查询程序和数据库在同一台电脑。相当于说本地开了一个服务器,打开网页慢,虽然后台处理逻辑非常快,但是页面加载很慢,这就有点奇怪了。虽然配置不高,cpu 和内存应该够用了,唯一怀疑的可能是硬盘,是 hdd 。我的 sql 语句并不复杂,最有效的索引也开启了,优化的空间不大

@wxf666 是我问题问的不好,因为数据比较敏感,没有想到比较好的类似的例子来举例。
1.重用上一次查询获取的数据,大概 20 次以内。

2.是的。
基础语句:
select * from bookstore where 条件 1

然后细分出
select * from bookstore where 条件 1 and 条件 2.1
select * from bookstore where 条件 1 and 条件 2.2 and 条件 3.1
这么排列组合的话大概十几二十次。


之前怀疑 sql 执行慢,所以想只查询
sql * from bookstore where 条件 1
后面的查询自己手写,但是觉得太傻了,先看看有没有方案再考虑暴力去算。


还要有对应的
select count(*) from bookstore where 条件 1
……
……
这里就麻烦了。没想到怎么加速,只能 python 写代码循环算。根据测试效果还不错,都在 0.1 秒内,比等数据库划算。
数据库理应更快的,只是我没有 debug 的手段

目前看瓶颈是在 network ,python 只执行一条语句,然后后面全部靠编码自己算确实是一个有效的规避手段

3.数据量在 180W ,使用 sqlite3 测试查询速度和 mariadb 差不多

准备换环境试试,这是一台隔离环境的电脑,装有专用软件,目前跑 win7 ,幸好原先有双系统,准备换 win10 试试,或者加个固态。当时装 mariadb 就是因为 mysql 找支持 win7 的找烦了
2023 年 6 月 21 日
回复了 la0wei 创建的主题 Python Python + mysql 多条相似 sql 语句查询如何加速?
@colinlikepotatos 视图和存储过程杀鸡用牛刀了,先简单的开始一点一点优化。
with...as 测试了下,没有显著减少时间。

环境实际是 mariadb 10.4.12 ,查询程序与 mariadb 在一台电脑上,带宽延迟应该都不是问题。用 heidisql 执行语句,发现有提示耗时的功能
查询 0.031 sec.(+3.307 sec. network)
等于说查询速度其实是很快的,至少这个量级我是满意的,0.1 秒都不到
但是 network 这个耗时太无语了,python 写了个测试程序,从查询到结果确实是这个时间。

没找到如何优化这点。目前思路是合并 sql ,看 1 条 sql 语句是否比多条节省 network 时间。
用 union 合并两条相似的查询,单条大概是 0.031 sec.(+3.307 sec. network),合并后又让人看不懂了
查询 8.190 sec (+ 0.281 sec. network )
耗时的位置调了个。

@wxf666 用了索引,根据 heidisql 的提示,查询不到 0.1 秒,后面的是网络耗时,具体消耗在哪里我还在查。

csv 超过 2000 行数据,每行有个编号,根据这个编号去查询 6 次,完整程序查询次数可能翻倍。

就是写个 python 程序,从 csv 读取,去数据库查询,查询结果写入另一个 csv
2023 年 6 月 21 日
回复了 la0wei 创建的主题 Python Python + mysql 多条相似 sql 语句查询如何加速?
@LeegoYih 有必要的,一条 sql1 秒多。我根据一个 csv 查询相关信息,整个文件跑完要 3 个多小时
@colinlikepotatos 这个方法好,我试试看
https://alternativeto.net/software/fiddler/
看看 mitmproxy 是否满足你需求
2023 年 6 月 13 日
回复了 justincnn 创建的主题 Google Google Blogger 好像千年不更新,但是一直活着
@tozp 我是放在 cf 的,cf 好像有什么技术可以转,但是我测试不成功
2023 年 6 月 12 日
回复了 justincnn 创建的主题 Google Google Blogger 好像千年不更新,但是一直活着
@tozp 请教裸域是怎么绑定的
2023 年 6 月 12 日
回复了 justincnn 创建的主题 Google Google Blogger 好像千年不更新,但是一直活着
回答不了
最近也在搞 blogger ,无需折腾,无广告,确实挺好的
2023 年 6 月 8 日
回复了 Vraw5 创建的主题 宽带症候群 听说广东电信系统出现故障
补充 31 楼,可以打电话给我江苏移动的卡,中断间隙偶尔有几 K 的流量,只能收几条推送消息
2023 年 6 月 8 日
回复了 Vraw5 创建的主题 宽带症候群 听说广东电信系统出现故障
用的流量卡归属地是佛山电信的,今天下午没网,鼓捣半天没效果,原来原因在这
2023 年 6 月 5 日
回复了 la0wei 创建的主题 MySQL oracle 临时表 二次查询 子查询
@DOMO 非常感谢,这个也进入待选项,我研究下
@d2moqi @bl
踩坑如下,不管结果如何,记录下来,方便后来人

oralce 版本都是 11g11.2.0.1.0
服务器是 centos6
客户机是 win7
下载文件 pdi-ce-9.4.0.0-343.zip

Pentaho data integration(kettle),spoon 反正不管啥名字,这软件运行起来了,功能界面倒是很容易理解,但是在连接数据库那里卡住了

首先报错 driver class 'oracle.jdbc.driver.OracleDriver' could not be found,make sure the 'Oracle' driver (jar file) is installed.
显然没有连接驱动的关系,下载 ojdbc6.jar 放 pdi 的 bin 目录即可,需要重启软件加载。至于更高版本的 ojdbc 没有尝试。

依然连接数据库报错,特意复现了下:
Connection failed.verify all connection parameters and confirm that the appropriate driver is installed.Listener refused the connection with the following error:ORA-12505,TNS:listener does not currently know of SID given in connect descriptor
搜索才知道要在数据库名称前加 / ,不然会报 ORA-12505

以为表输入、插入更新两个步骤就行了,看报错是对 NULL 处理有问题,然后加了个 if field value is null 的步骤

但是又有问题了,插入那对 NUMBER(13,6)转换有问题,提示 java.lang.String cannot be cast to java.lang.Double

估计是在 if field value is null 的转换还是有问题。

暂时踩坑这么多,后面看情况,字段太多,每个都来一遍太累了,后面可能退而求其次直接 dump 数据库
2023 年 5 月 22 日
回复了 nky9527 创建的主题 程序员 outlook 邮箱套路。。。🤮🤮🤮
@ohwind 我直接用家宽 IP 注册的,也是不需要手机号。google 必须开梯子,但是在注册阶段就已经要手机号了,不像微软,暗搓搓的
2023 年 5 月 22 日
回复了 nky9527 创建的主题 程序员 outlook 邮箱套路。。。🤮🤮🤮
楼上凡是说 IP 不干净的,你们都是使用固定 IP 的吗?有几个家宽能拿到固定 IP 的?此外,家宽动态 IP 的话,你们又怎么在登录前验证 ip 是否干净?

前几个月为了把 onedrive 家庭版用起来,注册一个邮箱账号,在 PC 网页注册时,验证码那里始终过不了,验证通过后又让点击,反复循环,后来在手机注册的,倒是没有让填手机号,但是后来再次登录账户时就要求手机号绑定了,确实感觉是套路
@d2moqi 看到一篇文章《超详细的六款主流 ETL 工具介绍及功能对比》,对 ETL 工具对比,声称 kettle(pantaho)对数据库表结构有要求,存在一定侵入性。对这个工具不了解,是这样的设计吗?对数据库无 /低侵入性优先,易用性第二,开源免费第三
@d2moqi ETL 这个词听说过,估计有戏:)
@liprais debezium xstream 这两个我都看看
@liprais 我搜了下 ogg ,似乎要开启归档模式,我要去数据库验证下,有什么低侵入性的替代吗
1 ... 2  3  4  5  6  7  8  9  10  11 ... 39  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1283 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 17:31 · PVG 01:31 · LAX 09:31 · JFK 12:31
♥ Do have faith in what you're doing.