V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  lithbitren  ›  全部回复第 9 页 / 共 17 页
回复总数  334
1  2  3  4  5  6  7  8  9  10 ... 17  
用递归和循环可以实现嵌套关系查询,相当于所有变量和值的关系存进堆空间的感觉,即便是不能直接循环的 sqlite,也可以用 with 来解数独,传统 sql 表达能力还是很强的。
2020-07-06 00:20:34 +08:00
回复了 systemcall 创建的主题 Android 感觉手机太重了,有办法让它变轻点吗?
俺还希望多加电池,重点都无所谓
刚注册 leetcode 的时候,100 个 easy 我做了一个周末,还是用 py,18 岁的我肯定做不到。
2020-06-29 19:00:18 +08:00
回复了 199678i 创建的主题 程序员 现在出北京到别的城市需要隔离不?
估计整个城市新增为零一段时间才可能不要核算检测,起码要七个月底了。
2020-06-28 23:22:05 +08:00
回复了 zzzmh 创建的主题 Redis 一直有一个好奇,如果网站用 redis 作为唯一的数据库,会怎样?
在知乎上看到好像有公司是真的堆 redis 做数据存储的,就是太费钱,不过老板喜欢,其他暂时没有太严重的问题。
不过也就看过这么一例,也不知道是不是编的,网上绝大多数碰到这个问题的都是劝退,也几乎没人敢尝试放在业务上。
2020-06-27 22:45:19 +08:00
回复了 liuser666 创建的主题 程序员 手机无线投屏的原理是什么?为什么电脑不行?
手机各种投屏基本都是把源推到电视,推完以后手机可以关掉 app 都可以继续播
2020-06-26 11:05:35 +08:00
回复了 Colorful 创建的主题 Python 请教一个 Python 爬虫,抓取 JS 变量的问题
以前还不会正则的时候碰到过这种,直接

i = html.find('window._xxxx = ')

获得头坐标,然后再

j = html.find('</script>', i)

获得尾坐标,然后再

json.loads(html[i + len('window._xxxx = '): j])

就可以得到对象了。。
2020-06-25 15:08:36 +08:00
回复了 vertigo 创建的主题 程序员 [巨型难题] 如何通过 Python ,确定图片剪裁位置
涉及拉伸用循环大概率是不行的,最好还是用现成的模糊匹配库
2020-06-25 13:31:22 +08:00
回复了 Radeon 创建的主题 DNS 向工信部投诉 ISP 的 DNS 劫持需要准备什么证据?
三四年前投诉过没用,投诉转到当地的工程师连 dns 污染都没听过(或者是在装傻),当时就听网上说投诉多了会剔除,但貌似也没有,现在基本都是 https 了,已经比较少碰见了
2020-06-25 10:31:34 +08:00
回复了 naldo0193 创建的主题 Python 请问有快速和准确的汇总长短文相似文章的方法吗?
最长公共子序列要用的话,得回溯除出所有连续的公共序列,过滤掉重复几个字或十几个字的,然后再加总求百分比,直接求只能求出最长的那个长度,多个短公共序列是不能直接得出的
2020-06-25 10:25:09 +08:00
回复了 PUBG98k 创建的主题 程序员 请问有 360 的人在这里吗?求助
360 市场份额已经过大,而且跟 guojia 安全已经深度绑定,叫用户拒用 360 是不太现实的
2020-06-23 20:50:54 +08:00
回复了 zckun 创建的主题 Python 问个 Python 性能相关的
students = [
ㅤ{
ㅤㅤ'class': random.randrange(2000),
ㅤㅤ'sex': random.randint(0, 1),
ㅤㅤ'height': random.randrange(150, 190)
ㅤ}
ㅤfor _ in range(1_000_000)
]

collect = collections.defaultdict(lambda: {
ㅤ'maleSum': 0,
ㅤ'maleCount': 0,
ㅤ'femaleSum': 0,
ㅤ'femaleCount': 0
})

for student in students:
ㅤif student['sex']:
ㅤㅤcollect[student['class']]['maleSum'] += student['height']
ㅤㅤcollect[student['class']]['maleCount'] += 1
ㅤelse:
ㅤㅤcollect[student['class']]['femaleSum'] += student['height']
ㅤㅤcollect[student['class']]['femaleCount'] += 1

result = [
ㅤClass['maleSum'] / Class['maleCount'] - Class['femaleSum'] / Class['femaleCount']
ㅤfor Class in collect.values()
]

测了测,百万级数据查询时间肯定不超过半秒,这还是用带键名的,如果把临时字典换成数组,估计还能再将快几倍,拆分数组类型到 numpy 然后开 numba,估计还能再快几倍,几十分钟居然就真等了。。。
2020-06-23 20:43:22 +08:00
回复了 zckun 创建的主题 Python 问个 Python 性能相关的
什么鬼,数据才 68 万,遍历一轮数据记录把男女身高总和和个数装进字典,然后遍历字典计算差指输出,最多不超过半秒。
主楼三十亿个学生是够吓人的,几十分钟是要的。
2020-06-22 16:33:00 +08:00
回复了 p1094358629 创建的主题 Python Python 怎么获取多线程的总执行时间??
requests 的 asyncio 版 requests-async 也可以,或者是 httpx 也行,不过要配好官方协程,最好把 py 的版本弄新一点,不然有时候可能会出现莫名其妙的 bug 。
2020-06-22 16:19:48 +08:00
回复了 p1094358629 创建的主题 Python Python 怎么获取多线程的总执行时间??
不明白难点在哪,希望知道总时间就直接测 main 的执行时间,需要知道各个线程的时间,就在重载的 run 函数首尾加上计时就行了,然后存字典存数组都可以直接存。io 密集的无所谓,如果 cpu 密集的最好给 run 函数传入一个进入线程的时间参数,不然有时候可能一开程就被挂起了,导致时间测量不太准确。

不过这个循环也有点迷,如果判断 queue 不为空,判断完以后如果其他线程先把队列消费空了,那 get 方法就阻塞了啊。

对于这种固定数量的任务,既然都用 requests 了,那直接上 grequests 就完事了,最多重写一下里面的方法加个成功的回调(原生库里面只有失败回调)。
2020-06-21 01:05:27 +08:00
回复了 qazwsxkevin 创建的主题 Python 为什么两个字典对比,结果和想象的不同?
字典里用内置库的 decimal.Decimal 比是相同的,再排查下是不是 sqlalchemy 模块的问题
2020-06-18 20:27:07 +08:00
回复了 hejw19970413 创建的主题 程序员 这几天通过做算法题,谈谈自己的对语言的感觉
@786375312123 我说的时间复杂度讨论不是这种,说的是那题的两种解法一种是 O(m*m*n)一种是 O(m*n*n*n),python 必须依据 m 和 n 的数据规模分类讨论成 O(m*n*min(m, n*n))的复杂度才能过,其他语言都不用。
2020-06-18 12:22:09 +08:00
回复了 cabbage 创建的主题 Go 编程语言 Golang 泛型他来了!
@notamail list 还好吧,而且队列手写也好写啊,直接用数组性能比 list 快几倍,我说的是 container/heap
1  2  3  4  5  6  7  8  9  10 ... 17  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2668 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 05:31 · PVG 13:31 · LAX 21:31 · JFK 00:31
Developed with CodeLauncher
♥ Do have faith in what you're doing.