V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yucongo  ›  全部回复第 3 页 / 共 7 页
回复总数  140
1  2  3  4  5  6  7  
2021-05-07 14:25:58 +08:00
回复了 996bujiaban 创建的主题 Python 求解, python3,当数据大的时候,怎么列出全部排序可能?
import more_itertools as mit
%time mit.ilen(itertools.combinations([f'{i:02}' for i in range(0, 999)], 400))

内存并不是问题,时间是个问题,直到天荒地老也不会完结……

当然,上面已经有大佬说了可以用 C(999, 400)
2021-05-02 23:16:14 +08:00
回复了 overthemoon 创建的主题 问与答 求文件内容搜索软件
试试 ripgrep (rg),不过是命令行,但灰墙强大好用
试试 vuetify 或 buefy
2021-04-23 12:59:18 +08:00
回复了 eroko 创建的主题 问与答 8 瓶水 2 瓶有毒 6 个耗子 要求单次检验出结果
@JustLookBy 大佬这个程序 https://abiudoit.github.io/algorithmTest/checkPoison.html 给的反馈啥意思?
例如(第 5 号老鼠不想喝药啦:)),
10000000
01000000
00100000
00010000
00001000
00000000

反馈说:失败,毒药 0,1 和 0,2 存在相同死亡情况: 000000
毒药是 5,6,7 中的两瓶时,所有老鼠都安全吧
2021-04-03 23:45:59 +08:00
回复了 imn1 创建的主题 Python 现在爬虫对付脚本构造的网页还有什么方法,除了 selenium
playwright, 爬虫新利器
2021-03-27 15:21:05 +08:00
回复了 ling516 创建的主题 Python 写了一个 py 想让它在云服务后台运行
tmux 或 pm2

喜欢折腾的话还可以装 tmux-resurrect 插件。
2021-03-27 10:21:13 +08:00
回复了 badacook 创建的主题 Python Python 数据分析策略选择
Savitzky–Golay 或 lowess?
bert (或其他 embedding )+ faiss 或许可以一试。其实好像也可以利用 elasticsearch
win.withdraw() 或许是你想要的
2021-01-22 18:50:35 +08:00
回复了 xianxiaobo 创建的主题 程序员 我经常有一个复制粘贴的需求,有现成的解决方案吗?
@xianxiaobo 你是想用点击鼠标贴内容?试试 arsclip,可以固定在屏幕上。arsclip 和 clibor 都绿色、比较轻量级的程序,比较合我的口味。
2021-01-22 11:39:11 +08:00
回复了 xianxiaobo 创建的主题 程序员 我经常有一个复制粘贴的需求,有现成的解决方案吗?
我来安利一下 clibor,或许是你想要的。

不过 clibor 贴完后会自动调到第一位,所以贴三次后,原来的 1,2,3 位的 a,b,c 就成了 1,2,3 位的 c, b, a 。老版 clibor ( 149 及以前的版本) clibor 不能拷图,现在已经到 221 版,不知道什么情况。我中间换到 Win-V 了,少运行一个程序。

clibor 和 Win-V 各有所长( clibor 可以设置常用的内容,电邮地址,api 令牌什么),看需要是什么。
2021-01-09 17:38:01 +08:00
回复了 yucongo 创建的主题 Python 重提「英文词组」分词问题
@neosfung 感谢回复

我折腾了一个 pypi 包 https://pypi.org/project/phrase-tokenizer/

pip install phrase-tokenizer

开源 github 库: https://github.com/ffreemt/phrase-tokenizer
2021-01-07 11:45:28 +08:00
回复了 zhuzhuaini 创建的主题 Python Python 读取 TXT 如何按照关键行提取内容
pydantic + dotenv
2021-01-05 17:17:02 +08:00
回复了 yucongo 创建的主题 Python 重提「英文词组」分词问题
@zyx199199 感谢回复,我查查 Constituency Parsing 。之所以将 for 和 starting 划在一起是因为 for 单独一起就接近一个 stop word, 可有可无?其实 for starting a fire 划在一起或许更合理点。
2021-01-05 15:23:34 +08:00
回复了 BarryLu 创建的主题 Python 「英文词组」分词问题
不知道楼主有没有找到解决方法?找到了话能不能分享一下?

如果只是对名词词组感兴趣,spacy/textaxy/textblob 里的 noun_chunks/noun phrases/NER 或许有用。但我也是希望能像 jieba 做中文分词那样将英语句子分成有意义的词组,例如:A match / is / a tool / for starting / a fire. Typically, / modern matches / are made of / small wooden sticks or stiff paper.

搜了一下,好像没有现成的工具,最接近的办法可能是用 spacy 的 rule based matching 匹配出 noun phrase (比较简单,有现成的)和 verb phrase 。textacy 里有个极简的 VP 常数('<AUX>* <ADV>* <VERB>')。

总之,离英语“词组分词”还很远
2020-12-29 23:42:42 +08:00
回复了 zictos 创建的主题 Python Python 如何一次性终止某个子进程下面的所有子进程?
import psutil

parent_pid = 30437
parent = psutil.Process(parent_pid)
for child in parent.children(recursive=True): # or parent.children() for recursive=False
.... child.kill()
parent.kill()

SO 答案
pd.read_csv(r"file.csv").astype(float).sum(axis=1)
2020-11-17 21:16:14 +08:00
回复了 ztoben 创建的主题 Python Python in 操作在 tuple 和 list 中到底哪个快?
In [112]: tuple_ = tuple(range(100000))

In [113]: list_ = [*range(100000)]

In [114]: %timeit 999 in list_
65.2 µs ± 16.8 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [115]: %timeit 999 in tuple_
60.3 µs ± 5.88 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [116]: %timeit 999 in tuple_
60 µs ± 4.19 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [117]: %timeit 999 in list_
54.2 µs ± 1.38 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)

其实几乎没有区别
2020-11-02 12:34:35 +08:00
回复了 imn1 创建的主题 Python 老生常谈,但还是问一下, Python env 选择
@renmu123 win 里用 poetry 没问题啊…… 还可以用不同的 Python 版本,修改 C:\Users\xyz\.poetry\bin\poetry.bat 里的 python(例如改成 py -3.8 ) 拷成 poetry38.bat

@echo off
py -3.8 "%USERPROFILE%\.poetry\bin\poetry" %*

就可以生成 Py3.8 的虚拟环境。我的 Windows 里各种用 poetry 整的 3.6 、3.7 、3.8 的虚拟环境。
2020-10-27 17:34:34 +08:00
回复了 yellowtail 创建的主题 Python 函数可变参数遇到固定语句无法判断参数关系的问题
all(elm > argv[idx + 1] for idx, elm in enumerate(argv[:-1]))
1  2  3  4  5  6  7  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3554 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 04:23 · PVG 12:23 · LAX 20:23 · JFK 23:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.