V2EX › dongxiao 的所有回复 › 第 1 页 / 共 3 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2 3

❮

❯

2022 年 4 月 12 日

回复了 LeeReamond 创建的主题 › Python › 有关生产环境下替代 pandas 新一代的一些数据分析框架，有用过的朋友吗

试试 ‘dask‘
https://dask.org/

2022 年 3 月 22 日

回复了 cwjwgg 创建的主题 › 程序员 › 求套类似问答的知识库系统

自己开发的一个知识问答系统，供参考 `https://github.com/memirror/magicMirror`

2022 年 3 月 21 日

回复了 ChuangChang 创建的主题 › 电影 › 求一些脑洞大开的电影

《那个男人来自地球》

2022 年 3 月 11 日

回复了 qjbcnrs 创建的主题 › 程序员 › 自定义指标查询，有什么好的实现方法？

规则引擎，比如可以看看 Drools

2022 年 3 月 4 日

回复了 LeeReamond 创建的主题 › Python › numpy 对二维数组按某行或某列排序问题

```
d[:, d.argsort(axis=1)[0]]
```

2022 年 3 月 4 日

回复了 yagamil 创建的主题 › Python › pandas dataframe 时间作为索引时如何转化为日期而非时间？

执行的时候应该有条 warning 信息吧：
```FutureWarning: Indexing a DataFrame with a datetimelike index using a single string to slice the rows, like `frame[string]`, is deprecated and will be removed in a future version. Use `frame.loc[string]` instead.
```

所以你应该这么执行：
```
df.loc["2020-01-01"]
```

2022 年 1 月 7 日

回复了 turtlekey 创建的主题 › 生活 › 分享一下小学时发生的两件趣事

想起了那年的高考作文，`深处种菱浅种稻，不深不浅种荷花`，我硬是理解成了写保护环境😂

2021 年 11 月 11 日

回复了 keroppi 创建的主题 › Python › pandas 怎么对比当前行的前面 7 天的所有某列的数字？

pandas 先 rolling 后聚合，比如以每一天与过去 7 天做比较：
1. dataframe.rolling("7d").min() == dataframe
2. dataframe.rolling("7d").min()

2021 年 9 月 3 日

回复了 lwgo 创建的主题 › 奇思妙想 › 做一个开源的聊天机器人，怎么样？

做了个`魔镜`，可以问一些天气、医药、名人八卦、诗句啥的
https://github.com/memirror/magicMirror
https://github.com/memirror/mmflask

2021 年 8 月 4 日

回复了 lskjdfgl 创建的主题 › MySQL › 基本工资标准表数据库怎么设计

可以考虑用拉链表

2021 年 6 月 23 日

回复了 enderftt 创建的主题 › Python › Python lambda 改写

```
print(list(map(lambda x:x.update({'5':5}) or x,d)))
```
用 update 也没啥问题，比如可以用如上这种 trick 来实现

2021 年 4 月 17 日

回复了 Te11UA 创建的主题 › Python › 异步 MySQL 库 databases 的 Table 结构怎么从经典模式转成 ORM？

``` python
from sqlalchemy import select

query = select(User)
```
试试这种可行嘛

2021 年 3 月 26 日

回复了 2bin 创建的主题 › Python › 请教 Python 中 xpath 如何实现这种需求

html.xpath("string(//a)")

2021 年 3 月 26 日

回复了 badacook 创建的主题 › Python › pandas DataFrame

```python

col1 = pd.Series(['a', 'b'])
col2 = pd.Series(['x', 'y'])
col3 = pd.Series(['1', '2'])

col1, col2, col3 = map(pd.DataFrame, [col1, col2, col3])
col1.index = [1 for _ in range(len(col1))]
col2.index = [1 for _ in range(len(col2))]
col3.index = [1 for _ in range(len(col3))]

r = (
col1
.join(col2, how="outer", lsuffix="_col1", rsuffix="_col2")
.join(col3, how="outer")
)
r.columns = ["col1", "col2", "col3"]

print(r)
```

2021 年 2 月 17 日

回复了 kwklover 创建的主题 › 程序员 › 分享：如何实现一个高效率的查重系统？顺带问问各位 V 友大牛有没有更好的实现方式

试试 Embedding+FAISS

2020 年 12 月 10 日

回复了 jayzau1973 创建的主题 › Python › 请教一个关于 Mysql 连接的问题

我用的 sqlalchemy，采用的方法是设置超时后把 session 设成 global，然后开了个多线程在超时前销毁 session 并重建，用的地方 import 这个包就行

2020 年 9 月 9 日

回复了 Te11UA 创建的主题 › Python › Python 如何优雅地处理子线程异常？

使用装饰器，把捕获逻辑提取出来

2020 年 9 月 7 日

回复了 uti6770werty 创建的主题 › Python › 求优雅又高效率的写法，对字典列表，根据字典的多个 k,v 键值对，去重复。。。

这就是 SQL 根据某几个字段 distinct 吧，可以用 pandas 转成 DataFrame 然后 drop_duplicates，设置 subset 即可，或者用空间换时间，建个 set 存储已见到的数据 tuple，不在 set 内则追加新列表，一遍循环即可

2020 年 8 月 23 日

回复了 yellowtail 创建的主题 › Python › 求教一个 pandas 赋值失败的问题， pandas 赋值机制到底是怎么回事...

@yellowtail 区别很大，.loc 相当于按键值取，你即使对 dataframe 重排，.loc 取得的值仍是不变的，.iloc 则是按位置，顺序变了取的值也就变了。看了下描述，你的需求可以用 dataframe 的 apply 实现或者 series 的 map 实现，用的广播方式，并行计算，如果用循环那可就太慢了

2020 年 8 月 21 日

回复了 yellowtail 创建的主题 › Python › 求教一个 pandas 赋值失败的问题， pandas 赋值机制到底是怎么回事...

试试 df.loc[1,"a"]=1

1 2 3

❮

❯