V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ipwx  ›  全部回复第 41 页 / 共 200 页
回复总数  4000
1 ... 37  38  39  40  41  42  43  44  45  46 ... 200  
2021-12-06 00:41:40 +08:00
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
> 利用程序识别最多只能达到 pytesseract 模块这种程度的效果了吗?

pytesseract 是上古时代的东西啊,十年前的算法。当然比不上好歹有一坨 DL 工程师的百度。

你要牛逼,你自己写模型嘛
2021-12-05 15:09:02 +08:00
回复了 SuperMild 创建的主题 分享创造 gof: 一个可扩展的文件处理器(带截图说明)
这种小工具更适合用 Python 做 —— 插件也容易
2021-12-04 23:39:52 +08:00
回复了 refresh 创建的主题 投资 求教一个股票年化计算的问题,回答送分
所以我同一一楼,直接期末资产除以期初资产就行。
2021-12-04 23:39:09 +08:00
回复了 refresh 创建的主题 投资 求教一个股票年化计算的问题,回答送分
@refresh 你的需求过于复杂了,而且这个统计有些没有意义。

因为对于投资而言,空仓本身就是一种态度(看空)。事实上,按照证监会的规则,基金是不允许空仓的,不然你以为他们傻啊,真 A 股普跌的时候他们不会空仓嘛?
2021-12-04 23:33:16 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 说起来当年我做一篇论文,曾经有过最多 20 个实验在跑:四个数据集、每组各 12 个参数的组合,一个大表需要跑。那更是不可能复制 50 个 .py 文件或者 50 个 Jupyter Notebook 呗。只能按照我的工作流,实验代码项目化,IDE 里面自动同步到服务器(有共享文件系统,所以同步到任何一台服务器,等于同步到所有服务器)。

然后超参都通过命令行给,每台服务器还当时用了 Dask Scheduler ,一个好了就启动下一个。基本都是第一天挂上,第二天看结果。。。。

我还写了个 Vue.js 的结果收集页面 hhh
2021-12-04 23:30:10 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 当然后来做公司项目了,那还是必然差不多还是 IDE 优先 hhh 。反正真的上传代码都是 git push ,部署有 CI 。综上,无论是研究性代码,还是工程性代码,其实 IDE 效率都远高于单独用 Jupyter notebook 或者 vscode 。
2021-12-04 23:27:19 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 但是你以己度人了。

事实上我写代码从来都用 IDE ,无论是六万行 C++ ( CLion )还是 pytorch 模型( Pycharm )。Jupyter 我基本上只是在服务器上起 Jupyter Lab 用它的终端,实际写模型还是在 Pycharm 里面,打开它的 ssh 自动同步功能,修改的代码就自动上传到服务器了。

然后我当年实验室里面,二十几台服务器我配的,有共享文件系统。这样的好处是,在自己笔记本上修改了代码,瞬间可以在 20 几台服务器(其中四台 GPU ,共 20 几张显卡)的服务器上同时开多个实例调参数——你只是在各个不同服务器上的 Jupyter lab terminal 里面操作而已。这不比一个 Jupyter notebook 强太多了吗?

此外就是,我当年做研究,代码也是有层次、整理成工程的。甚至我自己都有一套自己的 tensorflow 组件库(后来是 pytorch ),可以 pip install 的。实验室不下十篇论文引用了我的组件库。

而且哪怕不是像我这样工程能力比较强的,遵照我的 workflow ,用起来也很爽。就是参考我上面说的,本地笔记本用 IDE 改好以后,瞬间就同步到二十几台服务器上了。真在截稿前 ddl 疯狂跑参数的时候,这实在太重要了。

啊顺便我自己有一套参数保存、读取和命令行读取的库。这样的话一个 .py 可以瞬间人肉调参十几组同时跑。这也是大前提。
2021-12-04 18:13:31 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
还有就是选中一块内容 Shift + Tab 是整体取消一格缩进。。。 也都是 IDE 的基本功能
2021-12-04 18:12:55 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 可是,所有编辑器都可以直接用空格替代 tab 啊。。。

包括配置 1 tab = 4 spaces 。。。或者 js 就是等于 2 spaces 。IDE 处理 tab 和缩进是很方便的,回车自动缩进其实也不用按 tab 。
这个作者是真爱,以至于有些洁癖。

看了看他最自信的亮点大概是:写出来的程序小而美。我似乎当年也有那个喜欢各种小而美的时代,觉得 Delphi 做出来才几百 K 的绿色软件,比 DotNet C# 高到不知道哪里去了。

为了这个目的才捣鼓了这么多 demo 。也是因为这个原因所以才热衷于写 demo 。

可惜,长大了才明白,把一个已经存在的东西做的小而美,其实没有多大意义。新东西才有意义,哪怕为了快速开发,是大而丑的。
呃、、、我的定义可能有问题。这个我不确定

回购的股票,和一开始就不流通的股本,到底是不是同等的,这个存疑。
1. 确实可以增发股票。
2. 公司可以回购或者卖出回购的股票。

事实上公司公开发行的股票(流通股)都不是它的全部股本。都会有一部分,甚至是一半股本不流通。而回购股票就是用钱把流通股变回不流通股,反之也可。不过这种行为一般只有大跌才会启动回购(稳定股价),等回暖再卖出。总体来说,回购行为一般是贴钱的,毕竟大跌的时候下场救市嘛。。。
2021-12-02 16:53:23 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 按你的逻辑,IDE 也有自动缩进辅助啊,也不难写 hhh
2021-12-02 16:52:55 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 意思是,既然只有正确缩进了,大家才能看得清,那“缩进”本身就不再是“自由”,本来就是 must 。

而且既然每个语言都有自己的“缩进个数规范”,那本来这也不是“自由”,本来也是 must 。

只不过 python 把这件事放到语言层面规定了下来而已。

所以只是大家不爽它不自由,而不是缩进本来有错。
2021-12-02 15:17:52 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
如果加上 JIT 。。。

看看 pybind11 和 V8 bind 在 C++ 里面的巨大编程难度差别就懂了。。。
2021-12-02 15:17:12 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
因为有了 GIL 和引用计数,不需要考虑多线程,是个会写代码的基本都能包装一个 C++ 的算法给 Python 。。。

搞(数学)算法的,大部分人都没有多少编程功底。但是他们能贡献大量算法,才有了今天的数据科学的繁荣。
2021-12-02 15:15:45 +08:00
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
Python 基本上是成也 CPython ,败也 CPython 。

基本上很多核心设计都是为了 glue c extension 而存在的。。。这个嘛,对于 web developer 就是傻逼,对于 data scientist 就是圣经。其他任何语言,包括 ruby, java, c#,哪个比 python 更容易黏合 c/c++ 扩展上机器学习、神经网络的?顶多还有个娘胎中的 julia 。
你们老师真挑。。。Python 没有这三样还能有啥。。。

数据库和数据结构都不是 Python 的特长,让你们做这个还要体现 Python 的特点和优势??

----

实在不行你做个数据库兼容层,把 SQLite 语法翻译对接到 PostgreSQL, MySQL 上。。。
2021-12-01 16:59:21 +08:00
回复了 among 创建的主题 MongoDB mongodb 中的递归查找子目录
就算是操作系统上面递归子目录也这么慢啊。。。

你要检索的时候秒出结果,你就需要加索引:

1. 要么把所有目录的前缀抽出来当 tag 扔进倒排索引。
2. 要么找个支持前缀匹配的数据库。

说实话你可以自己写一个程序挂在那里跑,专门维护内存索引,绝对不慢
1 ... 37  38  39  40  41  42  43  44  45  46 ... 200  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5311 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 35ms · UTC 03:45 · PVG 11:45 · LAX 19:45 · JFK 22:45
Developed with CodeLauncher
♥ Do have faith in what you're doing.