V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  NoOneNoBody  ›  全部回复第 72 页 / 共 167 页
回复总数  3337
1 ... 68  69  70  71  72  73  74  75  76  77 ... 167  
263 天前
回复了 LiuNeng 创建的主题 职场话题 周一吐槽一下被领导说不会说话
和国企、事业单位、政府打交道,一定要厘清“谁说了算”,然后走足够流程找准这个人
并不是说走关系,而是说这个人批准了,其他人无法反驳,但走流程是让他也无法被人质疑

OP 此题,虽然明面上主任>副主任,但实际副主任应该是主管业务的,他才是说了算的人,主任大多数情况是不理这事的,不经副主任的话,他想什么你就无法控制了,事情自然就难办了,另一个隐藏变量是主任没有对副主任的人事权
263 天前
回复了 LiuNeng 创建的主题 职场话题 周一吐槽一下被领导说不会说话
@shizhibuyu2023 #3
主任>副主任>科长,其实应该是主任 or 副主任,科长不够格
其中副主任和科长都是业务相关,主任不管这事,所以先要科长确认业务上有没有问题
应该是这个逻辑
以前会,现在不会
安卓+安卓+安卓(功能机)+安卓(功能机)
263 天前
回复了 bright0908 创建的主题 Python 小白求推荐人工智能学习路线和教程
好多模型人家都弄好了,写个程序其实不难,不怕见笑,我只会抄
例如 sklearn AgglomerativeClustering 聚类核心代码就两行
agglomerative = AgglomerativeClustering(n_clusters=n_clusters)
clusters = agglomerative.fit_predict(scaled_weighted_features)
但是大量的工作是怎么整理数据符合 fit_predict 的要求,还有就是跑一次可能很耗时,如果结果不理想,就要重新组织数据再一次,再一次,再一次……

更多的工作在查错,因为数据量太大,你搞不清是哪一个样本出错的,或者是怎样的错误
例如跑着跑着断了,报错是维度不一致,想维度问题其实是想不通的,一般数据都是批量处理的,不会出现单个数据维度异常,其实更大可能是某个数据为空或者 np.nan ,模型优先“检查维度”导致报错是维度不一致
原始数据不为空,但一些转换处理会导致部分变为空,例如 rolling 移动窗口首尾有窗口不够的问题,diff 左右值求差必然少一个,过滤数据后忘了“补齐”或“对齐”……诸如此类

还有前面说的 float 类型的事,数据没错,程序逻辑也没错,就是跑起来就报错,因为 pytorch 默认 float32 ,但 numpy 默认 float64……破,搞了我几个小时,一直以为数据错了
如果用到 numba 加速的话,类型也是大问题

个人建议 numpy/pandas 还是要熟,有批量转换和查找的能力,“查找”就是定位,找到哪一行哪一列的数据

我近半年写的代码,写出来都是很快,随机模拟生成数据都能跑,就是用实际数据就断,估计近半时间都是在花类型的查“错”上
263 天前
回复了 bright0908 创建的主题 Python 小白求推荐人工智能学习路线和教程
我是从人脸识别开始的……
机器学习可以不看,但 numpy ,pandas 还是要懂,无论什么学习,整理数据还是必须的,你不能靠 for 来完成数据处理
机器学习可以不看,但 sklearn 文档还是该知道怎么查,sklearn 的文档比较有用

ps: python 的类型问题烦死人,float32 和 float64 没指定好,都能导致 pytorch 跑不起来
我个人坚持送到家门是正确的,但我也从来不需要送到家门,除了大件和需要安装的,一直都不写真实地址

@ivvei #46
你这句话适合所有行业计件的岗位,如果他们都没压力,社会很和谐
我查物流时,经常看到快递员早上 8 点就开始派送了,那么加上装箱等等时间,估计早上七点就到岗了

这年头,想工作轻松自在,毫无压力,没多少人能做到
265 天前
回复了 Hole 创建的主题 职场话题 休年假期间直属领导连续打了 13 个电话
岳飞?
术业有专攻
重装吧,估计你的 em 什么配置搅乱了
或者找个免安装版本试一下,如果两个都是这样,那就不是 em 问题,可能是系统的问题了
@bugcoder #14
刚写完,还真是用了直方图计数,大致原理是这几句
bin_edges = np.linspace(np.min(sequence), np.max(sequence)+.1, n+1)
hints, _ = np.histogram(sequence, bins=bin_edges)
indices = np.cumsum(hints)[:-1]
arr = np.split(sequence, indices)
然后从 arr 逐个按权重提取
@jsjcjsjc #3
没用过,一般都可以,主要是 windows 格式的文本的话要注意,换行符是两个字符,单纯\n 是不行的,要\n\r
你的编辑器支持多行正则就可以了
@Famio #9
和我的思路很接近,只是这个思路处理密度接近均匀的可行,但我没想好#2 所说那种密度不均的情况,而且这种样本可能性不小
@yuyue001 #8
我本意是想 gpt 帮我找找哪个包的方法能实现,它阅读的手册肯定比我多很多,我以为 sklearn 有方法已经能完成这个,没想到没有找到
@lsk569937453 #2
原数列本来就密度不均的话,那也是没办法,只能抽取,不能生成
a 应是 1,100,205, 1000
b: 1, 8, 16, 1000
c:1, 600, 1000, 20000

@Oldletter #1
不需要唯一答案,只需要基本满足条件,其实就是减少随机抽样出现“密度过于集中”这种不可控的情况,人为干预一下
python 是层层依赖,项目大(主要是依赖多)的话确实分析很耗时
我项目不大,但依赖很多,也很耗时,就因为这个原因转 sublime+pyright 了
267 天前
回复了 omerg 创建的主题 成都 狗卵子电信
没有良民证都是罪犯
1 ... 68  69  70  71  72  73  74  75  76  77 ... 167  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2496 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 314ms · UTC 15:52 · PVG 23:52 · LAX 07:52 · JFK 10:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.