V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  yuchting  ›  全部回复第 1 页 / 共 18 页
回复总数  349
1  2  3  4  5  6  7  8  9  10 ... 18  
57 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
把大象装进冰箱需要几步?
0 、如何吧文本词条化?然后把词条变成向量,然后吧每个短信的词条向量算出来。中文词汇五万六千余条,每个短信词汇大概在 5-10 。
1 、如何合理的抽样数据?大样本太多,需要降低样本。可以用随机抽样?
2 、对降低的样本进行人工标记。标记种类,比如骚扰、乱码文字、京东、淘宝、诈骗、淫秽等等。
3 、对标记样本的词汇向量机器监督学习( CNN ,RNN ,KNN 等)。分为两拨,一波学习一波测试。
4 、学习完成之后,再抽样大样本数据进行评价(样本数据划分词条,然后使用词条作为输入,标签作为输出)。
5 、评价结果如果和人的评价结果一基本一致的话,表示这个模型就很好了。
57 天前
回复了 andforce 创建的主题 程序员 约 192GB 短信样本如何标记分类?
把大象装进冰箱需要几步?
300 天前
回复了 toadloading 创建的主题 Pixel Google 的 Pixel 手机有什么特别的好处?
难道“贵”不是一个缺点么?
323 天前
回复了 cuimc 创建的主题 分享创造 我的作品 memocard 被阮一峰推荐啦
擦除之后 ctrl+z 记得做一下。
329 天前
回复了 superliwei 创建的主题 分享创造 国产软件征集中文名字
“仙人板板”,a 哈哈哈
329 天前
回复了 superliwei 创建的主题 分享创造 国产软件征集中文名字
其实就叫“板板”就 OK 了:“你新建一个板板把”,“这个想法可以记录到板板上”,“回头我到板板上查一下”,“张三的板板里面有”……挺好的,辨识度高,不会有歧义,顺口。
楼上说过了,换线,我之前用的一个 hub ,hdmi 输出 2K ,各种删,换了 Type c+dp 的线,好了。
我在这里推荐小米的 buds pro4 ,会不会被打?
2022-10-17 18:30:17 +08:00
回复了 liyunyang 创建的主题 程序员 公司要求用户敏感数据加密存储,大伙有什么建议吗?
@liyunyang 把 100W 手机号读取出来,放到一个 hashmap 中,占用多少内存?答案是 13MB-15MB 。
2022-03-02 09:46:56 +08:00
回复了 ooee2016 创建的主题 Linux 请教个远程执行 centos 指令的问题
用 python 、go 、c 等写一个微服务,监听一端口,http 服务,然后让他 curl 一下,执行就可以。可以给他设置一个密码,执行之后输出 source ip ,时间等等的 log ,还可以发微信、钉钉、飞书等机器人通知说执行了,看看有没有滥用之类的。
https://www.zhihu.com/question/465598253/answer/2199368036
世界上最贵的东西就是免费,世界上“最迷惑”的东西就是开源。
2022-02-10 16:37:59 +08:00
回复了 mmmfj 创建的主题 程序员 失业在家怎么减少焦虑情绪
只有趟过的人才知道工作的重要性,你厌烦的不是工作,而是那种“不好的”工作。好工作的 4 个条件:

So here it is. A good job is where a worker,
one, is fairly treated.
Two, has a promising future.
Three, feels psychologically safe.
And four, has a sense of purpose.

https://www.ximalaya.com/sound/495815897

愿你能找到好的工作,拥有美好的人生。
2021-11-02 11:10:27 +08:00
回复了 guangyaomiao 创建的主题 程序员 职级对标:互联网公司研发岗薪酬排行榜
好人一生平安~
2021-10-26 11:44:04 +08:00
回复了 monster1priest 创建的主题 Java Java 库为什么要这么写?
其实更吊的写法应该是 if((var a = getNumber()) > 0) ...
可惜没语言支持。
你不提醒还好,一提醒,大家都去找 [捂脸]
2021-07-27 10:05:43 +08:00
回复了 NotreDame 创建的主题 程序员 最近在恶补知识,发现成为一名优秀的开发真的太难了
PS
[长时间积累] ,有的时候我们很容易误解,我举个例子,我之前学英语,每天打卡 30-60 分钟,就跟着读 3 边,觉得应该可以了把,只需要坚持几年我的英文也可以了把?

后来从一个专业老师得知,她跟读一个 1 分钟的材料,一般是 20 遍起,有时候 50 遍;看美剧,一集刷 20 遍,直到台词倒背如流。

恐怖。原来除了 [长时间积累] ,还有 [高强度] 。我现在终于直到为什么高中的时候有些女生每堂课认真记笔记,下课也联系,但是学习成绩就是不好,原来和我一样只完成 [打卡] ,并没有用心的 [高强度] 。

如果我也能每天刷 3 个小时算法,然后把《算法导论》看 10 遍,习题做 10 遍,估计我也能超神。

人已工作,结婚生子,后悔不已。
2021-07-27 09:55:36 +08:00
回复了 NotreDame 创建的主题 程序员 最近在恶补知识,发现成为一名优秀的开发真的太难了
其实,只有一种能力是最厉害的,就是

[在短时间内掌握一门技能,并且把他用于输出]

很多时候无法完成这样的工作,是因为你的见识、基础知识、项目经验、沟通能力等等的 [内功] 不到位。

然而可悲的事情,很多时候,大多数人却浮于表面,认为一个人牛之所以牛,是因为他知道 AAA 、BBB 、CCC,其实,你看不到的,是他内在的各种基础能力,而那些基础能力,是需要长时间积累而来的。
2021-06-18 11:04:18 +08:00
回复了 IdJoel 创建的主题 Node.js 请教一个问题,做中间件的意义是什么?
先说意义:

中间件的实际意义是:把复杂的问题拆分成具体子问题,让更多的人一起解决这个大问题。
中间件绝大多数的时候会降低软件运行效率,而不是增加运行效率。


再说为什么:

随着用户的需求不断增大,之前一两个程序员能够实现的软件规模已经基本不可能出现了,软件原来越复杂,越来越庞大。所以需要大量的人,组成不同的团队,一起做,那么怎么样才能让自己的团队里的专心做自己的部分,而不关心其他的部分呢?只有划分模块,模块一划分,必定解耦,不然没意义,一解耦,必定出现无数中间件。


最后说自己一个故事:

以前自己一个人写 MMO 的客户端逻辑层,high 的不行,一开始就把原有消息系统、代理系统、工厂系统什么设计模式统统干掉了,直接函数调用,TMD 只会降低效率。虽然最后没啥问题,但是客户端就我一个。

若干年后,我去了一个庞大公司,发现逻辑层程序员就 30 号人,4 个小组,做不同的部分,客户端分成前 UI 、后 GamePlay,Haxe 、xml 、C++,OC,java,各种各样的代码……要是没有某些中间件系统隔离模块,绝对一锅粥……


最后,凡事没有绝对,软件工程也没有银弹。
2021-02-25 11:28:24 +08:00
回复了 MeloForsaken 创建的主题 程序员 彦祖们,请教下这个问题有什么好的解决方案?
重试其实不是重要的,必须要重试。
重点是,为每一个请求、应答加一个唯一 hash,然后每次处理需要 hash 比对、存库( memcache )。
否则,在事务中等待应答,效率太低。
2020-12-14 11:07:08 +08:00
回复了 pianjiao 创建的主题 生活 带娃真的是太崩溃了
快四十了,两个娃,大娃没请月嫂,我人生中觉得花的最值一笔钱,就是那两个月几万块的月嫂钱。
1  2  3  4  5  6  7  8  9  10 ... 18  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1213 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 18:03 · PVG 02:03 · LAX 10:03 · JFK 13:03
Developed with CodeLauncher
♥ Do have faith in what you're doing.