V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  neoblackcap  ›  全部回复第 70 页 / 共 102 页
回复总数  2036
1 ... 66  67  68  69  70  71  72  73  74  75 ... 102  
2016-10-17 19:26:31 +08:00
回复了 CNAX 创建的主题 数据库 想参加一个大数据培训班,有推荐的吗?
说一下自己最近的经历吧,基本上每天都跟最少几十万的数据在打交道,有上百万的,我觉得能说明一些问题。

规整的数据很好分析,但是现实数据都是不规整的,有从 excel 文件来的,有数据库的,有 csv ,一个文件有 13 列,数据库却有 30 列,每个列名都只有意思一样,合并数据需要你来做

这个时候你必须要有开发的能力,一般公司是不可能专门配开发来实现你的模型,因为他们根本就不需要建模,不能用的模型都是垃圾。

同时数据量大上去了, excel 2013 也就支持到 100 万行左右的数据,超过这个上线必须开发。
开发能力很重要!
开发能力很重要!
开发能力很重要!

说完开发能力了,那么剩下就是拼线性代数跟概率论了。不过我目前用的也不多,就线性代数可能用得上一点点。

小数据分析大概就是上面这个样子,仅供参考。
2016-10-16 19:18:16 +08:00
回复了 diggzhang 创建的主题 职场话题 同事未经同意修改我的线上代码,该怎么办 T_T
你们撕逼直接在生产环节撕逼也是厉害,我们撕逼最多也就是在 code review 的环节
@mhycy 我说的 SQL 维护成本高就是指新人需要懂 SQL ,我更加指的是裸 SQL 。
你说的查询生成在我看来本质上就是 ORM ,你这样用没有问题,只不过你有没有试过 benchmark ?性能有没有提高?文档跟其他的 ORM 框架比起来怎么样?总不可能每个接触这套东西的人都来人肉问你吧?就算你愿意回答,你真有这么多时间吗?这些在我看来都是维护成本,至于为什么说裸 SQL 维护成本更大呢?原因是新人不用去了解各个数据库的 SQL 实现,他也不用去思考你这套东西跟已有部件的组合。
同时不要神化 SQL , SQL 能解决很多问题,但是用程序一样能解决,比如外键什么的都能自己进行检查来约束,数据库完全可以当成一个存储引擎外加+SQL 接口的组件来使用
我并不是排斥 SQL ,任何的事情都是要看环境的,你们适合的不一定适合其他人,可能你们本身团队的人员就比较强,我讨论的只是普遍情况下 ORM 可以解决大多数问题,而且很多问题可以通过软件设计来配合使用纯 ORM 的方式进行开发。
@mhycy 但是 SQL 有更高的维护成本,新人更难加入开发的队伍, Java 的出现就是为了让萌新都能成为干活的队友出现的。绝大多数的所谓灵活性都是为了一时自己开发爽。一个系统从业务逻辑以及架构设计上调整去适配 ORM 我觉得才是正路,因为 ORM 的学习成本比 SQL 低,那么就代表要成为你队友的门槛低,工作能通过堆实习生解决的问题都不是问题。
当然你的队友都很强,你们都能写出壮健性能高简洁明了的代码,那么当我没说。
2016-10-13 21:59:10 +08:00
回复了 lufficc 创建的主题 PHP 分享一片文章: Laravel 的核心概念,另请教 Php 大神。。。
php 不是一个请求一个进程吗?
2016-10-09 12:59:39 +08:00
回复了 pc10201 创建的主题 程序员 将 linux 服务器代维做为创业方向有前途吗?
看什么服务罗,一般来说,你们若是只提供重启,那么机房就已经提供了。若是运维的话,你们又是如何得知不是软件 bug 引起的呢?
要不就做成一个软件平台,参考各类监控,否者需求都是无限多的。
@bianchensz 丢过数据,不放心啊。硬盘就几百块,但是宝贵的图片就不止这个价了。
2016-10-07 23:21:09 +08:00
回复了 SlipStupig 创建的主题 Python 求推荐 python 靠谱的 mock server
还后端 mock 个毛线,叫前端用 express 自己解决。反正他们现在工作不是也要开 dev server 么?
@xspoco 啊,果然反了,反正必须是冗余,我目前是一比一镜像, raid 1 , raid 0 丢数据欲哭无泪啊
个人正在使用 qnap 的 TS-431 ,基本要有的软件都支持。关键是有 4 盘位。
相信我,硬盘绝对比你的宝贵信息价值低。
一定要上 raid 0 之类的冗余方案, raid 1 都是邪道。
@xjr1022 你们啊,用 Java 写的 IDE 就不要省内存啊,赶紧点 Help -> Edit Custom VM Options, 将"-Xmx"选项的值调大。整天触发 Full GC ,不卡才怪
2016-10-03 21:50:36 +08:00
回复了 lufficc 创建的主题 程序员 国庆撸了一篇文章, Git 的核心概念,望 V 友大神们指正
集中式版本控制,现在看来其实是跟实现有关,虽然楼主没讲,但是其实就是暗指 svn 。但是像 google 一样基于 GFS 建立的集中式版本控制,却的的确确可以容错,一个节点的崩溃不会影响整个系统的可用性。
2016-10-01 13:56:49 +08:00
回复了 livedutvchina 创建的主题 C 分享一位韩国女生的编程:使用 C++开发的 flight simulator
努力也是天赋?搞不懂你的逻辑
2016-09-30 23:17:21 +08:00
回复了 livedutvchina 创建的主题 C 分享一位韩国女生的编程:使用 C++开发的 flight simulator
编程与性别无关,正如智商与性别无关
能否学好编程大多数只与努力有关。
在我看来, 99%的编程还谈不上需要拼智商。
绝大多数的编程功力都是可以通过训练来提高,水平低就多读书,不要整天鼓吹什么性别歧视。
2016-09-27 13:32:21 +08:00
回复了 viator42 创建的主题 程序员 公司的商城 App 被人一分钱下单,不知道他是怎么办到的
服务端不校验商品价格,客户端生产订单,大概就是这几个问题
2016-09-25 22:21:35 +08:00
回复了 lufficc 创建的主题 程序员 一个问题,博客需不需要 Redis?
@reus 数据有缓存,但是缓存是可以定时过期?请问 mysql 的缓存能否做到 7200 秒之后过期?还有就是用户每次访问之后我要自动将 token 重新更新为 7200 秒,请问数据库如何操作。
我自问见识浅薄,不知道如何仅适用数据库优雅地实现这些功能。若是你知道,还望告知
2016-09-25 15:48:59 +08:00
回复了 lufficc 创建的主题 程序员 一个问题,博客需不需要 Redis?
@luffylcc OAuth2 生成的 token 肯定是放 redis , token 还要放数据库,那样多慢多麻烦啊, redis 自动过期释放,存放 token 这样的信息超级好用
2016-09-22 17:12:12 +08:00
回复了 miao445201 创建的主题 Python 新手向: PyCharm for mac 引入第三方库失败。
什么外部库?你这是 python 运行环境没设好,你自己指定的环境不对,好比你用系统 python2 的解释器运行 python3 的项目,不炸才有鬼。
python 开发,请使用 virtualenv
CPU 我能用多少?
1 ... 66  67  68  69  70  71  72  73  74  75 ... 102  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2850 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 14:15 · PVG 22:15 · LAX 06:15 · JFK 09:15
♥ Do have faith in what you're doing.