V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  noparking188  ›  全部回复第 5 页 / 共 59 页
回复总数  1169
1  2  3  4  5  6  7  8  9  10 ... 59  
2023-12-16 13:37:02 +08:00
回复了 KOMA1NIUJUNSHENG 创建的主题 职场话题 国内搞大数据开发的小公司都有真本事吗
这种专门做数据的公司我呆过两家,都是垂直领域行业 Top ,对方应该也是个半吊子,内部数据架构还在摸索。
比不了电商、社交平台那种面向 C 端每天都有海量数据产生,单表数据过 T 不得了,各种冗余全加一起能达到 PB 级,数据维度多、价值高、关系杂、时效性高。
看完 DDIA 这本书,然后各找一个 OLTP/OLAP 数据库,还有 MPP 引擎学习一下原理和底层设计,这样大概肚子里有点货能吹牛皮了。
都是从💩开始糊起来的,想一步到位找到近似最优架构以后不换,很难办啊,先把💩糊了产品撑起来,以后再慢慢搞。
个人的话就多多关注下 Data Infra 领域的技术动向了,以前有个很不错的 DBWeekly 可惜早不更新了,那些云厂商的各种解决方案挺值得参考的。
2023-12-13 11:59:00 +08:00
回复了 yantianzhi 创建的主题 程序员 [阿菜求助]开源项目应该如何入手
你先看看这个 https://build-your-own-x.vercel.app/#build-your-own-web-server ,了解 web server 怎么设计实现的,
然后再去看 bottle 为什么这么设计。
我以前也打开过 bottle 源码,就学到了这个写法:
```
parser = ArgumentParser(prog=args[0], usage="%(prog)s [options] package.module:app")
opt = parser.add_argument
opt("--version", action="store_true", help="show version number.")
```
2023-12-07 10:22:30 +08:00
回复了 hanlin85 创建的主题 生活 最近在纠结是否要多买一套开发区的房
@Xmi080225 #34 看过《置身事内》吗,借用一句读书笔记,了解政府怎么做,比你自己觉得怎么做,要重要得多。
再推荐《八次危机》,可以解答你第二句前半部分的疑问,当然,那只是温铁军一家之言。
2023-12-07 10:16:49 +08:00
回复了 hanlin85 创建的主题 生活 最近在纠结是否要多买一套开发区的房
@purringpal #24 哦,这个人是清华经济学教授,讲宏观经济的,搬运的清华的线下课部分到 B 站,我觉得挺受用的。
2023-12-05 11:47:52 +08:00
回复了 hanlin85 创建的主题 生活 最近在纠结是否要多买一套开发区的房
看当地的规划,那边搞什么产业,有没有可能和能力落实,再看看 B 站 靳卫萍老师最新一期视频,总之就是跟着政策走
2023-12-05 10:02:07 +08:00
回复了 gongshishao126 创建的主题 汽车 人生第一台车, 10+ 到 20+ 油车求推荐
去看 b 站 铁秀
代码写好点,因为后面换公司了可能还要拿过来改改用,省得又重新写了,省下来的时间可以摸鱼
2023-12-02 12:42:10 +08:00
回复了 chensuiyi 创建的主题 程序员 陈随易 2023 年终回顾和 2024 年计划
呜呜呜,前端果然不学不行,我一个数开得重新学点前端和设计了
2023-12-02 12:39:18 +08:00
回复了 wenerme 创建的主题 程序员 开发用词强迫症?
收藏了
2023-12-02 12:02:50 +08:00
回复了 tomorrow092 创建的主题 问与答 那些想带女生入门编程的 过来看看, 我都被整破防了!
@noparking188 #53 提问
2023-12-02 12:02:19 +08:00
回复了 tomorrow092 创建的主题 问与答 那些想带女生入门编程的 过来看看, 我都被整破防了!
@cxtrinityy #29 这些人对技术没有钻研精神,工作以来遇到的人大部分都是这样,不懂疑问的艺术,也不会有任何改进,沟通起来很费劲
2023-12-01 09:53:12 +08:00
回复了 Chayebao 创建的主题 程序员 请教一下大数据 ETL 工具该如何选择。
@Chayebao 什么资源
2023-12-01 09:32:32 +08:00
回复了 Chayebao 创建的主题 程序员 请教一下大数据 ETL 工具该如何选择。
@Chayebao 一样的,你可以和老板吹嘘你用了 HTAP 分布式 NewSQL ,可以同时支撑海量数据实时和离线处理,开发和业务改动最小,基本写 SQL 就行,只是费点运维。今天剩下的时间你可以快速做个 POC 验证下
2023-12-01 09:08:44 +08:00
回复了 Chayebao 创建的主题 程序员 请教一下大数据 ETL 工具该如何选择。
@Chayebao 我建议,Fink CDC 同步的库换成 tidb ,开 tiflash ,SQL 只用改下加 comment hint 使用 AP 引擎,tidb 可以基本视作 MySQL 使用,调度还是用 dolphin ,支撑不了的复杂计算加 spark 集群,dolphin 可以直接集成,你所有的任务只要写 SQL 就够了
2023-12-01 08:51:32 +08:00
回复了 Chayebao 创建的主题 程序员 请教一下大数据 ETL 工具该如何选择。
@noparking188 你只有 TP 的存储系统,你要加一个 AP 的存储系统做 ETL ,你现在的架构算是传统数仓,且远比不上 SQL Server ,SQL Server 那一套现在都逐渐被淘汰了,AP 数据库支撑不了的处理,你加 Spark ,tidb 生态有 tispark
2023-12-01 08:45:49 +08:00
回复了 Chayebao 创建的主题 程序员 请教一下大数据 ETL 工具该如何选择。
BCD 库换成 tidb ,开 tiflash ,调度用 dolphin 或者 airflow 之类,回写实时可以用 ticdc
tidb 生态全方位兼容 MySQL
2023-12-01 08:41:01 +08:00
回复了 Chayebao 创建的主题 程序员 请教一下大数据 ETL 工具该如何选择。
@heyline 这个好用吗,体验咋样
2023-11-30 18:23:00 +08:00
回复了 liuguangxuan 创建的主题 生活 农村父母养老问题,我们可以做些什么?
1. 给父母交社保,要交满 15 年;
2. 城乡基本医疗保险,一年三四百;
3. 每个省或市的普惠保(医保),一年几十到一百多;
4. 商业医保补充,我买的好医保;
5. 自己多努力挣钱,自己有能力才是父母最大的保障;

当然,一个人的命运,既要靠自我奋斗,也要考虑历史的进程。现在主要看 2035 年规划是否完成。
@ZZ74 #21 😂 是的,把工作任务完成给发工资就行,少做吃力不讨好的事
2023-11-30 11:29:59 +08:00
回复了 c7in7 创建的主题 职场话题 记录人生的第一次被裁
恭喜恭喜,沾沾喜气
1  2  3  4  5  6  7  8  9  10 ... 59  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1115 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 23:07 · PVG 07:07 · LAX 15:07 · JFK 18:07
Developed with CodeLauncher
♥ Do have faith in what you're doing.