首先我很菜,现在的话是自己在学 python 搞搞机器学习,爬虫什么的。结果导师突然叫我做大数据,但是我这方面毛都不会,想着去看看系统性学习的视频但是没什么时间了(年底就开题了),直接啃书的话有推荐书籍吗(最好 python 的,java 的话只能说是学过。。。),或者各位诸位有什么其他学习途径推荐吗。成功毕业了致谢里面一定谢谢各位
1
terencelau 2019-07-06 10:49:38 +08:00
做大数据就是提取庞大数据中的核心价值,然后机器学习、数据挖掘、深度学习这些都是处理数据的方法(获取核心价值的方法)而且之间方法有不小的共通性。
|
2
enaxm 2019-07-06 11:13:22 +08:00
入门容易,你想专业从事的话肯定搞不了
入门看林子雨的书、教程什么的 之后搭个简单的画像系统就行,参考下面这贴,这哥们只用了一周: http://www.voidcn.com/article/p-esoabbfy-brr.html |
3
enaxm 2019-07-06 11:19:13 +08:00
学习路径的话你可以先去牛客找找,不过从我的经验上来看,网上说的路线都比较片面,缺乏系统性。不过对你搞个毕设肯定是够了。
最近没大有时间,你问的足够细的话我可能解答一下。 https://www.nowcoder.com/discuss/41091 https://www.nowcoder.com/discuss/120918 |
4
yangmiemie 2019-07-06 11:22:49 +08:00 1
希望你首先理解大数据的相关概念,要做这东西你最起码要知道这东西是什么,从 what,how 的角度去做,最后实现出来之后思考 why 才是你更上一个台阶的步骤。大数据无非就是两个基础部分,存储和计算。后续再利用机器学习,深度学习结合 TensorFlow 利用你的数据分析训练处一个模型,或者直接数据分析得到有价值的东西,能够帮助人们预测或者知道某件事情或者数据的走向。java 需要学习,毕竟主流的大数据工具 Hadoop 就是 java 搞的。第一阶段可以先了解 Hadoop 的体系结构、原理、编程,第二阶段需要知道 NoSQL 数据库是什么,然后学习一下 Hadoop 生态的 NoSql ( HDFS、MapReduce、HBase ),第三阶段就是去学习数据分析引擎了,Hadoop 生态的数据分析引擎 Hive、Pig 等。再者再去学习一下流引擎,如 Spark、Apache Storm 等。最后在学习一下现在流行的实行计算引擎 Apache Flink,以及处理消息队列的 kafka。如果只做数据分析的话 python 也是可以的,要学习 numpy 和 pandas 等等。视频资源网上一搜一大把,实在不行就去哔哩哔哩找。希望能帮助你。
|
5
danshendog 2019-07-06 12:40:28 +08:00 via iPhone 1
不知道你是本科还是硕士...
若是本科的话,除非真的是很厉害的学校否则毕设都是想不过都难吧…… |
6
ljpCN 2019-07-06 14:27:23 +08:00 via Android
啃论文,善用 google scholar 以及 ieee 和 ACM 等等出版社的电子论文库
|
8
iyaozhen 2019-07-06 16:32:43 +08:00
大数据的话还是得 java,绕不开。
话说大数据不都是几年前风口吗?你们导师怎么开 dao 车。现在完善的教程还是很多的,是在不行就买网课 |
9
qq544230987 2019-07-06 16:35:18 +08:00
毕业,应该简单吧
|