V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Hlianbobo
V2EX  ›  Python

数据分析数据挖掘专业应该如何学数学?

  •  
  •   Hlianbobo · 2020-11-17 19:05:30 +08:00 · 1585 次点击
    这是一个创建于 1469 天前的主题,其中的信息可能已经有所发展或是发生改变。
    提出这个问题是希望能以数据分析或数据挖掘为最终学习目标的人,在学习数学知识的过程中如何少走弯路。以下是我按照该问题的不同阶段整理的框架。(由于本人目前无法区分数据挖掘和数据分析明确界限。因此以下讨论暂将两者放在一起讨论。回答时如有必要可以分开讨论。)

    1 、据我目前所知,做数据分析或数据挖掘。主要用到的数学门类有线性代数,概率、统计(有其他门类欢迎补充)。学习顺序一般是按照微积分、线性代数,概率,统计的顺序拾级而上。

    2 、学习微积分主要是为学习线性代数、概率、统计打基础,因为后三科中很多地方要用到微积分的内容。而微积分本身直接应用到数据分析或数据挖掘的地方不多。如果我说的不对,请纠正。

    3 、由于微积分知识本身深度和广度都很大。并不是所有知识点都会在线性代数、概率、统计中用到。同理,线性代数,概率,统计也并非所有知识点都用到了数据分析或数据挖掘领域。因此在学习每一门课的时候,突出重点就很重要了。重点部分除了要熟练掌握外还需要有足够的深度。以下图为例。

    https://chaoli.club/index.php/attachment/thumb/5fb3703005559


    如果要在学线性代数的过程中不因微积分基础不牢造成学习障碍。那么在学习微积分的过程中,就要重点掌握“微积分知识点 1”、“微积分知识点 2”。要学好“微积分知识点 1”,就要掌握好“微积分知识点 4”。
    同样以上模板也可以套用在概率和统计上。

    下面按照不同阶段和层次来套用上面的模板,提出具体问题:
    一、微积分部分:
    1 、学习线性代数前,需要重点掌握哪些微积分的知识点或章节?
    2 、学习概率前,需要重点掌握哪些微积分的知识点或章节?学习更高阶的概率知识前,需要重点掌握哪些微积分的知识点或章节?
    3 、学习统计前,需要重点掌握哪些微积分的知识点或章节?学习更高阶的统计知识前,需要重点掌握哪些微积分的知识点或章节?

    二、线性代数部分:
    1 、学习概率以前,需要重点掌握哪些线性代数的知识点或章节?更高阶的概率呢?
    2 、学习统计以前,需要重点掌握哪些线性代数的知识点或章节?更高阶的统计呢?
    3 、学习数据挖掘或数据分析前,需要掌握哪些线性代数的知识点或章节?

    三、概率
    1 、学习统计以前,需要重点掌握哪些概率的知识点或章节?更高阶的统计呢?
    2 、学习数据挖掘或数据分析前,需要掌握哪些概率的知识点或章节?

    四、统计
    1 、学习数据挖掘或数据分析前,需要掌握哪些统计的知识点或章节?

    五、除了以上四门数学,做数据挖掘和数据分析还需要学哪些数学门类下的哪些知识点或章节。

    有了以上架构除了能突出重点,还可以在学习相关数学理论时,时刻想到如何联系到应用层面。
    1 条回复    2020-11-18 00:41:56 +08:00
    jones2000
        1
    jones2000  
       2020-11-18 00:41:56 +08:00
    一般工具人只需要了解概念, 知道什么数据用什么方法分析, 算法什么的现成的库都有, 数据填上,算法选定,结果就出来了.
    除非你是自己开发算法库,那就需要了解原理,推导公式什么的.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3022 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 14:32 · PVG 22:32 · LAX 06:32 · JFK 09:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.