小白学习Python数据挖掘
Python现已稳坐机器学习的榜首言语(机器学习编程言语之争,Python夺冠),尤其是深度学习结构Torch宣告支撑Python以后。所以学习Python进行数据发掘是性价比是最高的(自己也抛弃了运用了3年多的R言语)。而运用Python进行数据发掘是最近几年才开端火起来的,之前网上许多的资料都是对于Python网页开发等。但运用Python进行数据发掘的侧重点现已彻底不一样了。自己即是浪费了许多时刻来筛选这些博客、书本。所以就有了这篇文章,希望能帮我们少走一点弯路。
本文章主要从数据挖掘的角度出发,谈谈如何入门数据挖掘。本文不能保证你能成为大神,但是如果能踏踏实实地学习完,找一份年薪15w+的工作还是不太难的,考虑到市场上人才的稀缺。本人也是非计算机专业,所以希望给非计算机的人一点参考。现在市场上数据挖掘的人才非常缺少,现在大一点的企业都需要数据分析、数据挖掘的人才,但是国目前只有3所大学开设了相关的本科专业,计算机专业的人也不会抢这饭碗,因而,造成了数据挖掘市场上人才的供给不足,所以给了一大堆非科班出身人很多的机会。
一、Python 基础语法学习
如果只推荐一本书,强烈推荐《跟老齐学Python》,Python中的核心概念做了非常棒的讲解,深刻而不失幽默。
如果想系统的学习推荐密歇根大学的《学习使用Python编程并分析数据》系列课程。
廖雪峰Python教程 简单易上手的Python基础语法教程,值得学习, Python 2和Python 3版本都有。
二、 机器学习理论
基本经典的机器学习书籍
机器学习入门(中/英)(谷歌大牛的课程)
机器学习(乔治亚理工大学计算机课程)
周志华的西瓜书《机器学习》
深入一些的可以考虑李航的《统计学习方法》
还有偏统计的斯坦福的教授写的《统计学习导论》,深入版本的《The Elements of Statistical Learning》(英文影印版)
上面推荐的都是非常不错机器学习的入门书籍,都是经典了。
三、Python机器学习代码学习
掌握Python语法的基础上学习《Python for data analysis》是比较不错的选择,涵盖了iPython notebook、Numpy、Scipy和Pandas包的使用。
《Python数据分析与挖掘实战》介绍了使用Python进行数据挖掘的详细案例,数据和代码都可以下载,作为机器学习的进阶学习是不错的选择(这本书也用对应的R语言和Matlab 版本)。
还有Udacity机器学习纳米学位项目代码(Github上有)
再推荐2本国外网站的书籍,还在early release阶段《Python Data Science Handbook》和《Hands On Machine Learning with Scikit-Learn and TensorFlow》,非常好的代码示范。注册Safari Online,可以免费看10天。
四、优秀博客和微信公众号
我推荐的网站和微信公众号都是我平时天天看的,那些水货大多被我取消关注了,养成每周清理公众号的好习惯。
1. 数据挖掘入门与实战 全是干货,代码质量非常高。
2. 机器学习研究会 我校老师组织的学习平台,代码加行业信息齐飞,质量非常高。尤其是我校的AI公开课(有直播),中国顶尖人工智能大腕云集。
3. 新智元 人工智能方向行业观点,对于自己把握技术方向非常重要,比如说自动驾驶这个坑能不能入?
4. 机器之心 技术前沿与重量级新闻。
还有一些其他的,下次再继续补充。
还有几个博客:
iPhone上可以使用Reeder阅读器,Instapaper用来保存后稍后阅读,因为信息量比较大。
No free Hunch Kaggle竞赛平台的官方博客,包括一些优秀的代码解读以及高分选手的采访,十分有用的经验(来自不同背景,不同年龄层次,不同职业的选手)
Analytics Community | Analytics Discussions | Big Data Discussion 干货技术文章
新浪微博-爱可可 (北邮PRIS模式识别实验室陈老师)
五、计算机书本下载网站
再增加几个外文书本下载网址:
1. All IT eBooks 全,也许需求运用翻*墙下载,翻*墙办法见文末
2. Library Genesis 各种书本,不局限于编程书本
3. Fox eBook - eBooks Free Download Site
4. Development / Programming / AvaxHome
马哥学习交流群