5-7天自学掌握Python基础知识,然后进行Python基础知识测验。根据测试结果考虑是否重新学习Python基础知识。
注:廖雪峰教材看累了,可以换着看看莫烦的Python视频。
-
Python基础阶段需要掌握知识点
- Python基础类型:数字类型、None类型、Bool类型、字符串类型
- Python常用内置数据结构:列表(list)、元组(tuple)、字典(dict)、集合(set)
- Python逻辑控制与操作:If分支语句、for/while循环控制、try...except异常处理
- Python函数:定义函数、函数参数、函数式编程
- Python类与模块:类构造、类实例化、模块介绍、模块加载和使用
- Python的IO编程:文件读写
- Python进程与线程:进程与线程区别
-
Python基础测验 完成上面的基础学习后,可以在下面的题目中小试牛刀:
30天左右时间掌握Python实现基础算法,然后完成牛客网的《剑指Offer》和牛客网的LeetCode经典编程题的练习。
算法刷题技巧:
学习分三个部分:
- 自己去 牛客网的《剑指Offer》 做题系统中进行python练习
《剑指Offer》pdf书籍已经放到algorithm
- 自己去 牛客网的LeetCode经典编程题 做题系统中进行python练习
- 自己学习慕课网视频《玩转算法面试 leetcode题库分门别类详细解析》
在 算法作业集 中自主记录完成的习题并定时反馈结果, 算法作业集 实现代码上传至 solution_sample 文件夹中。
学习目标:
-
需要掌握的题目类型:
- 数组
- 字符串
- 查找
- 排序
- 链表
- 堆栈
- 树+递归
- 回溯法
- 动态规划
- 贪心算法
-
需要完成目标:
- 希望第二阶段结束后,可以把牛客网的《剑指Offer》全部刷完。
- 希望第二阶段结束后,可以把牛客网的LeetCode经典编程题全部刷完。
1天学习基于Python的经典库。14天完成一个Python爬虫工具。
-
基于Python的经典库(1天了解经典库)
- Numpy
- 这是一个非常有名的数据分析库。从计算数据分布的中位数,到处理多维数组,NumPy 都可以帮你完成。
- Pandas
- 这是用来处理 CSV 文件的。当然了,你还需要处理一些表格、查看统计数据等,那 Pandas 就是可以满足你的需求的工具。
- Matplotlib
- 把数据存储在 Pandas 的数据框后,你可能需要做一些可视化来理解数据的更多信息。毕竟一图抵千言。
- Seaborn
- 这是另一个可视化工具,但这个工具更侧重于统计结果的可视化,比如直方图、饼图、曲线图或相关性表等。
- Scikit-Learn
- 这是用 Python 实现机器学习的终极工具。所谓用 Python 实现机器学习指的就是这个——Scikit-Learn。所有你需要的从算法到提升的内容都能在这里找到。
- 干货|理解Python爬虫基础知识
- Numpy
-
Python爬虫项目(14天)
- 1天完成练手项目 3 个适合新人上手的Python项目(附代码!)
- 13天完成爬虫工具 找一个感兴趣的爬虫项目练习
- Python高级用法
- Python对象的比较与复制
- 值传递、引用传递or其他,Python里参数是如何传递的?
- 强大的装饰器
- metaclass
- 深入理解迭代器和生成器
- 揭秘Python协程
- Python并发编程之future
- Python并发编程之asyncio
- 你真的懂Python GIL(全局解释器锁)吗?
- Python垃圾回收机制
- SWIG:TensorFlow等流行框架背后的Python/C++混合编程技术
- Python实现Web开发框架:Django、Flask
以下内容为了解内容,可以学习完整个机器学习内容后,再看:
本阶段学习教材:书籍《统计学习方法》,李航著。统计学习方法书籍pdf/算法Python代码实现/课件
- 数据归一化方法
- 过拟合/欠拟合
- 正则化
- 交叉验证
- 模型评估
- 偏差和方差
- 数据不均衡处理方法
- 线性模型
- 线性回归
- 岭回归
- Lasso回归
- 线性分类
- 逻辑回归(会推导)
- SoftMax回归
- 线性回归
- 支持向量机(会推导)
- 决策树
- ID3
- C4.5 -> 随机森林 <- Bagging
- CART -> AdaBoost/GBDT <- Boosting
决策树学习要与集成学习联系起来。
- 贝叶斯
- 朴素贝叶斯
- 贝叶斯网络
- 正态贝叶斯
- 浅层神经网络
- KNN(k-Nearest Neighbor, k近邻学习)
- 距离度量学习
- LDA(线性判别分析) -> KLDA
- 隐马尔科夫模型
- 条件随机场
- K-means聚类(会推导、会写代码)
- 层次聚类
- 高斯混合聚类
- 密度聚类
- DBSCAN
- OPTICS
- Mean Shift
- 谱聚类
- EM算法
- PCA -> KPCA
- SVD
- 流行学习
- LLE
- 拉普拉斯特征映射
- 等距映射
- 局部保持投影
- 主题模型
- Bagging
- Boosting
- AdaBoost
- 随机森林
- GBDT
- XGBoost
- LightGBM
- stacking
- 策略迭代
- 价值迭代
- 蒙特卡罗算法
- 时序差分算法
- SARSA算法
- Q学习
- DQN
- 策略梯度
- 感知器
- 感知器模型-神经网络的起点
- logistic回归
- logisitc回归虽然名字叫回归,但实际上是一种用于分类问题的算法,它在感知器模型的基础上加了一个logistic函数进行映射,得到区间(1, 0)类的概率值,刚好可以作为样本属于正样本的概率。logistic回归的作用类似于神经网络中的单个神经元,logistic函数即激活函数。这个函数导数的有界性为神经网络的梯度消失问题埋下了祸根。
- MLP
- 多层感知模型(MLP)-真正意义上的神经网络
- 分类网络
- AlexNet
- GoogleNet
- VGGNet
- ResNet
- 检测网络
- RCNN簇
- RCNN
- SPPNet
- FastRCNN
- MaskRCNN
- YOLO簇
- YOLO V1
- YOLO V2
- YOLO V3
- SSD簇
- SSD
- DSSD
- RFCN簇
- FPN簇
- RetinaNet簇
- Anchorfree簇
- 其它
- RCNN簇
- 分割网络
- FCN
- DialatedConv
- 跟踪网络
- HCF
- 轻量化网络
- MobileNet V1
- MobileNet V2
- ShuffleNet V1
- Xception
- LSTM
- GRU
- BRNN
- NTM
- seq2seq
- RNN+CTC
- VAE
- CVAE
- GAN
- CGAN
- GCN


