Introduction
1.
K-近邻算法
1.1.
K-近邻算法简介
1.2.
k近邻算法api初步使用
1.3.
距离度量
1.4.
k值的选择
1.5.
kd树
1.6.
案例1:鸢尾花种类预测--数据集介绍
1.7.
特征工程-特征预处理
1.8.
案例1:鸢尾花种类预测--流程实现
1.9.
k-近邻算法总结
1.10.
交叉验证,网格搜索
1.11.
案例2:预测facebook签到位置
2.
线性回归
2.1.
线性回归简介
2.2.
线性回归api初步使用
2.3.
数学:求导
2.4.
线性回归的损失和优化
2.5.
梯度下降法方法介绍
2.6.
线性回归api再介绍
2.7.
案例:波士顿房价预测
2.8.
欠拟合和过拟合
2.9.
正则化线性模型
2.10.
线性回归的改进-岭回归
2.11.
模型的保存和加载
3.
逻辑回归
3.1.
逻辑回归介绍
3.2.
逻辑回归api介绍
3.3.
案例:癌症分类预测-良/恶性乳腺癌肿瘤预测
3.4.
分类评估方法
3.5.
ROC曲线的绘制
4.
决策树算法
4.1.
决策树算法简介
4.2.
决策树分类原理
4.3.
cart剪枝
4.4.
特征工程-特征提取
4.5.
决策树算法api
4.6.
案例:泰坦尼克号乘客生存预测
4.7.
回归决策树
5.
集成学习
5.1.
集成学习算法简介
5.2.
Bagging和随机森林
5.3.
随机森林案例
5.4.
Boosting介绍
5.5.
GBDT介绍
6.
聚类算法
6.1.
聚类算法简介
6.2.
聚类算法api初步使用
6.3.
聚类算法实现流程
6.4.
模型评估
6.5.
算法优化
6.6.
特征工程-特征降维
6.7.
案例:探究用户对物品类别的喜好细分降维
6.8.
算法选择指导
7.
拓展知识
7.1.
其他距离公式
7.2.
再议数据分割
7.3.
正规方程的另一种推导方式
7.4.
梯度下降法算法比较和进一步优化
7.5.
多项式回归
7.6.
维灾难
7.7.
分类中解决类别不平衡问题
7.8.
向量与矩阵的范数
7.9.
无偏估计
Published with GitBook
Introduction
线性回归
学习目标
掌握线性回归的实现过程
应用LinearRegression或SGDRegressor实现回归预测
知道回归算法的评估标准及其公式
知道过拟合与欠拟合的原因以及解决方法
知道岭回归的原理及与线性回归的不同之处
应用Ridge实现回归预测
应用joblib实现模型的保存与加载