• Introduction
  • 1. K-近邻算法
    • 1.1. K-近邻算法简介
    • 1.2. k近邻算法api初步使用
    • 1.3. 距离度量
    • 1.4. k值的选择
    • 1.5. kd树
    • 1.6. 案例1:鸢尾花种类预测--数据集介绍
    • 1.7. 特征工程-特征预处理
    • 1.8. 案例1:鸢尾花种类预测--流程实现
    • 1.9. k-近邻算法总结
    • 1.10. 交叉验证,网格搜索
    • 1.11. 案例2:预测facebook签到位置
  • 2. 线性回归
    • 2.1. 线性回归简介
    • 2.2. 线性回归api初步使用
    • 2.3. 数学:求导
    • 2.4. 线性回归的损失和优化
    • 2.5. 梯度下降法方法介绍
    • 2.6. 线性回归api再介绍
    • 2.7. 案例:波士顿房价预测
    • 2.8. 欠拟合和过拟合
    • 2.9. 正则化线性模型
    • 2.10. 线性回归的改进-岭回归
    • 2.11. 模型的保存和加载
  • 3. 逻辑回归
    • 3.1. 逻辑回归介绍
    • 3.2. 逻辑回归api介绍
    • 3.3. 案例:癌症分类预测-良/恶性乳腺癌肿瘤预测
    • 3.4. 分类评估方法
    • 3.5. ROC曲线的绘制
  • 4. 决策树算法
    • 4.1. 决策树算法简介
    • 4.2. 决策树分类原理
    • 4.3. cart剪枝
    • 4.4. 特征工程-特征提取
    • 4.5. 决策树算法api
    • 4.6. 案例:泰坦尼克号乘客生存预测
    • 4.7. 回归决策树
  • 5. 集成学习
    • 5.1. 集成学习算法简介
    • 5.2. Bagging和随机森林
    • 5.3. 随机森林案例
    • 5.4. Boosting介绍
    • 5.5. GBDT介绍
  • 6. 聚类算法
    • 6.1. 聚类算法简介
    • 6.2. 聚类算法api初步使用
    • 6.3. 聚类算法实现流程
    • 6.4. 模型评估
    • 6.5. 算法优化
    • 6.6. 特征工程-特征降维
    • 6.7. 案例:探究用户对物品类别的喜好细分降维
    • 6.8. 算法选择指导
  • 7. 拓展知识
    • 7.1. 其他距离公式
    • 7.2. 再议数据分割
    • 7.3. 正规方程的另一种推导方式
    • 7.4. 梯度下降法算法比较和进一步优化
    • 7.5. 多项式回归
    • 7.6. 维灾难
    • 7.7. 分类中解决类别不平衡问题
    • 7.8. 向量与矩阵的范数
    • 7.9. 无偏估计
  • Published with GitBook

Introduction