您现在的位置: 北发图书网 >>图书 >> 计算机语言与程序 >> Python大战机器学习-数据科学家的第一个小目标
热销排行榜
最近浏览的其他商品
    浏览更多同类商品
    Python大战机器学习-数据科学家的第一个小目标
    丛书名: ISBN: 978-7-121-30894-9
    供应商: 电子工业出版社 出版日期: 2017年3月1日
    编著者: 华校专 译者:
    版次: 1 印次: 1
    页数: 语种:
    纸张: 包装: 平装
    开本: 32开 读者对象:
    原价: ¥69.00 折扣价: ¥49.70    立刻节省:¥19.30
    存量: 现在有货,10本以上 销量: 19
       
        
    所属分类:
    首页 >> 科学技术 >> 计算机与网络 >> 计算机语言与程序
    分享到:新浪微博    推荐到豆瓣    腾讯微博    白社会    开心网
    推荐购买

    • Java核心技术-基础知..

    • JavaScriptDOM编程艺..
    编辑推荐

      时下极热门的职业是数据科学家,而不是传统的信息科学家,也不是大数据工程师。

    n

      数据科学家必备的技能中,机器学习和Pytho应该是位列前五的两项,学习本书,实现自己的第1个小目标。

    内容提要
    数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数 据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越 来越大的作用且日益受到关注。 Python是最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实 现机器学习算法的首选语言。 本书以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python编程实 践,采用“原理笔记精华+算法Python实现+问题实例+代码实战+运行调参”的形式展 开,理论与实践结合,算法原理与编程实战并重。 全书从内容上分为13章分4篇展开:第一篇:机器学习基础篇(第1-6章),讲述机器 学习的基础算法,包括线性模型、决策树、贝叶斯分类、k近邻法、数据降维、聚类和EM 算法;第二篇:机器学习高级篇(第7~10章),讲述经典而常用的高级机器学习算法,包括 支持向量机、人工神经网络、半监督学习和集成学习;第三篇:机器学习工程篇(第11~12 章),讲述机器学习工程中的实际技术,包括数据预处理,模型评估、选择与验证等;第四 篇:Kaggle实战篇(第13章),讲述一个Kaggle竞赛题目的实战。 本书内容丰富、深入浅也,算法与代码双管齐下,无论你是新手还是有经验的读者,都能 快速学到你想要的知识。本书可供为高等院校计算机、金融、信息、自动化及相关理工科专业 的本科生或研究生使用,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

    作者介绍

      华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。

    目录

    第一篇 机器学习基础篇1
    第1 章 线性模型 2
    1.1 概述2
    1.2 算法笔记精华2
    1.2.1 普通线性回归2
    1.2.2 广义线性模型5
    1.2.3 逻辑回归5
    1.2.4 线性判别分析7
    1.3 Pytho实战10
    1.3.1 线性回归模型11
    1.3.2 线性回归模型的正则化12
    1.3.3 逻辑回归22
    1.3.4 线性判别分析26

    n

    第2 章 决策树 30
    2.1 概述30
    2.2 算法笔记精华30
    2.2.1 决策树原理30
    2.2.2 构建决策树的3 个步骤31
    2.2.3 CART 算法37
    2.2.4 连续值和缺失值的处理42
    2.3 Pytho实战43
    2.3.1 回归决策树(DecisionTreeRegressor) 43
    2.3.2 分类决策树(DecisionTreeClassifier) 49
    2.3.3 决策图54

    n

    第3 章 贝叶斯分类器 55
    3.1 概述55
    3.2 算法笔记精华55
    3.2.1 贝叶斯定理55
    3.2.2 朴素贝叶斯法56
    3.3 Pytho实战59
    3.3.1 高斯贝叶斯分类器(GaussianNB) 61
    3.3.2 多项式贝叶斯分类器(MultinomialNB) 62
    3.3.3 伯努利贝叶斯分类器(BernoulliNB) 65
    3.3.4 递增式学习partial_fit 方法69

    n

    第4 章 k 近邻法 70
    4.1 概述70
    4.2 算法笔记精华70
    4.2.1 kNN 三要素70
    4.2.2 k 近邻算法72
    4.2.3 kd 树73
    4.3 Pytho实践74

    n

    第5章 数据降维 83
    5.1 概述83
    5.2 算法笔记精华83
    5.2.1 维度灾难与降维83
    5.2.2 主成分分析(PCA) 84
    5.2.3 SVD 降维91
    5.2.4 核化线性(KPCA)降维91
    5.2.5 流形学习降维93
    5.2.6 多维缩放(MDS)降维93
    5.2.7 等度量映射(Isomap)降维96
    5.2.8 局部线性嵌入(LLE) 97
    5.3 Pytho实战99
    5.4 小结118

    n

    第6章 聚类和EM 算法 119
    6.1 概述119
    6.2 算法笔记精华120
    6.2.1 聚类的有效性指标120
    6.2.2 距离度量122
    6.2.3 原型聚类123
    6.2.4 密度聚类126
    6.2.5 层次聚类127
    6.2.6 EM 算法128
    6.2.7 实际中的聚类要求136
    6.3 Pytho实战137
    6.3.1 K 均值聚类(KMeans) 138
    6.3.2 密度聚类(DBSCAN) 143
    6.3.3 层次聚类(AgglomerativeClustering) 146
    6.3.4 混合高斯(GaussianMixture)模型149
    6.4 小结153

    n

    第二篇 机器学习高级篇155
    第7章 支持向量机 156
    7.1 概述156
    7.2 算法笔记精华157
    7.2.1 线性可分支持向量机157
    7.2.2 线性支持向量机162
    7.2.3 非线性支持向量机166
    7.2.4 支持向量回归167
    7.2.5 SVM 的优缺点170
    7.3 Pytho实战170
    7.3.1 线性分类SVM 171
    7.3.2 非线性分类SVM 175
    7.3.3 线性回归SVR 182
    7.3.4 非线性回归SVR 186

    n

    第8章 人工神经网络 192
    8.1 概述192
    8.2 算法笔记精华192
    8.2.1 感知机模型192
    8.2.2 感知机学习算法194
    8.2.3 神经网络197
    8.3 Pytho实战205
    8.3.1 感知机学习算法的原始形式205
    8.3.2 感知机学习算法的对偶形式209
    8.3.3 学习率与收敛速度212
    8.3.4 感知机与线性不可分数据集213
    8.3.5 多层神经网络215
    8.3.6 多层神经网络与线性不可分数据集216
    8.3.7 多层神经网络的应用219

    n

    第9章 半监督学习 225
    9.1 概述225
    9.2 算法笔记精华226
    9.2.1 生成式半监督学习方法226
    9.2.2 图半监督学习228
    9.3 Pytho实战234
    9.4 小结243

    n

    第10章 集成学习 244
    10.1 概述244
    10.2 算法笔记精华244
    10.2.1 集成学习的原理及误差244
    10.2.2 Boosting 算法246
    10.2.3 AdaBoost 算法246
    10.2.4 AdaBoost 与加法模型252
    10.2.5 提升树253
    10.2.6 Bagging 算法256
    10.2.7 误差-分歧分解257
    10.2.8 多样性增强259
    10.3 Pytho实战260
    10.3.1 AdaBoost 261
    10.3.2 Gradient Tree Boosting 272
    10.3.3 Random Forest 288
    10.4 小结298

    n

    第三篇 机器学习工程篇299
    第11章 数据预处理 300
    11.1 概述300
    11.2 算法笔记精华300
    11.2.1 去除唯一属性300
    11.2.2 处理缺失值的三种方法301
    11.2.3 常见的缺失值补全方法302
    11.2.4 特征编码307
    11.2.5 数据标准化、正则化308
    11.2.6 特征选择310
    11.2.7 稀疏表示和字典学习313
    11.3 Pytho实践316
    11.3.1 二元化316
    11.3.2 独热码317
    11.3.3 标准化321
    11.3.4 正则化325
    11.3.5 过滤式特征选取326
    11.3.6 包裹式特征选取330
    11.3.7 嵌入式特征选取334
    11.3.8 学习器流水线(Pipeline) 339
    11.3.9 字典学习340

    n

    第12 章 模型评估、选择与验证 345
    12.1 概述345
    12.2 算法笔记精华346
    12.2.1 损失函数和风险函数346
    12.2.2 模型评估方法348
    12.2.3 模型评估349
    12.2.4 性能度量350
    12.2.5 偏差方差分解356
    12.3 Pytho实践357
    12.3.1 损失函数357
    12.3.2 数据集切分359
    12.3.3 性能度量370
    12.3.4 参数优化387

    n

    第四篇 Kaggle 实战篇401
    第13 章 Kaggle 牛刀小试 402
    13.1 Kaggle 简介402
    13.2 清洗数据403
    13.2.1 加载数据403
    13.2.2 合并数据406
    13.2.3 拆分数据407
    13.2.4 去除唯一值408
    13.2.5 数据类型转换410
    13.2.6 Data_Cleaner 类412
    13.3 数据预处理415
    13.3.1 独热码编码415
    13.3.2 归一化处理419
    13.3.3 Data_Preprocesser 类421
    13.4 学习曲线和验证曲线424
    13.4.1 程序说明424
    13.4.2 运行结果430
    13.5 参数优化433
    13.6 小结435

    n

    全书符号 436

    豆瓣评论

    读华校专《python大战机器学习》

    汪杨     2017年5月7日
    主要内容就是翻译文档,比较水 p3 一定要先做feature scaling p205 svm的复杂度。早停策略,将数据集分成训练集和验证集两类。当验证误差升高但训练误差降低时,停止训练。同时返回具有最小验证集误差的连接权值...
    【 更多】
     
    商品搜索:  书名  作者  供应商  高级搜索
     
    公司简介 | 服务承诺 | 保护隐私权 | 业务合作 | 法律顾问 | 友情链接
    客服专线:010-80808080 客服邮箱:service@beifabook.com
    Copyright © 北发图书网 2007, beifabook.com All Rights Reserved
    京ICP证070509号/京ICP备10016977号/ 京公网安备11011202000189号  出版物经营许可证 新出发京批字第直0979号
    北京北发电子商务股份有限公司 版权所有