书籍详情
《应用预测建模》[54M]百度网盘|亲测有效|pdf下载
  • 应用预测建模

  • 出版社:绿佰然图书专营店
  • 出版时间:2016-04
  • 热度:10493
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

基本信息

书名:应用预测建模

作者:[美] 马克斯·库恩(Max Kuhn),谢尔·约翰逊(Kjell

出版社:机械工业出版社

出版日期:2016-04-01

ISBN:9787111533429

字数:620000

页码:409

版次:

装帧:平装

开本:16开

商品重量:kg

编辑推荐


这本关于数据分析的图书广受好评,荣获2014年Ziegel奖,还被很多教师选为“数据科学”课程的教材。本书专注于预测建模的实际应用,介绍了从数据预处理到建模再到模型评估和选择的整个过程,以及背后的统计思想,涉及各种回归技术和分类技术。从解决实际问题延伸到模型拟合,以及随之出现的主题,如处理类不平衡、选择预测因子等在实践中经常出现的问题,作者意在为读者提供预测建模过程的指导,并结合开源软件R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含了书中例题和习题使用的数据,以及用于重复书中每一章分析的R代码。

内容提要


  这是一本专注于预测建模的数据分析书,意在为实践者提供预测建模过程的指导,比如如何进行数据预处理、模型调优、预测变量重要性度量、变量选择等。读者可以从中学到许多建模方法以及提高对许多常用的、现代的有效模型的认识,如线性回归、非线性回归和分类模型,涉及树方法、支持向量机等。0章和7章分别研究混凝土混合物的抗压强度和作业调度两个案例。
  作者重实际应用,轻数学理论,从实际数据出发,结合开源软件R语言来求解实际问题,详细给出R代码和处理的步骤。R包AppliedPredictiveModeling包含书中使用的数据,以及可以用于重复书中每一章分析的R代码,让读者能在精度范围内重复本书的结果,并自然地将书中的预测建模方法应用到自己的数据上。章后附有习题,方便读者巩固所学。
  这本业界互相推荐的好书,适合所有数据分析人员阅读。

目录


译者序
前言
章导论
1.1预测与解释
1.2预测模型的关键部分
1.3专业术语
1.4实例数据集和典型数据场景
1.5概述
1.6符号
部分一般策略
第2章预测建模过程简介
2.1案例分析:预测燃油效能
2.2主题
2.3总结
第3章数据预处理
3.1案例分析:高内涵筛选中的细胞分组
3.2单个预测变量数据变换
3.3多个预测变量数据变换
3.4处理缺失值
3.5移除预测变量
3.6增加预测变量
3.7区间化预测变量
3.8计算
习题
第4章过度拟合与模型调优
4.1过度拟合的问题
4.2模型调优
4.3数据分割
4.4重抽样技术
4.5案例分析:信用评分
4.6选择调优参数值
4.7数据划分建议
4.8不同模型间的选择
4.9计算
习题
第二部分回归模型
第5章衡量回归模型的效果
5.1模型效果的定量度量
5.2方差偏差的权衡
5.3计算
第6章线性回归及其扩展
6.1案例分析:定量构效关系建模
6.2线性回归
6.3偏 小二乘法
6.4惩罚模型
6.5计算
习题
第7章非线性回归模型
7.1神经网络
7.2多元自适应回归样条
7.3支持向量机
7.4K近邻
7.5计算
习题
第8章回归树与基于规则的模型
8.1简单回归树
8.2回归模型树
8.3基于规则的模型
8.4装袋树
8.5森林
8.6助推法
8.7Cubist
8.8计算
习题
第9章溶解度模型总结
0章案例研究:混凝土混合物的抗压强度
10.1模型构建策略
10.2模型性能
10.3优化抗压强度
10.4计算
第三部分分类模型
1章分类模型的效果度量
11.1类预测
11.2评估预测类
11.3评估类概率
11.4计算
2章判别分析和其他线性分类模型
12.1案例分析:预测是否成功申请经费
12.2逻辑回归
12.3线性判别分析
12.4偏 小二乘判别分析
12.5惩罚模型
12.6 近收缩质心
12.7计算
习题
3章非线性分类模型
13.1非线性判别分析
13.2神经网络
13.3灵活判别分析
13.4支持向量机
13.5K近邻
13.6朴素贝叶斯
13.7计算
习题
4章分类树与基于规则的模型
14.1基本的分类树
14.2基于规则的模型
14.3装袋决策树
14.4森林
14.5助推法
14.6C5.0
14.7比较两种分类预测变量编码方式
14.8计算
习题
5章经费申请模型的总结
6章对严重类失衡的补救方法
16.1案例分析: 预测房车保险所有权
16.2类失衡的影响
16.3模型调优
16.4选择截点
16.5调整先验概率
16.6不等案例权重
16.7抽样方法
16.8成本敏感度训练
16.9计算
习题
7章案例研究:作业调度
17.1数据切分和模型策略
17.2结果
17.3计算
8章衡量预测变量重要性
18.1数值结果变量
18.2分类结果变量
18.3其他方法
18.4计算
习题
9章特征选择介绍
19.1使用无信息预测变量的结果
19.2减少预测变量个数的方法
19.3绕封法
19.4过滤法
19.5选择偏差
19.6案例分析:预测认知损伤
19.7计算
习题
第20章影响模型表现的因素
20.1第Ⅲ类错误
20.2结果变量的测量误差
20.3预测变量的测量误差
20.4连续变量离散化
20.5模型预测何时是可信的
20.6大样本的影响
20.7计算
习题
附录
附录A各种模型的总结
附录BR语言介绍
附录C值得关注的网站
参考文献

作者介绍


马克斯·库恩(Max Kuhn)
康涅狄格州格罗顿市辉瑞全球研发非临床统计部主任,在制药和诊断行业已有近20年应用预测模型的经验,他还是很多R包的作者。 n
谢尔·约翰逊(Kjell Johnson)
博士,在药物研发和其他行业有近20年统计咨询和预测建模经验,曾任辉瑞全球研发统计部主任。

文摘


序言