书籍详情
《 机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps》[52]百度网盘|亲测有效|pdf下载
  • 机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps

  • 出版社:清华大学出版社
  • 作者:[美] 弗拉德·里斯库蒂亚(Vlad Riscutia)著 叶伟民、刘华、余灵 译
  • 出版时间:2024-04-01
  • 热度:2756
  • 上架时间:2025-03-08 06:13:50
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

机器学习大数据平台的构建、任务实现与数据治理


  你需要构建安全、稳定的数据平台,需要可以扩展到任何规模的工作负载。当项目从实验室进入生产环境时,你需要确信它可以应对现实工作中的挑战。本书能够帮助你实现这些需求,将讲述如何设计和实现基于云的、可以轻松监控、扩展和修改的数据基础设施。
  通过本书,你将学到构建和维护大型企业大数据平台所需的技能。书中包括设置基础设施、编排、工作负载和治理,写作风格清晰、实用。在学习过程中,你将建立高效的机器学习管道,然后掌握省时的自动化和DevOps解决方案。书中基于Azure的示例很容易在其他云平台上实现。

 
内容简介

主要内容
● 数据字典和数据治理
● 数据质量管控、合规和分发
● 构建自动化管道以提高可靠性
● 数据摄取、存储和分发
● 支持生产环境中的数据建模、分析和机器学习

作者简介

  Vlad Riscutia是微软的软件架构师。

目  录
第1 章 简介 1
1.1 什么是数据工程 2
1.2 本书读者对象 3
1.3 什么是数据平台 3
1.3.1 数据平台的构成 4
1.3.2 基础设施即代码,无代码基础设施 6
1.4 使用云构建 7
1.4.1 IaaS、PaaS 和SaaS 7
1.4.2 网络、存储和计算 7
1.4.3 如何使用Azure 8
1.4.4 与Azure 交互 8
1.5 实现Azure 数据平台 11
1.6 本章小结 13
第Ⅰ部分 基础设施
前  言
本书凝聚了我过去几年在Azure 客户增长和分析团队扩展大数据平台的经验,希望对你有所帮助。随着我们的数据科学团队的壮大和团队的洞见对业务的重要性越来越突出,必须确保我们的数据平台是稳健的。
大数据的世界相对较新,规则仍在建立中。我相信我们的故事具有普遍性和参考性:数据团队一开始只有几个人,这个阶段的首要目标是证明数据团队可以产生有价值的洞见。在这个阶段,很多工作是临时的,没有进行大规模工程投资的必要性和紧迫性。数据团队中的数据科学家在他们的机器上运行机器学习(ML)模型,生成一些预测,然后通过电子邮件发送结果这一简单的流程就足以满足需求了。
随着时间的推移,团队不断地壮大,团队需要处理更多的任务和工作,并且这些任务对于团队的成功和效率至关重要。同样的ML 模型现在需要插入一个能够处理实时数据流的系统,并且每天都需要运行,处理的数据量比最初的原型多100 倍以上。
此时,可靠的工程实践就变得至关重要了;我们需要应对规模的变化、可靠性、自动化、监控等。
本书包含了过去几年我在数据工程方面学到的宝贵经验,主要包括以下内容:
媒体评论
“本书提供了清晰且易于复用的示例,是数据工程方面的权威和全面指南。”
——Kelum Prabath Senanayake Echoworx
“这是一本全方位涵盖解决方案架构师或工程师需要考虑的所有方面的Azure宝典。”
——Albert Nogués, 法国达能
“本书将是一次意义非凡的穿越Azure生态系统之旅。你将快速构建管道并连接组件!”
——Todd Cook,Appen
“本书是机器学习与DevOps工程师通往Azure世界的绝佳教程。”
——Krzysztof Kamyczek,Luxoft
——valiant2ex

相关推荐