本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
这本Python爬虫技术书是一个完整大数据应用框架:从数据收集、分析到数据可视化、数据建模。本书各章节以实际案例为出发点,对大数据分析、爬虫技术应用感兴趣的小伙伴们来说,值得购买。
本书是一本通过实战教初学者学习爬取数据、清洗和组织数据进行分析和可视化的Python 读物。书中案例均经过实战检验,笔者在实践过程中深感采集数据、清洗和组织数据的重要性,作为
一名数据行业的“码农”,数据就是沃土,没有数据,我们将无田可耕。
本书共13 章,包括6 个核心主题,其一是Python 基础入门,包括环境配置、基本操作、数据类型、语句和函数;其二是Python 爬虫的构建,包括网页结构解析、爬虫流程设计、代码优化、爬虫效率优化、无线端的数据采集、容错处理、反防爬虫、表单交互和模拟页面点击;其三是Python数据库应用,包括MongoDB、MySQL 在Python 中的连接与应用;其四是数据清洗和组织,包括NumPy 数组知识,以及pandas 数据的读写、分组、变形,缺失值、异常值和重复值处理,时序数据处理和正则表达式的使用等;其五是综合应用实例,帮助读者贯穿爬虫、数据清洗与组织的过程;最后是数据可视化,包括matplotlib 和pyecharts 两个库的使用,涉及饼图、柱形图、线图、词云图等图形,帮助读者进入可视化的殿堂。
本书以实战为主,适合Python 初学者及高等院校相关专业的学生阅读,也适合Python 培训机构作为实验教材。
零一
原名陈海城,慕研数据分析师事务所创始人,电商数据专家,数据分析师,开发工程师;从事教育培训、数据分析和人工智能行业,专注于电商企业的数据化服务。
韩要宾
CDA数据分析研究院资深讲师;5年电商从业经验,4年数据挖掘实战经验;专注于数据分析与挖掘、机器学习、深度学习,服务客户包括苏宁易购、迪卡侬、百草味、浙江师范大学等。
黄园园
具有10年软件开发经验,全栈工程师,六西格玛黑带,精通Python和机器学习算法,具有丰富的分布式爬虫开发经验;曾在苏州三星电子电脑(SESC)、新加坡电信(NCS)、希捷科技(Seagate Technology)等世界知名企业研发部工作,参与过花旗银行在线支付系统、银行账单自动化审核系统等大型软件开发,曾任杭州沐垚科技有限公司CTO。
在数据科学领域,Python的发展势头十分迅猛。一方面,Python拥有各种开源的网络爬虫框架,可以帮助数据科学家快速收集数据;另一方面,Python在机器学习和深度学习方面有很多成熟的拓展包,可以帮助数据科学家完成各类数据分析任务,无论是简单的线性回归,还是复杂的深度学习网络构建。
著名数据分析网站炼数成金创始人
黄志洪
这本书教大家如何利用Python撰写爬虫程序,清洗和组织数据,解析网页的内容,并将数据储存于数据库中,内容非常详细,帮助大家节省时间,是值得一读的好书!
台湾大学资讯工程博士,铭传大学资讯工程学系教授
李御玺 (Yue-Shi Lee)
这本Python爬虫技术书是一个完整大数据应用框架:从数据收集、分析到数据可视化、数据建模。本书各章节以实际案例为出发点,对大数据分析、爬虫技术应用感兴趣的小伙伴们来说,这本书值得购买。
爱数据学院创始人
数据海洋
在互联网时代,信息大爆炸,爬虫技术被广泛地用于原始数据的积累。零一以自己的亲身实践,用Python 3实现了抓取、存储、清洗和可视化等数据处理操作。本书语言简洁、知识点全面、图文并茂,让爬虫技术变得简单易学,非常适合新手。
《R的极客理想》系列图书作者
张丹