从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版

从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版

编辑点评:

从零开始学Python数据分析与挖掘第二版以Python 3.7版本作为数据分析与挖掘实战的应用工具,从Python的基础语法开始,陆续介绍有关数值计算的numpy、数据处理的pandas、数据可视化的matplotlib和数据挖掘的sklearn等内容

从零开始学Python数据分析与挖掘第二版pdf下载

编辑推荐

"为满足用人单位对数据分析和挖掘人员在编程方面的技能要求,本书遵循由浅入深的原则,详细地介绍了利用Python及其相关工具实现数据分析和挖掘的实用技能。 结合Python中成熟的Numpy、Pandas、MatPlotLib、Sklearn、Seaborn、Statsmodels和SciPy模块,实现数据分析与挖掘中关于数据的清洗、整理、探索、可视化、建模和评估等流程的操作,让每一位对数据分析和挖掘的从业者或感兴趣的读者都能从中学到所需的内容。 详解十大常用数据挖掘算法及案例实战,如多元线性等

内容简介

全书共涵盖15种可视化图形以及10个常用的数据挖掘算法和实战项目,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。

作者简介

刘顺祥,统计学硕士,“数据分析1480”公众号运营者。曾就职于唯品会电商平台,担任不错数据分析师一职。目前就职于靠前某数据咨询公司,为联想、亨氏、美丽田园、喜力、网鱼网咖等企业提供数据咨询服务。著有《从零开始学Python数据分析与挖掘》一书。

目录

第1章 数据分析与挖掘概述

1.1 什么是数据分析和挖掘

1.2 数据分析与挖掘的应用领域

1.2.1 电商领域——发现破坏规则的“害群之马”

1.2.2 交通出行领域——为打车平台进行私人订制

1.2.3 医疗健康领域——找到佳医疗方案

1.3 数据分析与挖掘的区别

1.4 数据挖掘的流程

1.4.1 明确目标

1.4.2 数据搜集

1.4.3 数据清洗

1.4.4 构建模型

1.4.5 模型评估

1.4.6 应用部署

1.5 常用的数据分析与挖掘工具

1.6 本章小结

1.7 课后练习

第2章 从收入的预测分析开始

2.1 下载与安装Anaconda

2.1.1 基于Windows系统安装

2.1.2 基于Mac系统安装

2.1.3 基于Linux系统安装

2.2 基于Python的案例实战

2.2.1 数据的预处理

2.2.2 数据的探索性分析

2.2.3 数据建模

2.3 本章小结

2.4 课后练习

第3章 Python基础与数据抓取

3.1 数据结构及方法

3.1.1 列表

3.1.2 元组

3.1.3 字典

3.2 控制流

3.2.1 if分支

3.2.2 for循环

3.2.3 while循环

3.3 字符串处理方法

3.3.1 字符串的常用方法

3.3.2 正则表达式

3.4 自定义函数

3.4.1 自定义函数语法

3.4.2 自定义函数的几种参数

3.5 一个爬虫案例

3.6 本章小结

3.7 课后练习

第4章 Python数值计算——numpy的高效技能

4.1 数组的创建与操作

4.1.1 数组的创建

4.1.2 数组元素的获取

4.1.3 数组的常用属性

4.1.4 数组的形状处理

4.2 数组的基本运算符

4.2.1 四则运算

4.2.2 比较运算

4.2.3 广播运算

4.3 常用的数学和统计函数

4.4 线性代数的相关计算

4.4.1 矩阵乘法

4.4.2 diag函数的使用

4.4.3 特征根与特征向量

4.4.4 多元线性回归模型的解

4.4.5 多元一次方程组的求解

4.4.6 范数的计算

4.5 伪随机数的生成

4.6 本章小结

4.7 课后练习

第5章 Python数据处理——展现pandas的强r /> 5.1 序列与数据框的构造

5.1.1 构造序列

5.1.2 构造数据框

5.2 外部数据的读取

5.2.1 文本文件的读取

5.2.2 电子表格的读取

5.2.3 数据库数据的读取

5.3 数据类型转换及描述统计

5.4 字符与日期数据的处理

5.5 常用的数据清洗方法

5.5.1 重复观测处理

5.5.2 缺失值处理

5.5.3 异常值处理

5.6 数据子集的获取

5.7 透视表功能

5.8 表之间的合并与连接

5.9 分组聚合操作

5.10 本章小结

5.11 课后练习

第6章 Python数据可视化——分析报告必要元素

6.1 离散型变量的可视化

6.1.1 饼图——“芝麻信用”失信用户分布

6.1.2 条形图——胡润排行榜

6.2 数值型变量的可视化

6.2.1 直方图与核密度曲线——展现年龄分布特征

6.2.2 箱线图——房单价分布形态

6.2.3 小提琴图——客户消费数据的呈现

6.2.4 折线图——公众号每日阅读趋势

6.3 关系型数据的可视化

6.3.1 散点图——探究鸢尾花花瓣长度与宽度的关系

6.3.2 气泡图——暴露商品的销售特征

6.3.3 热力图——一份简单的月度日历

6.4 多个图形的合并

6.5 本章小结

6.6 课后练习

第7章 线性回归预测模型

7.1 一元线性回归模型——收入预测

7.2 多元线性回归模型——销售利润预测

7.2.1 回归模型的参数求解

7.2.2 回归模型的预测

7.3 回归模型的假设检验

7.3.1 模型的显著性检验——F检验

7.3.2 回归系数的显著性检验——t检验

7.4 回归模型的诊断

7.4.1 正态性检验

7.4.2 多重共线性检验

7.4.3 线性相关性检验

7.4.4 异常值检验

7.4.5 独立性检验

7.4.6 方差齐性检验

7.5 本章小结

7.6 课后练习

第8章 岭回归与LASSO回归模型

8.1 岭回归模型

8.1.1 参数求解

8.1.2 系数求解的几何意义

8.2 岭回归模型的应用——糖尿病病情预测(1)

8.2.1 可视化方法确定λ值

8.2.2 交验证法确定λ值

8.2.3 模型的预测

8.3 LASSO回归模型——糖尿病病情预测(2)

8.3.1 参数求解

8.3.2 系数求解的几何意义

8.4 LASSO回归模型的应用

8.4.1 可视化方法确定λ值

8.4.2 交验证法确定λ值

8.4.3 模型的预测

8.5 本章小结

8.6 课后练习

第9章 Logistic回归分类模型

9.1 Logistic模型的构建

9.1.1 Logistic模型的参数求解

9.1.2 Logistic模型的参数解释

9.2 分类模型的评估方法

9.2.1 混淆矩阵

9.2.2 ROC曲线

9.2.3 K-S曲线

9.3 Logistic回归模型的应用——运动状态的识别

……

从零开始学Python数据分析与挖掘第二版pdf下载截图

从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版插图(1)从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版插图(2)从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版插图(3)从零开始学Python数据分析与挖掘-从零开始学Python数据分析与挖掘第二版pdf下载电子版插图(4)

评分及评论

无用户评分

来评个分数吧

  • 5 分
    0
  • 4 分
    0
  • 3 分
    0
  • 2 分
    0
  • 1 分
    0

Comments