分类 | 高教类- 职教理论、研究、规范及标准 |
---|---|
ISBN | 978-7-5618-7022-8 |
开放标志 | |
尺寸 | 8.75 |
字数 | 218 |
出版社 | 天津大学出版社 |
作者 | 郭肖勇 |
印次 | 1次 |
版次 | 1版 |
定价 | 45.00 |
印张 | 8.75 |
包装 | 平装 |
出版日期 | 2021-08-01 |
印刷日期 | 2021-08-01 |
PV | |
Base_PV | |
页数 | 140 |
购买地址 | https://item.jd.com/13507930.html |
数据分析与挖掘可以帮助人们从数据中发现规律获取知识。Pandas与Scikit-learn是目前较为流行的数据分析、可视化与机器学习工具。通过Python语言可以方便地使用Pandas与Scikit-Iearn进行数据分析与挖掘。《(2021版)Pandas与scikit-learn数据分析与挖掘实用指南》通过大量的实例系统地讲解这两个库的使用。前两章介绍了数据挖掘的基本概念和Python开发环境的搭建。第3章和第4章介绍Pandas与Scikit-leam的使用。第5章介绍特征工程,这是在数据挖掘与建模过程中非常重要的环节。最后一章通过实例来演示完整的数据挖掘项目流程。
《(2021版)Pandas与scikit-learn数据分析与挖掘实用指南》适合高等院校理工科专业的本科生和研究生及其他任何对数据分析与挖掘感兴趣的人士阅读。
第1章 引言
1.1 数据挖掘
1.2 机器学习算法
1.3 数据挖掘的主要流程
第2章 Python基础
2.1 Python简介
2.2 Python开发环境的搭建
第3章 Pandas基础
3.1 创建、读取和写入
3.2 索引、选择和分配
3.3 分组和排序
3.4 数据类型和缺失值
3.5 重命名及合并
第4章 Scikit-learn基础
4.1 Scikit-learn简介
4.2 Scikit-learn的技术基础
4.3 Scikit-learn安装
4.4 监督学习
4.5 交叉验证:评估机器学习模型的表现
第5章 特征工程
5.1 基准模型
5.2 分类编码
5.3 特征的生成
5.4 特征的选择
第6章 实例
6.1 lightgbm实践:桑坦德银行客户交易预测
6.2 Kaggle Titanic生存预测