分类 | 高教类- 计算机 |
---|---|
ISBN | 978-7-5618-7677-0 |
开放标志 | |
尺寸 | 正16 |
字数 | 332 |
出版社 | 天津大学出版社 |
作者 | 山东劳动职业技术学院、天津滨海迅腾科技集团有限公司 |
印次 | 1印 |
版次 | 1版 |
定价 | 59.00 |
印张 | 13 |
包装 | 平装 |
出版日期 | 2024-03-17 |
印刷日期 | 2024-03-17 |
PV | |
Base_PV | |
页数 | 208 |
购买地址 |
随着互联网的迅速发展,网络上的资源和信息呈现爆发式增长。此外,越来越多的网站和应用程序提供了丰富的数据,并为开发者提供了接口,以便让他们使用和利用这些数据。在这种情况下,网络爬虫作为一种能够自动采集并处理互联网上的信息的工具,逐渐成为了数据采集和分析过程中不可或缺的一部分。
在数据采集方面,网络爬虫可以用于获取互联网上的各种数据,例如新闻、评论、商品信息、用户数据等。通过网络爬虫,研究人员、企业和个人都可以快速、准确地获取大量数据,并对其进行分析和挖掘。这些数据可以被用来制定商业决策、预测市场趋势、评估产品竞争力、推荐产品或服务等。
本书由七个项目组成,分为初识网络爬虫、基于Python库实现静态数据采集、基于urllib实现客户端数据采集、基于Requests-HTML实现动态数据采集、基于Scrapy框架实现网页数据采集、基于 Scrapy-redis分布式实现网页数据采集以及基于自动化测试工具实现网页数据采集,内容简明扼要,由浅入深,循序渐进。