电影数据大批量获取研究
摘要
随着大数据时代的不断发展,数据对于个人,企业乃至国家来说变得越来越重要。但当人为去翻页查询定
位数据,下载数据,效率会很低。网络爬虫技术就能够在大量的数据中定位到有效数据,并把它获取出来,进行本
地化保存或者数据库存储,方便用户更加直观对比和查阅。本文网络爬虫是基于Python语言,结合第三方xlwt库、
lxml库和matplotlib库实现对网站电影数据的大批量获取、本地保存和数据可视化。
位数据,下载数据,效率会很低。网络爬虫技术就能够在大量的数据中定位到有效数据,并把它获取出来,进行本
地化保存或者数据库存储,方便用户更加直观对比和查阅。本文网络爬虫是基于Python语言,结合第三方xlwt库、
lxml库和matplotlib库实现对网站电影数据的大批量获取、本地保存和数据可视化。
关键词
Python;xlwt;lxml;matplotlib;电影数据
全文:
PDF参考
[1] 王康,史雅婷,梁洪炎,吉卓嘎,强巴卓玛 . 基
于 XPath 的天气数据的爬取研究 [J]. 江苏通信,2021,37
(05):83-84.
[2] 卢江,刘文正 . 基于爬虫技术的图书购买推荐与
比价策略研究 [J]. 科技资讯,2021,19(01):214-219.
DOI:10.16661/j.cnki.1672-3791.2010-5042-8461.
[3] 胡 正 雨 . 基 于 Python 的 网 络 爬 虫 技 术 研 究 [J]. 科
技 风,2020(20):102.DOI:10.19392/j.cnki.1671-
7341.202020080.
[4] 孙亚红 . 基于 Python 的招聘信息爬虫系统设计 [J].
软件,2020,41(10):213-214+235.
[5] 曾燕清,陈志德,李翔宇 . 应用树结构的 Xpath 自
动提取算法 [J]. 福建电脑,2020,36(07):34-38.DOI:
10.16707/j.cnki.fjpc.2020.07.008.
DOI: http://dx.doi.org/10.18686/jsjxt.v4i1.69954
Refbacks
- 当前没有refback。