首页出版说明中文期刊中文图书环宇英文官网付款页面

电影数据大批量获取研究

周 睿, 王 争
电子科技大学成都学院

摘要


随着大数据时代的不断发展,数据对于个人,企业乃至国家来说变得越来越重要。但当人为去翻页查询定
位数据,下载数据,效率会很低。网络爬虫技术就能够在大量的数据中定位到有效数据,并把它获取出来,进行本
地化保存或者数据库存储,方便用户更加直观对比和查阅。本文网络爬虫是基于Python语言,结合第三方xlwt库、
lxml库和matplotlib库实现对网站电影数据的大批量获取、本地保存和数据可视化。

关键词


Python;xlwt;lxml;matplotlib;电影数据

全文:

PDF


参考


[1] 王康,史雅婷,梁洪炎,吉卓嘎,强巴卓玛 . 基

于 XPath 的天气数据的爬取研究 [J]. 江苏通信,2021,37

(05):83-84.

[2] 卢江,刘文正 . 基于爬虫技术的图书购买推荐与

比价策略研究 [J]. 科技资讯,2021,19(01):214-219.

DOI:10.16661/j.cnki.1672-3791.2010-5042-8461.

[3] 胡 正 雨 . 基 于 Python 的 网 络 爬 虫 技 术 研 究 [J]. 科

技 风,2020(20):102.DOI:10.19392/j.cnki.1671-

7341.202020080.

[4] 孙亚红 . 基于 Python 的招聘信息爬虫系统设计 [J].

软件,2020,41(10):213-214+235.

[5] 曾燕清,陈志德,李翔宇 . 应用树结构的 Xpath 自

动提取算法 [J]. 福建电脑,2020,36(07):34-38.DOI:

10.16707/j.cnki.fjpc.2020.07.008.




DOI: http://dx.doi.org/10.18686/jsjxt.v4i1.69954

Refbacks

  • 当前没有refback。