开放期刊系统

基于豆瓣电影的数据采集的设计与实现

黄泽辉, 张桂花
四川大学锦城学院计算机与软件学院

摘要

在这个大数据时代，豆瓣网已经成为最重要的社交网站之一，笔者针对豆瓣电影网的特性设计并实现了对网页内容的信息采集。通过python进行爬虫获取豆瓣电影中的排名，电影，时间，导演，评分版块，对电影进行降序排名，并将目标数据存储到电子表格中，获得豆瓣电影排行榜单，可用于后续的数据研究。

关键词

python；豆瓣电影网；流程设计；网络爬虫

全文:

PDF

参考

[1] Tian Fang,Tan Han,Cheng Zhang,Ya Juan Yao. Research and

Construction of the Online Pesticide Information Center and Discovery Platform Based on Web Crawler[J]. Procedia Computer Science,2020,166.

[2] Dusan Stevanovic,Aijun An,Natalija Vlajic. Feature evaluation for web crawler detection with data mining techniques[J]. Expert Systems With Applications,2012,39(10).

[3] 范长军 . 行业惯例与不正当竞争 [J]. 法学家 ,2015(05):84- 94+178.

DOI: http://dx.doi.org/10.18686/jsjxt.v2i4.30255

Refbacks

当前没有refback。

合作支持单位

新加坡万仕出版社
北京春城教育出版物研究中心
马来西亚唐博科学研究院
北京万象兴荣科技文化发展有限公司
新加坡亿科出版社
春城(成都)文化传媒有限公司

基于豆瓣电影的数据采集的设计与实现

摘要

关键词

全文:

参考

Refbacks

合作支持单位

数据库合作单位

环宇中文期刊

友情链接

联系环宇

用户名
密码
记住我