首页出版说明中文期刊中文图书环宇英文官网付款页面

“互联网 + 教育”环境下网站信息采集系统开发研究

况 富强
济源职业技术学院

摘要


高校上级管理部门繁多,新的要求、动态不能及时获取。经常出现新的要求、动态在上级主管部门网站的新闻、公告已发布多日,通过公文流转到高校后,学校准备申报或上报资料时间所剩无几,工作上造成被动,失去先机。本文开发一套数据采集系统,主要用来抓取主管部门网站的新闻、公告等内容,定时给学校相关各级领导分类推送上级要求和指示,以便及早谋划,助力高校高速发展。

关键词


高校;动态获取;数据采集

全文:

PDF


参考


[1] 肖新凤,张绛丽 . 基于 Python 的爬虫技术的网站设计与实现 [J]. 现代信息科技,2020,4(14):73-75 + 78.

[2] 刘硕 . 精通 scrapy 网络爬虫 [M]. 北京:清华大学出版社,2017.

[3] 洪伟 . 分布式网络爬虫系统设计与实现 [D]. 沈阳理工大学,2020.

[4] 赵北庚 . 基于 Flask 与爬虫技术的可视化深度学习数据标注系统 [J]. 电子制作,2020(20):36-37.




DOI: http://dx.doi.org/10.12361/2661-3298-05-16-108989

Refbacks

  • 当前没有refback。