notice.py 功能 爬取华北水利水电大学的通知页面,可指定开始页面和结束页面。 爬取格式: 若通知文章无附件,则直接将通知正文保存为文本文件,文件名为 [部门][标题][创建时间]。 若通知文章带有附件,则创建一个文件夹,放置通知正文的文本文件和所有附件。 文件夹: 内容: 依赖 python3 requests beautifulsoup4 lxml 使用方法 clone 此仓库到本地 打开命令行, cd 到仓库目录 ncwu_crawler pip 安装依赖 pip install -r requirements 输入 python notice.py 运行 测试平台 ubuntu 16.04 Windows 8,10