This branch is 1 commit ahead of, 1 commit behind Jack-Cherish/python-spider:master.

Name	Name	Last commit message	Last commit date
Latest commit pen4 update lxml 4.6.3 to 4.9.1 Nov 21, 2022 c962096 · Nov 21, 2022 History 339 Commits
2020	2020	Update README.md	Nov 22, 2020
Netease	Netease	根据歌单下载网易云音乐	Feb 9, 2018
baiwan	baiwan	百万英雄答题辅助系统	Jan 12, 2018
bilibili	bilibili	Update bilibili.py	Sep 12, 2018
bilibili_luckyman	bilibili_luckyman	Create README.md	Jul 3, 2022
cartoon	cartoon	火影忍者漫画下载	Jun 4, 2017
dingdong	dingdong	京东商品晒单图下载	Jul 8, 2018
douyin	douyin	更换域名修复收藏的视频下载	Dec 24, 2019
one_hour_spider	one_hour_spider	笔趣看当时无法打开，就参照教程爬取了笔趣阁内容	Jul 31, 2018
video_downloader	video_downloader	Update requirements.txt	Jul 13, 2018
zhengfang_system_spider	zhengfang_system_spider	update lxml 4.6.3 to 4.9.1	Nov 21, 2022
12306.py	12306.py	用Python抢火车票的简单小程序	Jan 3, 2018
README.md	README.md	Update README.md	Nov 22, 2020
baiduwenku.py	baiduwenku.py	百度文库文章爬取(待完善)	May 16, 2017
baiduwenku_pro_1.py	baiduwenku_pro_1.py	新版百度文库爬虫	Jun 1, 2018
biqukan.py	biqukan.py	Update biqukan.py	Oct 8, 2018
daili.py	daili.py	代理ip池	May 28, 2017
douyin.py	douyin.py	抖音APP视频下载更新	Nov 19, 2017
douyin_pro.py	douyin_pro.py	抖音app视频下载升级版	Mar 4, 2018
downloader.py	downloader.py	文件下载小助手	Aug 23, 2017
financical.py	financical.py	跟着股神巴菲特学习炒股之财务报表入库(MySQL)	Sep 2, 2017
geetest.py	geetest.py	Update geetest.py	Nov 26, 2019
hero.py	hero.py	王者荣耀出装小助手(爬取手机APP)	Aug 7, 2017
shuaia.py	shuaia.py	爬取《帅啊》网帅哥图片	May 22, 2017

Repository files navigation

注：2020年最新连载教程请移步：Python Spider 2020

Python Spider

原创文章每周最少两篇，后续最新文章会在【公众号】首发，视频【B站】首发，大家可以加我【微信】进交流群，技术交流或提意见都可以，欢迎Star！

声明

代码、教程仅限于学习交流，请勿用于任何商业用途！

爬虫小工具

downloader.py:文件下载小助手

一个可以用于下载图片、视频、文件的小工具，有下载进度显示功能。稍加修改即可添加到自己的爬虫中。

动态示意图：

爬虫实战

biqukan.py:《笔趣看》盗版小说网站，爬取小说工具

第三方依赖库安装：
```
 pip3 install beautifulsoup4
```
使用方法：
```
 python biqukan.py
```
baiduwenku.py: 百度文库word文章爬取

原理说明：http://blog.csdn.net/c406495762/article/details/72331737

代码不完善，没有进行打包，不具通用性，纯属娱乐。
shuaia.py: 爬取《帅啊》网，帅哥图片

《帅啊》网URL：http://www.shuaia.net/index.html

原理说明：http://blog.csdn.net/c406495762/article/details/72597755

第三方依赖库安装：
```
 pip3 install requests beautifulsoup4
```
daili.py: 构建代理IP池

原理说明：http://blog.csdn.net/c406495762/article/details/72793480
carton: 使用Scrapy爬取《火影忍者》漫画

代码可以爬取整个《火影忍者》漫画所有章节的内容，保存到本地。更改地址，可以爬取其他漫画。保存地址可以在settings.py中修改。

动漫网站：http://comic.kukudm.com/

原理说明：http://blog.csdn.net/c406495762/article/details/72858983
hero.py: 《王者荣耀》推荐出装查询小助手

网页爬取已经会了，想过爬取手机APP里的内容吗？

原理说明：http://blog.csdn.net/c406495762/article/details/76850843
financical.py: 财务报表下载小助手

爬取的数据存入数据库会吗？《跟股神巴菲特学习炒股之财务报表入库(MySQL)》也许能给你一些思路。

原理说明：http://blog.csdn.net/c406495762/article/details/77801899

动态示意图：
one_hour_spider:一小时入门Python3网络爬虫。

原理说明:
- 知乎：https://zhuanlan.zhihu.com/p/29809609
- CSDN：http://blog.csdn.net/c406495762/article/details/78123502
本次实战内容有：
- 网络小说下载(静态网站)-biqukan
- 优美壁纸下载(动态网站)-unsplash
- 视频下载
douyin.py:抖音App视频下载

抖音App的视频下载，就是普通的App爬取。

原理说明:
- 个人网站：http://cuijiahua.com/blog/2018/03/spider-5.html
douyin_pro:抖音App视频下载（升级版）

抖音App的视频下载，添加视频解析网站，支持无水印视频下载，使用第三方平台解析。

原理说明:
- 个人网站：http://cuijiahua.com/blog/2018/03/spider-5.html
douyin:抖音App视频下载（升级版2）

抖音App的视频下载，添加视频解析网站，支持无水印视频下载，通过url解析，无需第三方平台。

原理说明:
- 个人网站：http://cuijiahua.com/blog/2018/03/spider-5.html
动态示意图：
geetest.py:GEETEST验证码识别

原理说明:

无
12306.py:用Python抢火车票简单代码

可以自己慢慢丰富，蛮简单，有爬虫基础很好操作，没有原理说明。
baiwan:百万英雄辅助答题

效果图：

原理说明：
- 个人网站：http://cuijiahua.com/blog/2018/01/spider_3.html
功能介绍：

服务器端，使用Python（baiwan.py）通过抓包获得的接口获取答题数据，解析之后通过百度知道搜索接口匹配答案，将最终匹配的结果写入文件（file.txt)。

手机抓包不会的朋友，可以看下我的早期手机APP抓包教程。

Node.js（app.js）每隔1s读取一次file.txt文件，并将读取结果通过socket.io推送给客户端（index.html）。

亲测答题延时在3s左右。

声明：没做过后端和前端，花了一天时间，现学现卖弄好的，javascript也是现看现用，百度的程序，调试调试而已。可能有很多用法比较low的地方，用法不对，请勿见怪，有大牛感兴趣，可以自行完善。
Netease:根据歌单下载网易云音乐

效果图：

原理说明：

暂无

功能介绍：

根据music_list.txt文件里的歌单的信息下载网易云音乐，将自己喜欢的音乐进行批量下载。

bilibili：B站视频和弹幕批量下载

原理说明：

暂无

使用说明：

 python bilibili.py -d 猫 -k 猫 -p 10

 三个参数：
 -d	保存视频的文件夹名
 -k	B站搜索的关键字
 -p	下载搜索结果前多少页

jingdong：京东商品晒单图下载

效果图：

原理说明：

暂无

使用说明：

 python jd.py -k 芒果

  三个参数：
 -d	保存图片的路径，默认为fd.py文件所在文件夹
 -k	搜索关键词
 -n  	下载商品的晒单图个数，即n个商店的晒单图

zhengfang_system_spider：对正方教务管理系统个人课表，个人学生成绩，绩点等简单爬取

效果图：

原理说明：

暂无

使用说明：
```
 cd zhengfang_system_spider
 pip install -r requirements.txt
 python spider.py
```

其它

欢迎 Pull requests，感谢贡献。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

注：2020年最新连载教程请移步：Python Spider 2020

Python Spider

声明

目录

爬虫小工具

爬虫实战

其它

About

Releases

Packages

Languages

pen4/python-spider

Folders and files

Latest commit

History

Repository files navigation

注：2020年最新连载教程请移步：Python Spider 2020

Python Spider

声明

目录

爬虫小工具

爬虫实战

其它

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages