Skip to content

获取12306全国未来30天车次详细数据,12306爬虫

Notifications You must be signed in to change notification settings

casolxia/12306TrainCrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

12306全国火车车次爬虫介绍

12306有预售30天的车票,所以每一次都能获取最近30天的车次数据
可以获取到车次的详情数据,包括停车站,停车时间以及停车顺序等
可定时抓取,每日更新数据 基于webmagic实现

运行

  1. 初始化需要获取所有车站站点编码数据,在/images/station_code.csv 需导入数据库
  2. /src/com/crawler/train/Train12306Page 类为获取最近30天全国车次数据,简略数据仅仅包含车次号,出发站和终点站以及时间
  3. /src/com/crawler/train/TrainDetail12306Page 为根据第二步获取的简略数据进一步获取车次的详细数据,因数据量大会有失败的情况,需要重试抓取

数据展示

1 车站编码数据
image

2 车次简略数据
image

3 车次详细数据
image

About

获取12306全国未来30天车次详细数据,12306爬虫

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages