爬取A股所有股票的公司和价格数据
- 基于WebMagic-0.7.3开源框架实现爬虫
- 基于SpringBoot-2.7.13
- 数据存储在mysql
- 支持爬取A股所有股票的价格数据
- 支持爬取A股所有公司信息
- 支持A股所有股票价格数据每天更新
- 支持数据读取失败后重试补齐数据
- 支持爬取A股所有股票的分红信息,并且定时更新
- 所有数据基于东方财富网站
- 建库脚本在 data 目录下
- 最新的股票代码及公司信息是 2024-04-18 的
- 使用 NewStockSpider 爬新股(提示:修改每页读取的新股数一次把需要的新股读出来)
- 调用 CompanyInfoSpider.run() 更新新股股票的公司信息
- 调用 StockHisPriceSpider.run() 爬取新股的历史价格数据(提示:需要修改取新股的查询条件)
- 更新完上面数据后,每天按 SpiderRunner 的定时任务跑就行,会定时更新新股和每天的股票价格
- StockCodeSpider.run() 爬取所有股票代码信息
- CompanyInfoSpider.run() 更新所有股票的公司信息
- StockHisPriceSpider.run() 爬取所有股票的历史价格数据
- 更新完上面数据后,每天按 SpiderRunner 的定时任务跑就行,会定时更新新股和每天的股票价格
- 本项目启发于box-spider