题库,包括抓取试题,抓取答案,图像识别答案等
所属分类:其他
开发工具:Python
文件大小:10KB
下载次数:18
上传日期:2019-07-20 19:14:57
上 传 者:
舒适的猫
说明: 一个题库爬虫,包括抓取试题,抓取答案,图像识别答案,抓取分类,导入数据库
(A question bank crawler, including grabbing test questions, grabbing answers, image recognition answers, grabbing classification, importing into the database)
文件列表:
.idea (0, 2018-04-22)
.idea\vcs.xml (167, 2018-04-22)
sprider (0, 2018-04-22)
sprider\category.py (2320, 2018-04-22)
sprider\dbsave.py (4145, 2018-04-22)
sprider\exam_struct.sql (2283, 2018-04-22)
sprider\load_images.py (1933, 2018-04-22)
sprider\sprider.py (1454, 2018-04-22)
sprider\sprider2.py (2582, 2018-04-22)
sprider\sprider_qustion.py (1805, 2018-04-22)
sprider\test.png (912, 2018-04-22)
sprider\test.py (441, 2018-04-22)
# tiku_sprider
## 帮别人写的一个题库爬虫,包括抓取试题,抓取答案,图像识别答案,抓取分类,导入数据库
- category.py 运行可在当前目录下生成分类数据 cate.txt
- 单线程运行 速度较慢
- sprider.py 运行可在当前目录下生成 某个分类的 试题数据 data.txt
- 单线程运行 速度较慢
- sprider2.py 运行可在data文件夹下创建以每个分类编号命名的 试题数据
- 线程池 + 队列 + 消费者生产者模型 速度较快
- sprider_qustion 运行可抓取data文件夹内所有问题的答案数据,生成ans_all.txt
- 线程池 + 队列 + 消费者生产者模型 速度较快
- 自动识别图像类型的答案
- dbsave.py 运行可将所有数据导入数据库
- 线程池 + 队列 + 消费者生产者模型 速度较快
## 随手写的工具,没怎么优化。不过测试单机可以很快抓取10w+试题,答案,以及几十万图片
近期下载者:
相关文件:
收藏者: