题库,包括抓取试题,抓取答案,图像识别答案等

所属分类:其他
开发工具:Python
文件大小:10KB
下载次数:18
上传日期:2019-07-20 19:14:57
上 传 者舒适的猫
说明:  一个题库爬虫,包括抓取试题,抓取答案,图像识别答案,抓取分类,导入数据库
(A question bank crawler, including grabbing test questions, grabbing answers, image recognition answers, grabbing classification, importing into the database)

文件列表:
.idea (0, 2018-04-22)
.idea\vcs.xml (167, 2018-04-22)
sprider (0, 2018-04-22)
sprider\category.py (2320, 2018-04-22)
sprider\dbsave.py (4145, 2018-04-22)
sprider\exam_struct.sql (2283, 2018-04-22)
sprider\load_images.py (1933, 2018-04-22)
sprider\sprider.py (1454, 2018-04-22)
sprider\sprider2.py (2582, 2018-04-22)
sprider\sprider_qustion.py (1805, 2018-04-22)
sprider\test.png (912, 2018-04-22)
sprider\test.py (441, 2018-04-22)

# tiku_sprider ## 帮别人写的一个题库爬虫,包括抓取试题,抓取答案,图像识别答案,抓取分类,导入数据库 - category.py 运行可在当前目录下生成分类数据 cate.txt - 单线程运行 速度较慢 - sprider.py 运行可在当前目录下生成 某个分类的 试题数据 data.txt - 单线程运行 速度较慢 - sprider2.py 运行可在data文件夹下创建以每个分类编号命名的 试题数据 - 线程池 + 队列 + 消费者生产者模型 速度较快 - sprider_qustion 运行可抓取data文件夹内所有问题的答案数据,生成ans_all.txt - 线程池 + 队列 + 消费者生产者模型 速度较快 - 自动识别图像类型的答案 - dbsave.py 运行可将所有数据导入数据库 - 线程池 + 队列 + 消费者生产者模型 速度较快 ## 随手写的工具,没怎么优化。不过测试单机可以很快抓取10w+试题,答案,以及几十万图片

近期下载者

相关文件


收藏者