K12题库数据集是一个面向基础教育阶段的综合性题库资源,涵盖了小学、初中、高中三个学段的主要学科,共计包含4599道高质量的题目。该数据集对于教育技术研究、智能教学系统开发、自然语言处理模型训练以及教育数据分析具有重要的应用价值。
数据集包含了完整的题目元数据、原始题目内容、标准答案、详细解析、知识点标注等丰富信息。其中,部分题目还包含了图片资源,这些图片文件与题目内容一一对应,为理解题目提供了重要的视觉辅助。数据集的完整性和多样性使其成为教育AI领域研究和应用开发的宝贵资源。
在科研应用方面,该数据集可用于训练和评估智能问答系统、自动解题模型、知识点推荐算法等。在产业应用方面,数据集可支撑在线教育平台的题库建设、个性化学习推荐系统、智能批改系统等产品的开发。算法的训练和应用需要大规模、高质量的标注数据,而本数据集正是满足这一需求的优质资源。
数据基本信息
数据字段说明
| 字段名称 |
字段类型 |
字段含义 |
数据示例 |
完整性 |
| subjectName |
字符串 |
学科名称 |
语文、数学、英语、物理… |
100.0% |
| _id |
字符串 |
题目唯一标识符 |
71c7d734b9e740e09965eee85b291f04… |
100.0% |
| logicQuesTypeName |
字符串 |
题目类型 |
解答、单选、填空、判断… |
100.0% |
| question |
字符串 |
题目内容 |
学校图书馆那丰富的图书又像磁石一样吸引着我。(缩句)… |
100.0% |
| difficulty |
整数 |
题目难度 |
1-5,数值越大难度越高… |
100.0% |
| gradeGroupName |
字符串 |
学段名称 |
小学、初中、高中… |
100.0% |
| subjectId |
字符串 |
学科ID |
1、2、3、4… |
100.0% |
| is_img |
整数 |
是否包含图片 |
0表示无图片,1表示有图片… |
100.0% |
| answer |
字符串 |
标准答案 |
图书吸引着我。… |
100.0% |
| Analysis |
字符串 |
题目解析 |
本题考查缩句。缩句是汉语语法中的一种常见操作…… |
100.0% |
| gradeGroupId |
字符串 |
学段ID |
1表示小学,2表示初中,3表示高中… |
100.0% |
| knowledge |
数组 |
知识点标签 |
[“句”, “基础知识”]… |
95.7% |
数据分布情况
学科分布
| 学科名称 |
记录数量 |
占比 |
累计占比 |
| 数学 |
600 |
13.05% |
13.05% |
| 英语 |
600 |
13.05% |
26.09% |
| 语文 |
599 |
13.02% |
39.12% |
| 化学 |
400 |
8.70% |
47.81% |
| 历史 |
400 |
8.70% |
56.51% |
| 地理 |
400 |
8.70% |
65.21% |
| 政治 |
400 |
8.70% |
73.91% |
| 物理 |
400 |
8.70% |
82.60% |
| 生物 |
400 |
8.70% |
91.30% |
| 科学 |
400 |
8.70% |
100.00% |
学段分布
| 学段名称 |
记录数量 |
占比 |
累计占比 |
| 初中 |
2000 |
43.49% |
43.49% |
| 高中 |
1799 |
39.12% |
82.60% |
| 小学 |
800 |
17.40% |
100.00% |
题型分布
| 题型名称 |
记录数量 |
占比 |
| 解答 |
1934 |
42.05% |
| 单选 |
1905 |
41.42% |
| 填空 |
645 |
14.02% |
| 判断 |
86 |
1.87% |
| 多选 |
15 |
0.33% |
| 多选多 |
7 |
0.15% |
| 完形填空 |
6 |
0.13% |
| 连词成句 |
1 |
0.02% |
难度分布
| 难度等级 |
记录数量 |
占比 |
| 1 |
473 |
10.28% |
| 2 |
1504 |
32.70% |
| 3 |
2321 |
50.47% |
| 4 |
262 |
5.70% |
| 5 |
39 |
0.85% |
图片分布
| 是否含图片 |
记录数量 |
占比 |
| 有图片 |
1517 |
32.99% |
| 无图片 |
3082 |
67.01% |
数据规模与类型
数据集共包含4599道题目,覆盖10个学科,3个学段,8种题型。数据格式为JSON Lines(每行一个JSON对象),便于逐行读取和处理。数据集还包含1517道带图片的题目,对应1517个图片文件(PNG和JPG格式),图片文件存储在独立的image目录中,通过题目中的is_img字段和图片路径可以建立对应关系。所有题目均包含完整的题目内容、标准答案和详细解析,2019道题目包含选择题选项。所有题目均标注了知识点标签,共出现31653次知识点标注,涵盖4331个不同的知识点标签。
数据优势
| 优势特征 |
具体表现 |
应用价值 |
| 完整原始文件 |
数据集包含1517个图片文件,与题目一一对应,图片格式为PNG和JPG |
支持基于图像的题目理解、OCR识别、图文混排题目处理等应用 |
| 高质量标注信息 |
所有题目均包含标准答案和详细解析,4599道题目有完整解析,每道题目标注了知识点标签 |
可用于监督学习、知识图谱构建、智能推荐系统训练 |
| 多学段全覆盖 |
覆盖小学、初中、高中三个学段,10个主要学科 |
支持跨学段知识体系研究、个性化学习路径推荐 |
| 题型多样性 |
包含8种题型,涵盖选择题、填空题、解答题等 |
支持多种题型的自动批改、智能组卷、题目难度评估 |
| 难度标注完整 |
所有题目标注了1-5级难度,难度分布均匀 |
支持个性化推荐、自适应学习系统开发 |
| 数据规模适中 |
共4599道题目,数据量适中便于快速实验和验证 |
适合算法原型开发、模型快速迭代、教育资源有限的研究团队 |
| 数据集获取 |
K12数据集 |
|
数据样例
说明:由于数据集包含完整的图片文件,部分题目的图片无法在文章中直接展示。实际数据集中,所有标注为is_img=1的题目都包含对应的图片文件,图片文件路径可通过题目中的图片引用获取。以下展示的是元数据样例,涵盖了不同学科、学段、题型的多样性特征。
元数据样例
样例 1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| { "_id": "dca9938bc7f241df8323394e29754257", "question": "常用于测量液体体积的仪器是( )\n", "answer": "A", "Analysis": "A选项:量筒用于量取液体的体积,故正确;\nB选项:试管可以用作少量液体的反应器,不能用来测量液体体积,故错误;\nC选项:烧杯可以用作大量液体的反应器,溶解稀释液体,一般不用来测量液体体积,故错误;\nD选项:水槽用于排水法收集气体,不能用来测量液体体积,故错误;\n故选A。\n", "options": "A:量筒\n\nB:试管\n\nC:烧杯\n\nD:水槽\n", "logicQuesTypeName": "单选", "subjectId": "5", "is_img": 0, "difficulty": 1, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [ "希望学精品题", "量筒的使用及误差分析", "实验常用的仪器", "常见仪器的使用注意事项", "科学探究", "学习基本的实验技能" ] }
|
样例 2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| { "_id": "410fe40216e94f33904b9b820b05ee35_1_1", "question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n如图1是自来水的生产过程。据图回答:\n\n<img alt=\"\" height=\"131\" src=\"image/ed6cc07a-acfe-4041-9ea3-58cdd07730ae.png\" width=\"367\" />\n\n该过程中没有使用的净水方法是 ___ ___ 。(填字母序号)\n", "answer": "A\nB", "Analysis": "自来水的生产过程使用的净水方法有沉淀、过滤、吸附和消毒等,没有蒸馏,则该过程中使用的净水方法有AB。\n", "options": "A:沉淀\n\nB:过滤\n\nC:蒸馏\n", "logicQuesTypeName": "多选", "subjectId": "5", "is_img": 1, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [] }
|
样例 3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| { "_id": "410fe40216e94f33904b9b820b05ee35_1_3", "question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n如图1是自来水的生产过程。据图回答:\n\n<img alt=\"\" height=\"131\" src=\"image/ed6cc07a-acfe-4041-9ea3-58cdd07730ae.png\" width=\"367\" />\n\n在净水时,可用明矾作混凝剂沉降小颗粒不溶性杂质,其化学式为 $$\\text{KAl}{{\\left( \\text{S}{{\\text{O}}_4} \\right)}_{n}}\\cdot 12{{\\text{H}}_2}\\text{O}$$,$$n$$ 的值为 ___ ___ 。\n", "answer": "$$2$$", "Analysis": "在 $$\\text{KAl}{{(\\text{S}{{\\text{O}}_4})}_{n}}\\cdot 12{{\\text{H}}_2}\\text{O}$$ 中,钾元素显 $$+1$$ 价,铝元素显 $$+3$$ 价,硫酸根显 $$-2$$ 价,根据化合物中正负化合价的代数和为零可得 $$+1+(+3)+(-2)\\times n=0$$,则 $$n=2$$。\n", "options": "", "logicQuesTypeName": "填空", "subjectId": "5", "is_img": 1, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [] }
|
样例 4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
| { "_id": "410fe40216e94f33904b9b820b05ee35_2", "question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n【项目二】:认识水的蒸发\n\n图2反映烧杯内的水在不同温度下汽化时发生变化的微观示意图,请将 $$50{}^\\circ \\text{C}$$ 时相同空间内对应的微观示意图补充完整 ___ ___ (图中“●”表示氧原子,“○”表示氢原子)。\n\n<img alt=\"\" height=\"123\" src=\"image/6952c17e-2354-44fc-a8aa-1e15d6778021.png\" width=\"257\" />\n", "answer": "<img alt=\"\" height=\"77\" src=\"/data/new_tk/images/new_img/2_5/image_15/e4d0fe4c-3c18-4c31-87e3-2bb45c3c6486.png\" width=\"85\" />\n", "Analysis": "温度越高,分子之间的间隔越大,分子热运动越快,蒸发越快,空气中的水分子更多,因此,与 $$20{}^\\circ \\text{C}$$ 时对应的微观示意图相比,$$50{}^\\circ \\text{C}$$ 时相同空间内对应的微观示意图为:<img alt=\"\" height=\"77\" src=\"/data/new_tk/images/new_img/2_5/image_6/e4d0fe4c-3c18-4c31-87e3-2bb45c3c6486.png\" width=\"85\" />。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "5", "is_img": 1, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [ "物质组成的表示", "由水分解判断元素组成", "化合价", "增进对科学探究的理解", "身边的化学物质", "水与常见的溶液", "科学探究的基本方法和环节", "希望学精品题", "水", "水的组成", "试题类型", "科学探究与创新意识", "科学探究", "微观粒子特征的实际应用及影响因素", "微观粒子特征的模型表示", "水的净化", "电解水实验的现象、结论及注意事项", "物质的化学变化", "物质构成的奥秘", "影响化学反应速率的因素", "微观粒子的特征", "求某元素/原子团的化合价", "自来水厂的净水流程和净水常用的方法", "实验方案设计", "微粒构成物质", "素养" ] }
|
样例 5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
| { "_id": "410fe40216e94f33904b9b820b05ee35_4", "question": "某小组同学对生活中水展开了项目式学习探究。\n\n【项目一】:探究自来水的生产过程\n\n【项目四】探究影响电解水速率的因素\n\n以收集 $$20\\ \\text{mL}$$ 氢气为标准,记录时间和收集氧气的体积,实验数据如下表:\n\n<table align=\"center\" border=\"1\" cellpadding=\"0\" cellspacing=\"0\" style=\"width:515px\">\n\t<tbody>\n\t\t<tr>\n\t\t\t<td style=\"text-align:center\"> </td>\n\t\t\t<td>\n\t\t\t温度 $$/{}^\\circ \\text{C}$$\n</td>\n\t\t\t<td>\n\t\t\t外加电压 $$/\\text{V}$$\n</td>\n\t\t\t<td>\n\t\t\t氧气 $$/\\text{mL}$$\n</td>\n\t\t\t<td>\n\t\t\t时间 $$/\\text{s}$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t①\n</td>\n\t\t\t<td>\n\t\t\t$$15$$\n</td>\n\t\t\t<td>\n\t\t\t$$6$$\n</td>\n\t\t\t<td>\n\t\t\t$$9.9$$\n</td>\n\t\t\t<td>\n\t\t\t$$54.6$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t②\n</td>\n\t\t\t<td>\n\t\t\t$$15$$\n</td>\n\t\t\t<td>\n\t\t\t$$9$$\n</td>\n\t\t\t<td>\n\t\t\t$$10.0$$\n</td>\n\t\t\t<td>\n\t\t\t$$23.4$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t③\n</td>\n\t\t\t<td>\n\t\t\t$$15$$\n</td>\n\t\t\t<td>\n\t\t\t$$12$$\n</td>\n\t\t\t<td>\n\t\t\t$$9.0$$\n</td>\n\t\t\t<td>\n\t\t\t$$15.0$$\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t④\n</td>\n\t\t\t<td>\n\t\t\t$$30$$\n</td>\n\t\t\t<td>\n\t\t\t$$6$$\n</td>\n\t\t\t<td>\n\t\t\t$$9.6$$\n</td>\n\t\t\t<td>\n\t\t\t$$46.2$$\n</td>\n\t\t</tr>\n\t</tbody>\n</table>\n实验①②③可探究 ___ ___ 对电解水速率的影响,欲探究温度对电解水速率的影响,应选择的实验组是 ___ ___ (填实验序号).根据表中数据得出电解的最佳温度和电压是 ___ ___ .\n", "answer": "外加电压\n①④\n$$30{}^\\circ \\text{C}$$、$$12\\ \\text{V}$$", "Analysis": "根据表中数据可知,实验①②③温度相同,外加电压的大小不同,则实验①②③可探究外加电压对电解水速率的影响,欲探究温度对电解水速率的影响,其他条件相同,温度不同,则应选择的实验组是①④;根据实验①②③可知,温度相同,外加电压越大,收集等体积的气体所需时间越短,反应速率越快,根据实验①④可知,外加电压相同,温度越高,收集等体积的气体所需时间越短,反应速率越快,故根据表中数据得出的结论是温度越高,外加电压越大,电解水的速率越快,根据表中数据得出电解的最佳温度和电压是 $$30{}^\\circ \\text{C}$$、$$12\\ \\text{V}$$。\n", "options": "", "logicQuesTypeName": "填空", "subjectId": "5", "is_img": 0, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [ "物质组成的表示", "由水分解判断元素组成", "化合价", "增进对科学探究的理解", "身边的化学物质", "水与常见的溶液", "科学探究的基本方法和环节", "希望学精品题", "水", "水的组成", "试题类型", "科学探究与创新意识", "科学探究", "微观粒子特征的实际应用及影响因素", "微观粒子特征的模型表示", "水的净化", "电解水实验的现象、结论及注意事项", "物质的化学变化", "物质构成的奥秘", "影响化学反应速率的因素", "微观粒子的特征", "求某元素/原子团的化合价", "自来水厂的净水流程和净水常用的方法", "实验方案设计", "微粒构成物质", "素养" ] }
|
样例 6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| { "_id": "c2f8c7c97e7b475cb941283c580348eb", "question": "用如图所示装置及药品进行实验,能达到对应实验目的的是( )\n\n<table align=\"center\" border=\"1\" cellpadding=\"0\" cellspacing=\"0\" style=\"width:515px\">\n\t<tbody>\n\t\t<tr>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"82\" src=\"image/584c51a3-9c63-4147-a3e3-7558c1ff0e40.png\" width=\"42\" />\n</td>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"84\" src=\"image/ca4c9d3a-ea11-4150-bed4-84f62f095442.png\" width=\"154\" />\n</td>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"98\" src=\"image/8d10b6a6-c8af-4550-8845-40f0bd1e9ba2.png\" width=\"99\" />\n</td>\n\t\t\t<td>\n\t\t\t<img alt=\"\" height=\"96\" src=\"image/031d9b8b-7fdd-4b72-897b-eb986ac621f3.png\" width=\"83\" />\n</td>\n\t\t</tr>\n\t\t<tr>\n\t\t\t<td>\n\t\t\tA收集氧气\n</td>\n\t\t\t<td>\n\t\t\tB证明二氧化锰是该反应的催化剂\n</td>\n\t\t\t<td>\n\t\t\tC监控 $${{\\text{O}}_2}$$ 流速\n</td>\n\t\t\t<td>\n\t\t\tD验证蜡烛燃烧生成水\n</td>\n\t\t</tr>\n\t</tbody>\n</table>", "answer": "D", "Analysis": "A选项:氧气密度比空气大,应用向上排空气法收集,该选项不能达到实验目的;\nB选项:催化剂是指能改变反应速率,但反应前后质量和化学性质不变,该实验只能证明二氧化锰能改变过氧化氢的分解速率,但不能证明反应前后质量和化学性质不变,该选项不能达到实验目的;\nC选项:氧气不易溶于水,若想监控氧气的流速,则应将氧气直接通入水中,即氧气从长管通入,该选项不能达到实验目的;\nD选项:干冷烧杯内壁有水雾,则说明蜡烛燃烧生成水,该选项能达到实验目的。\n故选D。\n", "options": "A:A\n\nB:B\n\nC:C\n\nD:D\n", "logicQuesTypeName": "单选", "subjectId": "5", "is_img": 1, "difficulty": 2, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [ "科学探究的基本方法和环节", "希望学精品题", "增进对科学探究的理解", "实验方案设计", "科学探究" ] }
|
样例 7
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
| { "_id": "5820dc5aa9cc4397a372328d1144b1ae_5", "question": "$$2023$$ 年 $$10$$ 月 $$31$$ 日,神舟十六号载人飞船回收舱顺利返回,航天员在中国空间站完成各项任务,因此,保障航天员的氧气需求至关重要。那么,空间站的氧气从哪里来?\n\nⅠ.从地球带上去\n\n空间站是一个相对封闭的场所,解决“气体从哪里来”的问题必然伴生着“气体往哪里去”的问题。为此,科学家设计了生物再生生命保障系统,实现了“水—氧—碳”的循环转化。下列叙述正确的是(填序号) ___ ___ 。\n", "answer": "A\nB\nC", "Analysis": "A选项:“水 $$-$$ 氧 $$-$$ 碳”的循环转化,不需要携带大量氧气,减少了氧气的携带量,减轻了火箭和飞船的载重,该选项叙述正确;\nB选项:生物再生生命保障系统中不需要氢气,系统需要对氢气进行转化,该选项叙述正确;\nC选项:人体代谢产物中的水,设计系统时应考虑这部分水的净化,该选项叙述正确。\n故选ABC。\n", "options": "A:“水—氧—碳”的循环转化,减少了氧气的携带量,减轻了火箭和飞船的载重\n\nB:电解水在产生氧气的同时产生氢气,系统需要对氢气进行转化\n\nC:人体代谢产物中含有大量的水,设计系统时应考虑这部分水的净化\n", "logicQuesTypeName": "多选", "subjectId": "5", "is_img": 0, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [ "我们周围的空气", "空气", "身边的化学物质", "水与常见的溶液", "希望学精品题", "空气的成分与各成分体积分数", "氧气", "水", "水的组成", "试题类型", "微观粒子特征的实际应用及影响因素", "工业制取氧气", "电解水实验的现象、结论及注意事项", "检验气体是否为氧气", "物质构成的奥秘", "氧气的性质和用途", "微观粒子的特征", "氧气的制取实验", "自然界中的氧循环和碳循环、氮循环", "氧气的物理性质", "氮气", "微粒构成物质" ] }
|
样例 8
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| { "_id": "d5fa351e2ee0423989f4e69f9f71d79f", "question": "关注实验安全,规范实验操作下列相关说法不正确的是\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"1\"><tr><td>A.酒精洒落在实验台燃烧起来,应立刻用水浇灭</td></tr><tr><td>B.加热高锰酸钾制氧气时,试管口放一团棉花,可防止加热时粉末状物质进入导管</td></tr><tr><td>C.在实验室泡蔗糖水喝</td></tr><tr><td>D.实验室要正确使用火源,并束好长发,系紧宽松衣物</td></tr></table>", "answer": "AC\n", "Analysis": "\n【详解】\nA、不慎碰倒酒精灯,不要惊慌,应立即用湿抹布盖灭,不可用水浇灭,故说法错误;\nB、高锰酸钾制取氧气实验中,试管口放一团棉花可防止加热时试管内的粉末状物质进入导管,故说法正确;\nC、实验室中的蔗糖不能泡水喝,实验室中任何药品不能品尝,故说法错误;\nD、要正确使用酒精灯,并束好长发、系紧宽松衣物,以免引起火灾,故说法正确。\n故选AC。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "5", "is_img": 0, "difficulty": 1, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "化学", "knowledge": [ "基本实验操作", "实验室制取氧气的方法", "我们周围的空气", "实验与安全", "氧气的制取实验", "氧气", "物质的加热", "酒精灯的使用方法和注意事项", "身边的化学物质", "化学实验安全规则", "科学探究", "学习基本的实验技能" ] }
|
样例 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| { "_id": "9b9379a6f85d438b925ad5ff5b6e6f0d", "question": "陈旭麓在《近代中国社会的新陈代谢》中提到:“1840年,在炮口的逼迫下,中国蹒跚地走入近代。随后的一百余年里,驱使中国社会脱出常轨,改道变形。”这场“炮口的逼迫下”的历史事件( )\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"2\"><tr><td>A.推翻了中国封建专制制度</td><td>B.成为中国近代化的开端</td></tr><tr><td>C.使中国开始沦为半殖民地半封建社会</td><td>D.标志着洋务运动的破产</td></tr></table>", "answer": "C\n", "Analysis": "\n【详解】\n依据题干“1840年,在炮口的逼迫下,中国蹒跚地走入近代。随后的一百余年里,驱使中国社会脱出常轨,改道变形”,结合所学知识可知,1840年鸦片战争爆发,鸦片战争后西方列强的侵略打断了中国社会的正常发展进程,中国由主权独立、领土完整的封建国家转变为半殖民地半封建社会,逐步半殖民地半封建化,社会性质发生了根本变化,C项正确;辛亥革命清帝退位,推翻了中国封建专制制度,排除A项;洋务运动是中国近代化的开端,排除B项;甲午中日战争中北洋水师全军覆没,标志着洋务运动的破产,排除D项。故选C项。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "8", "is_img": 0, "difficulty": 2, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "历史", "knowledge": [ "侵略与反抗", "《南京条约》", "鸦片战争", "中国近代史" ] }
|
样例 10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| { "_id": "b1ab1392d1ec4f0c8c0ce71225fd8976", "question": "如下图是《民权画报》于1912年8月13日刊登的一幅讽刺漫画,画中有一只猿猴手持五色旗,在地球上绕圈子跑动。该漫画( )\n<img src=\"image/f621a97ecbfd8000108bad9e22c3088e.png\" style=\"vertical-align:middle;\" alt=\"\" width=\"186px\" height=\"204px\">\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"2\"><tr><td>A.继承了传统文人画的风格</td><td>B.证实了袁世凯复辟帝制</td></tr><tr><td>C.描绘了生物进化论内涵</td><td>D.反映了当时政治转型艰难</td></tr></table>", "answer": "D\n", "Analysis": "\n【详解】\n根据题干“一只猿猴手持民国五色旗,在地球上绕圈子跑动”并结合所学知识可知,五色旗是民国旗帜,漫画中猿猴举着民国旗帜跑向了专制,这讽刺了袁世凯窃取辛亥革命的胜利果实,漫画反映了当时政治转型的艰难,D项正确;传统文人画强调的是写意,漫画明显不属于传统文人画,排除A项;袁世凯复辟帝制已经到了1916年,所以漫画不能证实袁世凯复辟帝制,排除B项;描绘了生物进化论的内涵与漫画信息“共和、专制”无关,排除C项。故选D项。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "8", "is_img": 1, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "历史", "knowledge": [ "辛亥革命与中华民国的建立", "近代化的探索", "中华民国建立", "中国近代史" ] }
|
样例 11
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| { "_id": "d246ebf4bb404aecbb23f813ad81a963", "question": "2024年7月23日,我国科研团队在嫦娥五号月球样品中,发现了一种富含水分子和铵的未知矿物晶体——ULM-1。这是科学家首次在月壤中发现分子水。我国进行太空探索的意义主要有( )\n①开发利用太空中丰富的生物资源②利用太空的物理环境进行科学实验\n③探索空间环境对人类生存的影响④为人类和平利用太空贡献中国方案\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"4\"><tr><td>A.①②③</td><td>B.②③④</td><td>C.①③④</td><td>D.①②④</td></tr></table>", "answer": "B\n", "Analysis": "\n【详解】\n太空为真空环境,就目前的科学手段而言,无法证明其有生物资源存在,①错误;太空提供了一个与地球截然不同的物理环境,如微重力、高真空、强辐射等。这些条件为科学实验提供了独特的平台,使得在地球上难以进行或成本高昂的实验得以在太空中实现,②正确;了解太空环境对人类生存的影响,不仅有助于我们更好地保护地球环境,还能为未来的太空居住和施行提供必要的科学依据,③正确;中国作为航天大国,积极参与太空探索活动,不仅提升了自身的科技实力和国际地位,还为全球太空治理和和平利用太空贡献了中国方案,④正确。B正确,ACD错误。故选B。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "9", "is_img": 0, "difficulty": 3, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "地理", "knowledge": [ "自然地理", "地球和地图" ] }
|
样例 12
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| { "_id": "24e5d5cebb7d4e229663ceb9a8fb2f24", "question": "一般来说,在相同图幅的情况下,比例尺小的地图,表示的范围大,呈现的内容较为简略。下列是关于北京市的四幅地图。若图幅相同,则其中比例尺最小的是( )\n<img src=\"image/d47c48fa713c176cb1fc64580bd6eeb4.png\" style=\"vertical-align:middle;\" alt=\"\" width=\"481px\" height=\"134px\">\n<table border=\"1\" name=\"optionsTable\" style=\"width:100%;table-layout:fixed;\" cols=\"4\"><tr><td>A.①</td><td>B.②</td><td>C.③</td><td>D.④</td></tr></table>", "answer": "B\n", "Analysis": "\n【详解】\n相同图幅,范围越大,比例尺越小,内容越简略;范围越小,比例尺越大,内容越详细。四幅图幅相同的地图,②图中国地图范围最大,则比例尺最小,B正确,ACD错误。故选B。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "9", "is_img": 1, "difficulty": 2, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "地理", "knowledge": [ "比例尺", "地图三要素", "地图", "自然地理", "地球和地图" ] }
|
样例 14
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
| { "_id": "8d0e4e0fa7f94ea9bc5a71b266d03161", "question": "读下图漫画《村民议事》。从漫画中我们可以感受到( )\n<img src=\"image/dbc64ae4a0aba0b3f53858e0c7586e4b.jpg\" style=\"vertical-align:middle;\" alt=\"\" width=\"250px\" height=\"167px\">\n①我国发展基层民主 ②村民可以直接管理国家事务\n③村民民主意识增强 ④我国根本政治制度得以落实\n", "answer": "B", "Analysis": "\n【详解】\n本题考查基层群众自治制度、增强民主意识的要求。\n①③:漫画中《村民议事》,有利于我国发展基层民主,落实基层群众自治制度,有利于村民民主意识增强,提高村民的主人翁意识,①③符合题意;\n②:村民可以间接管理国家事务,②说法错误;\n④:我国的根本政治制度是人民代表大会制度,材料强调的是基层群众自治制度,④说法错误;\n故本题选B。\n", "options": "A:①②\nB:①③\nC:②④\nD:③④", "logicQuesTypeName": "单选", "subjectId": "10", "is_img": 1, "difficulty": 2, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "政治", "knowledge": [ "参与民主生活", "公民增强民主意识的做法", "我与国家和社会", "人民当家作主", "基层群众自治制度", "民主与法治", "增强民主意识", "我国的政治和经济制度", "基本政治制度", "追求民主价值" ] }
|
样例 15
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| { "_id": "70dbc5f0d4fe4679b44ff28479acab6c", "question": "和谐关系,共同构建\n以下是初中生小闽生活中的两段对话:\n<table border=\"1\" style=\"width:525.923px;border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;border-collapse: collapse;\"><tr ><td style=\"width:217px;border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;\">对话一\n爸爸:爸妈,周末我们带孩子回去,陪你们吃饭、唠唠嗑。\n叔叔:爸妈对不起!我有任务,不能回家陪你们过节了。小时候您常说,“对祖国的忠,就是最大的孝”,可是我好多年没回家看你们了……\n爷爷:你们都是孝顺的孩子,“修身以尽孝,建功以报国”,你们做得很好。\n小闽:这就是家风吧,我也会传承下去的!</td><td style=\"width:208px;border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;\">对话二\n小闽:刘老师,虽然您一直要求严格,但我知道您很关心我们,最近总听您咳嗽,您要多注意身体。\n刘老师:谢谢小闵,你的关心让我很感动、很开心。最近天气转凉,你也要注意。\n小闽:谢谢老师提醒。我还想跟您请教一道题目,我觉得有另一种更简单的解法。\n刘老师:是吗,我们一起来讨论下。</td><td style=\"border-width:1px 1px 1px 1px;border-style:solid solid solid solid;border-color:black;\"><br /></td></tr></table>请你任选一段对话,结合所学知识,谈谈你的感悟。\n", "answer": "选择对话一:①家风作为一种无形的力量,会融入家庭成员的血脉中,潜移默化地影响家庭成员的价值观念、性格特征、道德修养和行为习惯等。②优良家风引导我们向上向善,促进家庭幸福和谐。③孝亲敬老是中华民族的传统美德,也是公民的法定义务。④我们要积极传承孝敬父母的优良传统。\n选择对话二:①彼此尊重、教学相长、携手共进,是师生交往理想而美好的状态;②我们应主动理解、关心老师;真诚接受老师的引领和指导。\n", "Analysis": "\n【分析】\n考点考查: 孝敬父母、传承良好家风、建立良好的师生关系\n能力考查:调动和运用知识,论证和探究问题 \n核心素养:健全人格\n【详解】\n第一步:审设问,明确主体、作答范围及作答角度; \n本题的设问主体是中学生,需要运用孝敬父母、传承良好家风、建立良好的师生关系的知识,从感悟类习题的角度进行作答; \n第二步:审材料,提取关键词,链接教材知识; \n关键词①:“对祖国的忠,就是最大的孝”;这就是家风吧,我也会传承下去的→可链接家风的重要性;传承良好家风;\n关键词②:周末我们带孩子回去,陪爸妈吃饭、唠唠嗑→可链接孝亲敬老是中华民族的传统美德,也是公民的法定义务;要积极传承孝敬父母的优良传统;\n关键词③:小闽与刘老师相互理解、共同讨论问题→可链接彼此尊重、教学相长、携手共进;我们应主动理解、关心老师;真诚接受老师的引领和指导;\n第三步:整合信息,组织答案。\n", "options": "", "logicQuesTypeName": "解答", "subjectId": "10", "is_img": 0, "difficulty": 4, "gradeGroupId": "2", "gradeGroupName": "初中", "subjectName": "政治", "knowledge": [ "建立良好的师生关系的做法", "正确认识老师的表扬与批评", "让家更美好", "孝亲敬长的做法", "亲情之爱", "师生交往", "家的意味", "正确面对老师的引领和指导", "建立良好的师生关系", "我与他人和集体", "师生之间", "师长情谊" ] }
|
应用场景
1. 智能教育系统开发
该数据集可用于开发智能教育系统,包括智能题库管理、自动组卷、个性化学习推荐等功能。系统可以根据学生的学段、学科、知识点掌握情况,从数据集中筛选合适的题目进行推荐。题目的难度标注可以用于构建自适应学习路径,根据学生的答题表现动态调整题目难度。数据集中丰富的知识点标签可以用于构建知识图谱,实现知识点之间的关联分析和学习路径规划。对于包含图片的题目,系统可以集成OCR技术识别图片中的文字和图形,实现图文混排题目的智能处理。标准答案和详细解析可以用于开发智能批改系统,自动评估学生的答题情况并提供个性化反馈。
2. 自然语言处理模型训练
数据集中的题目内容、答案、解析等文本信息可以用于训练自然语言处理模型,包括题目理解、答案生成、解析生成等任务。题目内容可以作为输入,答案作为输出,训练seq2seq模型实现自动解题。解析文本可以用于训练模型生成题目的详细解答过程,帮助学生理解解题思路。知识点标签可以用于多标签分类任务,训练模型自动识别题目涉及的知识点。不同题型的题目可以用于训练模型处理多种类型的教育文本。数据集的规模适中,适合用于模型的原型开发和快速实验,也可以作为大规模预训练数据集的补充。
3. 教育数据挖掘与分析
数据集可以用于教育数据挖掘研究,分析题目的难度分布、知识点覆盖情况、题型分布等。通过对题目内容的文本分析,可以挖掘题目的语言特征、复杂度特征等,用于题目质量评估。知识点标签的共现分析可以揭示知识点之间的关联关系,用于构建学科知识体系。不同学段、学科的题目分布可以用于分析教育资源的分配情况。难度标注可以用于研究题目的难度评估标准,验证难度标注的合理性和一致性。包含图片的题目可以用于研究图文混排题目的特征,分析图片在题目理解中的作用。
4. 智能批改与评估系统
数据集中的标准答案和解析可以用于开发智能批改系统,自动评估学生的答题情况。对于选择题,系统可以比较学生的答案与标准答案,实现快速批改。对于主观题,系统可以基于标准答案和解析,使用自然语言处理技术评估学生答案的相似度和正确性。详细解析可以用于生成个性化反馈,指出学生的错误点和改进方向。难度标注可以用于分析学生的能力水平,根据答题正确率和题目难度评估学生的学习情况。知识点标签可以用于分析学生的知识掌握情况,识别薄弱知识点并推荐相关练习。
5. 教育资源推荐系统
数据集可以用于构建教育资源推荐系统,根据学生的学段、学科、学习进度等因素推荐合适的题目。系统可以基于协同过滤、内容过滤等推荐算法,从数据集中筛选符合学生需求的题目。知识点标签可以用于实现基于知识点的推荐,当学生需要练习某个知识点时,系统可以推荐相关的题目。难度标注可以用于实现难度自适应的推荐,根据学生的能力水平推荐合适难度的题目。题型的多样性可以满足不同学习场景的需求,如复习、练习、测试等。包含图片的题目可以用于推荐需要视觉理解的题目,丰富推荐内容的多样性。
结尾
K12题库数据集是一个高质量、多维度、全学段覆盖的教育资源数据集,共包含4599道题目,涵盖了小学、初中、高中三个学段的主要学科。数据集的核心优势在于包含完整的原始文件(1517个图片文件)和高质量的标注信息(标准答案、详细解析、知识点标签)。这些优势使得数据集在教育AI研究、智能教育系统开发、自然语言处理模型训练等领域具有重要的应用价值。
数据集采用JSON Lines格式存储,结构清晰,易于处理和分析。每道题目都包含完整的元数据信息,便于快速检索和筛选。图片文件与题目内容一一对应,支持基于图像的题目理解应用。数据集的多学段、多学科、多题型特点使其成为教育AI领域研究和应用开发的宝贵资源。
该数据集适用于算法研究人员、教育技术开发者、在线教育平台建设者等不同角色的需求。无论是用于模型训练、系统开发还是数据分析,数据集都能提供高质量的标注数据和丰富的应用场景。有需要可私信获取更多信息。