基于知识图谱的软件工程学科在线学习平台
将北京邮电大学软件工程专业课程的培养方案存入图数据库,并展示给用户.
建立一个问答系统,用户可以输入一个专业相关的问题,系统在图数据库中进行查询,给用户返回查询结果
- 主要用到了d3js库,实现展示相应的效果
- 首先使用HanLP将每种查询对应的问题进行分词,并在分词结果中查找每个问题分别对应词典中哪些词
- 根据每种查询对应的问题出现的关键词,在Spark中用朴素贝叶斯算法建立一个分类模型
- 用户每次输入一个问题之后,首先用HanLP进行分词,之后找出在词典中找出出现词的下标,组成一个向量
- 将向量带入朴素贝叶斯模型中得到预测结果,进而进行相应的查询,返回给用户相应的结果
- 目前questions_classification.txt中只有两种问题,需要添加一些问题
- 在添加问题的同时,需要给每种问题再detailed_questions中添加一个文件,存储该问题可能的提问方式
- 在添加问题的时候如果需要给分词应用添加新的词典,比如需要添加一个词典用来保存所有老师的名字..
课程的概述 课程的先修课程 课程的开课学期 课程的选修必修 课程的学分 课程的学时 课程的课程编号 课程的英文名称 课程的授课老师姓名