- 学员自由选择项目。
- 推荐学员进行组队,群策群力,共同完成同一个项目。
- 项目鼓励不同学员,不同组队之间进行讨论,分享心得。
- 项目过程由学员自主完成,禁止助教参与项目或提供除思路指导之外的其他帮助。
- 项目开放程度较大,最终按照项目评分标准进行评判。
- 项目过程中,以一星期为周期,每个周期末,学员需提交项目节点报告,并由负责带队的助教带领进行阶段总结。节点报告参考本文
- 每周末的项目总结每组仅派一名学员参加,报告文本必须提交到gitee上指定位置,未提交文档则总成绩扣一分
- 每组推荐尽量让每一位学员都参与至少一次直播讲解。
- 参加过项目的学员参与就业推荐过程,未参与项目的学员只结业,不参与就业推荐。
- 项目成绩靠前的学员优先推荐就业
-
评分采用10分制,10为最高分
-
评分中,同时参考项目的文档和代码,文档所占比重高于代码。文档要求如下:
- 对所用模型的理解,完整而充分
- 对训练过程的描述,清晰易懂
- 尽可能详细的列举出了项目中碰到的坑并且给除了解决方案,没有解决的,也需要描述尝试过的解决方式和对情况的推测
- 对项目运行的结果给予充分的解释,好在哪里,不好在哪里
- 尽可能多的尝试应用了课程中学到的知识,并对应用的结果给出了解释和评估
-
代码要求如下:
- 没有语法错误
- 没有明显逻辑错误
- 注释丰富,逻辑清晰
- 尽可能多的应用了课程中学到的知识
-
多人组队完成的项目,项目评分即为团队中每个成员的评分
-
项目结果仅占很少评分比例,也就是,项目没完成,出不了结果也可以提交,文档足够丰富,展示的内容足够详细,也可以得到不错的分数
-
项目提交过的学员,除项目没有任何实质内容的情况外,不论成绩如何,均可认为顺利结业。
-
文档请注意要求有项目总结介绍性文档和每周的阶段性文档。文档内容请尽量反应真实项目状况,遇到的 问题 ,解决方式等等。尽量不要出现罗列参考资料,但是不写自己的内容的文档。
-
打分依据为项目的文字性描述文档。直播讲解可以使用PPT,其内容可以作为主观部分加分项目,但是不作为客观部分打分依据。
-
不满足项目说明中的要求,酌情扣分。
- 评分采用10分制,初始为0,按项加分。10为最高分。
- 由讲师根据项目情况给予酌情加分,考虑如下几个方面:
- 项目难度
- 完成的程度
- 最后的结果
- 文档的质量
- 讲解人员的讲解是否精彩,重点的把握
- 参与直播讲项目的人员,每次每人+1分,直播中提问不算。
- 由于直播人数可能较多,每个人的讲解有时间限制,超过时间限制酌情扣分,扣分针对直播的个人,每超时5分钟扣1分。
- 直播过程,可提出自己的问题,与讲师讨论,讨论过程不计入讲解时间。
最终项目评分会在第四次直播的时候视情况由讲师直接为参与直播的学员点评并打分,这时未参与第四次直播的学员,可以在第四次直播之后24小时内提交项目获得打分与点评.逾期提交的项目准许结业。不予打分点评。直播过程的打分现场给出,经过整理后一周内发送给学员。
如果第四次直播,因一些意外状况,如全员都没能做完项目,可以考虑直播后一周内全员提交项目再统一打分。
所有项目,要求提交代码和文档到gitee上面,留作记录。
- 数据探索文档
- 各数据特征实际意义及与最终目标的推测
- xxx
- xxx
- 各数据特征分布情况,特征间联合分布情况
- xxx
- xxx
- 各数据特征与最终结果的分布关系
- xxx
- xxx
- 对特征工程的探索与规划的初步计划,打算重点关注哪些特征,准备对特征进行什么处理。
- xxx
- xxx
- 各数据特征实际意义及与最终目标的推测
-
特征工程
- 特征xx的处理
- xxx
- xxx
- 特征xx的处理
- xxx
- xxx
- xx
- 特征xx的处理
-
基本模型训练效果及论证
- linear
- cv结果
- r2 score
- 可视化
- 讨论
- xx
- lasso
- cv结果
- r2 score
- 可视化
- 讨论
- xx
- ridge
- cv结果
- r2 score
- 可视化
- 讨论
- xx
- xxx
- linear
-
高级方案的尝试计划
- 模型融合
- xxx
-
ctr最终结果
- 分数
- 可视化
- 模型结果解析
-
高级方案尝试及结果
- 模型融合
- xxx
- xxx
- xxx
- xxx
- xxx
- xx
- 模型融合
-
形成最终文档
- 项目各个阶段中的坑
- 心得体会
- 项目不足与改进设想
- 数据探索文档
- 数据分布与分析
- xxx
- xxx
- 编码尝试与结果评估
- onehot
- embeding
- embdeing可视化
- xxx
- 数据分布与分析
-
基本模型训练效果及论证
- kmeans
- 结果
- 可视化
- 讨论
- xx
- dbscan
- 结果
- 可视化
- 讨论
- xx
- xxx
- 结果
- 可视化
- 讨论
- xx
- kmeans
-
高级方案的尝试计划
- 模型融合
- xxx
-
分类最终结果
- 分数
- 可视化
- 模型结果解析
-
高级方案尝试及结果
- 模型融合
- xxx
- xxx
- xxx
- xxx
- xxx
- xx
- 模型融合
-
形成最终文档
- 项目各个阶段中的坑
- 心得体会
- 项目不足与改进设想
- 数据探索文档
- 数据分布与分析
- xxx
- xxx
- 编码尝试与结果评估
- onehot
- embeding
- embdeing可视化
- xxx
- 数据分布与分析
-
基本模型训练效果及论证
- kmeans
- 结果
- 可视化
- 讨论
- xx
- dbscan
- 结果
- 可视化
- 讨论
- xx
- xxx
- 结果
- 可视化
- 讨论
- xx
- kmeans
-
高级方案的尝试计划
- 模型融合
- xxx
-
分类最终结果
- 分数
- 可视化
- 模型结果解析
-
高级方案尝试及结果
- 模型融合
- xxx
- xxx
- xxx
- xxx
- xxx
- xx
- 模型融合
-
形成最终文档
- 项目各个阶段中的坑
- 心得体会
- 项目不足与改进设想
- 数据准备
- 数据下载
- 数据格式的理解
- xxx
- 资料查阅
- ssd,yolo,等的论文阅读
- inception,resnet系列论文阅读
- 项目方案规划
- 模型规划
- 使用哪种模型,方案
- 检测部分,分类部分
- 多模型并行或end2end方案
- yolo, ssd等
- xxx
- 系统规划
- 系统架构
- 输入输出
- 结果展示或分析
- 模型规划
-
训练数据处理
-
模型训练
- 训练过程出现的问题以及解决
- 训练过程可视化
- loss可视化
- xxx
-
可用系统的搭建
- 系统可以运行起来
- 能够看到输入输出
-
模型训练完成
- 结果可视化
- 效果分析
-
系统搭建完成
- 能运行并根据合理的输入给出合理的输出
- 没有明显不合理的设计
- 输入输出可操作
- 对各种异常能够处理,系统不会崩溃
- xxx
-
形成最终文档
- 项目各个阶段中的坑
- 心得体会
- 项目不足与改进设想
- 项目安装说明
- 项目使用说明
- 使用展示视频
- 数据准备
- 数据下载
- flickr8k
- coco
- 数据格式的理解
- xxx
- 数据下载
- 资料查阅
- im2txt等相关阅读
- 项目方案规划
- 模型规划
- 使用哪种模型,方案
- xxx
- 系统规划
- 系统架构
- 输入输出
- 结果展示或分析
- 模型规划
-
训练数据处理
-
模型训练
- 训练过程出现的问题以及解决
- 训练过程可视化
- loss可视化
- xxx
-
可用系统的搭建
- 系统可以运行起来
- 能够看到输入输出
-
模型训练完成
- 结果可视化
- 效果分析
-
系统搭建完成
- 能运行并根据合理的输入给出合理的输出
- 没有明显不合理的设计
- 输入输出可操作
- 对各种异常能够处理,系统不会崩溃
- xxx
-
形成最终文档
- 项目各个阶段中的坑
- 心得体会
- 项目不足与改进设想
- 项目安装说明
- 项目使用说明
- 使用展示视频