Skip to content

9202014710/sklearn

Repository files navigation

=================
第一部分 无监督学习
=================
利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习。
有监督学习和无监督学习的最大区别在于数据是否有标签。
无监督学习最常应用的场景是聚类(clustering)和降维(Dimension Reduction)
--------------------------------
cityexpense_3.py, cityexpense_4.py
实现了对31省的居民消费的聚类分析,采用的是Kmeans方法
分别设置簇数为3和4进行分析

原文链接:https://blog.csdn.net/Blackoutdragon/article/details/113363372
--------------------------------
online_time.py
数据介绍:现有大学校园网的日志数据, 290条大学生的校园网使用情况数据,
数据包括用PID,学生编号,МAС地址,开始始上网时间,停止上网时间,上网时长,校园网套餐等。
利用已有数据,分析学生上网的模式。通过DBSCAN分析上网时间与上网时长的模式。

DBSCAN是基于密度的聚类算法,将数据点分为三种点
核心点:在半径Eps内含有超过MinPts数目的点
边界点:在半径Eps内点的数量小于MinPts,但落在核心点的领域内
噪音点:既不是核心点也不是边界点的点
算法流程:将所有点标记为三类点,将噪声点删除,为距离在Eps内的所有核心点之间赋一条边,
每组连通的核心点形成一个簇,将每个边界点指派到一个与之关联的核心点的簇中(哪一个核心点的半径范围内)
                     
原文链接:https://blog.csdn.net/qq_44033208/article/details/125207478
--------------------------------
iris.py
目标:已知鸢尾花数据是4维的,共三类样本。
使用主成分分析(PCA)实现对鸢尾花数据进行降维,实现在二维平面上的可视化。
--------------------------------
降维之NMF,人脸图像
--------------------------------
picdvsn.py
目标:利用K-means聚类算法对图像像素点颜色进行聚类实现简单的图像分割
输出:同一聚类中的点使用相同颜色标记,不同聚类颜色不同
技术路线:sklearn.cluster.KMeans
--------------------------------
=================
第二部分 有监督学习
=================
=================
第三部分 强化学习
=================

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages