圈子推荐
查看所有吧>>
活跃用户
    AtlasDB GIS应用—聚类分析

    介绍:

    聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。

    聚类技术通常又被称为非监督分类,与监督分类不同的是,在簇中那些表示数据类别的分类或者分组信息是没有的。简单来说,监督分类的意思是,具体有哪些类别,以及这些类别有哪些特征,我们是已知的,我们要做的就是将样本按照不同的特征归为不同的类;非监督分类(聚类)的意思就是我只有一堆样本,要分成哪几类是未知的,要根据样本的内部结构特征去归类,这样得到的聚类结果是不唯一的,但都是遵循了一定的内部特征的。

      

    在商业上,聚类分析是细分市场的有效工具,被用来发现不同的客户群,并且它通过对不同的客户群的特征的刻画,被用于研究消费者行为,寻找新的潜在市场在生物上,聚类分析被用来对动植物和基因进行分类,以获取对种群固有结构的认识在保险行业上,聚类分析可以通过平均消费来鉴定汽车保险单持有者的分组,同时可以根据住宅类型、价值、地理位置来鉴定城市的房产分组在互联网应用上,聚类分析可以被用来在网上进行文档归类,等等,在大数据和人工智能上应用也十分广泛。

    GIS中,聚类分析,主要是分析要素的空间位置特征,对要素进行聚类,比如,有很多房间在地图上是挨着的(也有不挨着的),并且这些房间都是面装要素,现在要对挨着的房间进行分组并安排专人管理,可以通过聚类分析,找出所有挨着的房间。 

      

    再比如,疫情期间,街道要将距离在5m以内的房子进行分组,安排专人负责每天负责出去买菜来供应住户,也可以通过聚类来实现:

      

    应用举例:

    图形之间的距离如果小于规定的距离,他们就被化为同一类:

    integer ST_ClusterDBSCAN(geometry winset geom, float8 eps, integer minpoints);

    我们假设有一个点集,这些点集的空间分布在空间上可能有一定的规律,我们可以通过这种聚类的方法来测试这种规律,假设我们将距离为2米以内的点归为一类,可以看到测试效果:

     

    可以看到,7个点被分成了3类,每一类的特点就是点之间的距离小于2米,我们通过这个结果可以发现大部分的点距离在2米之内,有两个点不在,且这两个点之间的距离也大于2米。


    • 分享到:
    排序方式:回复时间 共有3条评论

    于贵阳 发表于 2020-04-19 15:10 1 楼

    太抽象了,有没有例子呀

    | 回复

    于贵阳 发表于 2020-04-19 15:48 2 楼

    和人工智能里面的分类聚类有差别吗

    | 回复

    呼哈哈呼 发表于 2020-04-20 15:31 3 楼

    很多问题都可以利用向量思想抽象变成空间问题,利用聚类算法来分类

    | 回复