<返回更多

机器学习-人工智能-用户分群--聚类分析

2020-04-28    
加入收藏

自学B站课程笔记总结:

在风投领域,如何为客群分群呢?有些时候是有标签的。如:客户是否有过欺诈、非欺诈的行为。

另外一种情况,则需要通过其他类型的特征进行判断了,如消费记录、还款记录、提现记录等。

例如,我们可以人为定义高风险客户,低风险客户、高消费客户、低消费客户。

说到聚类,就要提簇的概念,不重叠,也不覆盖的。通过定义距离,来度量相似的程度,米尼科夫斯基距离。适合数值型的变量。

 

机器学习-人工智能-用户分群--聚类分析

距离公式

 

机器学习-人工智能-用户分群--聚类分析

类别性变量

 

机器学习-人工智能-用户分群--聚类分析

类别性变量转化为数值型变量

 

机器学习-人工智能-用户分群--聚类分析

簇间距

 

机器学习-人工智能-用户分群--聚类分析

数据预处理方法

如果有一些人的收入在100万,相对比较少的时候,用归一化的处理效果并不好,分母还是特别高。除此之外,新的样本还会出现比0小,或者比1大的结果。

 

机器学习-人工智能-用户分群--聚类分析

衡量聚类效果好坏

 

机器学习-人工智能-用户分群--聚类分析

计算误差或距离的方法

如果聚类模型做的好,则样本距离簇的整体最好。贪心策略指每一步都朝着更好的方向。

 

机器学习-人工智能-用户分群--聚类分析

 

 

机器学习-人工智能-用户分群--聚类分析

 

先用层次聚类,选出的精度比较好。

 

机器学习-人工智能-用户分群--聚类分析

 

 

机器学习-人工智能-用户分群--聚类分析

 

 

机器学习-人工智能-用户分群--聚类分析

 

假设少量样本覆盖了各种情况。

 

机器学习-人工智能-用户分群--聚类分析

 

 

机器学习-人工智能-用户分群--聚类分析

 

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>