太原科技大学学报

2014, v.35;No.143(03) 171-175

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于属性熵和加权余弦相似度的离群算法
An Outlier Mining Algorithm Based on Attribute Entropy and Weighted Cosine Similarity

刘爱琴,荀亚玲

摘要(Abstract):

离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。

关键词(KeyWords): 属性熵;余弦相似度;离群数据;天体光谱

Abstract:

Keywords:

基金项目(Foundation): 太原科技大学青年基金项目(20093015)

作者(Author): 刘爱琴,荀亚玲

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享