聚类分析方法应用到串并案件中,采用何种距离计算形式是需要解决的基本问题。通过理论分析选择Jaccard系数和余弦相似度两种距离计算形式,使用参考模型与聚类结果比较的性能度量方法,对两种距离计算形式进行对比研究,发现基于该两种距离计算形式的聚类结果与参考模型一致,得出应用聚类分析方法串并案件可以使用Jaccard系数和余弦相似度两种距离计算形式的结论。
Abstract
Distance computing is a basic problem when cluster analysis has been applied into joint investigation. Usually, Jaccard coefficient and cosine similarity are the two ways for distance computing. In this paper, the reference model was compared with the result of cluster analysis based on the handling of Jaccard coefficient and/or cosine similarity, showing that the result of cluster analysis is the same as that of reference model. Therefore, both Jaccard coefficient and cosine similarity can be used into cluster analysis for joint investigation.
关键词
串并案 /
聚类分析 /
距离计算 /
Jaccard系数 /
余弦相似度
{{custom_keyword}} /
Key words
joint investigation /
cluster analysis /
distance computing /
Jaccard coefficient /
cosine similarity
{{custom_keyword}} /
{{custom_sec.title}}
{{custom_sec.title}}
{{custom_sec.content}}
参考文献
[1] 周志华. 机器学习[M].北京:清华大学出版社,2016:197-198.
[2] 骆建新,张智勇.案件串并工作浅析[J].河南公安高等专科学校学报,2010,19(6):123.
[3] 程琳. SOM网络模型在刑事案件并案侦查中的应用[J].计算机与数字工程,2009,37(11):95-98.
[4] 夏颖,王哲,程琳. 聚类分析在犯罪数据分析中的应用[J].合肥工业大学学报:自然科学版,2009,32(12):1924-1927.
[5] 韩宁,陈巍. 基于聚类分析的串并案研究[J].中国人民公安大学学报:自然科学版,2012(1):53-58.
[6] 张建根,沈建良,于奎栋. 浅析科学串并案件的条件与方法[J].警察技术,2006(3):53-54.
[7] 康永为. 大数据环境下高维数据处理若干问题[D].桂林:广西师范大学,2013:14.
{{custom_fnGroup.title_cn}}
脚注
{{custom_fn.content}}