按順序匹配的,**如下:
/*** 判斷兩個字串相似度,可設定level
*@param
strsource
原字串
*@param
strcompared
比較字串
*@param
level
評分閥值
*@param
morecount
比較字串比原字串多多少個限制
*@return
*/public staticboolean issimilar(string strsource,string strcompared,intlevel,intmorecount)
intcount=strsource.length();
intmaxsamecount=0;
//遍歷count次
for(inti=0;iintnowsamecount=0;
intc=0;
intlastindex=0;//記錄上一次匹配的目標索引
//遍歷每一次的原字串所有字段
for(intj=i;jcharcharsource=strsource.charat(j);
for(;ccharcharcompare=strcompared.charat(c);
if(charsource==charcompare)
}c=lastindex;//遍歷完目標字串,記錄當前匹配索引
}if(nowsamecount>maxsamecount)
}//大於原字串數量的情況
if(maxsamecount>count)
doubledlv= (double)100*maxsamecount/count;
intilv=10*maxsamecount/count*10;
intcha=(int)dlv-ilv;
intyu=cha>5?1:0;
ilv+=yu*10;
if(ilv/10>=level)else
}
Java字串相似度匹配
原文 package com.xfl.boot.common.utils created by xfl time on 2018 11 16 0 10 description public class similarityutils param str1 param str2 public stat...
字串相似度
這個演算法 於網上,但忘記了出處,對其使使用了 issame封裝,然後用在了自己的網頁資料抓取 中。求解兩個字串的相似度int calculatestringdistance const string stra,const string strb intret c lena 1 lenb 1 for...
字串相似度
最近要對字串進行聚類,這些字串都是 的輸出,嘗試了幾種字串相似度度量的方法 levenshtein距離 字串核函式 lcs max len str1,str2 其中相似度用公式distance 1.0 similarity 1轉換為距離.使用層次聚類方法.下面是要聚類的字串 points aabbc...