python 路徑相似度

2021-09-22 01:50:42 字數 1001 閱讀 6159

/path/1/b1

/path//b1

/path//b1/c

1.輸入乙個路徑的值

/path// 設這個字串為st1

2.輸入乙個被比較的路徑值

/path/1/b1 :st2

將第乙個字串st1 進行split("/")

將第二個字串st2 進行split("/")

【「path」,正則1,正則2】列表1

【path,1,b1】列表2

用列表1 和列表2 進行比較 方案用正則

比較結果用 boolean 值接收

【true , false , false 】

[1,0,0]

相似度 = 【列表1的第乙個】*權重 + 【列表1的第二個】*權重

import re

# 權重係數

weight =[5

,1,2

,2]# 測試正則

regex_url =

"/path/\d+/\d+"

# 測試路由

test_url =

"/path/1/jafa"

regex_list = regex_url.split(

"/")

test_list = test_url.split(

"/")

# 正則比較結果

regex_res =

for regex, test in

zip(regex_list, test_list)

: finds = re.findall(regex, test)

a =(1

if finds else0)

sum=

0for w, i in

zip(regex_res, weight)

:sum

+= w * i

print

("sum :"

,sum

)

python 余弦相似度

余弦相似度相關係數 建立樣本與分詞 s1 本週末去釣魚 s1 cut i for i in jieba.cut s1,cut all true s2 下週去花卉市場買花 s2 cut i for i in jieba.cut s2,cut all true word set set s1 cut u...

余弦相似度及基於python的余弦相似度實現

余弦相似度,又稱為余弦相似性,是通過計算兩個向量的夾角余弦值來評估他們的相似度。對於兩個向量,可以想象成空間中的兩條線段,都是從原點 0,0,出發,指向不同的方向。兩條線段之間形成乙個夾角 如果夾角為0度,則意味著方向相同 線段重合 如果夾角為90度,意味著形成直角,方向完全不相似 如果夾角為180...

相似度演算法之余弦相似度

余弦距離,也稱為余弦相似度,是用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小的度量。余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫 余弦相似性 上圖兩個向量a,b的夾角很小可以說a向量和b向量有很高的的相似性,極端情況下,a和b向量完全重合。如下圖 如上圖二 可以認...