sparse similarity:給定一些整數集合,計算集合之間的稀疏相似度。稀疏相似度定義為交集大小和並集大小的比值。
假設有s
個集合,每個集合中有n
個整數。最簡單的方式就是對於每一對集合,查詢第乙個集合中有多少元素在第二個集合中,這樣就算出了交集的大小,最後根據容斥原理計算並集的大小即可。這種方法的時間複雜度為o(s ^ 2 * n ^ 2)
;如果查詢過程用set
,那麼複雜度降為o(s ^ 2 * nlogn)
;如果查詢過程用unordered_set
,那麼複雜度降為o(s ^ 2 * n)
。根據題幹s
和n
的輸入規模都會達到500
,3
次方的演算法應該是會超時的。
再來降低一下複雜度,也就是優化一下o(s ^ 2)
的部分。如果不想兩兩全部比較,那就爭取只處理相似度不為0
的集合對,假設有p
個,最壞情況下每一對都有n
個整數,則這一部分的時間複雜度為o(pn)
。如果要使用這種方法,就要求我們提前能夠用某種資料結構表示出相似的部分,亦即對於乙個給定的整數x
,有哪些集合包含x
,這也就是倒排索引,整體的時間複雜度為o(sn + pn)
。
這道題很難和正確結果進行比較,也不知道預期輸出是怎麼個演算法得來的,最好是找個工具排個序最後再文字比較下。
class
solution}}
map,int
> pair2intersize;
void
computeintersectionsize()
}}} vector ans;
void
adjusttosimilarities
(const vectorint>>
&docs)
}public
: vector
computesimilarities
(vectorint>>
& docs)
};
書上還給出了另外一種方法,將所有的元素排序,這樣相同的元素就會聚到一起,之後的處理方法就和上面的相同了,時間複雜度為o(sn * logsn + pn)
,和上面不用unordered_map
的情況一樣,但是執行時間沒多大區別。
class
solution
bool
operator
<
(const element &rhs)};
vector sorted;
void
sortdocs
(const vectorint>>
&docs)
}sort
(sorted.
begin()
, sorted.
end())
;}map
,int
> pair2intersize;
void
computeintersectionsize()
}}vector ans;
void
adjusttosimilarities
(const vectorint>>
&docs)
}public
: vector
computesimilarities
(vectorint>>
& docs)
};
程式設計師面試金典
1.有個小孩正在上樓梯,樓梯有n階台階,小孩一次可以上1階 2階 3階。請實現乙個方法,計算小孩有多少種上樓的方式。為了防止溢位,請將結果mod 1000000007 給定乙個正整數intn,請返回乙個數,代表上樓的方式數。保證n小於等於100000。int countways int n retu...
程式設計師面試金典 2 2
return kth to last 返回單鏈表中倒數第k個元素。下面會分別使用遞迴和非遞迴的方法來解決這道題,一般來說遞迴的方法寫起來更容易,但是效率一般不是最好的,比如這道題遞迴解法的 量大約是非遞迴解法的一半,但是時間複雜度依然是o n 遞迴解法。這種方法的本質是先遍歷到鍊錶尾部,最後再返回的...
程式設計師面試金典 2 4
partition 編寫 將鍊錶中小於x的元素放在鍊錶的前半部分,大於x的元素放在鍊錶的後半部分,沒有順序要求。如果是陣列的話,根據x對陣列進行劃分的方法類似於快排。對於鍊錶會更簡單一些,可以直接將原始鍊錶拆分為兩個鍊錶,乙個中所有元素比x小,乙個中所有元素比x大,最後再進行連線。通過在鍊錶中使用b...