首先想到的是乙個最直接的方法,我們可以對所有id進行排序。然後再掃瞄一遍排好序的id列表,統計各個id出現的次數。如果某個id出現的次數超過總數的一半,那麼就輸出這個id。這個演算法的時間複雜度為o(n * log2
n + n)。
如果id列表已經是有序的,還需要掃瞄一遍整個列表來統計各個id出現的次數嗎?
如果乙個id出現的次數超過總數n的一半。那麼,無論水王的id是什麼,這個有序的id列表中的第n/2項(從0開始編號)一定會是這個id(讀者可以試著證明一下)。省去重新掃瞄一遍列表,可以節省一點演算法耗費的時間。如果能夠迅速定位到列表的某一項(比如使用陣列來儲存列表),除去排序的時間複雜度,後處理需要的時間為o(1)。
但上面兩種方法都需要先對id列表進行排序,時間複雜度方面沒有本質的改進。能否避免排序呢?
如果每次刪除兩個不同的id(不管是否包含「水王」的id),那麼,在剩下的id列表中,「水王」id出現的次數仍然超過總數的一半。看到這一點之後,就可以通過不斷重複這個過程,把id列表中的id總數降低**化為更小的問題),從而得到問題的答案。新的思路,避免了排序這個耗時的步驟,總的時間複雜度只有o(n),且只需要常數的額外記憶體。
在這個題目中,有乙個電腦科學中很普遍的思想,就是如何把乙個問題轉化為規模較小的若干個問題。分治、遞推和貪心等都是基於這樣的思路。在轉化過程中,小的問題跟原問題本質上一致。這樣,我們可以通過同樣的方式將小問題轉化為更小的問題。因此,轉化過程是很重要的。像上面這個題目,我們保證了問題的解在小問題中仍然具有與原問題相同的性質:水王的id在id列表中的次數超過一半。轉化本身計算的效率越高,轉化之後問題規模縮小得越快,則整體演算法的時間複雜度越低。
擴充套件問題
隨著tango的發展,管理員發現,"超級水王"沒有了。統計結果表明,有3個發帖很多的id,他們的發帖數目都超過了帖子總數目n的1/4。你能從發帖id列表中快速找出他們的id嗎?
參考上面的解法,思路如下:
如果每次刪除四個不同的id(不管是否包含發帖數目超過總數1/4的id),那麼,在剩下的id列表中,原先發帖比例大於1/4的id所佔比例仍然大於1/4。可以通過不斷重複這個過程,把id列表中的id總數降低**化為更小的問題),從而得到問題的答案。
尋找發帖「水王」
分析與解法 首先想到的是乙個最直接的方法,我們可以對所有id進行排序。然後再掃瞄一遍排好序的id列表,統計各個id出現的次數。如果某個id出現的次數超過總數的一半,那麼就輸出這個id。這個演算法的時間複雜度為o n log2 n n 如果id列表已經是有序的,還需要掃瞄一遍整個列表來統計各個id出現...
尋找發帖「水王」
題目 解法1 對所有id排序,因為該id出現的次數超過總數的一半,對有序的序列,第n 2項即為所求id。解法2 每次刪除兩個不同的id,那麼剩下的id列表中,水王 的id次數仍然超過總數的一半。可以通過不斷重複這個過程,把id列表中的id總數降低,從而得到答案。總的時間複雜度只有o n 且只需要常熟...
尋找發帖水王
擴充套件 隨著tango的發展,管理員發現,超級水王 沒有了。統計結果表明,有3個發帖很多的id,他們的發帖數目都超過了帖子總數目n的1 4。你能從發帖id列表中快速找出他們的id嗎?分析 在這個題目中,有乙個電腦科學中很普遍的思想,就是如何把乙個問題轉化為規模較小的若干個問題。分治 遞推和貪心等都...