現在有十萬個單詞,請你找出重複次數最多的十個。

2021-10-19 02:42:19 字數 692 閱讀 8673

字串,最大長度4個g,乘以10萬個…

思路一我們不能直接在記憶體裡操作

可以拆分成n多個檔案

以長度區分,不同長度放在不同的資料夾

以首字母區分,不同首字母放在不同資料夾

以為字母區分,不同尾字母放在不同檔案

這樣一來,每個檔案的每個資料長度相同且首字母尾字母也相同

接著從元素個數最多的檔案開始,若找到的最多重複元素比剩下的檔案元素長度(元素長度可藏在檔名中)則直接返回該字串(最長之一)

若沒有,則將每個檔案的最多重複字串,記錄在另乙個檔案

最後對該檔案進行查詢找到最多重複字串

首先採用從左往右單位排序的演算法

每次篩出出現次數最大的字母,丟棄其他字母單詞

如此迴圈直至遇到末尾字元,此時記錄以鍵值對形式儲存該字串及其出現次數到另乙個檔案中

最終,找到出現次數最多的前10個字串

思路二採用桶的思想,不過10萬個字串,最壞情況可能需要10萬個桶,因此,我們需要將他們放在不同目錄下,避免單目錄下10萬個桶電腦卡死,比如我們每層目錄26個子目錄a-z,按字串從左往右建立目錄,小於10萬個資料夾,乙個3個位元組,如此資料量就變成小於30萬個位元組,最終以單詞字串|次數命名檔案,每次遍歷到該字串,次數+1,最終產生10個節點,儲存最長10個字串及其出現次數

採用有序單鏈表過濾(此處參考我上次的100個結點過濾1e個數字篩出最長10個字串

十萬個為什麼

目錄 import sys import some module noqa答案 將 noqa新增到一行表示linter 乙個自動檢查 質量的程式 不應該檢查此行.可能生成的任何警告都將被忽略。那條線可能有一些 看起來很糟糕 的東西,但開發商理解並打算出於某種原因它在那裡 有關更多資訊,請參閱flak...

十萬個什麼時候

十萬個什麼時候 什麼時候開始供暖?什麼時候是危險期?什麼時候白帶多?什麼時候光棍節?什麼時候驗車?什麼時候徵兵?什麼時候做 最好?什麼時候立冬?什麼時候量血壓?什麼時候補葉酸?什麼時候讀輕聲?什麼時候洗頭?什麼時候做唐氏篩查?什麼時候入團?什麼時候父親節?什麼時候是萬聖節?什麼時候可以驗孕?什麼時候...

十萬個為什麼 SVG

這兩天學習了下 svg 在專案中的使用,學到了以前很多不知道東西,在這裡打算以問答的形式作個總結。專案中使用 svg 的好處?svg總結起來用兩個優點,首先最主要的放大不會失真,其次相對同樣的圖示.png,圖示.svg 位元組更小。所以應用到專案中意義就非常明顯,放大不會失真,那麼針對 androi...