將資料去重後在進行排序多種方式

2021-10-01 05:26:56 字數 1141 閱讀 4614

方法一:直接用set去重,這裡set有三種:

①treeset會對插入內容自然排序;

//treeset會對插入內容排序

treesetdata1 = new treeset();

for(string s : str)

system.out.println();

system.out.print("treeset對字串陣列去重結果(會排序):");

for(string s : data1)

②hashset輸出順序不能保證;

//hashset根據元素的hashcode值來決定元素的儲存位置,當遍歷該集合時候,順序不能保證

hashsetdata2 = new hashset();

for(string s : str)

system.out.println();

system.out.print("hashset對字串陣列去重結果(順序不可保證):");

for(string s : data2)

③linkedhashset以元素的新增順序輸出。

//linkedhashset根據元素的hashcode值來決定元素的儲存位置,當遍歷該集合時候,linkedhashset將會以元素的新增順序訪問集合的元素

linkedhashsetdata3 = new linkedhashset();

for(string s : str)

system.out.println();

system.out.print("linkedhashset對字串陣列去重結果(按輸入順序):");

for(string s : data3)

方法二:用arraylist去重,比較元素在list中是否已存在,不存在則加入list

//arraylist去重

arraylistdata4 = new arraylist();

for(string s : str)

system.out.print("arraylist去重結果:");

for(string s : data4)

system.out.println();

mongodb 對資料去重後再進行統計

自身是mongo小白,對此問題,瀏覽好多部落格文件,都沒有找到太好的答案,彙總一下 distinct只是去重,並不會統計,返回的是列表,如下 db.clct.distinct a 返回 1 14 15 16 18 如果需要進行分組統計,可以用 group db.clct.aggregate 返回 說...

awk對php日誌進行去重統計排序

通過awk命令,執行split方法切分當前行的日誌 拆分後得到a nf 就是最後的介面位址 然後對其進行?之後的引數拆分,因為我們只需要介面位址,不關心引數 對其進行ascii排序 uniq c去重,並且統計數量 sort n r按照數字來進行排序,並且倒序 獲取報錯數量最多的前十個 具體介面路徑被...

bitmap實現大資料排序和去重

要點 假如有10億元素,全部資料讀進記憶體,占用 1000000000 4 1024 1024 1024 3.725 g,解決方法 bitmap演算法,每一位都能表示一位數字,10000000000 8 1024 1024 1024 0.116 g,節約了31倍的空間!define sizebit ...