#ifndef _celltimestamp_hpp_
#define _celltimestamp_hpp_
//為了避免同乙個標頭檔案被包含(include)多次,c/c++中有兩種巨集實現方式:
//一種是#ifndef方式;另一種是#pragma once方式。
#pragma once
// 達到微秒的計時器
#include
using namespace std::chrono;
class celltimestamp
~celltimestamp()
//獲取當前秒
double getelapsedsecond()
//獲取毫秒
long long getelapsedtimeinmillisec(){
return this->getelapsedtimeinmicrosec()*0.001;
//獲取微秒
long long getelapsedtimeinmicrosec(){
return duration_cast(high_resolution_clock::now() - _begin).count();
protected:
// 高精度計時器
time_point_begin;
#endif
Hive hive一種通用的上億級別的去重方法
前些陣子在公司做專案遇到了乙個問題,就是需要都行業中的所有品牌的uid進行去重的然後計數的操作。資料量去完重複大概2個億,去之前大概將近三個億。做法一 最原始的做法使用的是count distingct uid 這個需要大概跑3個小時的任務。做法二 使用group by去重,效果依然不好。做法三 使...
一種千萬級別檔案查詢思路
將千萬級別的檔案按照名稱排序,每5000條記錄提取乙個關鍵id。按照關鍵id新建資料夾 將前5000個檔案放入第乙個關鍵資料夾中,5001 10000放入第二個資料夾中。生成乙個python字典,鍵為所有關鍵點,值為關鍵點對應的檔案。將python字典轉換為json檔案。提取時的步驟 1 將json...
一種特別的樹形結構 並查集
並查集主要解決連線問題 並查集操作 find i 查詢父親結點 isconnected p,q 查詢是否相連,返回bool unionelements p,q 合併兩個結點 普通版本 無路徑壓縮,無優化 class unionfind 析構函式 unionfind 查詢過程,查詢元素p所對應的集合編...