---恢復內容開始---
一,大資料類:
問:一億條字串,固定長度,其中有重複的兩條資料,如何找到(不限制方法)
1.linux系統下一條命令
2.匯入資料庫新增非聚焦索引,一條select 命令
3.檔案流寫成1000個檔案,並計算hash值 % 100 這樣就有100個檔案,開多執行緒平行計算hashset
問:一億條int型別的整數如何找到重複的
申請長為1億的bitarray,根據比如這樣的陣列 可以用bitarray這樣表示0111011 ,第幾位存在就標示為1,不存在則記為0,直接掃瞄bitarray就可以確定需要新增的數是否存在了。
二,在你看來,資料庫優化要注意哪些內容?
基礎知識準備: sql server 的資料儲存都是b樹來存放
1.聚集索引的原則是放在那些高頻,唯一的屬性列上,當表沒有建立聚焦索引的時候,那時的表的儲存順序就是以堆的方式存在,是沒有順序可言的。
表的順序上的連續是非常的重要的
盡量在唯一性高的字段上建立索引,不要在性別這種唯一性很低的字段上建立索引;
2.非聚焦索引
3.聯合索引 注意順序
4.索引的碎片化,需要rebuild索引。
5.填充因子
6.學會看查詢計畫
t-sql的優化:
1.在where條件中盡量不要在=號左邊進行函式、運算子、或表示式計算,如where datediff(dd,starttime,getdate())=6 ;或where num/2=100;
2.在where中盡量避免出現!=或<>操作符;
3.在where中盡量避免對欄位進行null值判定;
4.使用like關鍵字進行模糊查詢時,不要使用前置百分號,如like 『%123%』;
5.資料庫欄位的長度盡量的小(保證應用的前提下);
6.不要使用selecte*,不要使用*號來查詢資料;
7.盡量避免使用游標,游標的效率是很差的,可以使用while迴圈來代替;
8.盡量避免返回大量資料(查詢資料(select)優化,分頁處理等);
9.使用exists代替in和not in
10.注意是否使用髒讀,with(nolock)
面試,都面什麼
面試,都試什麼?從理論上講,面試可以測評應試者任何素質,但由於人員甄選方法都有其長處和短處,揚長避短綜合運用,則事半功倍,否則就很可能事倍功半。因此,在人員甄選實踐中,我們並不是以面試去測評乙個人的所有素質,而是有選擇地用面試去測評它最能測評的內容。面試測評的主要內容如下 1 儀表風度 這是指應試者...
微軟面試都考些什麼 親身經歷
做乙個簡單的自我介紹 技術,工作經驗等等 1.各種排序演算法 冒泡,選擇,插入,快速,堆排序 靈活性很大.不會照搬課本.比如,返回陣列中第k大的元素 2.字串各種常用操作,要求寫函式.比如 字串逆序,判斷字串中有無出現重複字元.單詞逆序.3.實現atof,atoi,設計測試用例.有可能讓敲在電腦上測...
JAVA面試題及解答
第十六,set裡的元素是不能重複的,那麼用什麼方法來區分重複與否呢?是用 還是equals 它們有何區別?set裡的元素是不能重複的,那麼用iterator 方法來區分重複與否。equals 是判讀兩個set是否相等。equals 和 方法決定引用值是否指向同一物件equals 在類中被覆蓋,為的是...