談一下我今天參加完後的感受吧,首先神經網路很重要,他們也很關注這個方面的應用。還有就是很深厚的數學背景,對矩陣,線代,和概率論等知識考察的比較多。
一、簡答題
1、目前深度神經網路有哪些成功的應用,簡述其適用原因。
2、不同程序之間進行通訊的方式有哪些?(至少列出三種)
3、有n個樣本,每個樣本都是d維的,使用knn分類演算法,採用歐式距離,(1)其時間複雜度為多少?(2)當n很大時,可以使用什麼方法進行優化?(3)k的值對**的方差和偏差的影響是什麼?
現在看來n應該是訓練集的樣本數,時間複雜度是指的分類乙個樣本需要的時間。
(1)knn分類的的思想是,計算待分類樣本與訓練集中所有樣本的距離,找出距離最小的k個,計算那個標籤出現的次數最多,將出現最多的標籤作為樣本的標籤。計算距離的複雜度是o(m*d),排序最快得是o(m*log(m)),找出現最多的標籤的複雜度是k。因此總的時間複雜度是o(n*d+n*log(n)+k))。
(2)knn比較費時的步驟在於要計算與訓練集中每乙個樣本的距離,為了減少計算量,可以每次從訓練集中隨機地選取一部分樣本進行,作為分類的依據。假設每次取t個點,則時間複雜度變為o((t*d+t*log(t)+k))。當n很大時,選取的t可以遠遠小於n。
(3)記樣本的真實標籤為y,分類結果記為x,x是隨機變數,可以取訓練集中所有出現的類標籤。
如果k=n,則任意y,x|y=訓練集中包含樣本數最多的類的標籤。
如果k=1,則分類結果是離待分類樣本最近的訓練集中的樣本的類的標籤。
現在,仍然沒有梳理出這裡的方差和偏差指的是什麼?
二、演算法與程式設計題
1、給定陣列a=(n可變),請輸出所有的組合。
思路是,首先將從小到大排序,記包含k個元素組合的集合為g(k)。
如果知道g(k-1),則採用以下方式生成g(k): u。
2、陣列a中相鄰兩個數的差的絕對值為1,如,給定某乙個數字t,求其在陣列中的位置。
思路是,用一指標p遍歷陣列,首先計算當前位置與t的絕對值s,然後移動到p+s處,比較p+s指的元素與t是否相等,若相等,輸出當前下標,若不相等,重複計算絕對值、移動,比較步驟。
3、布豐投針問題。平面上有一組距離為d的平行線,向其上任意地投一根長為l(l答案為2*l/(pi*d).
三、系統設計題
1、神經網路模型,要求計算1、2、3層的兩個偏導數。
2、k-means聚類演算法,
(1)請寫出目標優化函式。
sum_ sum_ dist(x,c_i)
其中c_i表示屬於第i簇的點的集合,c_i表示c_i的質心。
(2)常用的終止條件有哪些?
質心不再發生變化,或者只有1%的點屬於的簇發生了變化。(3)結合k-means,描述em演算法的基本原理和步驟。
(4)使用mpi 或mapreduce,如何進行並行。
百度2016研發工程師筆試題(六)
2016 研發工程師筆試題 六 的會話有四個過程,請選出不是的乙個 a.建立連線 b.發出響應資訊 c.發出請求資訊 d.傳輸資料 2.osi 參考模型中,網路層的主要功能是 a.路由選擇,擁塞控制與網路互連 b.提供可靠的端一端服務,透明地傳送報文 c.資料格式變換,資料加密與解密,資料壓縮與恢復...
百度2013研發工程師A筆試
1 動態鏈結庫和靜態鏈結庫的優缺點 動態鏈結的優點 1 不占用源程式 段,節省空間。2 使程式更容易更新。3 減少物理頁面的切入。4 增加程式的可擴充套件性 動態鏈結的缺點 1 效能損失 2 相容性問題 靜態鏈結的優點 1 裝載速度快。2 不存在版本相容的問題 靜態鏈結的缺點 1 體積問題 2 可擴...
百度的筆試題(開發測試工程師)
1.改程式目的是從乙個字串中求出字母a z分別出現的次數。include stdafx.h include stdio.h include string.h void foo char a 100 int cnt 256 for char c a c z c 找出程式中的錯誤,並且修改!修改為 in...