很多問題不記得了 依稀的記憶如下
1、介紹一下梯度下降、梯度消失->怎麼解決->(resnet、lstm)
2、怎麼防止過擬合->正則化->介紹l1(稀疏)、l2(平滑)
3、樣本不平衡怎麼處理
4、介紹一下xgboost、gbdt
5、場景題:給定8億的wifi資料(特徵:接入時間、mac位址、型別(公共、家庭)、型號、名稱......)和6千萬的實體(特徵:屬性(酒店、商場、學校......)、userid......),怎麼把他們關聯起來?
思路:1)首先應該注意到兩個資訊的量級差的很大,故第一步應該縮小範圍,主要根據wifi型別&實體接入的userid,劃分公共wifi&私人wifi;
2)關聯時間可以細化;eg:如現在已經判定是學校的wifi,那麼怎麼關聯到是教學樓的wifi還是食堂的wifi還是寢室,可以根據時間流的接入峰值來判斷,食堂wifi的接入時間多在飯點時刻;
3)wifi名字的統一;如sysu、中山大學、zhongshandaxue,都表示同一實體,可以用word2vec統一
面試官看我的簡歷看了1min,也沒讓自我介紹,然後說現在學生做的東西都很像啊,什麼5層cnn,設定濾波器,用caffe或者tensorflow啊,然後專案的東西一點沒問,機器學習演算法也沒問,也不手撕**,介紹場景題就介紹了10min~
場景題:
應用:反作弊;黑廠會利用機器同時操控n臺手機,完成註冊,可能會刷單或者**訊息......
需要解決的問題:step1.如何區分黑廠和正常使用者;step2.如何區分邊界值,及實際場景中很多黑廠的感測器資料和正常使用者差不多,分布情況極為相似,怎麼準確區分這部分資料?
hint:1、無監督問題;2、解決思路:如何區分資料;評價指標
告知技術已經招滿了,面試官覺得我技術基礎紮實,溝通能力較好,推薦到了大資料產品經理。全程聊技術,不過更側重問如何想到解決思路,基於業務怎麼獲取特徵.......
其實是比較輕鬆地聊天,但臨時提前面試,加之痛經,面到中途還去廁所吐了,和男面試官只能說是暈車,好尷尬......
主要聊科研專案,一面面試官是2012實驗室的,針對專案還是問了一下key point;二面面試官是海思的,搞晶元的吧,沒問太多
問了機器學習演算法(反正都是常規的問題):
1、rf、xgboost
2、l1、l2
斷篇了。。。
1、專案介紹,主要說了gan
2、l1正則是不是總是稀疏的
3、怎麼求矩形影象內的畫素和(積分圖法)
問的特別細緻
1、pooling的作用
2、介紹一下lr
3、cnn有哪些功能層->bn的作用
4、怎麼優化函式
介紹專案
手撕**:
1、樹的層次遍歷;
2、帶權重的樹,從根節點到葉子節點,求最小路徑和;
3、兩有序鍊錶的合併;
把話語權都丟給了你,先介紹自己,大概剛睡醒也沒怎麼複習,以為會被問很多,結果一上來什麼都不問,有些懵逼,自我介紹->專案介紹->比賽介紹;
1、會不會分布式的資料處理?(知道spark、hadoop這些工具,沒有用過,感覺和面試官的部門不match)
2、介紹一下rf
3、介紹一下傳統機器學習中的分類、聚類方法;
手撕**:
1、寫乙個排序演算法
2、單鏈表的列印
3、單鏈表的反轉
機器學習演算法:
1、線性回歸;
2、場景題,怎麼用線性回歸解決
專案介紹
1、xgboost怎麼**結點(自定義的增益);
2、xgboost可不可以實現分布式->怎麼實現;
3、xgboost特徵篩選時的輸入輸出;
4、mle、map的區別於聯絡
手撕**:
5層cnn,在bp時倒數第一層和倒數第二層的引數更新
前端cvte面經
一面 自我介紹 react和vue的區別 react為什麼是mvc 瀏覽器快取 這裡提到了http快取 cookie主要用來做什麼 http快取 盒子模型 用什麼屬性實現 box sizing 如果給元素加上padding呢 margin重疊 怎麼解決margin重疊 bfc margin的值是 的...
2021秋招CVTE面經
c 11的特性知道哪些?說一下 c 中的記憶體布局?靜態變數的作用,為什麼要有靜態變數?當時答的時候靜態變數這塊沒有回答好,bss段和資料段有些混淆 c 中的struct和class之間的區別有啥?知道哪些智慧型指標?簡單說下原理和應用場景,盡量能夠多說些 c 中多型是怎麼實現的?以及實現的原理 虛...
騰訊面經2020 11 24
一面wxg 自我介紹 對自己專案介紹,技術棧等等,優化設計是關注重點。然後手撕 2題。接下來常規詢問環節,大概涉及的知識點如下 await async 網路常見安全攻擊,解決方法 我提到了csp與token校驗,馬上加問csp和token校驗怎麼實現的 防抖節流 出現場景,應用情況,解決方法,手寫 ...