今天是端午節,媽媽讓我不要老是待在實驗室,多出去轉轉。
3月自從這個學期開學(3.6),我就開始關注找實習的事情,一方面知道暑假是實習的好時間,但是另一方面也知道自己導師不會讓自己那麼早去,要給他幹活。但是還是存有殘念,想怎樣才能放我去實習,但是忽略了最重要的一點就是自己到底有沒有實力去實習。所以我參加了各大公司的春早筆試,結果下來不算太好。我也由此認識到了自己的不足。一方面自己的技術水平達不到,另一方面對於自己的定位不清晰。之前想幹機器學習,可是自己的數學功底有沒有很好,想幹資料分析,sql那時候又是剛剛起步。又想幹運營和產品,但是自己的相關業務知識也沒有,那時候不知道運營的幾個階段。
我只知道學姐們在京東網易等公司實習,但是並不清楚具體幹的什麼工作。因為學姐比較忙,也沒有更多的交流。後來學姐們回到實驗室改**,通過和學姐們的交流,逐漸明確了自己的定位和方向。
所以我這幾個月做的就是提高自己的sql,excel和tableau的水平。
4月先是通過幾本書補足基礎sql,我聽學姐的建議做了牛客網上的sql程式設計題,發現綜合類的sql還是有一定的難度。只是看書不實踐不行。也聽另乙個學姐建議我最晚6月份的時候開始找實習。
這個時候老師剛好接到了乙個電視台的專案,對,就是這麼巧,老師想讓我用python做,但是我覺得這個資料前期不用機器學習的部分還是用sql,以便提高sql水平。電視台的資料說實話我很喜歡,因為時效性很強,且資料相對完整,資料量大,清洗起來方便。而且是直接和公司對接,在專案過程中要去電視台和廣告部溝通他們的需求,確定需求之後想辦法實現,並視覺化,但是在做的過程中遇到的最大的兩個問題就是 資料的理解和與電視台方面的需求溝通。對方不停的改需求。
5月一方面這份資料的字段並沒有給出明確的定義,記錄方式較為奇怪,在我之前的部落格也有提到過。另一方面就是傳媒領域並不了解,在溝通需求的時候存在一些問題,電視台方面有資料,而且想讓這些資料作用在廣告上面,所以通過電視台的廣告部和我們聯絡,但是他們也不清楚資料能做什麼,他們想要什麼。所以同幾次溝通之後才逐漸明確了需求。
在做專案的過程中我的sql水平有了一定的提公升,而且通過看書學到的sql技巧實踐在專案上的時候,很有成就感。
6月這個月開始了解資料分析師的實習,也在豐富自己的簡歷。
聽了dt財經的資料視覺化講座,其中提到視覺化的額本質是重新設計資料,找到最合適的圖形去表達,而不是單純的炫技。要注重資料模型的打磨,將資料視覺化視為資訊傳達而非技術問題。重點要放在如何理解資料。說實話這個我是吃過虧的,因為先前對於電視台資料的理解不夠,走了很多的彎路。
我為什麼想找實習,一方面我在自己做專案的時候,什麼都是我乙個人大包大攬,有時候做錯了都不知道,閉門造車。我想體驗下大公司團隊分工明確的工作氛圍。另一方面,我認可這個公司的品牌和價值觀,並且想在實習的時候學到東西,甚至能夠爭取到留下來的機會。
實習 資料分析崗 試題整理
1 增加資料 2 正則項 3 early stopping 4 控制模型複雜度 a.dropout 我覺得類似於subfeature b.剪枝 控制樹深 c.增大分割平面間隔 5 bagging 6 subsampe subfeature 7 特徵選擇 特徵降維 8 資料增強 加包含雜訊的資料 9 ...
筆試 京東資料分析暑期實習
京東暑期實習是我參加的最後乙個公司的筆試,也是唯一過了的筆試。因為一直忙的沒時間準備,就直接拿筆試當學習機會。京東資料分析的筆試是20道選擇 2道程式設計題。都不是很難 以上程式設計感覺還是用c c 順手,被迫無奈我又去翻了翻已經忘了的知識。1 選擇題主要是概率論和機器學習之類的,記不太清了。2 程...
分析資料分析崗位實習資訊(3 補充)
df.loc 公司規模 我們把公司規模按照人數分為3類 2000人的為大型公司,15人的為小型公司,其他為中型公司。則有,大型企業 156 中型企業 244 小型企業 10。plt.figure figsize 6 9 定義餅狀圖的標籤,標籤是列表 labels u 大型企業 u 中型企業 u 小型...