2017中國國際大資料產業博覽會貴安國際數字經濟論壇——「雲鏈」服務論壇在貴安新區北斗灣開元酒店貴安廳開幕。 章魚大資料ceo 秦松疆 ,以大資料人才培養為主題進行了演講。以下內容根據 演講速記整理(有刪減):
大資料1、 產業規模
目前是乙個dt時代,分階段來看,第乙個階段是網際網路時代,是把整個產業扁平化的時代。第二個階段是移動網際網路時代,。第三個階段是雲計算階段,讓我們傳統企業很容易、很輕鬆的搭建資訊化平台。第四個階段是物聯網和人工智慧時代,這個時代萬物相連,萬物皆有智慧型,這個時代會產生非常巨大的資料,我們只有用大資料方法、儲存技術、運算技術來處理這麼大的資料。
有人講2023年我們會達到1萬億的規模,在這之前我們回顧一下這個領域。
2、人才培養
今天我們所有的國民經濟都是無所不在的業務資料驅動,這是我們今天面臨的現實。在這種背景下,國家從15年到現在出台了一系列的政策,除了像發展綱要,國家從頂層到地方部委都有出台相關的檔案,包括我們知道的,教育部從去年就開始增加了本科的大資料和技術運用這個專業,去年有38家申請這個專業,32家通過,從學科價值上已經開始按大資料方向來建設了。
在這個背景下,我和中關村大資料產業聯盟的領導,走訪了中關村的一些企業。我們得到乙個反饋。作為企業人要運用大資料會碰到什麼困難?首當其衝就是人才的問題。
有乙個說法就是咱們國家去年的大資料人才缺口是100萬,2023年中國大資料人才缺口達到200萬,這給高校和人力資源企業的乙個很大的優惠。同樣美國市場也是大資料人才的不足,企業科學家不是我們理解的真正的科學家,而是在資料領域的乙個說法,是資料科學家或者資料分析師。
我們再看一下dt時代人才的情況,它是乙個交叉的綜合的乙個三棲動物。
資料時代是通過資料得到方法,這個叫做資料範示,資料要求人才掌握的知識層面非常的多。
dt人才指的是什麼?資料科學家不是院士類的科學家,是一種稱呼,還有資料分析師、資料工程師、資料架構師、資料產品經理。比如說資料工程師是管理資料的,資料科學家是用資料驅管理人,方向不一樣,乙個是被動乙個是主動。在資料科學領域裡面說得比較多,在大資料時代是用資料驅物,所個說差別還是明顯的。
我們看乙個高薪企業,判斷他有多少it人才,是要看他有多少資料科學家和資料工作者,因為現在所有企業都不能避免遇到大資料的問題。
剛才講的是一種背景,在這種背景下人才的缺乏是100萬或者是200萬, 我們有這麼多傳統企業,為什麼培養不出人才?
3、誰來培養,社會還是學校?
首先,傳統培訓的方式不太適合培養資料科學家、資料分析師等交叉的複合型人才。我們跟清華大學合作是用另外一種模式,我們成立了乙個交叉書院,培養大資料人才的時候用的是不同專業、不同學院的學生組成乙個團隊來培訓。在復旦大學也是同樣的模式,在大資料科學上的培養人方式用基礎學科加上行業專業,作為專業的方向。
但是,這種模式在傳統培育機構比較適合,社會的培養機構是很難培養出來人才的。我認為大資料人才的培養一定是以高校為主要責任。為什麼現在的大學培養不出來社會上需要的大資料人才?
社會招聘的人和大資料的設計有什麼關係?首先我們看某招聘**大資料招聘行為,其中工程師和挖掘師要求是比較多的。對工作經驗要求來看,大多數是3到5年,大資料對企業和崗位的要求、對學歷的要求不是特別重要,反而是工作經驗,你的工程、你的實踐經驗是要求比較高的,主要是要求三到五年,這是我們統計資料得到的結果。
我們再看一下一些網際網路公司對大資料崗位的要求,他們對資料操作方面要求是比較多的。去年有38家高校申請大資料專業,大多數是以課程設計為主,但是他們培養人的體系跟市場是不一致的,這讓我很有深思。問題在**?
首先第乙個問題是在計算機領域、大資料領域裡面,老師的團隊是跟不上最新技術的發展的。
另外乙個高校本科類大資料人才培養的目標和企業培養目標不一致,高校是培養長期有工程能力、獨當一面的的,而企業是需要馬上就上手的。高校裡面的學習、開發、資料環境是無法滿足真正的社會需求。
大資料行業人才缺口究竟有多大?
如今我們聽到越來越多關於大資料相關的資訊,無論是大資料行業的工資薪酬還是大資料的人才缺口數量,它已然成為了是繼雲計算 物聯網後的又一全球熱點問題它不斷的受到了社會各界的關注。大資料已經成為一種戰略資源,具有廣闊的應用前景。為了解決網際網路應用對大規模計算能力 資料儲存能力的迫切需求,因此,雲計算的概...
學習大資料月薪過萬的秘密
什麼是大資料?大家對大資料的定義不盡相同,但作為學習者和使用者來說,如何使用大資料工具和技術從大資料中提取 分析出有價值的資訊和資料,指導各個行業使用者做出準確決策才是更值得關心的。大資料好就業嗎?根據全球最頂尖管理諮詢公司麥肯錫 mckinsey 出具的乙份詳細分析報告顯示,預計到2018年,大資...
堆排序思想 找出100萬個資料中的前100大資料
首先在c 的檔案下新建乙個txt檔案,命名為test.txt,然後在generate random.cpp中寫如下 先讀取txt檔案中生成的100萬個隨機數,這個量是很大的 其實可以生成更多,這裡用100w為例 如果完整排序後輸出前100大,這樣非常耗時!所以選擇如下演算法 構造乙個容量為100的小...