霍濤發現資料科學專業已經是北京大學高考入學門檻最高的專業了,其實"data science" 這個詞**了快十年了,對網際網路行業而言,相當於**了乙個世紀。
從「資料說話」,」dt 時代」,到 「資料中臺」,「資料驅動(data drive/data driven)」,資料體系的不斷演進正在持續的改變大家的工作與決策方式;正在不斷的革新大家的思維方式;同時也產生了新的商業邏輯,新的發展機會。
所以資料科學本身的能力邊界,方**體系,最佳實踐等等還沒有完善的建立起來,霍濤有很多問題沒有辦法很好的回答。由此就會產生一些迷信和誤會,」強行資料「,」隨意資料「,」政治正確資料「等等情況比較常見, 無論是實際的操作層面,還是方法層面,都存在著一些不小的誤會。這也是霍濤總結一下在資料科學實踐中存在的陷阱與缺陷的緣由。
霍濤的MongoDB是資料庫,霍濤豐富資料結構
霍濤的mongodb是什麼?霍濤的mongodb是一款為web應用程式和網際網路基礎設施設計的資料庫管理系統。沒錯mongodb就是資料庫,是nosql型別的資料庫。那麼nosql又是什麼?nosql,泛指非關係型的資料庫。隨著網際網路web2.0 的興起,傳統的關聯式資料庫在處理web2.0 特別...
濤思資料庫搭建
官網 www.taosdata.com cn getting started 1.服務端安裝 a.使用官網的快速上手的tar安裝包安裝,直接解壓,執行tdengine server資料夾中的install.sh命令安裝 使用這種方式會自動安裝濤思客戶端到 usr loacl taos下 配置檔案在 ...
新詞發現方法資料
新詞發現與詞的切分差不多是同一回事 1.資訊熵 最常用2.基於切分的新詞發現 相比1計算量要小,可能引數選取需要根據文字資料量來調整 3.遺忘演算法 可能是計算量最小的演算法了,效果有待驗證 特點 無監督學習 o n 級時間複雜度 訓練 執行為同一過程,可無縫處理流式資料 未登入詞 新詞 登入詞沒有...