碎碎念:最近選修了聯合國教科文組織國際工程科技知識中心的電腦科學微學位,裡面包括《資料結構和演算法設計》《資料探勘:理論和演算法應對大資料》《計算思維和資料科學導論》《使用ruby on rails的敏捷開發基礎》,內容都比較基礎,很適合新手入門或者拓展自己的知識面。
其中就被清華大學深圳研究生院的袁博老師圈粉了吖!他講的資料探勘導論帶有大量了生活案例,總能讓我有「aha」 moment,那怎麼能不寫讀書筆記呢!
最近看完了第一章節,把一些覺得很有意思的東西整合到這裡。
準備工作
1 想深入乙個領域最好的方式就是看這個領域的著作/期刊,跟蹤國際會議的最新**以及該領域的大牛,不應該閉門造車。
(書籍、會議、大牛什麼的資料等我整理完更新上來鴨)
3 資料探勘是多個學科的集合體 ,想把一門課學好,只聽是不夠的,要課後看很多衍生延申的閱讀,要思考 。
4 「tell me and i forget. teach me and i remember. involve and i learn. ——franklin」
對一些基本概念的理解
資料:是最底層的資訊,包括聲音影象文字等非結構化的資訊。
大資料:超過了傳統軟體處理能力的資料。
資料探勘:資料+演算法+高效能計算平台 的集合,是通過分析發現規律而不是創造規律。
雲計算:將資源變成一種服務,需要用時再去「租賃」,降低成本,提高資源利用效率。
一些有趣的案例
(有好多圖需要整理,待更新…)
reflection:
1 需要訓練自己的多向思維而不要單項思維,你會發現這個世界是多麼地有趣。
2 輸入輸出都太少,寫不出來東西,就比如這個blog,寫幾行字都能憋死我,多練。
資料探勘筆記(1)
1 資料探勘的一種定義 是一項通過探測大量資料以發現有意義的模式和規則的業務流程。資料探勘是一種業務流程,它以其它業務流程產生的大量資料為輸入,一般經過收集,清洗,整理,識別 分析和度量等加工,得到某種有意義的模式或規則作為輸出。而這種輸出反過來可以為其它業務流程提供度量,判斷,等作用。資料探勘的基...
資料探勘筆記 1
維歸約規範化 選擇資料子集 視覺化模式表達 高維性 物件擁有數量不少的屬性 資料的所有權與分布 分布式資料處理 非傳統的分析 資料探勘要求自動產生和評估假設,並且資料探勘資料集多是時機性樣本,而非隨機性樣本 關聯分析 association analysis 用來發現描述資料中強相關的模式 聚類分析...
資料探勘筆記1
資料可以與類或概念相關聯。例如,在allelectronics 商店,銷售的商品類包括計算機和印表機,顧客概念包括bigspenders 和budgetspenders。用彙總的 簡潔的 精確的方式描述每個類和概念可能是有用的。這種類或概念的描述稱為類 概念描述。這種描述可以通過下述方法得到 1 資...