關聯分析用於描述多個變數之間的關聯。如果兩個或多個變數之間存在一定的關聯,那麼其中乙個變數的狀態就能通過其他變數進行**。關聯分析的輸入是資料集合,輸出是資料集合中全部或者某些元素之間的關聯關係。例如,房屋的位置和房價之間的關聯關係或者氣溫和空調銷量之間的關係。
關聯分析主要包括如下分析內容:
(1)回歸分析
回歸分析是最靈活最常用的統計分析方法之一,它用於分析變數之間的數量變化規律,即乙個因變數與乙個或多個自變數之間的關係。特別適用於定量地描述和解釋變數之間相互關係或者估測或**因變數的值。例如,回歸分析可以用於發現個人收入和性別、年齡、受教育程度、工作年限的關係,基於資料庫中現有的個人收入、性別、年齡、受教育程度和工作年限構造回歸模型,基於該模型可以根據輸入的性別、年齡、受教育程度和工作年限**個人收入。
(2)關聯規則分析
關聯規則分析用於發現存在於大量資料集中的關聯性或相關性,從而描述了乙個事物中某些屬性同時出現的規律和模式。關聯規則分析的乙個典型例子是購物籃分析。該過程通過發現顧客放入其購物籃中的不同商品之間的聯絡,分析顧客的購買習慣。通過了解哪些商品頻繁地被顧客同時購買,這種關聯的發現可以幫助零售商制定營銷策略。其他的應用還包括價目表設計、商品**、商品的排放和基於購買模式的顧客劃分。
(3)相關分析
相關分析是對總體中確實具有聯絡的指標進行分析。它是描述客觀事物相互間關係的密切程度並用適當的統計指標表示出來的過程。例如,在經濟學中,如果一段時期內出生率隨經濟水平上公升而上公升,這說明兩指標間是正相關關係;而在另一時期,隨著經濟水平進一步發展,出現出生率下降的現象,兩指標間就是負相關關係。
相關分析與回歸分析在實際應用中有密切關係。然而在回歸分析中,所關心的是乙個隨機變數y對另乙個(或一組)隨機變數x的依賴關係的函式形式。而在相關分析中,所討論的變數的地位一樣,分析側重於變數之間的種種相關特徵。例如,以x、y分別記為高中學生的數學與物理成績,相關分析感興趣的是二者的關係如何,而不在於由x去**y。
《大資料分析原理與實踐》一一導讀
本書的緣起與成書過程 大資料經過分析能夠產生 值,這無疑已在大資料火爆的今天成為共識,從而使得大資料分析在 大資料 涉及的領域 如工業 醫療 農業 教育等 有了廣泛的應用。大資料分析的相關知識不僅是大資料行業的從業人員應該必備的,也是和大資料相關的各行各業的從業者需要了解的。然而,人們對大資料分析的...
《大資料分析原理與實踐》 第3章 關聯分析模型
關聯分析用於描述多個變數之間的關聯。如果兩個或多個變數之間存在一定的關聯,那麼其中乙個變數的狀態就能通過其他變數進行 關聯分析的輸入是資料集合,輸出是資料集合中全部或者某些元素之間的關聯關係。例如,房屋的位置和房價之間的關聯關係或者氣溫和空調銷量之間的關係。關聯分析主要包括如下分析內容 1 回歸分析...
《大資料分析原理與實踐》一一1 5 全書概覽
1.5 全書概覽 本書將較為全面地描述大資料分析的模型 技術 實現與應用。其中第2 7章介紹大資料分析模型,包括關聯分析模型 分類分析模型 聚類分析模型 結構分析模型和文字分析模型 第8 11章介紹大資料分析相關的技術,包括大資料預處理 特徵選擇和降維方法 面向大資料的資料倉儲和大資料分析演算法。第...