第三章
聚類分析
、聚類分析的基本思想和功能是什麼?
聚類分析的核心思想是根據具體的指標(變數)對所研究的個體或者物件進行分類,使得同一類
中的物件之間的相似性比其他類的物件的相似性更強。
聚類分析不僅可以用來對樣品進行分類,
也可以用來對變數進行分類。對樣品的分類常稱為
q型聚類分析,對變數的分類常稱為
r型的聚類分析。
聚類分析的目的或功能就是把相似的研究物件歸成類,
即使類間物件的同質性最大化和類與類間
物件的異質性最大化。
、試述系統聚類法的原理和具體步驟
)系統聚類的基本思想是:距離相近的樣品(或變數)先聚成類,距離相遠的後聚成類,過
程一直進行下去,每個樣品(或變數)總能聚到合適的類中。
)系統聚類的具體步驟:假設總共有
n個樣品(或變數)
第一步:將每個樣品(或變數)獨自聚成一類,共有n類;
第二步:根據所確定的樣品(或變數)「距離」公式,把距離較近的兩個樣品(或變數)聚合為
一類,其他的樣品(或變數)仍各自聚為一類,共聚成
n-1類;
第三步:將「距離」最近的兩個類進一步聚成一類,共聚成
n-2類;。。。,以上步驟一直進行
下去,最後將所有的樣品(或變數)全聚成一類。
、試述k-
均值聚類的方法原理
這種聚類方法的思想是把每個樣品聚集到其最近形心(均值)類中。
首先隨機從資料集中選取
k個點作為初始聚類中心,
然後計算各個樣本到聚類中的距離,
把樣本歸到離它最近的那個聚類中心所在的類。
計算新形成的每乙個聚類的資料物件的平均值來得到新的聚
類中心,如果相鄰兩次的聚類中心沒有任何變化,說明樣本調整結束,聚類準則函式已經收斂。
第四章判別分析
、應用判別分析應該具備什麼樣的條件?
判別分析最基本的要求是:分組型別在兩組以上;每組案例的規模必須至少在乙個以上;解釋變
量必須是可測量的,才能夠計算其平均值和方差,使其能合理地應用於統計函式。
、試述貝葉斯判別法的思路
思想是:假定對研究的物件已有一定的認識,常用先驗概率分布來描述這種認識,然後我們取得
乙個樣本,用樣本來修正已有的認識(先驗概率分布),得到後驗概率分布,各種統計推斷都通過後
驗概率分布來進行。將貝葉斯思想用於判別分析,就得到貝葉斯判別。
、試述費歇判別方法的思想。
費歇判別的思想是投影,將k組
p維資料投影到某乙個方向,使得它們的投影組和組之間盡可能
地分開。
、簡要敘述判別分析的步驟及流程。
簡述什麼是T SQL
在sql server的相關資料中,我們常看到t sql,那麼什麼是t sql?其實t sql,就是transact sql,是sql server對標準結構化查詢語言的擴充套件 sql,即structured query language 而在oracle中我們使用的是pl sql,也就是orac...
簡述什麼是 Cloud Native
為什麼我們需要使用 cloud native?雲計算的第乙個浪潮是關於成本節約和業務敏捷性,尤其是雲計算的基礎設施更加廉價。很多企業傾向於使用微服務架構來開發應用。微服務開發快速,職責單一,能夠更快速的被客戶所採納。同時,這些應用能夠通過快速迭代的方式,得到進化,贏得客戶的認可。cloud nati...
什麼是模式?什麼是框架?(簡述)
簡述 這是apache的開源專案,目前應用很廣泛。基於mvc模式,結構很好,基於jsp。jbuilder8裡已經整合了struts1.02的製作。免費。簡述waf struts結合的例子 web層用struts,ejb層用waf jsp taglib actionform action event ...