1
觀察離散資料分布的常用方法是 ( a )
a、直方圖
b、餅圖
c、密度圖
d、箱線圖
2交叉分析是基於 ( ) 橫向地組合交叉。
a、同一緯度
b、不同維度
c、同一方向
d、以上都不是
3離散型隨機變數的可能值為 ( c )。
a、乙個區間
b、無限個
c、有限個數
d、1個
4以下不屬於資料分析時用到的方法是 ( c )
a、相關分析
b、比較分析
c、高低分析
d、細分分析
5( b )越小,表明期望值的波動幅度越小,專案風險程度越低。
a、偏度係數
b、變異係數
c、極差
d、平均值
6變異係數是( b )
a、均值與期望值的比值
b、標準值與期望值的比值
c、期望值與標準差的比值
d、標準差與期望值之和
7( d ) 不是常用對比分析方法。
a、定基比
b、同比
c、環比
d、縱橫比
8( b ) 是指對資料在不同維度進行交叉展現,進行多角度結合分析的方法,彌補了「各自為政」分析方法所帶來的偏差。
a、相關分析
b、交叉分析
c、主成分分析
d、因子分子
9以下有關hive的敘述中,錯誤的是 ( d)
a、hive是建立在hadoop上的資料倉儲基礎構架
b、hive提供了一系列的工具,可以用來進行資料etl
c、hive定義了簡單的類sql查詢語言,稱為hql
d、hive不直接使用儲存在hadoop檔案系統中的資料
1細分的方法更多的是基於同一維度的縱深展開,也就是olap中的鑽取,比如從省份的資料細分檢視省份中各城市的資料,是基於地域維的下鑽。
正確答案:√
2交叉分析涉及多維度的組合,通常以圖表為主進行展現
正確答案:×
4變異係數是標準差與期望值的比值。
正確答案:√
5變異係數越小,表明期望值的波動幅度越大,專案風險程度越高。
正確答案:×
6假設檢驗的基本思想是小概率事件在一次試驗中基本上不會發生。
正確答案:√
7卡方檢驗中,卡方值越大,實際觀測值與理論推斷值越不符合;卡方值越小,說明二者越趨於符合。
正確答案:√
8卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小。
正確答案:√
12一般來說,環比可以與環比相比較,也可以與同比相比較。
正確答案:√
14對比分析最關鍵的是a/b兩組只保持單一變數,其他條件保持一致
正確答案:√
15同比就是當年第n月與第n-1月或第n+1月比。
正確答案:×
16環比就是當年第n月與前一年第n月比。
正確答案:×
17交叉分析基於多維模型,資料的維度越豐富,所能實現的交叉也越豐富和靈活,通過各種交叉分析能夠更加有效地發現問題,因此,對基層模型也沒有要求。
正確答案:√
19離散型隨機變數的可能值為無限個數。
正確答案:×
20不考慮總體分布型別是否已知,不比較總體引數,只比較總體分布的位置是否相同的統計方法是非引數統計。
正確答案:√
21多項相互關係分析意在分析多個自變項(量) (x1、x2、x3等)對某個因變項(量)y的共同影響與相對效應。
正確答案:×
22「隨機變數x的概率分布」就是所有出現的結果及每種結果發生的概率的一種函式表示,且所有可能的結果的概率之和等於1。
正確答案:√
23對比分析中,對比的參照物不同,得到的判斷結論也就不同。
正確答案:√
24資料細分時,可以按維度細分,有多少維度,就可以有多少種細分的方向,細分一步即可。
正確答案:√
26常用統計量函式中,偏度係數定義為四階矩,公式如下:
正確答案:×
28細分策略中,分渠道用來分析不同時間段資料是否有變化。
正確答案:×
29交叉分析不再侷限於乙個維度,就像資料立方體與olap中的立方體,是基於不同維度的交叉,時間維、地域維和產品維交叉在一起分析每個小立方的資料表現,可以通過olap的切片(slice)和切塊(dice)操作檢視。
正確答案:√
30常用統計量函式中,標準差函式定義為
正確答案:√
32分位數指一組資料**現次數最多的變數值。
正確答案:×
33f檢驗主要通過比較兩組資料的方差,以確定它們的精度是否有顯著性差異。
正確答案:×
35總體分布型別已知,用樣本指針對總體引數進行推斷或做假設檢驗的統計分析方法是引數統計。
正確答案:√
36定基比發展速度也叫總速度,是報告期水平與某一固定時期水平之比。
正確答案:√
37豐富和靈活的分析需求的實現在基於更加複雜的多維模型或者資料立方的同時,也節省了系統開銷。
正確答案:×
38因為乙個變數的相同的取值必須有相同的秩次,所以在計算中採用的秩次是排序後位置的平均值。
正確答案:×
41交叉分析是基於不同維度橫向地組合交叉。
正確答案:√
Hadoop技術 大資料概論
三 大資料應用場景 四 業務流程分析 大資料就是巨量的資料。大資料的計量單位已經超過tb級別發展到pb eb zb yb甚至bb級別。大資料是指在一定時間內無法使用傳統資料庫軟體工具採集 儲存 管理和分析其內容的資料集合。大資料技術的戰略意義不在於掌握龐大的資料資訊,而在於對於這些含有意義的資料進行...
大資料概論
大資料 big data 指無法在一定時間範圍 內用常規軟體工具進行捕捉 管理和處理的資料集合,是需要新處理模式才能具有更強的決策力 洞察發現力和流程優化能力的 海量 高增長率和多樣化的資訊資產。主要解決,海量資料的 儲存和海量資料的 分析計算 問題。按順序給出資料儲存單位 bit byte kb ...
大資料(1) 概論
什麼是大資料?首先大資料不是一門專門的技術,而是一些列技術的綜合應用,各類資料庫 檔案儲存 處理平台 作業系統甚至是硬體的綜合。大資料 這個詞被廣為流傳,但真正說起來,它更是一種市場用語,是營銷手段的產物。大資料 所代表的是一種較新的理念,一種對資料處理的新的技術組合,一種新的解決資料或企業運營的思...