資料分析感想

2021-05-25 19:28:41 字數 774 閱讀 3492

困擾著我的使用者啟用次數分析,讓人很是頭疼。在此就談談自己的今天一天的收穫和感受吧。

資料可信度。從使用者那邊獲取過來的資料佔使用者實際操作的比例是多大,使用者的啟用次數和使用者的視窗開啟次數理論上是一致的,可實際得到的資料確相差甚遠。我就開始懷疑收集這些的資料是否具有可靠性,r如果一開始收集得到的資料可信度就低,那麼以後分析得到的結果含金量將會很小,甚至會導致上級領導的決策失誤。但是聽了坤哥一番話之後,我明白了不少。在資料分析過程中,資料的丟失是必然的,是不可抗拒的力量導致的,但是這些不可抗拒的力量有這樣的分布上的一致性,就是說資料丟失在整個過程都發生了,是隨機發生的,並不是某一特定的時刻發生的。就像隨機抽樣一樣,並且呢它比隨機抽樣更趨於合理性,如果這個前提是你沒有必要去算丟失資料某屬性的情況的話,它在它的分析的維上,它的資料是有效的。比如使用者的啟用次數,它的使用天數是和啟用次數一起傳送過來的,就算丟失一部分資料,它的有效性還是存在的。

資料該如何清理,通過得出曲線圖很難去判定哪些資料是離群點。首日的使用者很怪,出現一次之後就不在出現了的使用者數佔很大比例。按理論上來說,這些不合理的離群點資料佔總數的比例應該是不大,可是在這裡卻佔了很大的比例。如果清理掉它,計算的基數就減少了,有效比例將減低,說服力就減弱了。如果不清理它,那麼這部分資料得出的結論又非常不合理。最後呢,還是決定清理掉它,把兩端的資料做了清理。

要分析什麼樣的資料才有意義。分析使用者的啟用次數來為了什麼,你做這件事情的目的是什麼?我想乙個呢,是分析wps的使用情況,使用者每天的啟用和使用時間怎麼樣的。通過這些呢,也可以確定使用者的質量。確定使用者的質量的這個標準是比較難定的。

明天的任務是分析周使用者的使用情況。

資料分析 資料分析概述

了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...

資料分析 資料分析的誤區

在資料分析的過程中,我們難免會走一些彎路,但有些彎路是可以避免的,下面我將介紹幾個資料分析過程中常見的誤區 我們一定都聽說過二戰中的乙個經典示例 軍方為了提高戰鬥機飛行員的生還率,打算在飛機上增加裝甲的厚度,但不能在所有部位加厚,這樣會喪失戰機的靈活性,於是軍方請了統計學家來研究,這些專家在一開始就...

「資料分析」崗位分析

行業內公司的融資情況從一定程度上說明了選擇資料分析崗位的穩定性 佔比情況是所有職位累加在一起,未區分職位 不需要融資的公司佔比60 d輪以上的公司42 其實很多不需要融資的公司,規模也是很大的,可以結合公司規模來判斷公司的情況如何,是否值得去發展。提供資料類職位的公司,規模還算比較大的 500人以上...