統計分析的體會

2021-03-31 15:08:30 字數 495 閱讀 9825

客戶給了一張基本的資料表,然後讓我做大量的計算,並且動態/靜態的做統計分析報表,經過了長達兩個月的苦戰,終於作完了。體會如下:

1、一張存放中間統計結果的表是必要的,如果能夠將客戶的統計分析需要經過計算才能顯示的字段囊括在內是最好不過了,畢竟在查詢的過程中作計算是一件很討厭的事,雖然有資料冗餘,但是簡化了資料有可能的多表關聯的效率問題。

2、適當的儲存上乙個統計時間段的資料會有意想不到的方便,減少了關聯自身的很多操作。

3、如果資料庫的遷移不在考慮範圍內的話,盡量使用儲存過程來提高統計分析的效率,畢竟統計如果資料量很大的話效率是非常關鍵的,如果需求分析、模組分割恰當,儲存過程寫的也很容易遷移的。

4、如果資料量很大的話,考慮分段儲存資料也是可行之策。

5、很多時候要使用臨時表會讓你的程式執行效率提高幾倍。

6、索引的建立要考慮很多因素,不恰當的索引會嚴重的導致查詢統計的效率。

7、多跟客戶溝通是你專案進度保證的關鍵,不要等你認為作完後讓客戶一次性的推翻的所有的成果。

資料的統計分析

資料預處理之後,我們要做一些統計分析,來觀察我們的資料,這其中包括 描述性分析 統計推斷。描述性分析 主要是統計指標 圖表。1 集中趨勢分析 除了分位數,我們還可以結合 中位數 眾數 平均數三者的關係。具體地 眾數在中位數左側,平均數在中位數右側,則此時資料呈正偏態分布,又叫右偏,存在極大異常值。是...

pandas的統計分析

import pandas as pd import numpy as np data pd.read excel meal order detail.xlsx print data n data print data 的列索引 n data.columns print data 的資料型別 n d...

數學建模 統計分析

1.正整數頻率表 使用tabulate函式可以得到正整數的頻率表 t ceil 5 rand 1,10 隨機產生一組資料 table tabulate t 得到t的頻率表 t 324 2345 531table 1110 22203 33042 205220tabulate有乙個缺點是,它得到的是正...