建模比賽過程中遇到的問題
首先看題的要求
在附件中給4個月的資料 其中包括 日期,時間,交易量,成功率,響應時間
資料量有十幾萬條;
通過使用r語言分析得出來資料
可以簡單得到一些結論 通過資料的篩選與分析並結合r語言對資料處理得到的折線圖形分析得出了,交易量與時間,日期存在明顯的相關關係。通過交易時間和反應時間圖示的分析,我們可以明顯得0時到八時與18時至24時的反應時間大致相同,且都處於最高值。我們分析這種情況可能是由於銀行工作人員上下班導致atm機服務的數量不同導致的。通過對資料的選擇與處理,提取出來幾種特徵引數,其中交易次數與交易時刻特徵引數符合logistic回歸分析模型。結合這四個月的資料分析與每日的交易量圖示,工作日和非工作日的散點圖發現有明顯的區別。其中每天的交易量,成功率與時間也有明顯的關係,利用資料及sql語句資料篩選,通過r語言軟體程式設計,繪製出交易成功率與時間段,交易量的動態。未完待續
Stratum與Coinbase交易分析
coinbase交易結構為 位元組字段描述4 版本這筆交易參照的規則 1 9輸入計數器 包含的交易輸入數量 32交易雜湊 不引用任何乙個交易,值全部為0 4交易輸出索引 固定為0xffffffff 1 9coinbase資料長度 coinbase資料長度 不定coinbase資料 在v2版本的區塊中...
資料特徵分析 Python資料探勘與分析
1.分布分析 1 定量資料的分布分析 求極差 組距 組數 分點 列出頻率分布表 繪製頻率分布直方圖 2 定性資料的分布分析 定性的資料常常使用變數來分組,然後使用餅圖 柱狀圖等來展示 2.對比分析 兩個相互聯絡的指標進行比較,從數量上展示和說明研究物件規模的大小,水平的高低,速度的快慢等 1 絕對數...
linux apache 日誌分析與狀態
linux apache 日誌分析與狀態 假設apache日誌格式為 問題1 在apachelog中找出訪問次數最多的10個ip。awk apache log sort uniq c sort nr head n 10 awk 首先將每條日誌中的ip抓出來,如日誌格式被自定義過,可以 f 定義分隔符...