回歸分析是資料分析中最基礎,也是最重要的分析工具。絕大多數的資料分析問題,都可以使用回歸的思想來解決。回歸分析的任務就是,通過研究自變數x和因變數y的相關關係,嘗試去解釋y的形成機制,進而達到通過x去**y的目的。
線性回歸
0-1回歸
定序回歸
計數回歸
生存回歸 型別
模型y的特點
例子線性回歸
ols,gls(最小二乘)
連續數值型變數
gdp,產量,收入
0-1回歸
logistic回歸
二值變數(0-1)
是否違約、是否得病
定序回歸
probit定序回歸
定序變數
等級評定(優涼差)
計數回歸
泊松回歸(泊松分布)
計數變數
每分鐘車流量
生存回歸
cox等比例風險回歸
生存變數(截斷資料)
企業、產品的壽命
估計權重(回歸係數):回歸分析賦予不同自變數x不同的權重,也就是不同的回歸係數,進而了解不同變數之間的相對重要性。
橫截面資料:在某一時點收集的不同物件的資料
時間序列資料:對同乙個物件在不同時間連續觀察取得的資料
面板資料:橫截面資料與時間序列資料綜合起來的一種資料資源
資料型別
常見建模方法
橫截面資料
多元線性回歸
時間序列資料
ar、ma、arma、arima、arch、garch、var
面板資料
固定效應和隨機效應、靜態面板和動態面板
巨集觀資料:蟲部落資料搜尋
巨集觀資料:大資料導航
微觀資料:人大經濟論壇
爬蟲:python等軟體爬取/傻瓜式軟體爬取(bilibili)
淺嘗輒止 數學建模(筆記 典型相關分析)
4.2 對典型相關係數的檢驗假設 確定典型變數數量 5.如何判斷綜合變數是否具有的代表性?二 運用spss計算相關資料 三 典型相關分析應用中的幾個問題 五 他山之石 典型相關分析是研究兩組變數 每組變數中都可能有多個指標 之間相關關係的一種多元統計方法。它能夠揭示出兩組變數之間的內在聯絡。在每組變...
淺嘗輒止 程式設計師的悲哀
我發現有一些這樣的人,從別人的地方把 拷貝過來,但是究竟有多明白不清楚,反正搞來搞去程式是調通了,貌似還執行的很好,但是問他程式裡的細節,搖頭不知道,框架為什麼要這麼配置?這樣配置有什麼作用?去除這個配置會發生什麼問題?搖頭,不知道。如果技術搞成這樣,我認為就是乙個悲哀,對個人生活就是個悲哀,對個人...
記錄一次MYSQL的備份 淺嘗輒止型
環境 win nt 熱備份 資料庫服務不停止的情況下所做的備份,好似mysql需要用雙資料庫來做?mysql我很少接觸,所以陌生,惰性忽略之。優點 不需要停止資料庫服務。缺點 囉唆一些,需要一些時間來倒騰。冷備份 把資料庫服務停止,然後copy資料檔案即可,或是利用winrar來做壓縮備份,比較簡單...