目前剛剛入職公司,拿到的第乙份任務是做資料清洗,關於資料清洗,還是要看國外的大師的研究,根據《統計視角下的金融高頻資料探勘理論與方法研究》一書(這裡要多說一句的是,jackson啊jackson,你總是能找到一些很好的書,這完全沒有問題,但是你又看了多少呢?恐怕沒好好看吧,看了書一定要及時做筆記,做記錄,不然你這個亂七八糟的腦子,根本就記不住什麼東西的)
在文章裡,雖然找不到原文了,但是裡面提到brownlees和gallo(2006)提到了資料清洗的研究,在zhang(2006)提到了(multi-scale realized volatility ,msrv)進行資料清洗的操作
還是沒找到完整的書,sigh
除了這個以外,在**資料:資料清理要點 裡提到了一些關於資料清洗的內容,其中說到了一些,可能有參考意義的是,
從資料**上看,造成資料錯誤的原因,無非有兩個
(非交易時間段這個不存在的)
為了測試系統、修復程式錯誤等,交易所往往會推送部分測試資料。千萬要謹記,這些資料僅做測試使用,並非真實的交易資料。因此,這部分測試資料需要從我們的資料庫刪除掉。
量化投資學習必讀書目(五) 《海龜交易法則》
內容簡介 在金融界,流傳著這樣乙個著名的故事。1983年,美國 界的兩個摯友 理查德 丹尼斯與威廉 埃克哈特之間就乙個問題產生了分歧 偉大的 交易者究竟是天生的,還是可以後天培養的?他們就這個問題進行了一場賭博,並為尋找答案進行了一場試驗,這就是著名的 海龜交易試驗 丹尼斯和埃克哈特在1000個報名...
量化投資學習 數字貨幣共識機制介紹
最普遍的共識機制是pow和pos。什麼是pow?pow proof of work 即工作量證明機制,pow機制是位元幣等需要挖礦幣種的通用機制,對於重複性小概率事件來說,出示結果同時就證明了工作量。具體到應用,就是工作越多,收益越大。這種思想被廣泛地使用在我們的生活中。比如近期火爆的 吃雞 遊戲 ...
量化投資學習的一點心得
量化學習中可能會遇到很多困難,自然需要搜尋一下網上資料,這個時候baidu表現的就及其坑,搜到很多資料都是2015年,或者2016年,裡面的解決方法本身就已經過時了,我還真是有苦難言。用google吧,國內又上不去。所以建議大家還是自己去擼文件了,比如pandas的學習材料 tushare的 我舉個...