AI炒股,靠譜不靠譜

2022-01-10 11:52:47 字數 2481 閱讀 1431

前一段時間,在聽(中文譯本: 人類簡史)。其中一章講到**可以用人工智慧**嗎?作者的觀點是不可以。因為**市場是有對抗性的,如果大家都相信**結果,而採取行動,而這樣的集體行動必然會影響股價。這個問題很有意思。然後,我就饒有趣味的觀望了一下人工智慧**股價的現狀。

在進入主題之前,分享一下財經聖經,benjamin graham的(中文譯本:聰明的投資者)的主要觀點之一: 不要嘗試做**!!!**市場唯一不變的是,他會殘忍地給對未來**自信滿滿的你乙個surprise。

《思考的快與慢》的作者daniel老爺爺也說啦,這個世界大部分事情都是隨機的,有一些因果關係嘛,都是喜歡故事的人類牽強編出來的。**市場,真的不要去**。

既然**市場無法做**,那華爾街的分析師們都在忙什麼?那些財經資料分析師們都在忙什麼?《聰明的投資者》裡說,其實他們忙活不忙活都一樣。如今有那麼多資料,難以避免想去分析,就像乙個人拿著錘子,見到釘子或者像釘子一樣的東西,都想過去釘一下。

有意思的是,前一段時間聽lex fridman的一期podcast,嘉賓是物理學家stephen wolfram, 他提到了,量子力學是破解這個世界的基礎,如果人類能夠成功建模量子微觀世界,這個世界的任何東西都是可以**的,比如說此刻的你在做什麼,甚至本期的podcast的內容都可以**出來, 所謂the theory of everything. 如果是這樣,那**市場**應該是個小問題吧。

那**市場到底可以**嗎。我們暫時可能無法回答這個問題。但我們可以回答乙個問題,人工智慧可以像巴菲特一樣買賣**嗎。可能按照daniel的理論,巴菲特也只是運氣好)。或者我們把問題更general一點,人工智慧可以像乙個行家一樣買賣**嗎?這個答案可能還是比較有信心的問答,可以。**市場有沒pattern我們不知道,但行家的操作還是有pattern可以找。

早期的****模型,通常是基於時間序列模型,通過序列分析來**未來的**走向。靠譜度如何呢?我想起了在大學時候學過一門課,叫做時間序列分析,有乙個例子是,**彩票,彩票比**應該更加難以琢磨。這又讓我想起了有了錘子找釘子的比喻。時間序列模型對於**操作來說,是有一定指導意義的,可以這麼說吧,時間序列模型就和那些看曲線走勢的股民們做著差不多的事情。雖然你不懂背後的驅動力是什麼,但是卻是有一定的規律,多少規律可信,對於股民和時間序列模型來說,一樣難評定。在市場風險領域,會引入一種評定方法,稱為backtesting(事後校驗)。把實際的結果與模型**出來的結果做比較。在機器學習領域,這個backtesting和test set很相似。如果backtest的結果好,可能只是overfitting了測試資料。就和選**一樣,乙個**在過去五年的表現特別好,但不代表未來就一定好。

貌似我們進入了乙個思考的死胡同: 測試結果壞,不行; 測試結果好,不一定可信。機器學習中,我們是不是也要質疑test set的評分好到底可信不可信吧。test set的評分是不是可信,有乙個很大的前提: test set的分布是不是可以代表真實的分布。對於**曲線走向,我們可以這麼翻譯過來,參與backtest的這個時間段的市場因素是不是有代表性。比如說2023年,covid19對it股和旅遊股的影響,使得2020的it股和旅遊股的走勢並不能代表general的情況。而市場因素非常的複雜,可代表還是不可代表,這個問題本身就很難回答。每一種程式語言的helloword都很好寫,但實際的code都相當複雜。我們學習test set策略時,貓狗的例子中的test set就和helloword差不多,但對於實際問題,難度大很多,而對於**市場來說,尤其的難。

對於乙個經濟分析師或**經理,當然並不是由單一的曲線走勢來決定投資策略。研究****的機器學習工程師們,總結出了三個方面。

技術分析和基本面分析,大家都不陌生,作為模型的輸入,也是非常直觀,就是一堆資料,internet上隨便拉。那情感分析具體怎麼操作呢。情感分析屬於自然語言範疇。機器學習工程師們會從推特,臉書以及其他的論壇上爬和**相關的內容,做情感歸類。談到情感分析對於****,相關的新聞也被列入此範疇,而且影響度似乎更大。有相當多的機器學習工程師們在做模型,來**某只**,當有相關的新聞在路透或者彭博發布後,當天的**價。實現起來也是自然語言處理的乙個應用,演算法也是可以自由選擇,神經網路,svm,甚至decision tree。當然每個機構或者個人的ambitious是不一樣的,長線**還是****,投資比例等等都是重要的資訊。

模型做出來了,怎麼評價其質量呢?當然靠譜的結論是通過實踐得出來,而不是實驗室用已知的資料計算出來的。乙個模型到底好不好,可能需要多年的時間來檢驗,不過多年之後,對**影響的因素可能又發生了變化,模型可能早就更新了多個版本了。

**的**模型,與其說是intelligent,我更願意說是automation,雖然二者概念的邊界很模糊。intelligent強調的是模型真正的掌握了奧秘,而automation是automate了人類的操作。而每個公司的模型是automate了該公司的操作策略。

如果說只是automation的話,大家可能對其難度大大松了一口氣。實則不然。即使我們已經擁有了automation (auto),也是有原則必須遵守,列出幾條我比較感興趣的分享一下:

喜歡此內容的人還喜歡

AI志願填報軟體靠不靠譜?

今年高考經歷了疫情的一陣折騰延遲了整整乙個月時間,在大資料的推送下高考熱搜詞彙頻頻出現在觀眾的視線中,一時之間成為焦點。經歷了乘風破浪的高考後,風波已經告一段落,分數也陸陸續續出來,接下來今年的應屆畢業生就要面對出分數填報志願等種種問題。想當年高考完得知分數的那一刻悲喜交加,終於塵埃落定有了結果,心...

財訊通軟體好用嗎?靠譜不靠譜

財訊通 軟體是國內專業的金融軟體開發商,軟體oem,指標模型編寫,量化交易程式化交易系統的開發,其中財訊通 軟體是一款專為中小投資者開發的金融分析利器。財訊通 軟體本著 即時 安全 公平 公正 以及 誠信 的原則為金融界服務,並得到了眾多客戶的一致好評,為我們爭創 一流的金融資訊,一流的金融軟體,一...

AIOps做根因定位靠不靠譜?

昨晚跟浙江移動曉徵總暢談很久,從狹義aiops做根因分析引出,聊了aiops的作用,跟sre的關係,實踐的總結,有很多共鳴,也碰撞出很多有意思的觀點。結合曉徵總整理的,和我記錄的,形成一篇文章,算是拋磚引玉,在aiops經歷了幾年實踐的基礎上,再次 下aiops這個話題。以下是正文 和兄弟們和以及江...