chatgpt分析股票嗎 論文解析 ChatGPT 炒股邏輯
論文解析 炒股邏輯
原文標題:《500% 回報率?史上最強基金經理 造!》
論文教你用 炒股,收益最高能到 500%!
,要把人類基金經理也給替代了?
英國的一家金融咨詢網站 表示,他們在 3 月 6 日創立了一個由 選擇的股票組成的投資組合,這個組合在兩個月后上漲了 4.93%。
而同期之內,英國 10 大最受歡迎的基金的平均表現為-0.78%,而且在 87% 的交易日中表現都不及「 指數」。
同樣的,同期標準普爾 500 指數(包含美國最有價值的 500 家公司的指數)也只上漲了 3%。
難道除了文字工作者們的崗位受到了威脅之外,「打工人」的臉面 —— 基金經理們也要失業了嗎?
未曾設想的道路
誰能想到,國外研究者還真整了篇論文出來,細致入微地探索 AI 炒股的能力。
具體來說,就是「喂」給 一些新聞標題,讓 來用情感分析( )判斷這些事件對股市的影響。
會判斷出,某一事件對股票價格有利、不利,還是不相關。之后,研究者會依照該結果打分,用真實的股市回報來看 準不準。
研究人員表示, 要比別的模型強多了,像什么 GPT-1、GPT-2 都預測的不準。
這說明兩件事,第一,股市的回報預測能力對語言模型來說是一個亟待進一步探究的能力。第二,更高級的語言模型一定能生成更準確的預測。
研究團隊主要使用的三個數據集分別是證券價格研究中心(CRSP)的每日收益率匯總,各大新聞頭條,以及 。
而數據樣本的覆蓋范圍從 2021 年 10 月開始,到 2022 年 12 月結束。
選擇這個時間段的道理也很簡單。 自己的訓練數據是到 2021 年 9 月,也就是說 10 月之前的數據根本就不用讓它預測,它自己早就知道結果如何了。所以,21 年 10 月以后的新數據正好讓 拿來練手。
三個數據集中chatgpt分析股票嗎,CRSP 的每日收益數據集包含了在美國主要的證券交易所上市的各種公司的股票的每日收益,包括股票價格、交易量和市值等數據。
其次,研究者搜集所有包含有公司名稱或者股票代碼的新聞,來源則是各類主要的新聞機構、金融新聞網站和社交媒體平臺。
對于每家公司而言,研究人員會收集樣本期間的所有新聞。
最后, 值得著重介紹一下。
自 2003 年以來, 一直是金融服務領域領先的數據分析供應商之一。
他們幫助企業從大量的信息中快速而輕松地有價值的部分。 的產品使客戶能夠提高收益、減少風險并提高運營效率。
總的來說, 的作用,就是保證喂給 的都是有效 / 相關的信息。
最終,研究團隊從 上匹配出 4138 家公司的 條新聞標題。
同時,研究人員會給每條新聞打分,從 0 到 100,衡量每條新聞和所提及的公司的關系。
0 分意味著在新聞中是被動提到某家公司的,可能只是捎帶手提了一嘴。研究人員追求的是 100 分的相關性。
同時chatgpt分析股票嗎,所有只介紹股市趨勢的新聞也排除在外,這種新聞違背了預測的初衷。相同內容的重復報道也被研究團隊規避,這樣收集到的數據才能為實驗更好的服務。
到這里,該收集的數據就差不多了,下一步就是該分析了。
打分制炒股
既然要讓 輸出內容,那首先就是設計一個 出來。
研究團隊使用的是以下這個 :
假設你是一個金融專家,且是一個有股票推薦經驗的金融專家。如果這條新聞是好消息,請回答「YES」,如果是壞消息,請回答「NO」,如果不確定,請在第一行回答「」,然后在下一行用一個短小精悍的句子進行闡述。
這個新聞對 (公司名稱)的股票價格來說,在 內(短期、長期)是好是壞?
新聞標題:
可以看到,研究人員讓 一個有股票推薦經驗的金融專家,而橫線的部分則用具體信息替代。
舉個栗子:
輸入新聞標題: 在與甲骨文的訴訟案中被罰 63 萬美元
評價對象:甲骨文股價
時間跨度:短期
輸出的回答是這樣的:
「YES。對 的罰款會間接促進投資者的信心,相信甲骨文有能力保護自己的知識產權,維護自身產品和服務的需求提升。」
然后,研究人員會根據 的回答進行打分。YES 算 1 分,NO 算-1 分, 算 0 分。
如果關于一家公司一天之內有很多新聞,那就把分數匯總一下,輸出一個平均值。
最后,再用這個預測的分數和之后真實的結果進行匹配。
散戶福音!
通過利用新聞標題數據和生成的情緒得分,研究人員發現 評估結果與樣本中股票的后續每日回報之間存在很強的相關性。
而且 的情緒評分比現有的傳統的數據供應商提供的情緒指標還要能更加準確地預測股票的收益。
研究團隊認為chatgpt分析股票嗎, 之所以比現有的情緒指數好,還是要歸因于強大的語言理解能力,使得它能夠捕捉新聞標題中的細微差別,從而使得生成的情緒得分更為可靠。
所以將大語言模型作為工具能夠提供比傳統的情緒指數更好的投資參考。
研究團隊還進一步發現, 情感評分對于小盤股的收益預測能力要好于大盤股。說明對于股東套利的限制可能會降低這個策略的收益能力。
研究團隊用 生成的情緒的分來指導股票操作。
具體操作方式就是,只要有消息放出,就買入(積極消息)或者短暫賣出(消極消息)股票。
消息如果是交易時間內放出,就以當時價格進行交易,如果是交易時間之外放出,就以第二天開盤價進行交易。
(黑線代表零成本的收益,綠線代表 5% 的交易成本的收益,藍線代表 10% 的交易成本收益,深藍色的線代表 25% 的交易成本收益,紅線代表市場整體收益)
這個表展示了操作的回歸分析的結果,很直觀地體現了第二天股票收益與 生成的情緒得分之間的相關性。
回報率 500%!?
用 對新聞標題進行情感分析,從而預測股票收益的表現是優于主要供應商的傳統情緒指數的。
說明了繼續開發探索大語言模型在金融行業的應用是非常有潛力的的。
隨著 AI 本身技術的發展,設計更復雜的模型在金融市場搞錢是一個很靠譜的事情。
宏觀來看,考慮到未來如果大部分金融從業人員都使用基于大語言模型的工具進行決策,也會對金融市場的價格的形成機制,信息的傳播途徑,和市場穩定性產生深遠的影響。
那么,具體的回報是什么樣子的呢?
多空策略,即購買有好消息的公司并賣空有壞消息的公司,回報率最高,超過 500%。
只做空策略,只關注賣空有壞消息的公司,回報率接近 400%。
只做多的策略,只買入有好消息的公司,回報率約為 50%。
當然,這個數字看著唬人,其實也就是一個理想情況。
但是,拋開冷冰冰的數字, 的這項能力確實有很大的發揮空間。
這可能會改寫股票交易,散戶現在有機會獲得比企業情緒分析更強大的工具。
一般來說, 正在使其他公司傾注在專有機器學習模型中多年的工作變得過時。
它跨越了數百萬美元的研發費用,任何人都可以輕松獲得這種能力。
對于普通投資者來說,跑贏大盤就挺好。
對于沒有很復雜金融知識和股票交易的經驗的普通人,當然做不了如此復雜的分析和精度很高的操作。
那么根據開頭提到的跑贏標普 500 的「 投資組合」中推薦的選股策略:
低負債率
歷史上持續穩定的增長
擁有能夠產生競爭優勢的資產。
也能挑選出不錯的公司,幫助你高效配置自己的資產。
但需要注意的是, 給出的回復并不能作為投資的事實性依據。
參考資料:
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。