Building an AI-Assisted Stock Prediction System
「我要的是能賺錢的預測,不然做系統幹嘛?」
我是這樣跟協作的Gemini這麼說,因為他都會都塞寫死數據給我,不過剛好讓我更知道要怎麼規劃系統與修改程式碼,還好Gemini的降智,讓我要自己找錯除錯,不像別的AI都不太用除錯…….哈
我規劃了幾種方式的系統,但都不太準,因為我之前過度相信AI,但幾次的失敗,我懂了AI的盲點與後台的限制,會顯示…..是 AI,有時可能會出錯。都有這個宣言,就是不要負責任。
我換了一個想法,終於這一版的準準準系統,有點樣子了,所以我想可以po文來分享,但我發現真的要準,必須串聯真資料。
這版系統我著手規畫融合了傳統籌碼分析與現代 LLM(大型語言模型)語意判讀的混合型量化,並加入該有的資料:
•爆量倍數
•外資買賣超
•新聞情緒分數
•投信
•自營商
•EPS
•本益比
•營收成長
•流動性
•題材
在串接台灣證交所與海外 API 的過程中,我踩過了無數資料科學與全端開發的經典大坑:
API 時間沙盒與「消失的籌碼」
系統初期最頭痛的問題,就是盤中掃描時會把外資與融資券數據全部洗成 0。因為台灣證交所的三大法人(T86)下午 16:30 才陸續更新,而融資券(MI_MARGN)甚至要等到晚上 21:30。
後來,我加入了盤中時間若未達標,系統會自動回溯前一日的結算數據,用這方式解決了資料湖被空數據污染的斷層問題。
「冷門地雷股」的陷阱
這是讓預測準確率卡關的最大元凶!一檔平時只成交 5 張的冷門股,今天成交 15 張,會造成「3 倍爆量」。這種「假爆量」會一度霸佔了系統的排行榜。我就改成單日成交量未達 500 張(500,000 股)的標的,直接排除,不然沒注意買了就尷尬了,成交量真的很少。
大量資料的無限迴圈
一開始,串接成功,但…..全市場 1,400 檔股票的爆量資料全部塞進系統,會導致系統一直在跑股票。要設限智改成 Top 20/30 ,來釋放系統效能,讓顯示能流暢展開。
四大核心引擎架構
目前的「準準準 7.0」不再只是單純的籌碼爬蟲,而是由四大引擎驅動的決策大腦:
1. 📡 全自動數據採集引擎(Data Lake)
- 多維度來源:涵蓋 TWSE 台灣證交所盤後 API、Yahoo Finance(yfinance)即時報價、Google News RSS
- 深度籌碼:追蹤每日成交量/價、外資/投信/自營商連買天數,甚至精準到融資大戶與借券賣出的異常增減
2. 🤖 AI 情感與共識大腦(Groq LLM)
- 系統內建 Llama-3.3-70b 大型語言模型,扮演極度冷血的華爾街量化分析師
- 自動抓取個股最新新聞與外資法人報告,進行極限濃縮,並強制給出 -3 到 +3 的市場共識情緒分數,將原本無法量化的「消息面」轉化為 XGBoost 模型的特徵值
3. 🛡️ 終極防雷濾網(Anti-Landmine Filters)
為了解決「高勝率卻賠錢」的痛點,系統實裝了最嚴苛的篩選機制:
- 流動性底線:排除低於 500 張成交量的殭屍股
- 基本面排雷:自動獲取 Trailing EPS 與 PE Ratio,若公司處於虧損(EPS < 0)或本夢比過高(PE > 100),系統會強制扣減 10%~15% 的預測勝率,並打上醒目的紅色警語
4. ⚙️ 動態量化預測模型(XGBoost Pipeline)
乖離率冷卻機制:加入單日暴漲暴跌的保護機制,若單日漲幅過高極易引發獲利賣壓,系統會強制啟動冷卻扣分,避免盲目追高
資產動態權重:不採用死板的單一公式。台股加重「法人實體買超天數」權重,美股則放大「AI 新聞情緒」的影響力

首選高勝率預測(台/美股分流)
這是系統的皇冠!我們將台股門檻設為 55%,美股設為 52%。全市場一萬多檔標的,必須同時通過流動性、基本面測試,且勝率突破天花板的菁英標的,才有資格進入這張榜單。
除了股票的資訊,我加入以下的資訊分析與預測:
🔥 爆量排行
直球對決市場熱度,抓出突破常態交易量的前 30 強,並依據法人有無跟單給予紅綠燈動作提示。
🏦 三大法人排行
一眼看穿外資、投信、自營商正在聯手鎖碼哪些股票,尋找波段起漲點。
🚨 避險與借券警報
專門抓出「融資激增但法人未買」或是「借券空單異常大增」的危險標的,在崩盤前提醒你避險逃跑。
💡 結語:讓數據說話,讓 AI 輔助決策
開發這套系統的初衷很簡單:把雜訊過濾掉,把真正的賺錢機會留下來。
「準準準 7.0」已經脫離了測試腳本的階段,成為了一套具備「情緒感知」與「嚴格量化防護」的商業級輔助系統。
在 AI 時代,預測不能只停留在傳統的 50% 機率盲猜,唯有將「籌碼、基本面、AI 語意」三者極限融合,才能在無常的金融市場中,搶先鎖定勝率超過 80% 的黃金波段。
失敗的過程 我做了一個模擬,預設了專家團隊並舉行「AI 模擬股市專家開會議」,我以為這樣可以讓預測更準,但幾次會議下來,雖然有模有樣的會議,但這是多餘的,因為都叫我認賠賣掉換現金。
我還想說導入 AI 模擬股市專家開會議,讓大家對話、互相辯論市場方向。但我發現,這根本不適合我這小散戶。那些專家思維都是大資金、大資金的股市大戶思維,他們講的是「控盤」、「籌碼運作」、「長期布局」,而我需要的是「能不能賺錢」、「什麼時候進場」、「什麼時候停損」。
我要的是能賺錢的預測,不是聽專家開會。所以我把這塊砍掉,回到最單純的核心:數據、濾網、模型、預測。
簡單,但有效。

發表留言