在量化交易的世界裡,資料品質常常是考量的因素。因為不論是歷史與live中的執行面,資料的誤差都有可能讓你的交易充滿了「不確定性」。那如何要避免這樣的問題呢? 可能有下列幾種:
1.從資料上去處理:例如台灣就是用期交所的資料進行開發,有在做連續日轉倉的交易,可能會多做一步資料價差的調整。
2.追求最極致的報價來源:自己拉專線,主機直接放在IDC機房,外加網路與軟硬體設備到位。
以上這二點幾乎可以把誤差降至最低,但是代價卻是十分昂貴(時間與金錢)。那有什麼方法可以應對,而達到CP值最好的方式呢?
其實只要從策略開發的架構去出發,讓策略邏輯對資料本身的依賴性與敏感性降低,加上使用CODE去調整一些不合理的價格真空情況,基本上可以解決87%的問題。
近期正好討論現貨最後一盤是否要併入1:30分的資料,C哥認為若是「人為」或是「事後」去併入,都無法在即時交易上一致。因為這些都是未來資訊(1:32分的價格併入1:30分),交易上就會面臨到重開或回補資料,倉位有可能不一樣的情況,這些反而可能是誤差真正的來源。所以,C哥一直認為資料要真實的呈現,過多的調整是否能反應真實情況,這點就值得思維與確認。
#交易細節真的很多
#C哥還是重視交易的本質
#線上量化基礎班想教的就是這樣的精神
https://cf995.tw/product/10/4