Sunday, May 8, 2016

交易策略 的數據挖掘






+

如何交易策略數學編碼 (如指數,外匯,商品,利率),如果你有很多不同的計量數據,你可以嘗試找到一個公式,看看是否有數據無任何關係 - 例如: 這個發現的模式來預測它。 什麼我問這裡是有一點不同:有另一種方式在這個意義上,你可以搜索公式f(),使得在給定的形式表示,其中某些指標被發現時買入或賣出交易策略(或 任何衍生組合)? 這個想法是,公式本身生活在指標/交易戰略n維空間,並試圖生存作為最好的,就可以了。 這必須是一個標準程序,多智能體系統模擬人工股市。 唉,我無法找到一個簡單的方法來做到這一點。 數據挖掘 計算機技術在過去幾十年的快速發展提供了投資專家(和業餘愛好者)與訪問和分析財務數據的巨大量的能力。 此外,萬維網,電子郵件和電子公告牌,這使世界各地的人們能夠快速訪問這些信息,以及提供對個人表達他們的意見和交互的手段。 其結果是,一些爭論,近年來更耐人尋味的話題都圍繞著實踐的後果“數據挖掘”。 數據挖掘包括通過對從該會預料偶然或隨機的條件下發生的結果不同的關係和模式的數據庫搜索。 數據挖掘技術在其本身的做法是既不好也不壞,並利用數據挖掘技術在許多行業中已成為普遍現象。 例如,在試圖提高壽命的研究人員可能使用數據挖掘分析原因,並與相關的死亡率。 數據挖掘也被廣告商和營銷公司的目標消費者。 但是,數據礦工可能是最臭名昭著的群體是股市研究,設法預測未來股票價格變動。 大多數如果不是所有的股票市場異常被發現(或者至少證明),通過過去的價格和相關的(有時不相關的)變量的數據挖掘。 當市場打漿策略通過數據挖掘發現,有許多在從一個回測策略使得飛躍的潛在問題,以成功地投資於未來真實世界的條件。 第一個問題是確定該關係發生在隨機或是否異常可能是唯一的被測試的具體樣品的概率。 統計學家樂於指出,如果你在折磨的數據足夠長的時間,它會承認任何東西。 在什麼是成為一個臭名昭著的例子大衛Leinweber去尋找隨機相關性的S&P 500指數彼得·科伊在商業周刊的文章,題為描述Leinweber的發現“誰礦山數據可能罷工傻瓜的黃金”(97年6月16日)。 本文討論了數據挖掘,邁克爾Drosnin的書聖經密碼。 而事實上,模式將發生在數據被偶然的機會,特別是如果你考慮很多因素。 數據挖掘的許多病例都是免疫的統計驗證或反駁。 在描述數據挖掘的陷阱,Leinweber“通過聯合國CD-ROM篩選和發現,從歷史上看,標普500指數成份股中最好的一個預測是奶油生產在孟加拉國。” 這個教訓按照大隊是一個學習“的公式,恰好契合了過去的數據不一定有任何預測價值。” 回溯測試一直是一個可疑類的信息。 當你向後看,你只是要展示什麼是好的。 通過數據挖掘發現異常被認為是隨著時間的增加的期間更顯著並且如果異常可以在出樣品測試在不同的時間段和可比的市場(例如在國外交易所)來確認。 如果一個異常被發現在後面的測試中,它也很重要,以確定成本(交易成本,買賣價差,對機構投資者的影響成本)將減少收益。 有些異常是根本無法實現的。 看到價值線異常和實施短缺更多關於這個話題。 此外,在過去奏效的策略可能只是停止工作隨著越來越多的投資者開始根據戰略投資。 見有效市場假說的更多關於這個話題。 The Motley Fool的一直深受多為提供教育諮詢,個人投資者(例如,Motley Fool的提供了建議投資者買入並持有的股票,警惕股票經紀和利益分析的衝突,同時要警惕合理的建議 不切實際的性能聲明)。 但Motley Fool的“愚蠢四國”股票的策略和它的理論基礎已經引起批評。 1997年,楊百翰大學教授格蘭特McQueen和史蒂芬索利coathored紙的金融分析師期刊(FAJ)的質疑道瓊斯戰略(摘要)的極受歡迎的狗。 在已經收集的數據進行分析,道指狗,該教授跟進做數據挖掘的案例研究出來的Motley Fool的愚蠢四。 McQueen和索利分析愚蠢四中雜色的描述傻瓜投資指南(MFIG),但愚人節居然有四愚蠢的多種變(另見愚蠢四個解釋和愚蠢的四個歷史)。 這項研究結果發表在3月/ 1999年4月發行的金融分析師期刊的題為另一篇文章“採礦愚人金”。 在愚人節的娛樂性和創造性的寫作風格的精神,教授已經公佈了BYU服務器上的“輕鬆”版紙(WordPerfect中)的。 在研究中使用的數據可以從這裡下載。 McQueen和索利包括數據挖掘的潛在隱患全面的解釋和他們進行了抽樣檢驗的愚蠢四。 教授之所以認為數據挖掘可以通過交易規則的複雜性進行檢測,缺乏一個連貫的故事或理論,出樣本的測試性能,對於風險的回報,交易成本和稅收的調整。 此外,他們還認為,愚蠢和四道十交易規則已經變得很流行,來影響股票價格在今年初。 The Motley Fool的已張貼在他們的愚蠢的四個投資組合報告這是在其1999年的檔案訪問的FAJ紙一場激烈的反應。 請參閱日期為5/10報告。 5/11。 5/12。 5/13。 5/14。 5/17。 5/18。 5/19。 5/20。 和5/21。 包括在這些反應都是一些反駁的FAJ紙,以及在本文所討論的問題的有效確認。 雖然許多問題值得商榷,在FAJ紙的真正嚴峻的考驗和重要的發現是一個不折不扣的樣品試驗從1949年的愚蠢四返回到1972年這一期間的愚蠢四個平均勉強擊敗道指30 每年0.32%,基本上更多的風險。 不僅沒有戰略弱於大盤,道指狗的時期,但交易成本後,佔風險它顯然會落後於道指的時期。 這個關鍵的問題是在5/14日的報告中簡要討論。 為了把這個問題的角度出發,考慮投資者在1973年開始回頭看道指表現比前24年。 這是難以理順如何,投資者可能知道,當時的愚蠢四會產生市場收益跳動前進。 在另一出樣品測試中,McQueen和索利用在MFIG討論的基礎1973年-1996期間,但使用七月重新平衡,而不是1月 在這些條件下的愚蠢四回報率每年只有2.95%的平均水平,高於12.23%的優勢超過道瓊斯工業平均指數與1月份再平衡大幅度降低擊敗了道指。 在防守狂人,幾個被披露至少MFIG並在網站上進行。 在愚蠢的四個報告,日期為98年8月7日。 他們指出,收益較低時,重新平衡發生在幾個月比其他月份。 此外,在MFIG從二十年期間25.5%的回報率數字是多次使用,但他們至少提的是,他們研究了數回至1961年,並在較長的一段時間,收益下降至18.35%。 另一方面,一旦它公開的是,在較長的時間週期進行了研究,繼續引用更強對該數據當然可以被視為可疑的較短期的號碼和基礎參數。 披露和注重更長期的結果趨向於增加一個數據挖掘的說法的可信度。 賈森·茨威格表達了他的愚蠢四的意見,挖掘分享自己的數據“非常愚蠢”,並從貨幣雜誌虛假利潤“額外阿呆”投資組合(1999年8月)。 在晨星網站上,你也可以讀約翰Rekenthaler在剛剛愚弄各地以及投資顧問威廉·伯恩斯坦認為簡議在一篇題為決定:所有雷區(另見詹姆斯·奧肖內西的反應和隨後進行的辯論) 。 2000年12月,The Motley Fool的宣布,他們不再提倡“愚蠢四國”股票的策略,這是他們所創造。 請參閱重新思考的愚蠢四背後的愚人節不再理建議的策略,他們已經吹捧通過他們的網站和書籍多年。 移動到另一個數據挖掘辯論,威廉·布洛克。 約瑟夫Lakonishok。 和布雷克萊伯龍(BLL)發表於1992年12月版財經雜誌的一篇文章,題為“簡單的技術交易規則與股票收益的隨機屬性”。 這項研究是為數不多的學術論文一是基於技術分析(參見技術異常的文章的完整討論)來記錄一個成功的交易策略。 教授證實,這兩個均線和支撐位和阻力工具都有相對道瓊斯工業平均預測值從1897-1986期間。 數據偵聽,技術交易規則的性能,並且引導是重溫了BLL文件,將出現在金融雜誌的1999年10月版的文章。 在文章中,瑞恩沙利文,阿倫Timmermann和白亥爾波特(STW)試圖確定對BLL結果數據Snooping的效果。 他們還利用從以下原學期間收集的數據,以提供一個徹頭徹尾的樣品測試(BLL數據到1986年,跑了)。 添加提供了整整100年的數據的最近幾年。 STW計算休息的每筆交易0.27%的%為整個期間表現最好的交易規則,即使交易成本的水平。 由於原BLL的數據覆蓋了近90年極長的時間,人們可能預期的策略,在出了樣品的測試表現良好。 但研究的結論最終可能會被用作有效市場假說的另一個潛在的例子。 STW發現“了BLL的結果似乎是穩健的數據窺探。不過,我們也發現了一個未在出樣本的實驗重複了最好的交易規則的優越性能涵蓋的時期1987年至1996年”,並 “有充分證據顯示技術交易規則是期內1987-1996任何經濟價值。” 這可能提供了另一個需要注意的股市數據挖掘與積極的投資者。 即使異常過去曾在一段很長的時間,即使結果似乎並未從數據窺探的缺陷受苦,一旦異常被發現甚至可能停止工作向前發展。 合理的人可以有意見的合理差別,沒有它成為道德或信仰的問題。 處警效率(RR)來自道瓊斯資產管理(5-6 / 99)是一個有趣的文章,討論了數據挖掘和問題“過度擬合。” 包括從投資行業的資深人士大衛·肖的意見。 特德·阿倫森。 和羅伯特·阿諾特。 文章認為,鑑於歷史數據有限的數量和複雜模型的無限多,不知情的投資者可能被誘騙到“過擬合”的數據。 這被假定為系統模式,實際上可能是樣本特異性因此沒有價值和。 人們向我們走來所有與交易策略的時候,據說作出非常大的超額收益。 但是的事情,人們發現,通過數據的大量採用標準的數學工具和篩選絕大多數都是統計假象。 阿倫森認為,市場是“幾乎完全有效的”,“你騙自己,如果你認為你會超過約51%以上的時間52%看透另一個人。” 阿倫森認為,投資者尋找市場的低效率減少從這些異常現象的交易成本,相當於盈利的潛力。 如果是這樣的情況下,最大限度地降低交易成本是在試圖戰勝市場的關鍵。 那麼,有沒有已經證實了的抽樣檢驗任何異常? 在金融雜誌的另一篇文章即將到來,詹姆斯·戴維斯,尤金·法瑪樓。 和Kenneth R. 法國人認為,答案是明確的肯定。 公司以低廉的價格為賬面價值的比率,並跑贏大市的格局已被記錄在美國和國外市場。 在特性,協方差和平均收益:1929年至1997年,筆者去了一大步進一步記錄低價格返回到預定的價值型股票,從1929年到1963年為前期的價值溢價甚至更大(按0.50% 月),比最近的1963年7月,以1997年6月期間(每月0.43%)。 最後,我們曾經真的肯定知道什麼樣的戰略在未來將跑贏大市? 關於這個問題的觀點肯定有所不同,但標準條款適用一如既往。 過往表現並不保證將來的表現。 附加數學討論,包括在櫻桃採摘。 股市詐騙。 和投幣式翻動書頁。 請將意見和建議,以投資家 最後更新時間2001年2月12日。 2001年投資家。 版權所有。 免責聲明 我公司在統計和財務諮詢領域專業的產品服務。 我持有博士學位的統計和斯坦福大學的博士學位輔修金融。 我已經在這個行業工作了四年,重點涉及數據挖掘,因子分析,聚類分析,時間序列分析,隨機波動率模型/資產定價,統計套利/專有交易策略發展等項目。 同樣重要的是,我有六年的財務和統計諮詢經驗。 我曾在市場營銷,醫學,生物學,心理學,社會學,政治學,教育,計算機科學和金融領域的諮詢公司,商務人士,研究人員和學生。 位置上看,我的客戶已經在紐約,波士頓,費城,華盛頓,洛杉磯,舊金山,聖何塞,斯坦福大學,西雅圖,芝加哥,多倫多,蒙特利爾,倫敦,愛丁堡,卑爾根,法蘭克福,科威特城,香港 香港,阿德萊德,墨爾本,悉尼等。 通常情況下,我在曼哈頓見面或通過Skype,電子郵件和電話諮詢,如果客戶端是遠從紐約。 除此之外,我為我的客戶,其可以或可以不要求一個會議做完整的項目。 的服務的例子:在任何主要的統計軟件包(R,MATLAB,SAS,SPSS,Stata的)的數據分析,實驗,定價和交易系統,論文援助的開發,諮詢會議設計,提高基本知識。 請閱讀服務類型的詳細描述。 經驗。 案例研究和付款方式。 除非緊迫性參與,價格為$ 60元每小時的標準項目(回歸,方差分析,勘察設計,非參數檢驗),多用於高科技材料(數據挖掘,聚類分析,面板數據,多元時間序列,隱馬爾可夫模型 ,馬爾可夫鏈蒙特卡羅,貝葉斯模型,GWAS,SAS功能,統計套利/交易策略,異國情調的資產定價,市場風險管理)。 請e-mail給我更詳細的價格信息或其他任何澄清。 consultingstanfordphd



No comments:

Post a Comment