作者:資管小生
來源:資管觀察(ID:xintuoguancha)
投資的重要基礎在于對市場態勢有更深刻的認識或者深邃的洞見,從而捕捉更好的投資機會。這種投資的優勢建立在很大程度上源于數據的支撐,要么基于現有數據進行獲得更不一般的發現或者認知,要么基于別人沒有的數據更先人一步知曉未來。對于前者來說,難上加難;對于后者,隨著監管的嚴格和信息披露的規范,投資者之間的信息不對稱程度越來越低,市場越來越有效,所有近年來股票指數基金大行其道。不過,近年來另類數據的興起似乎可以幫助投資者強化數據優勢,提升創造α的能力。
什么是另類數據?
另類數據與傳統數據相區別,也就是說另類數據并不來源于政府部門公布的數據或者上市機構的定期財務報告,從這個意義上看,投資者機構現在所使用的絕大部分數據都為傳統數據。另類數據本身是一個相對的概念,隨著另類數據的普及,其稀缺性不強后,就可能成為傳統數據;有些數據對于這家投資機構可能是另類數據,但是對另一家投資機構而言可能不是另類數據,因此是否為另類數據也要取決于數據的使用目的。從另類數據特征看,一是另類數據多是非結構化的,在整合和處理方面存在難度。二是另類數據多是未經過驗證,數據可靠性本身保證程度不高。三是另類數據所可能應用的范圍較低,部分數據僅可能反映了一部分個人或者企業活動。
目前,并沒有對于另類數據的權威定義或者分類,一般而言,另類數據主要包括社交網站信息、信用卡交易信息、定位信息、衛星圖片等,所涵蓋的領域較為廣泛。根據摩根大通的分類,按照來源劃分,另類數據主要包括個人類數據、商業活動類數據、監測類數據,個人類數據主要包括個人社交、網絡搜索、其他網絡活動數據;商業活動類數據主要包括商業交易數據、企業活動數據等;監測類數據主要包括衛星數據、定位數據等。
另類數據的興起主要與社會行為互聯網化、數據化以及數據分析技術成熟兩個因素具有很大關系。一方面現代社會信息技術日漸發展,諸如網民越來越多,智能手機使用更為普及,商業活動可檢測性越來越強,這些都會產生大量數據資源,IDC預測2020年全球數據量增速有望達到44%,我國數據量約占全球的20%,這些數據資產為洞見社會經濟活動提供了有益的窗口,成為寶貴的社會財富。另一方面,數據本身并沒有什么特別意義,而需要工具從中開發寶藏。現代數據分析技術日漸成熟,大數據模型、人工智能等日漸應用廣泛,相當于有了開發數據利器,幫助我們從而發現新的世界。
隨著另類數據需求的增大,另類數據行業蓬勃發展,全球另類數據提供商約為500家,自2005年后呈現快速增長態勢。這些數據商可提供原始另類數據,對于原始數據進行加工處理,提供數據深度分析和策略咨詢等服務,幫助投資機構成功利用另類數據捕捉投資機會。
圖1:全球另類數據提供商數量增長趨勢
為什么使用另類數據?
自本世紀開始,有關另類數據與資產管理的相關文獻逐步增多,諸如關注資產價格與社交網站情緒的相關性等文獻的出現,為對沖基金提供了探尋市場投資的新機遇。對沖基金以市場套利、尋求錯誤定價等為交易策略,獲取超額回報。尤其是近年來,對沖基金投資業績日漸平淡,投資者滿意度下降,資金流入壓力增多,另類數據為對沖基金提升α提供了新思路,根據LS調查,約80%的對沖基金已經使用了另類數據,約42%的對沖基金已經深度使用了另類數據,不僅如此,近年來公募基金、PE機構都在開始使用另類數據,早在2015年貝萊德就曾指出,若想獲得可持續的α,資管機構必須不斷使用包括另類數據的在內的大數據。
那么另類數據到底能夠為資管機構創造哪些價值呢?其價值最主要體現在發現市場新機遇、強化投研能力。一方面,另類數據提供了資管機構掌握市場動向的機會,可以領先一步,形成市場競爭優勢,提前布局,提高創造α的能力。諸如,超市類上市公司一般披露業績較晚,之前都是根據超市停車場車輛判斷購物人群數量,進而推測超市業績,現在更多使用衛星圖像進行分析。再如,美國某機構根據特斯拉工廠的手機信號推斷汽車生產數量,提早預判其汽車產量。有利這些另類數據,在可以提早制定投資策略。不過,隨著另類數據的更廣泛應用,另類數據所能夠賦予資管機構的這種領先優勢持續時間存在問題,而且有時候另類數據質量可能存在問題,也無法幫助資管機構獲取超額收益。另一方面,另類數據能夠幫助資管機構更加深入地了解企業、行業和市場,提供了基本面研究的交叉驗證和佐證。諸如渾水作為知名做空機構,其在盡調過程中,通常會使用另類數據,進一步驗證上市企業對外披露的業績數據。根據調查,90%以上的對沖基金機構都是將另類數據與原有的研究相結合,提高投研能力,夯實投資策略,提高獲取可持續α的能力。
調查數據顯示,75%的對沖基金應用另類數據更加深入地分析特定行業或者領域,68%的對沖基金希望另類數據能夠為現有研究提供支撐,57%的對沖基金希望通過另類數據形成獨特的投資策略。不過,不同規模資管機構對于另類數據的應用側重點有所區別,諸如管理規模為50億美元以下的對沖基金更多希望借助另類數據加強行業和投資對象研究,而管理規模為50億元美元以上的對沖基金則更多希望利用另類數據形成獨特的投資策略。
雖然另類數據的廣泛應用,對沖基金相關投入在不斷增大,統計數據顯示資管機構另類數據采購相關支出到2020年可能達到17億美元。不同資管機構支出規模有所差異,管理規模小于10億美元的資管機構2020年支出規模預計約為16萬美元,管理規模在10-100億美元的資管機構支出規模預計約為76萬美元,管理股民大于100億美元的資管機構相關支出預計約為400萬美元。對沖基金未來另類數據支出增速在10%以上的占比達到89%。可見,雖然對沖基金當前仍面臨較大的業績壓力和營收壓力,但是對于另類數據的支出依然保持較快增長,也是隱含了對于另類數據價值的認可和期許。
圖2:資管機構另類數據采購支出
如何用好另類數據?
另類數據具有較大價值,但是用好另類數據,加強相關風險管理并沒有達成一致,這也是資管機構最為擔憂之處。
如何選擇另類數據?一般而言,資管機構的數據既可以自行累積,也可以通過外采實現,二者各有利弊,調查顯示,管理規模越小的對沖基金機構自行累積的占比越高,這可能在于節省支出的考慮,不過自行累積和外部采購相結合仍是當下資管機構首先采取的策略。解決了數據來源的問題,那么接下來就是看下在多種多樣的另類數據分類中,該使用何種另類數據了。目前,對沖基金使用頻率最高的是信用卡交易等個人交易數據,占比為78%,其次為社交信息,占比為67%,云平臺信息和APP使用信息占比分別為59%和56%,定位信息和衛星圖片使用量并不高,占比分別為43%和21%,是所有另類數據中應用頻率較低的。另類數據使用廣泛度與數據質量和應用場景有很大關系,調查數據顯示,最精確的另類數據排名前兩位的是信用卡數據和網頁抓取信息,而最不精確的另類數據排名前兩位的是定位信息和衛星信息。
如何建立另類數據管理流程?使用另類數據的難度要大于傳統數據,因此資管機構首先需要明確另類數據戰略目標。首先是要明確另類數據應用范圍,如何配合現有投研體系,而不是眉毛胡子一把抓,另類數據也只是工具,配合做好投資決策,這也是使用另類數據的重要前提。其次是建立另類數據的管理流程,包括數據清洗、數據挖掘和分析、數據可視化、基于另類數據的投資信號和投資策略,從而實現完成的管理流程鏈條,如果沒有可靠的內部管理,另類數據的價值和發揮作用可能大打折扣,甚至可能適得其反。最后,就是做好使用另類數據的人才儲備和資源投入。另類數據的復雜性,需要配備專業的數據分析師、數據挖掘師,這部分投入是繼數據采購投入之外的,另外很大一塊投入。隨著另類數據的廣泛使用,數據分析師、數據工程師數量呈現爆發式上漲,相關人才缺口不斷增大。
圖3:另類數據崗位人才數量趨勢圖
如何管理好另類數據使用風險?另類數據應用還不成熟,不僅體現在技術方法上,還體現在監管和法律法規上。根據對沖基金調研反饋,普遍對于數據保護和數據管理風險感到憂慮。數據保護方面,目前大量另類數據涉及個人信息數據,目前美國、歐盟都在加強對于個人隱私數據的保護,相對另類數據的使用構成抑制。2019年,我國多個公司涉及利用爬蟲技術獲取個人信息而觸及法律底線,充分值得重視,未來資管機構需要充分保障所使用的數據來源依法合規。另一方面,另類數據需要借助復雜的信息科技技術進行處理和建模,這其中存在較高的操作風險和模型風險,操作風險來源于相關人員能力不足或者故意竊取商業數據;而模型風險來源于在數據挖掘、數據建模過程中導致的錯誤,進而可能形成最終投資決策的偏差。
注:文章為作者獨立觀點,不代表資產界立場。
題圖來自 Pexels,基于 CC0 協議
本文由“資管觀察”投稿資產界,并經資產界編輯發布。版權歸原作者所有,未經授權,請勿轉載,謝謝!