做投行、行研、咨詢等金融崗位,有沒有什么好用的找數據技巧呢?
01如何找官方的數據來源?
找到了數據,卻沒法找到來源,而數據不能使用的時候?數據說法不一,而沒有一個官方的來源,無法抉擇的時候?
這兩個問題有些類似,我們都是需要找到一個權威的官方來源。
股票基本面財務數據:
當然最正統的來源是上市公司的年報:美股:SEC.gov | Home港股:
上交所:上海證券交易所
深交所:深圳證券交易所
更方便獲取年報的網站應該是巨潮資訊網,當然單間公司也可以到公司的官網去下載。一般上市公司網站都有相關欄目。一般叫“投資者關系”。
官方經濟數據:
美聯儲:Board of Governors of the Federal Reserve System統計局:中華人民共和國國家統計局
石油:
OPEC:OPEC : Home
(OPEC每月都會發布月度報告,這也是很多新聞的來源)倫敦貴金屬交易所:London Metal Exchange: Home
(倫敦金等)
外匯:
國家外匯管理局
這類數據來源有很多,大同小異,就不再花時間堆鏈接了。
關鍵詞:方法找來源的方法很簡單,姑且叫它“關鍵字溯源法”吧。
其 實就是從財經新聞中尋找那些關鍵字,然后在搜索引擎上尋找它的網站。除去一些偽相關等無意義的財經新聞外,一些新聞是由專業的財經記者寫的,一些是引用一 些業內著名人士的分析的,還有一些則是翻譯外國的一些文件或新聞。在這些新聞內容中,多多少少會有一些機構組織名稱(通常是英文名)是容易被我們忽視的, 而這些恰恰是關鍵信息來源,甚至比你看的新聞更加客觀。這是一個很久以前的可能不起眼的新聞,以它為例子:
2014年全球十大黃金生產商排名
文中列出了十大黃金礦商的產量(這里暫且不論新聞的真實性,如果需要驗證的話,可以到相應國家的股市上看或在Google上查詢一下,再嚴格點可以深入各個公司的年報細看),這里提供了大量的信息:
1. 十大黃金礦商的名稱;
2. 數據來源(左下角GFMS)。
Then,搜索一下GFMS。
于是,我們得知了它是全球領先的會金屬咨詢公司,如果還不放心數據的真實性(畢竟這是二手數據了),我們可以直接搜索公司的名稱,年報是最標準不過的了。
比如搜索Goldcorp,進入其官網下載年報打開,所有的信息一目了然。
在這幾百頁的PDF里,你看到的就不僅是產量這么簡單了。包括維持成本(All-in sustaining costs)等等。你也可以對它們進行整合得出數據:
如果對大宗商品感興趣,從這方面入手也是一個切入點,也可以看看外國企業開采黃金的成本等等。可以作出一些調研分析。對于行研有一定的幫助。
如果你對看到的新聞追根溯源,能夠發現很多對分析有用的東西,比如美國能源署EIA2015展望(現在已經2016了)
有很多有意思的東西可以去被挖掘。
02數據找不到,如何繼續闡述問題?
有些數據就是找不到,不知道如何闡述某個問題的時候?
有些數據的確是找不到的,這時候就需要自己預測了。最常用的方法就是利用計量經濟學的方法建立經濟模型,根據已知的因素進行線性回歸分析,進一步去預測某些數據。
之前見過一個人,在投行工作期間研究高速公路上市公司,需要未來幾年計劃鋪設的公里數,有些政府網站會提供相關數據,但是有些政府網站并沒有提供,網上也沒 有任何相關數據。最終他根據幾個已知的數據,比如歷史鋪設的公里數、GDP增長率等等自己建立了一個經濟模型進行預測,結果據說還挺準確的。
比較常用的統計軟件就是Eviews、SPSS這些了吧。涉及到的具體問題比較復雜,也需要根據具體問題來分析。
03一個數字標題
有些數據明明就有,卻來自于某些咨詢公司,標價動不動就是上千!
現有的數據庫往往太貴,一般人承受不起。所以當一些數據可以從網頁上獲取得到,卻沒有相應的接口時,就需要用爬蟲了。
Excel
Excel可以選擇復制粘貼的方式,但效率較低,且無法更新。所以在Excel中調用數據是更為明智的做法。
具體做法是:
在網上找到想要的表格數據
復制網站,打開Excel,選擇數據-自網站
在彈出框的地址欄中輸入網址,進去后,在需要的表格左上方會有黃色的框黑色的箭頭,點擊便是選中表格。
選中后點擊導入就可以了。