Hot News

首頁 / 時事直擊 / 知識.考點 / 你在大學一定要學的課程—統計學

你在大學一定要學的課程—統計學

文章發表:2024/01/10

許誠哲
  • 國立臺灣大學經濟學博士
  • 現任高點研究所統計學與計量經濟學講師

  • 學科範疇:統計學
  • 關鍵知識:數據分析、統計推論、資料採礦

在最近10年裡,網路大幅度普及化的時代,大家每天花在網路瀏覽的時間越來越長。但無論是逛著拍賣網站、影音串流網站或是討論的論壇,每一個點擊與評論都將留下足跡。這些足跡與紀錄裡均可能包含著重要資訊,例如當今的流行趨勢,或者社會議題的風向,甚至是未來新興產業的發展方向。因此今幾乎每個企業都會投入大量資源聘請專業人才,分析這些資料並萃取出重要資訊。而分析資料最重要的基本知識,便是統計學。

無論未來你在大學裡選擇的領域為何,都可以看到統計學的足跡。

舉例來說,許多科技業(例如,台積電、鴻海)早在10年前就開始成立資料分析部門,蒐集機台的數據並找出影響良率的因子,用以改善製程與降低成本,增加企業利潤。在生技醫療業中,新藥的開發與解盲亦需透過統計學的驗證,證明該藥的療效是具有統計顯著性的,而如何設計實驗過程以確保藥物的有效性,也是生物統計學中的重要課題。而法律的實證分析在近年的能見度也逐漸提升,在法律案例的研究方面也逐漸從質化分析轉換成量化分析,意即利用統計學方法分析過去的案例,作為當前案例的判決依據。政治學中,重要政策的制定也需要背後嚴謹的模型建立,並於確認政策施行與成效的因果關係和政策成效的估計後,方能施行。同樣的,在公司的會計報表中包含的各項目也都可能包含重要資訊,亦需利用統計學分析報表中的資訊與股價報酬之間的相關性。舉例來說,著名的FAMA五因子模型中,即考慮了財務報表中的市值、淨值、獲利能力與投資總額等。此外,在公司發布財務報表當天,股價是否出現異常報酬的事件研究法也是一個熱門的研究主題。最後,在金融與經濟學中,統計學的重要性更是不言而喻。因此,不管高中選取的類組與大學選擇的科系為何,進入大學後,建議都要學習統計學與資料分析來增強該領域的專業知識。

一、何謂統計學?

統計學的應用可分成五個步驟:(一)定義問題;(二)蒐集資料;(三)建立模型;(四)分析資料;(五)決策制定。

舉例來說,有興趣的問題是:「若今天某檔股票上漲,明天該檔股票上漲的機會會比較大嗎?」 此時,我們應先蒐集該股票的歷史股價資料,由於股票價格是公開的資料,因此,此一資料不需付費即可輕易取得。

接著,我們要選取適當的模型描述股票的上漲或下跌。例如,我們可以假設股票的上漲或下跌類似投擲一枚硬幣,假設其出現正面即表示股票上漲,出現反面即為股票下跌,而出現的正面機率是需要進一步估計的,我們可將我們的問題轉化成以下模型:「假設當今天股票上漲時,明天股票的上漲機率為p1;而今天股票下跌時,明天股票上漲的機率為p2,我們想要確認的問題是p1是否大於p2。」

再者,利用統計學中的方法,我們可以對於p1與p2進行估計,並可以統計學的角度,判斷p1是否大於p2。

若我們成功地證明了p1大於p2,則可以做出以下推論:「若今天某檔股票上漲,明天該檔股票上漲的機會會比較大。」因此我們可於該股票上漲時,考慮隔天繼續持有(或者購買)該股票,以追求更大的利益。

當然,隨著有興趣的問題不同,則蒐集的資料、選取的模型與分析的方法都會不同。除了股票價格以外,還有其他更多有趣的問題。例如「大學的畢業科系不同,之後就業的平均起薪是否不同?」或者「在大學畢業之後,選擇唸碩士與直接就業,在10年之後的總收入是哪個何者較高?」而這些問題,統計學都有辦法回答。

二、統計學是大數據嗎?何謂大數據?

有些人認為,統計學或資料分析即是現在流行的用語「大數據分析」。對於任何議題,開口便是「你有沒有進行大數據分析?」因此同學對於「大數據分析」這個詞彙可能會感到既熟悉卻又遙不可及。事實上,數據的大小並沒有絕對,主要取決於現今硬體設備可以處理的極限。舉例來說,在30年前幾乎可稱作是大數據,因為當時的電腦快閃記憶體與硬碟容量不大,CPU的處理能力也較差。因此處理1萬筆資料就已經需要當時的超級電腦,並透過優化演算法才有辦法分析。但隨著科技進步,現今1萬筆資料甚至利用手機就可以進行運算與分析。而隨著資料蒐集愈來愈容易,現今的資料數量有著爆炸性的成長。舉例來說,臉書與臺大經濟系資料分析學程的專案中,釋出的檔案為PB級的資料。常見的筆電容量大約是512 GB,而1 TB大約是1000 GB,1 PB則大約是1000 TB。然而,這樣大小的資料當然無法全部讀進單一電腦中,需要一點演算法與技巧才有辦法對其中的資料進行分析。不過,無論數據的大小,分析資料的方式與邏輯都是相同的。

三、學習統計學的必經之路

令人聞風喪膽的商學院三大必修課程—經濟學、會計學與統計學當中,以統計學對於數學的要求最重。統計學除了常見的微分以外,更有著積分(事實上,統計學微分的應用比積分要少得多)、代數運算、累加符號和連乘符號充斥在統計學的課程當中。而在一類組的科系中,課程注重於個案分析,而分析方法大多是質化分析,缺乏量化分析的科學證據。因此會使學生傾向放棄量化分析,而轉向需要口才的質化分析。然而,只有理解每個統計學方法的數學原理,才可以在不同的情境當中選擇最適合的模型。事實上,若在避開數學的情況下學習統計學,只能知道在固定的框架下應該如何應用,但若是在遇到比較創新的情境下,就會缺乏開發新方法的能力。因此建議還是在理解數學原理的前提下進行學習。故修習統計學之前,其前導課程「微積分」對於一類組的同學是非常必要的。事實上,相較於高中數學,微積分中的數學在統計學的應用事實上是簡單許多的,因此只要拿出高中時期付出的一半努力,這樣的課程是難不倒各位的。在二、三類組的科系當中,由於大多數的課程都有數學方面的訓練,因此在學習統計學時通常不會遇到什麼困難。但在學習完之後,由於系所較少針對個案的分析邏輯進行訓練,往往擁有一身好功夫卻不知該如何應用。因此筆者建議,除了修習統計學,也應修習「經濟學原理」的課程加強模型建立與邏輯分析,以及「計量經濟學」加強統計學在實際資料的應用方式。

四、經濟學、會計學與統計學的跨領域結合

在現在的社會中,由於各個領域之間的合作相當常見,因此相較於專精於單一領域的專才,業界更需要的是對於多個領域皆有涉獵的通才。而經濟學與會計學,與統計學的結合應用相當常見。而財金實務上,在建構投資組合或擬訂交易策略時,通常不會只依靠純粹的技術分析,大多會搭配經濟理論或模型建構交易策略,或者根據最近的總體經濟面調整手中的投資組合,再利用統計學方法對於投資組合進行分析與權重調整。近年來,利用實際的資料去整理並分析目前會計準則是否有調整的空間,亦為重要的研究方向。同理,在分析公司股價時,除了該公司產業的未來性以外,目前的營運狀態,則可透過財務報表得知。事實上,在財務管理的領域中,無論是統計學、會計學或者經濟學的應用都相當廣泛。因此,如果在就業市場想增加自己的競爭力,對於統計學、會計學與經濟學都需要有相當深度的理解。

五、統計學考題範例

以下舉兩個偏向生活應用的統計考題範例。


釋例1


✦解析

根據題目所提供的資訊,可得到下表:


釋例2


✦解析

以卡方適合度檢定之。可計算得知資料之樣本數為120,將資料整理過後可得出下表:


由以上可看出,這些情境都是在生活中可能會遇到的,而這都是可以利用統計學加以解決的。

六、結語

在現今的產業中,無論是哪一個領域,注重的是應用實際的資料作為下決策的依據。因此除了領域的專業知識以外,也需要統計學的相關知識。雖然在學習過程中,統計學帶給同學的挫折感比較大,但是對於未來的幫助卻也是非常巨大的。因此筆者認為,在大學的課程當中,同學可以投入大量的時間去學習統計學。希望這篇文章,能夠提供同學理解到統計學的基本概念與重要性。

^