首頁 > 課程簡介
- 研習期間必須自備筆電
- 預備課程(7月1日~7月3日)
- 機率統計課程入門(1.5天)
黃文璋 教授(國立高雄大學應用數學系、統計學研究所)
由於生活中充滿著隨機性,因此人們常需對現況做推測,或對未來做預測。這些推論如何產生?擲筊?藉助水晶球?雖可有各種推論方式,但科學的推論,便得仰賴數據,所謂數據會說話。利用統計方法,先收集資料,加以整理及分析,然後給出推論。
對於隨機現象,即使用的方法很好,推論仍不易次次準確,也難以保證預測的誤差必有多大。一般人受數學的薰陶較久,數學思維根深蒂固,因而初學統計,對很多概念便常感到迷惑。數學中常在證明,從給定前提下,推導出結果;而統計則是由結果,來判定前提是否可接受。運用統計,通常不是在證明那件事必然是對的。在隨機世界裡,一切都是假設,只是看那一假設可接受即使接受某一假設,真相為何,仍屬未知。另外,數學中所得結果往往為斬釘截鐵式的,而統計裡所給乃允許誤差下的機率式保證。隨機性的特質,使統計在理解層次上,並不易掌握。因而在實際應用時,由於未具備數據素養,常未能讓統計的功能充分發揮,甚至誤用,使數據說錯話。
在本課程中,將闡釋隨機性的概念,並介紹一些基本的統計思維。
- R 軟體操作(1.5天)
吳漢銘 教授(淡江大學數學系資料科學與數理統計組)
舉凡日常的機率統計問題,例如:算機率值、統計參數估計、假設檢定及模型配適等等,除了需要理論証明推導之外,也需以程式做數值的模擬與驗証。而R語言正是研究者分析資料及執行統計模擬不可或缺的工具之一。R具有免費,開放源碼及學習資源豐富的優點。而其功能可透過套件增強。在經濟計量、財經管理、人文社會科學研究以及人工智慧等等領域已有大量的應用。隨著近期巨量資料(Big Data)浪潮興起,R對大數據採礦強大的分析功能更成為數據科學領域裡,最受歡迎的程式語言。本課程開課之前,需請學員自行先預習演練「R語言統計計算環境介紹及物件基礎」和「資料的輸入與輸出」教材內容。課程三天主題為: (1) R函式編寫, (2) 統計圖形及資料視覺化及(3) 統計模擬和一些R應用主題。
- 核心課程(7月6日~7月10日、7月13日~7月17日)
- 社會網絡(Social Network)(2.5天)
黃景祥 教授(中央研究院統計科學研究所)
潘建興 教授(中央研究院統計科學研究所)
劉維中 教授(中央研究院統計科學研究所)
顏佐榕 教授
(中央研究院統計科學研究所)
王泰期 博士(中央研究院統計科學研究所)
翁章譯 博士(中央研究院統計科學研究所)
楊巧意 博士(中央研究院統計科學研究所)
內容包含社會網絡分析常用方法的介紹和實際資料分析。首先介紹網絡的基本定義、構造和特性,如何從點與點的關係量化點的位置以及其重要性,如何把點分群來簡化網絡和不同網絡生成的機制。藉由一些經典例子介紹社會網絡分析的用處和特性,例如人際間同質性現象、策略聯盟、資訊的擴散。接著引進一些基本的網絡概念、模型和統計方法,例如網絡結構、中心性、群聚係數、網絡基序和最小世界模型等。學員也將分組參與建立和分析個人接觸日記的網絡資料。
- 生物資訊(Bioinformatics)(2.5天)
李克昭 教授(中央研究院統計科學研究所)
謝叔蓉 教授(中央研究院統計科學研究所)
楊欣洲 教授(中央研究院統計科學研究所)
袁新盛 教授(中央研究院統計科學研究所)
陳璿宇 教授(中央研究院統計科學研究所)
蔡志鑫 教授(中央研究院統計科學研究所)
隨著分子生物技術的快速發展,新穎的生物技術產生的大量數據,衍伸出複雜的資料分析問題,生物資訊學則為解決此複雜大量數據所沿生出的方法。在本課程中將邀請各領域專家介紹現代生物技術,並以其在農業、公共衛生、癌症醫學以及神經醫學領域上的應用,期望讓大家可以了解這些新科技的最新發展與應用以及生物資訊學如何解決大量數據在上述領域的問題,最後,期望大家了解生物資訊學的發展如何改善現代人類的生活。
- 統計在醫療照護研究的應用(Statistical Applications to Healthcare Research)(2.5天)
郭年真 教授(國立台灣大學健康政策與管理研究所)
陳君厚 教授
(中央研究院統計科學研究所)
陳珍信 教授(中央研究院統計科學研究所)
張源俊 教授
(中央研究院統計科學研究所)
程毅豪 教授(中央研究院統計科學研究所)
歐陽智聞 博士(中央研究院統計科學研究所)
我國實施全民健康保險剛屆滿二十年,加上對重大疾病的臨床診療、社區篩檢等研究,已累積巨量的健康照護資料庫。本課程將簡介這些重要的資料庫、新興的健康照護跨領域研究課題、及統計科學應用於健康政策、醫療照護上的研究;進而在大數據的架構下,演練互動式與視覺化的探索式資料分析,展現矩陣彩色視覺化環境之GAP廣義相關圖。並將從不同的醫學研究類型,淺談統計科學的基本概念。再由類別資料分析的觀念,介紹邏輯式迴歸分析,討論此模型在現代分類問題上的應用,以及序貫分析結合此模型的一些應用。對於串連診療資料而成的個人醫療史,我們將探討存活資料分析與多狀態病程的研究方法。最後將展示整合健康資訊之雲端系統雛型,來說明如何透過新一代的資料庫管理工具,運用資料視覺化環境,以整合統計理論、模型及方法在全民健康保險及其他相關資料的應用,以達成將統計科學更深入應用於健康政策、健康照護、健保財務、流行病學及預防醫學研究的願景。
- 實驗設計和分析(Design and Analysis of Experiments)(2.5天)
鄭清水 所長(中央研究院統計科學研究所)
林共進 教授(美國賓州州立大學統計所)
鄭少為 教授(國立清華大學統計學研究所)
潘建興 教授(中央研究院統計科學研究所)
林遠隆 博士(中央研究院統計科學研究所)
周仕鎧 先生(中央研究院統計科學研究所)
張菱軒 小姐(中央研究院統計科學研究所)
黃昭惠 小姐(中央研究院統計科學研究所、國立台灣大學數學系)
在很多科學研究和工商業應用裡,都需要進行不少的實驗。一個高效率的實驗需要特定的設計,而一個經過最優化設計的實驗也需要正確的分析。本研習向學員完整地介紹實驗設計和分析,內容包括:
一、實驗設計簡史:以輕鬆的方式帶領學員參訪實驗設計的發展過程;
二、初級設計師的實驗設計指南:向學員介紹不同類型的實驗和設計的特性;
三、實驗設計的工業應用:由經驗豐富的教授分享在不同公司擔任顧問時如何實際地應用實驗設計來解決不同的工業問題;
四、實驗分析有獎競賽:各學員以比賽的方式來分析一組有趣的實驗資料,並有大獎來獎勵最佳的一組學員;
五、實驗設計研究的成功經驗談:由前一期統計研習營的優秀學員來分享在研習營後加入研究小組做實驗設計研究的成功經驗;
六、實驗設計和分析的遠景:特別邀請美國講座教授來向學員分享學習實驗設計和分析的重要性,和剖析工商業界對實驗設計和分析的需求等。