2024 研究主題清單 (Research List)

Updated 2024.04.22(持續更新中)

連結
主持人(PI) 研究主題(Research Topic) 研究介紹(Introduction) 其他資訊(Other Information) 參考網頁
潘建興
Frederick Kin Hing Phoa
1.實驗設計和分析
2.大型網路資料分析
3.最佳化程序方法和應用
4.環境, 能源和交通大數據分析
1.Design and Analysis of Experiments
2.Analysis of Large-Scale Network Data
3.Optimization: Methods and Applications
4.Big Data Analytics in Environments, Energy and Transportation
我的研究小組旨在為有興趣應用統計和數據分析技術來解決尖端現實問題的學生提供第一手經驗的暑期實習機會。下列包括一些適合學生在兩個月內展開並獲得足夠研究成果的潛在主題。
1.實驗設計與分析:
(a) 設計臨床試驗的實驗。 (b) 設計網路調查或廣告實驗。 (c) 設計人工智慧和機器人測試實驗。 (d) 分析生物醫學診斷的實驗數據。 (e) 分析功能性磁振造影 (fMRI) 的實驗數據。
2.大規模網路數據分析:
(a) 研究真實網絡的網絡演化機制。 (b) 在大規模網路中有效地偵測社群。 (c) 有效地搜尋網路週期以偵測洗錢行為。 (d) 分析世界上最大的引文網絡 Web of Science。 (e) 在 3D 球面中繪製網路以達到平均節點分配。 3.優化方法及應用:
(a) 開發新的混合最佳化技術。 (b) 優化物流業配送路線。 (c) 優化超級電腦設施的任務調度。 (d) 開發高效率的翻譯器來解碼加密訊息。 (e) 在給定的平面圖中有效地分佈監視系統。
4.環境、能源與交通大數據分析
(a) 透過網路時間序列聚類分析空氣污染(PM 2.5)空氣箱大數據。 (b) 透過網絡時間序列聚類分析地下水變化大數據。 (c) 優化區域能源消耗結構。 (d) 最佳化包含可能人為延誤的火車/公車時刻表。 (e) 優化共享單車配送路線和站點分配。
本次實習機會開放給各層級的學生(學士、碩士、博士),工作內容依參與學生的程度進行調整。在這兩個月內,學生將與我進行文獻討論,然後在我的指導下開始研究主題。成果優良的學生會收到繼續參與研究的邀請,並會以產生足夠結果來在國際期刊上發表的為最終目標。
我們鼓勵所有有興趣參加本研究小組暑期實習的學生以電子郵件方式向我獲取進一步的說明和詢問。

The summer internship in my research group aims at providing first-hand experience to students who are interested in applying statistical and data analytics techniques to solve cutting-edge real-world problems. The following list includes some potential topics suitable for students to work on and obtain adequate research results within two months.

1. Design and Analysis of Experiments:
(a) designing experiments for clinical trials. (b) designing experiments for network surveys or advertisement. (c) designing experiments for AI and robotics testing. (d) analyzing experimental data from biomedical diagnosis. (e) analyzing experimental data from functional magnetic resonance imaging (fMRI).

2. Analysis of Large-Scale Network Data:
(a) studying the network evolution mechanism for real networks. (b) detecting communities efficiently in large-scale networks. (c) searching for network cycles efficiently for detecting money laundry. (d) analyzing the world's largest citation network, the Web of Science. (e) drawing the networks in 3D spherical surfaces with uniform node allocations.

3. Optimization: Methods and Application:
(a) developing new hybrid optimization techniques. (b) optimizing delivery routes for logistic industry. (c) optimizing task schedule in supercomputer facility. (d) developing an efficient translator for decoding encrypted messages. (e) developing an efficient surveillance system in a given floor plan.

4. Big Data Analytics in Environments, Energy and Transportation
(a) analyzing air pollution (PM 2.5) big airbox data by network time series clustering. (b) analyzing underground water variation by network time series clustering. (c) optimizing regional energy consumption scheme. (d) optimizing train/bus schedule with potential human delay. (e) optimizing share-bike delivery route and stop allocations.

This internship is open to students at all levels (bachelor, master, doctoral), and the work content is adjustable according to the level of the participating students. Within these two months, the students are expected to have literature discussions with me, then start to work on the research topic under my supervision. Students with excellent results will receive an invitation to continue participating in research, with the ultimate goal of producing sufficient results to be published in an international journal.

All students who are interested in participating in my research group's summer internship are encouraged to email me for further clarifications and enquiries.
  PI 個人首頁(PI's Information):
http://staff.sinica.edu.tw/fredphoa
Email: fredphoa@stat.sinica.edu.tw
陳君厚
Chun-houh Chen
健康大數據在精準醫療與智慧健康的應用
Analysis and application of big health data in precision medicine and smart health
參與智慧健康研究團隊(陳君厚博士和楊欣洲博士聯合指導),學習統計學習、機器學習、深度學習的方法與技巧,實際分析醫學影像、基因資料、環境暴露、就醫記錄、人口統計等大數據,開發資料科學與人工智慧的自動化方法,進行特徵擷取、疾病分型和診斷、病變分割與偵測、風險評估和預測等。
In this summer internship (under the joint supervision of Drs. Chun-houh Chen and Hsin-Chou Yang), you will join our research team ("Smart Health") to learn methods and techniques of statistical learning, machine learning, and deep learning. You will apply these methods to the practical analysis of big health data, including medical images, genetic data, environmental exposures, medical records, and demographic statistics. Additionally, you will gain knowledge in developing automated approaches in data sciences and artificial intelligence, focusing on feature extraction, disease classification and diagnosis, lesion segmentation and detection, as well as risk assessment and prediction.
要求:(1)對統計資料科學、人工智慧、精準醫療、智慧健康、醫學影像、電腦視覺處理、生醫訊號處理、大語言模型等充滿熱情。(2) 喜歡實際資料分析與研究。
Requirements: (1) Passion for statistical data sciences, artificial intelligence, smart health, medical imaging, computer vision, biomedical signals, and large language model; (2) Interest in real data analysis and research.
1. 研究室網頁 Lab website:https://gap.stat.sinica.edu.tw/
2. 研究群網頁 Research group website:https://sites.stat.sinica.edu.tw/SH/
楊欣洲
Hsin-Chou Yang
健康大數據在精準醫療與智慧健康的應用
Analysis and application of big health data in precision medicine and smart health
參與智慧健康研究團隊(陳君厚博士和楊欣洲博士聯合指導),學習統計學習、機器學習、深度學習的方法與技巧,實際分析醫學影像、基因資料、環境暴露、就醫記錄、人口統計等大數據,開發資料科學與人工智慧的自動化方法,進行特徵擷取、疾病分型和診斷、病變分割與偵測、風險評估和預測等。
In this summer internship (under the joint supervision of Drs. Chun-houh Chen and Hsin-Chou Yang), you will join our research team ("Smart Health") to learn methods and techniques of statistical learning, machine learning, and deep learning. You will apply these methods to the practical analysis of big health data, including medical images, genetic data, environmental exposures, medical records, and demographic statistics. Additionally, you will gain knowledge in developing automated approaches in data sciences and artificial intelligence, focusing on feature extraction, disease classification and diagnosis, lesion segmentation and detection, as well as risk assessment and prediction.
要求:(1)對統計資料科學、人工智慧、精準醫療、智慧健康、醫學影像、電腦視覺處理、生醫訊號處理、大語言模型等充滿熱情。(2) 喜歡實際資料分析與研究。
Requirements: (1) Passion for statistical data sciences, artificial intelligence, smart health, medical imaging, computer vision, biomedical signals, and large language model; (2) Interest in real data analysis and research.
1. 研究室網頁 Lab website:ttps://staff.stat.sinica.edu.tw/hsinchou/
2. 研究群網頁 Research group website:https://sites.stat.sinica.edu.tw/SH/
彭健育
Chien-Yu Peng
衰變分析與最佳實驗計畫
Degradation analysis and optimal test plans
實習內容將針對衰變分析與最佳實驗計畫為主,詳細內容請參考 PI 近年文章。 有興趣者請嘗試底下題目,在申請截止日(3月18日)前寄到chienyu@stat.sinica.edu.tw,信件主旨請寫上Summer Intern 2024-你的姓名。
The summer intern content will focus on degradation analysis and optimal test plans. For details, please refer to PI's recent articles. If you are interested, please try the following exercises and send them to chienyu@stat.sinica.edu.tw before the application deadline. Please write 「Summer Intern 2024-your name」 as the subject of the email.
附件:題目 PI個人首頁(PI's Information): https://staff.stat.sinica.edu.tw/chienyu/
Email:chienyu@stat.sinica.edu.tw
顏佐榕
Tso-Jung Yen
  本實驗室主要研究項目如下:
1. Interpretable models for medical AI
2. Generative models for science, e.g. denoising diffusion probabilistic model, flow-matching
3. Risk control for deep neural networks, e.g. conformal prediction
4. Fewshot learning from small data
本實驗室主要計算資源如下:
1.工作站:Nvidia RTX A6000 x 4,Nvidia RTX5000 x 4
2.個人電腦:Nvidia RTX3080,Nvidia RTX2080Ti
3.雲端運算:Amazon Web Service (NT$600,000 quota)

We aim to develop:
1. Interpretable models for medical AI
2. Generative models for science, e.g. denoising diffusion probabilistic model, flow-matching
3. Risk control for deep neural networks, e.g. conformal prediction
4. Fewshot learning from small data
Our computational resources include:
1. Workstation: Nvidia RTX A6000 x 4,Nvidia RTX5000 x 4
2. PC: Nvidia RTX3080 x 2,Nvidia RTX2080Ti x 2
3. Cloud computing: Amazon Web Service (NT$600,000 quota)
工作內容:
1.程式撰寫 2.報告撰寫
應徵資格:
1.孰悉Pytorch。 2.孰悉Chatgpt或是其他大型語言模型的應用。

The job content involves:
1. Programming
2. Report writing
Applicants should know how to use:
1. Pytorch,
2. Chatgpt.
PI個人首頁(PI's Information): https://sites.stat.sinica.edu.tw/tjyen/
Email:tjyen@stat.sinica.edu.tw
謝叔蓉
Shwu-Rong Grace Shieh
精準醫療
Precision Medicine
我的團隊發展統計、機器學習等計算方法,分析基因組數據、基因表現和組學(omics)數據、生物資料庫或健保資料等大數據,應用於預測癌症患者的對化療/標靶藥物反應,並發現免疫治療(immunotherapies)的生物標記 (biomarkers)。實習生透過學習上述方法與實際分析數據參與計畫。
My team develops statistical, machine learning and AI methods to analyze genomics (DNA) data, gene expression (mRNA) and other omics data to predict drug responses to chemo-, targeted- and immuno-therapies of cancer patients, and conduct survival analysis to find biomarkers, etc. Additionally, we shall analyze data of large biobanks.
應徵資格 : 歡迎 (1)對統計資料科學、人工智慧、或精準醫療具熱情 (2)會程式設計(R or Python),具統計、資工、應數…等相關科系的大四及以上學生加入。畢業後計畫深造尤佳。
應備文件 : 履歷表、自傳、大學(及研究所)成績單、及推薦人1位。
Qualification : (1) passionate about statistics and data science and analysis of real data, (2) fluent programming in R, Python or other scientific software; senior undergraduate students or above in Statistics,
PI個人首頁(PI's Information): https://staff.stat.sinica.edu.tw/gshieh/
Email:gshieh@stat.sinica.edu.tw
張馨文
Hsin-wen Chang
協助發展統計及機器學習方法
Help develop statistical and machine learning methodology
本研究室發展分析生醫資料之統計及機器學習方法,以處理包含穿戴型裝置、臨床試驗、分佈飄移所產生的資料。
This lab develops statistical and machine learning methodology for analyzing various types of biomedical data, including functional data such as wearable device data, clinical trial data with time-to-event outcomes, and data with distribution shift.
應徵資格:
(1) 有修過大學部高等統計、數理統計或類似課程者。
(2) 若想處理本研究室研究中偏程式、計算及應用的部分,需擅長統計軟體/程式語言,特別是R程式語言要能立刻上手。
(3)若想處理本研究室研究中偏理論的部分,則需修過高等微積分或實分析,及熟悉機率、測度等相關理論。
Qualification:
(1) Have taken undergraduate-level advanced statistics, mathematical statistics, or similar courses.
(2) If you want to handle computing and applied aspects of our research, you need to be familiar with statistical programming language, especially R.
(3) If you want to handle theoretical aspects of our research, you have to had taken advanced calculus or real analysis, and you need be familiar with probability and measure theories.
PI 個人首頁(PI's Information): https://www.stat.sinica.edu.tw/cht/index.php?act=researcher_manager&code=view&member=2
PI's Google Scholar page: https://scholar.google.com.tw/citations?user=_kWL_woAAAAJ&hl=en
Email: hwchang@stat.sinica.edu.tw
蔡恆修
Henghsiu Tsai
生成式行銷數據科學 Generative Marketing Data Science 2020-2030是生成式AI (GenAI)的十年, 了解生成數據(Generative Data)
如何幫助現代數位社會,已是歐美業界學界蓬勃發展的研究方向。其中,表格生成數據 (Tabular Generative Data)有極大的潛力進一步幫助我們這個資料導向的社會走向使用更可靠更值得信任的AI。
透過本研究主題,主持人PI會指導暑期實習生利用由對抗生成網路(Generative Adversarial Network,GAN)以及擴散模型 (Diffusion Model) 所生成的表格生成數據,探討其對數據分析以及機器學習可能的價值以及疑慮。
我們將會利用公開的行銷數據集,從中先進行基礎的數據分析以及機器學習模型訓練,獲得真實數據上的結論。進一步,PI將會協助實習生利用GAN以及擴散模型產生生成行銷數據,進行與在真實數據上相同的數據分析以及機器學習模型訓練,進一步比較生成數據上的結論是否與真實數據上一致。
根據知名諮詢公司高德納Gartner的預測,2030年生成數據將取代大部分的真實數據,成為整個社會AI基礎建設的燃料。
本研究主題希望透過暑期實習生計畫,培養台灣生成式數據的人才,為2030年的台灣社會厚植資料科學以及機器學習的教育基礎。
1. 實習研究會使用的公開行銷數據集:CTR Prediction - 2022 DIGIX Global AI Challenge (https://www.kaggle.com/datasets/xiaojiu1414/digix-global-ai-challenge)
2. NVIDIA介紹合成數據以及Gartner對2030年合成數據的預測。 (https://blogs.nvidia.com/blog/what-is-synthetic-data/)
3. 利用GAN生成表格生成數據 (https://github.com/sdv-dev/CTGAN)
4. 利用擴散模型生成表格生成數據 (https://github.com/yandex-research/tab-ddpm)
蔡恆修個人首頁(PI's Information): https://staff.stat.sinica.edu.tw/htsai/
Email: htsai@stat.sinica.edu.tw
共同指導王啟樺博士的個人主頁
https://sites.google.com/view/chihuawang/research
張明中
Ming-Chung Chang
實驗設計與大數據抽樣之理論與方法研究 本研究室主要探討統計科學中的兩個主題:
(1) 多階層因子設計;(2) 大數據子抽樣。資料的品質是決定分析成敗的關鍵,而多階層因子設計則關乎於複雜實驗單位資料收集的品質。我們專注於多階層因子設計的數學理論與實際應用,目標是提出高效的資料收集方法。大數據子抽樣則是一個近十年來新興的研究領域,其目的是從龐大的資料庫中抽取具有代表性的子集,以保證在此子集上進行的統計推論的有效性。我們致力於研究不依賴模型假設,且對各種模型均有穩健性的子抽樣方法。
  PI 個人首頁(PI's Information): https://sites.google.com/view/mcchang/
陳璿宇
Hsuan-Yu Chen
數據科學與精準智慧醫療 我是中研院統計所研究員 陳璿宇,亦為台大、中興與高醫等大學 合聘教授,也是台灣精準健康暨毒理基因體學會 理事長,我主持的實驗室為數據科學與精準智慧醫療研究室。
我們團隊的工作聚焦於多體學與臨床大數據的分析演繹,最後提出疾病發生與治療的預測模型,以提供疾病篩查與治療的分子導引。多體學包含基因體、轉錄體以及蛋白質體,為目前在各種領域如醫學、農學與生態學等最熱門的研究領域,我們為台灣與國際上該領域的知名研究團隊且參與了美國癌症登月計劃 (https://www.thenewslens.com/article/49769)。
除了數據科學外,我們亦與電機系教授合作,開發疾病監控相關的硬體與軟體,像是開發氣喘病人的智慧吸入器等智慧醫材產品。
我們研究團隊成員包含臨床醫師、統計學家、流行病學家、資訊與電機工程學家以及生物學家,為國內與國際上少見的跨領域整合團隊,目前有博士生7名、博士後研究員4名、碩士級研究助理7名以及2名國外實習生.
我們團隊近年執行的研究計畫如下:
1. 解析台灣環境致癌物導致的不吸菸肺腺癌癌化過程與發展治療策略
2. 氣喘智慧吸入器:人工智慧吸入藥物管理及氣喘風險預測
3. 台灣癌症登月計劃
4. 前瞻性多中心臨床研究驗證與優化多面向不抽菸肺癌風險預測模型
其他尚有超過19件合作計畫
我的個人資料介紹
【 連結 】
我的相關報導
【 連結 1.精準健康學會成立 】
【 連結 2. 中研院攜手台大】
【 連結 3. 建立癌症多體學平台】
【 連結 4. 國家實驗研究院研發服務平台亮點成果獎】
【 連結 5. 台大肺癌化療基因檢測法】
【 連結 6. 肺腺癌OUT】