學研新創 - 創新防疫科技
上呼吸道病毒現形高手:利用深度學習模型來建立上呼吸道病毒序列基因型即時分析平台
2020-12-23
林仲彥研究員團隊/中央研究院資訊科學研究所

林仲彥、林介華、徐哲仁、呂怡萱、熊昭、陳淑華

上呼吸道感染為台灣常見疾病,而急性呼吸道感染對兒童及嬰幼兒影響更為嚴重,呼吸道感染的症狀大多類似感冒,重則造成器官的衰竭甚至導致死亡; 107年衛福部健保署統計急性上呼吸道感染的醫療支出佔全民健保第四名,可見造成醫療資源之鉅。造成上呼吸道感染的致病原中,病毒占約九成五以上,如腸病毒、流感、類流感等。而截至目前為止,除麻疹與特定流感品系外,尚無疫苗或藥物可供上呼吸道感染的預防或治療。
目前檢測以免疫偵測為主,可能因採檢部位與病毒量濃度影響有偽陽或偽陰性,且僅能針對已知的病毒型做判斷。現今由於基因定序檢測技術的飛躍進步,以NGS技術配合高敏感度的病毒序列分類模型分析,將可快速辨別採樣檢體是否為與重症相關的病毒株,進而提供相應治療。
本團隊以大量由公有資料庫取得的上呼吸道病毒序列為基礎,分為11大類、 13個屬共35個種,結合其基因型資訊進行分類清洗,增加整體資料的精準度,及均化各個分類型別的資料筆數,透過基因序列的向量轉化模型(Word2Vec),結合第一層卷積神經網絡(Convolutional Neural Network, CNN)的建置,再結合細部分類模型,可提供更為精準的病毒分型,並鑑別出可能造成重症的品系,提供醫療療的重要指引,目前我們所建置的病毒分類模型準確率高達九成二,穩定度佳,同時每一分類的偽陽性大多低於2%。

評審推薦
本案利用oxford naropore建立上呼吸道病毒序列基因型即時分析平台,可針對187 種品系病毒進行分析,潛力佳。
2023年度精進成果
1. 擴增資料集:持續更新上呼吸道病毒序列資料集,今年度最新資料收集時間為2023年10月,共收錄近250萬筆原始序列資料。 2. 擴增病毒類別:增加可預測的上呼道病毒類別,總計共12大類,13個屬別(genus),24個種別(species),囊括種別下共108個基因型/亞型(genotype/subtype)。 3. 優化資料品質:在提高資料質量上,本年度根據病毒基因體特性制訂出更嚴謹的資料清洗準則,針對巨量資料進行細緻化與特異化的梳理,以獲得高品質的訓練資料集用於建立預測模型。最新的結果顯示,使用優化後的資料集所建立的AI模型,其預測準確率、召回率與F1 score等,皆比前一年度大幅提昇,SARS-CoV-2 F1 score更可高達99%,Influenza B virus HA (Hemagglutinin)和NA (Neuraminidase) F1 score 亦可達98%以上。 4. 解決序列失衡:資料預處理階段加入資料增強(data augmentation)、重新採樣(oversampling)以及調整損失函數(loss function)等方法,解決真實世界不同病毒型別序列數量失衡(unbalance)現象對深度學習所造成的影響。
團隊簡介
林仲彥
學歷 博士
現職 研究員
經歷

1. Joint-appointed Associate Research Fellow, National Health Research Institutes, Institute of Population Health Sciences, Taiwan (2012/1–present)
2. Invited Visiting Scholar, National Institute of Advanced Industrial Science and Technology, Computational Biology Research Center, Japan (2011/9–2012/7)
3. Associate Research Fellow, Academia Sinica, Institute of Information Science, Taiwan (2011/3–present)
4. Visiting Scholar , Molecular & Medical Phamacology , David Geffen School of Medicine at UCLA, United States (2010/8–2011/1)
5. Joint-appointed Assistant Principle Investigator, National Health Research Institutes, Division of Biostatistics and Bioinformatics, Taiwan (2005/11–2011/12)
6. Assistant Research Fellow, Academia Sinica, Institute of Information Science, Taiwan (2005/10–2011/1)
7. Joint-appointed Assistant Professor , National Taiwan University, College of Life Science, Taiwan (2005/2–present)
8. Assistant Investigator, National Health Research Institutes, Division of Biostatistics and Bioinformatics, Taiwan (2004/1–2005/10)
9. Postdoctoral Fellow, National Health Research Institutes, Division of Biostatistics and Bioinformatics, Taiwan (1999/10–2003/10)
10. Founder, Yam Navigator (http://www.yam.com), Taiwan (1997/6–present)

本網站中所有資料(包括影音.文字.圖表.數據等) ,均屬於本中心或各該新創企業團隊之專屬財產,如有引用,請確實註明出處來源。 <完整資訊>
財團法人生技醫療科技政策研究中心 版權所有
Copyright © 2012 - 2024 Research Center for Biotechnology and Medicine Policy (RBMP). All Rights Reserved