學研新創 - 智慧醫療與健康科技
中英文醫療自然語言處理整合平台
2022-01-07
郭昶甫教授團隊/長庚醫療財團法人林口長庚紀念醫院
郭昶甫、戴聞、高小玲、謝一諒、游信銘、謝孟甫、紀欽益、林敬恒、劉志勇、朱安鉑、陳榮陞
醫療病歷完整記錄病患的接受的診斷與處置行為,是醫療資料中的原始且珍貴的資料。
因為技術上的限制,直到近年因人工智能在自然語言處理的飛速發展,才能自動化的提取語意特徵。市場報告預估到了2027年,全球醫療自然語言處理的市場會成長至37億美元,複合年均成長率為20.5%。相要於一般與料,醫療資訊的獲得較為困難,訓練所需成本與運算資源也同樣的阻礙了自然語言處理的發展。
本平台結合長庚體系的醫療資料、醫學專業與人工智慧的自然語言處理,建立醫療語言資料整合平台,加速醫療資訊專案開發。我們提供中英文醫療BERT模型預訓練權重,能夠快速準確的實現下游任務的串接。舉凡病歷摘要、分類、中英文病歷與ICD-10編碼的相互轉換、重點標注等都可以快速訓練與應用。
本平台的目標是藉由具備東亞代表性的中英文醫療自然語言預訓練模型建立一站式的醫療資訊產品平台,幫助有志於醫療資訊相關各行業節省訓練成本、得到高品質結果,達到快速應用、佈署的效果。
評審推薦
1.為一整合式平台,整合各式醫療語料,並加入預訓練模型,提供客戶建立醫療語言模型時所需之資料撈取、預模型之建立以及前後端串接。提供一站式平台,從諮詢服務、資料提供、演算法開發、客製化模型架構、部署到日後維護,皆提供服務。
2.利用尖端自然語言人工智能技術整合成醫療自然語言發展平台,此平台可支援中英文醫療語言應用,頗具前瞻性。目前並已開發出病歷摘要、分類、中英文病歷與 ICD-10 編碼的相互轉換、重點標注等訓練與應用之功能。
3.目前屬於雛型開發階段,已有案件進行,具商化可行性,預計一年內將商品化。目前市場上缺乏以醫療自然語言處理之整合平台,具有市場潛力。
4.團隊由長庚醫院醫療人工智能核心實驗室,長庚醫學科技股份有限公司,長庚紀念醫院病歷課共同組成,具多元型,亦具相關資歷,研發潛力高。
5.訓練資料來源豐富,含長庚研究資料庫,MIMIC 重症醫學監護資料庫及 PubMed,系統完成後並導入長庚HIS系統,密西根大學醫學院,與保險公司跨界合作,提供使用,展現其實用性。
2.利用尖端自然語言人工智能技術整合成醫療自然語言發展平台,此平台可支援中英文醫療語言應用,頗具前瞻性。目前並已開發出病歷摘要、分類、中英文病歷與 ICD-10 編碼的相互轉換、重點標注等訓練與應用之功能。
3.目前屬於雛型開發階段,已有案件進行,具商化可行性,預計一年內將商品化。目前市場上缺乏以醫療自然語言處理之整合平台,具有市場潛力。
4.團隊由長庚醫院醫療人工智能核心實驗室,長庚醫學科技股份有限公司,長庚紀念醫院病歷課共同組成,具多元型,亦具相關資歷,研發潛力高。
5.訓練資料來源豐富,含長庚研究資料庫,MIMIC 重症醫學監護資料庫及 PubMed,系統完成後並導入長庚HIS系統,密西根大學醫學院,與保險公司跨界合作,提供使用,展現其實用性。
NEW
2024年度精進成果
核心技術部份, 為配合長期穩定更新之需求, 先以最新的transformer encoder架構大量微調後, 再加上lora技術以少量資料微調, 兩者配合可將訓練時間與資料縮短達到近似大量微調的效果. 實際在醫療場域落地後, 因持續更新的結果, 有些院區正確率可達近9成. 另增加主診斷排序之功能. 此成果已呈現於2024醫療品質照護國際會議 ISQua conference中, 獲得肯定.
團隊簡介
|
本網站中所有資料(包括影音.文字.圖表.數據等) ,均屬於本中心或各該新創企業團隊之專屬財產,如有引用,請確實註明出處來源。
<完整資訊>
財團法人生技醫療科技政策研究中心 版權所有
Copyright © 2012 - 2024 Research Center for Biotechnology and Medicine Policy (RBMP). All Rights Reserved
Copyright © 2012 - 2024 Research Center for Biotechnology and Medicine Policy (RBMP). All Rights Reserved