2022 年 11 月 30 日,OpenAI發表ChatGPT,不到一週,超過百萬用戶註冊,生成式AI因而廣受各行各業重視。生成式AI現今在醫療場域能發揮什麼功用?在醫療端的應用已經足夠成熟了嗎?生策中心專訪林口長庚紀念醫院醫療人工智能核心實驗室主任郭昶甫,以第一人稱呈現臨床端的觀點: |
生成式AI正為各行各業帶來改變,然而在醫療領域的影響才剛剛起步。生成式AI的兩個核心要素是「理解」與「生成」,沒有良好的理解,就不可能產生有用的結果。 這在醫療領域尤其重要,因為醫護人員的日常工作主要分為兩大部分:溝通和記錄。溝通包括與病人說話、與家屬的互動,還有醫師與護理師之間的溝通協作;記錄則是必不可少的,因為醫療是一個法律行為,臨床上做的醫療決策都需要記錄下來。這兩項工作都非常耗時,因此生成式AI在這些領域的潛在應用頗具吸引力。 生成式AI的優勢在於能夠幫助醫護人員自動生成記錄和文件,大幅減少他們的工作量。此外,臨床治療越來越強調依照黃金標準、共識或指引來給予病人治療。例如,風濕過敏免疫科一年就有將近20多份標準、共識或指引要讀,醫師若能借助生成式AI快速擷取重點、摘要,將節省大量時間。
生成式AI的研究仍處於早期階段,醫療應用須謹慎推進 生成式AI目前看起來很紅,但嚴格來說還集中於學術研究階段,在醫療領域大約是從2021年底才開始發展,還在非常早期的階段。根據PubMed資料庫的統計,2021年關於生成式AI的醫學論文為0篇,2022年有7篇,而2023年快速增加至500篇,但其中大部分是前瞻性評論文章,原創性研究論文僅佔少數,只有幾十篇屬於原創性論文。這反映出醫療界對於生成式AI的採納相對保守,這與醫療領域的高度要求有關。 醫療產業的特性使得新技術的導入相對較為緩慢。與ICT產業不同,醫療領域對於新技術的準確性和安全性要求極高。所以,生成式AI目前對於醫療領域有什麼衝擊,我認為短期內還很難看到。 醫療應用仍以分辨式AI居多,生成式AI成效待觀察 生成式AI與目前醫療領域中已經較為成熟的分辨式AI有著本質的區別。分辨式AI主要用於診斷和影像判讀,例如,在放射學和病理學中的應用較為廣泛。而生成式AI則可以更進一步,通過解釋和生成非結構化數據來支援臨床決策。然而,由於生成式AI涉及到更複雜的文本生成和資料整合,其臨床應用尚未成熟。 生成式AI與目前醫療領域使用的AI不同,AI要用在臨床,必須通過法律的規範,可能要取得ISO、GMP等認證、通過人體研究倫理審查委員會(IRB)審查、做臨床試驗後,才能真正落地使用。 過去5年,臨床上比較成熟的AI產品90%是放射學、病理學等影像相關的應用,非影像類的大約20~30個,主要與訊號有關,也有數位心理治療(Digital Psychotherapeutic),算是非常少。 近期《NEJM AI》(新英格蘭醫學期刊AI)發表一篇文章(https://ai.nejm.org/doi/full/10.1056/AIoa2300030),文中指出,醫療人工智慧設備的採用還在萌芽階段,大多數的使用是由少數設備驅動,例如,評估冠狀動脈疾病和診斷糖尿病視網膜病變的人工智慧設備,累計有超過10,000個理賠。 在林口長庚醫院,目前已經通過衛福部食藥署許可的AI軟體主要還是分辨式AI,這些系統包括「腕部舟狀骨骨折偵測軟體」、「心房顫動偵測軟體」,以及一項篩檢心臟衰竭的偵測軟體(心電圖)。這些應用主要還是以影像為主,這些都不是生成式AI,而是分辨式AI。 傳統的AI基本上就像人臉辨識,告訴醫師是或不是、有或沒有,主要協助醫師輔助判讀。假如AI軟體幫醫師判斷完後,生成一份完整的報告,這樣才算有使用生成式AI。儘管如此,目前有些報告比較偏向用結構化資料解決,塞入設定好的模板,只輸入病人的性別、年齡、過去病史、判讀結果後,就變成一份報告,這不太屬於生成式AI。因為生成式AI的真正潛力在於能生成非結構化數據,並根據不同的提問生成不同的結果。呼應我一開頭說的,生成式AI的兩個核心重點是理解,再來才是生成,理解又比生成更重要;現在最難的在於理解,再促使它往下行動。 生成式AI在病歷生成與資料擷取中的應用,病人隱私與流程仍需考量 醫護人員平常花太多時間在溝通,生成式AI在減少醫護人員溝通和記錄負擔方面具有巨大的潛力,我認為使用生成式AI幫忙辨識語音、記錄,完成病歷,減少醫護人員的負擔,這是合理的。例如,利用生成式AI來進行語音辨識,記錄病人的病情陳述,這能顯著降低醫護人員的工作量。然而,一項新科技的導入也帶來了新的挑戰,比如說,錄下病人的語音要先取得病人的同意;聽完病人主訴後,生成式AI再把它記錄到病歷上,單純辨識語音與記錄病歷是兩件完全不同的事情,並且如何在生成記錄過程中確保隱私和數據安全是關鍵問題。。 病人跟醫師講完話、電腦記錄下來,看起來是兩個步驟,其實不然。生成式AI聽到語音、理解後記錄下來;轉成紀錄時,是要生成完全一樣的逐字稿,還是萃取出重要的問題,然後再依照病歷需求生成,最後醫師再檢查和彙整?原本人工的流程如果要用電腦取代,每個醫院、每個專科的流程都不太一樣。 但對於獲取知識,尤其是快問快答、即時理解,提取重要資料,這對於年輕醫師或住院醫師尤為有用。例如,當面臨選擇抗生素治療時,資深醫師可以快速決定使用何種藥物,但年輕醫師可能需要查閱資料,這時生成式AI可以提供即時的答案,幫助醫護人員迅速做出決策。 不過,生成式AI在應用中可能會產生「幻覺(hallucination)」問題,這指的是AI生成了虛假的或不真實的答案。這在醫療領域是絕對不允許的,這其實有幾個解方,一種是對生成式AI進行微調,限制其創造性;另一種類似Open Book考試,餵給AI可能的答案範圍,採用像RAG(檢索增強生成)這樣的技術,可以幫助AI更準確地生成基於實際數據的答案,而不是「發明」新的內容。例如,醫師已經知道問題與感染有關,生成式AI就只要基於感染相關的文獻回答,而不是自己發明答案,它與人類的差別只在於人查得比較慢,而AI的速度比較快,也可以主動合成適當的回答。 無論什麼AI,用於醫療場域安全與有效性優先 無論AI技術在醫療中的應用多麼具有前景,我們不能為了AI而AI,所有醫療使用的工具,最重要的前提始終是保證安全性,然後才是考慮有效性。對於病人而言,生成式AI的應用必須可以改善他的預後,對於醫護人員,要能降低投入的時間成本,減少他們的工作負擔。如果一項技術增加了醫護人員的工作量,則其應用價值將大打折扣。所以放到真實世界驗證、公正地評價它所帶來的影響還是很重要;最終,必須符合法規,並需要有健保或保險來支付,它才能在實際醫療環境中穩定地運作。 我們不能用發展ICT產業的速度來看待醫療,生成式AI作為一項新興技術,其應用仍處於試錯階段。如何克服醫療產業保守、封閉的特性,我覺得要有耐心,要找到一個能夠真正提升醫療效率的「殺手級應用(Killer Application)」,將是生成式AI在醫療領域實現大規模應用的關鍵,才能真正發揮它的影響力。 ※系列報導:
|
Copyright © 2012 - 2024 Research Center for Biotechnology and Medicine Policy (RBMP). All Rights Reserved