編輯:艾麗
審核:李子吉
政審:王軍善
中國戰略新興產業融媒體記者 李子吉
自從2017年Transformer架構發布以來,大模型得到了蓬勃發展。2023年3月14日,OpenAI發布的GPT-4的走紅讓大模型在一夜爆火。Sora、Kimi、Suno等的接連問世,更是讓人真切感受到生成式大模型已從一個流行詞變成了一股發展的浪潮,浩浩蕩蕩地卷向每一個行業。
中醫藥也不例外。
不過,大模型本質上卻是使用海量數據訓練而成的神經網絡模型,然而中醫辨證過程是一個基于經驗和直覺的過程,涉及大量的主觀判斷和邏輯推理,這種辨證信息通常是模糊的、不確定性的、非線性的。
這與我們普遍的直觀感受也是一致的。在“最新的中醫院AI大模型研發”相關新聞消息下,不乏對AI中醫院的質疑和不解之聲。
>> 網友評論節選。來源:中國網資訊、百度百家號
那么,目前中醫藥傳統經驗能成為訓練大模型的數據庫嗎?距離我們用AI中醫看病還有多遠?中醫院標準化模型,難點在哪里?
中醫大模型如果能夠成功,其應用場景其實可以非常廣泛。首先,在臨床診斷方面,中醫大模型可以通過對患者的癥狀、體征等信息進行智能分析,為醫生提供輔助診斷建議,提高診斷的準確性和效率。其次,在治療方案制定方面,中醫大模型可以根據患者的具體情況,為其推薦最合適的治療方案,幫助醫生制定個性化的治療方案。此外,中醫大模型還可以用于藥物研發、疾病預防等領域,為中醫藥事業的發展注入新的活力。
然而,中醫大模型的實現并非易事。由于中醫理論和實踐的復雜性和獨特性,如何從海量數據中提取出有價值的信息,如何將這些信息轉化為可用的知識體系,是中醫大模型面臨的主要挑戰。此外,如何保證模型的準確性和可靠性,如何將其應用于臨床實踐,也是需要解決的重要問題。
數據是人工智能大模型變得“聰明”的關鍵。
中醫藥幾千年積累的知識是最優質的數據資源,然而中醫藥面臨作用原理說不明白、講不清楚的“黑箱”問題。目前國內提出的中醫藥大模型普遍以中醫藥傳統經驗知識圖譜作為訓練數據,缺乏與生命底層語言的作用聯系和顛覆性創新。如何在中醫理論經驗基礎上,進一步用現代科學方法解析中醫藥的作用原理,優化提高中醫藥臨床療效,是目前中醫藥發展當中亟須解決的問題。
人類的肌體是一個高度復雜的系統,呈現極強的魯棒性與自組織性;而中醫治療采用的復方中藥同樣是高度復雜的系統,表現在藥物化學、代謝、分布等多種層面;同時傳統的中醫理論體系復雜,中藥質量控制難度高,中藥及方劑的藥理機制基礎研究不足等挑戰,中醫藥的現代化之路仍有巨大的困局待解。
以復雜性科學的視角分析,中醫藥的診療實質上可以看作一個復雜系統對另一個復雜系統的控制過程。它應用一種藥物復雜系統對另一個生命復雜系統進行“合理的”調控,使后者從疾病狀態下的“穩態”向健康狀態的“穩態”遷移,其復雜程度遠遠高于經典藥理學的研究對象。
當病患服用中藥后,藥物成分就會與體內的分子物質,如核酸、蛋白質、糖等產生作用而發揮療效,過程中涉及人體疾病生命語言靶標發現、中藥對人體生命分子作用功能的大規模底層實驗數據、中醫藥算力算法等復雜計算和實驗、臨床論證過程等。
這也就導致中醫診斷涉及復雜的辨證過程,通常需要結合多種數據源,如患者的主觀描述、醫生的觀察以及多種檢查結果等。然而,中醫診斷的個性化、經驗性和主觀性,導致目前公開可用的中醫相關數據集較少;而缺乏充足的數據集,直接限制了智能辨證模型的訓練和驗證,導致模型性能難以達到預期。
同時,已有公開數據集的質量也存在著較大的差異。目前可用于辨證模型訓練的數據集主要來源于住院病歷和門診醫案,但往往因為中醫醫師的經驗和個人習慣,導致這些數據存在著標注不準確、信息不完整、數據格式不統一等問題。
另一方面,在中醫這種復雜的理論體系中,疾病的發生和發展是一個復雜的過程,涉及多種因素的相互作用。而現有的智能辨證模型往往只關注其中的一部分因素,忽略了其他可能對辨證結果產生影響的因素。這種簡化處理雖然可以降低模型的復雜度,但也導致了模型普適性的降低。
數學模型是復雜系統的一種反映,在系統生物學研究中具有強大的作用。
“方劑-中藥-組分-靶標-表型-證候”主軸中各節點之間的關系非常復雜,只有盡可能準確地模擬生理系統中復雜藥物調控的各個節點變化,最大限度地將系統變化與臨床表現的關系聯系起來,甚至建立定量關系,人工智能才能夠真正在中醫藥研究領域充分利用好中醫藥積累的復雜數據。
當前的方劑學、中藥學、藥物化學、生物化學、分子生物學、病理生理學等經過了百余年的發展,已經積累了大量的關于中醫藥復雜系統和人體復雜系統的知識,能夠在一定程度上或者一定層面上“打開黑箱”,基于部分完整的生理系統進行模擬,同時依據輸入和輸出信號,設置一部分未知的節點,最終應用大模型對于上述兩種復雜系統的相互作用進行一定程度的模擬。
2021年,博奧晶方通過一種基于分子信號通路的中藥高通量篩選與智能組方技術,實現了將中醫藥理論體系歸納成符合現代科學慣例的數據化表達方式,這是為破解中醫藥面臨的現代化與傳統之間的系統性挑戰蹚出的一條新路徑。
據全國人大代表、中國工程院院士、清華大學生物醫學工程學院講席教授程京介紹,分子本草技術是基于世界首創的全景化疾病通路數據庫和超大規模中藥分子功能數據庫,利用AI技術構建的“多彈打多靶”的中藥組方篩選大模型,結合了現代生命科學、人工智能、大數據等多學科交叉創新優勢,為創新中藥的快速研發及作用機制的科學闡釋奠定了堅實基礎。
分子本草技術的原理主要有三點,一是通過挖掘在疾病狀態下,人體的分子信號通路靶標的激活或抑制作用,建立全景化疾病通路數據庫;二是通過實驗檢測藥物處理人體疾病細胞模型后的基因表達數據,建立藥物的作用信號通路圖譜數據庫,目前已檢測了1200多種中藥和食品提取物對人體十大系統疾病細胞模型作用的10億級真實基因表達數據,涵蓋3000萬條藥物功能核心信號通路數據;三是以疾病信號通路為靶標,以藥物組方逆轉通路為核心,AI驅動智能組方。從而形成科學內涵清晰、靶標明確的中藥組方,提高中藥組方用于臨床的有效性和確定性。
程京在今年全國兩會上提出了《用顛覆性技術構建創新中藥AI大模型 守住中國人生命健康紅線》的建議。建議在“十四五”規劃科技研發專項中盡快設立重大專項,支持大學和企業聯合開展“用顛覆性技術構建中醫藥AI大模型”重大系統化工程,打造從底層中醫藥知識數據和實驗數據、中藥功能評價算法工具、中藥新產品開發智能平臺綜合解決方案的大模型賦能產業生態。開發符合中國人生命語言特點的原創中國藥,用創新中藥守住中國人生命健康紅線。
進入2024年以來,與中醫藥相關的大模型產品不斷問世。
同出自清華大學孵化成果的博奧晶方和水木分子宣布,雙方將基于在中醫藥原創研發數據積累、大模型創新算法開發方面的資源優勢,重點聚焦中醫藥AI大模型共建、中藥研發新模式探索以及交叉創新人才培養等領域開展深度合作。
這次合作并不是大模型這股風第一次吹到中醫藥領域。
1月23日,浙江九為健康科技股份有限公司與華為云計算技術有限公司在深圳簽署中醫藥大模型全面深化合作協議。通過整合九為健康在中醫藥領域的科研實力和華為云在AI大模型領域的技術優勢,攜手構建“中醫藥盤古大模型”。
九為健康首席科學家、研發總裁王永華表示,盤古大模型的應用,可以更快、更準確地篩選出具有潛在療效的中藥成分和藥物,將大大縮短傳統研發周期,為中醫藥領域帶來更多創新療法與藥物。另外,盤古大模型能夠根據個體患者的生物信息和病情數據,提供個性化的中醫藥治療方案,這將使中醫藥更加精準地滿足每個患者的需求,進一步提高療效和治愈率。與此同時,盤古大模型的綜合分析能力有助于揭示中藥與西藥之間的相互作用和協同作用機制,為中西醫結合治療探索更多可能性,推動中西醫融合治療模式的創新與進步。
為促進中醫藥傳承創新,4月12日,全球首個中藥全產業鏈大模型“本草智庫·中藥大模型”在成都正式對外發布。“本草智庫”由成都中醫藥大學等單位聯合開發,匯集了1500萬條中藥材基原物種的基因信息,3000余萬條中藥成分與靶點的互作信息,400余萬個化合物等中藥研究底層核心數據,形成了覆蓋中藥全產業鏈的2000余萬個實體和超20億個關系對的知識圖譜,可以為基礎研究、中藥種植、質量控制、藥物研發等中藥全產業鏈關鍵環節提供決策支持。
“本草智庫”開發團隊負責人、中國工程院院士陳士林介紹說,“本草智庫”以千億級參數規模文心大模型為支撐,通過指令微調和檢索增強生成技術,具備了中藥知識的提取與生成、中藥垂直領域解決方案輸出、中藥產業一站式數字化服務三大功能。
“本草智庫”實現中藥研究底層核心數據與中藥全產業鏈關鍵環節的有機結合,對中藥材種植、質量控制、藥物研發等中藥全產業鏈關鍵環節有重要意義,有助于提升中藥基礎研究和產業的整體效率和質量水平,為中藥全產業鏈的關鍵環節提供精準的決策支持,從而優化生產流程,提高產品質量,確保藥品安全。
4月10日-12日,第三屆中醫藥高質量發展大會暨新時代中醫藥高質量發展戰略研討會于浙江烏鎮召開。會上,十位院士、專家聯合發布了面向中醫針灸領域的專業大模型——“天河靈樞大模型”裝置。
“天河靈樞大模型”命名來源于中國傳統醫學著作《靈樞》,是基于中醫經典名著和針灸臨床循證證據庫以及中醫循證知識圖譜等專業數據,對2023年5月發布的“天河天元大模型”進行訓練微調,開發的面向中醫針灸領域的專業大模型,由國家超級計算天津中心聯合現代中醫藥海河實驗室及天津中醫藥大學、天津大學、信創海河實驗室等團隊合作研發。
當用戶尋求針灸治療建議時,“天河靈樞大模型”能夠迅速分析用戶的病情,提出包括針刺、艾灸、按壓等多種針灸治療方法的個性化建議。此外,“天河靈樞大模型”在回答用戶問題的同時,還會將相關的證據資料一一列出,這些證據資料可能涵蓋經典中醫典籍的引述、現代醫學研究的成果,以及臨床循證研究等。
各類中醫藥大模型的出現,標志著這個產業到了發生變革的時機,但是,深層的問題仍然存在,距離“用AI看病”,無論是在技術和數據方面、還是在用戶接受度方面,都還有很長的路需要走。
END
編輯:艾麗
審核:李子吉
政審:王軍善
終審:朱永旗