今年5月,國家藥品監督管理局藥品審評中心(CDE)發(fā)布《真實(shí)世界證據支持藥物研發(fā)的基本考慮》(意見(jiàn)稿),意味著(zhù)“如何將真實(shí)世界證據(RWE)納入到我國藥物研發(fā)和監管決策中”,開(kāi)始成為監管層正式思考以及著(zhù)手推動(dòng)解決的問(wèn)題。
一時(shí)間,行業(yè)熱議:“RWE究竟能解決哪些臨床問(wèn)題?RWS要整合哪些數據?RWD采集及處理流程是否留痕可追溯?其數據分析的方法學(xué)又是什么?”......
要回答這些直面從監管到落地的“靈魂拷問(wèn)”,讓真實(shí)世界證據真正“為我所用”,首先要解決的就是醫學(xué)數據庫的問(wèn)題。
對此,在7月29日,中國生物統計2019年學(xué)術(shù)年會(huì )上,醫療大數據及人工智能企業(yè)零氪科技(LinkDoc)創(chuàng )始人兼CEO張天澤以“我國醫學(xué)數據庫現狀和挑戰”的議題,給出了來(lái)自行業(yè)一線(xiàn)探索和實(shí)踐者的思考和經(jīng)驗分享。
產(chǎn)業(yè)需求是真正的驅動(dòng)力量
“在過(guò)去一段時(shí)間,有幾種力量在驅動(dòng)著(zhù)醫學(xué)數據庫的發(fā)展。”
首先是“技術(shù)驅動(dòng)”。據IDC Digital預測,到2020年,醫療數據量將達40萬(wàn)億GB,這是2010年的30倍。在過(guò)年十年時(shí)間里,醫療信息化迎來(lái)大發(fā)展,為人類(lèi)沉淀了大量的“原始材料”,“就像未經(jīng)冶煉的原油”,而接下來(lái)醫療數據化的階段,是基于海量數據信息化,服務(wù)價(jià)值輸出的關(guān)鍵和必由之路。
其次是“政策推動(dòng)”。2016年國務(wù)院辦公廳發(fā)布《關(guān)于促進(jìn)和規范健康醫療大數據應用發(fā)展的指導意見(jiàn)》,2017年又發(fā)布《關(guān)于促進(jìn)“互聯(lián)網(wǎng)+醫療健康”發(fā)展的意見(jiàn)》,再到2018年國家衛健委發(fā)布《國家健康醫療大數據標準、安全和服務(wù)管理辦法(試行)》……簡(jiǎn)單梳理下來(lái),三年左右時(shí)間里,國家累計發(fā)布30+政策文件,將健康醫療大數據納入國家大數據戰略布局,加速我國醫學(xué)數據資源共享利用。
最后,也是最重要的是“需求牽引”。
藥品研發(fā)與評價(jià)、醫藥營(yíng)銷(xiāo)與流通、商業(yè)健康險、輔助診斷與輔助治療、基因數據分析、醫學(xué)專(zhuān)業(yè)繼續教育、臨床科研服務(wù)、藥品監管、公共衛生管理……在醫療的各個(gè)領(lǐng)域,數據都可以發(fā)揮巨大價(jià)值。“醫療數據平臺和資源,處于新醫療產(chǎn)業(yè)的樞紐位置,在個(gè)體化、精準診療的時(shí)代意義尤其巨大。”
也正在這種強勁需求的牽引下,我國誕生了一些特定功能數據庫與特定人群數據庫,如醫學(xué)文獻數據庫、生物信息數據庫、臨床醫療數據庫、保險支付數據庫,等等。
“但產(chǎn)業(yè)的需求和牽引,其實(shí)才是真正的力量。”
重大疾病藥物研究需求的大力牽引
今天,尤其在醫藥研發(fā)領(lǐng)域,這股牽引的力量正拉扯的愈發(fā)劇烈。
有數據顯示,腫瘤藥物I期到III期試驗的時(shí)間為9.6年,從首次申請專(zhuān)利到上市耗時(shí)10.5年,2018年每種腫瘤新藥的平均成本達到26億美元,研發(fā)成功率下降至8.0%。
“精準治療時(shí)代的到來(lái),臨床試驗難度加大,患者入組難度加大,藥物研發(fā)的時(shí)間成本和財務(wù)成本顯著(zhù)上升,而且藥物適用的患者人群非常細分、離散,臨床診療難度變高,患者管理難度變大。此外,適應癥開(kāi)發(fā)的競爭與商業(yè)的競爭,正在成為兩個(gè)平行的主戰場(chǎng),中長(cháng)期直接影響商業(yè)開(kāi)發(fā)的潛力。”
可以說(shuō),重大疾病藥物研究需求的快速增加,帶來(lái)專(zhuān)病數據庫的巨大需求。
在美國,ASCO就倡導和推動(dòng)了北美多個(gè)腫瘤RWD數據平臺的發(fā)展,如CancerLinQ、Flatiron等。國際醫藥巨頭羅氏分別以21億和24億美元收購了Foundation和Flatrion,以推動(dòng)真實(shí)世界數據在醫藥研發(fā)中的應用。從中可見(jiàn)一斑。
我國也一直在積極探索科研級醫學(xué)數據庫的建立。如,中國隊列共享平臺(China Cohort Consortium),但它的開(kāi)放程度較低;全國腫瘤登記中心(National Central Cancer Registry),它的數據每年以報告形式來(lái)公布,而且不完全以臨床研究或者藥物經(jīng)濟學(xué)研究為目標建立。
整體而言,我國數據庫普遍缺乏以患者為中心的全景、長(cháng)效數據。而可應用于藥物研發(fā)的專(zhuān)病隊列要求病歷原件的完整度十分高,病歷原件不僅包括院內數據,還有院外數據。院內數據又包括院內信息系統數據以及科室沉淀數據;院外數據則包括院外處方數據以及隨訪(fǎng)等數據。以NSCLC患者的病歷原件為例,需要包涵確診入院、手術(shù)、術(shù)后輔助治療、復發(fā)轉移、基因檢測、1~n線(xiàn)治療、生存數據等全流程數據。
“患者治病的過(guò)程,就像一個(gè)孩子在吃面包,面包屑掉了一地,就要跟蹤一路把這個(gè)面包屑收起來(lái),這樣才可能產(chǎn)生高質(zhì)量科研級數據。”
期待和現實(shí)的差距
所以,當真正撿拾起一塊塊的“面包屑”,拼接完整,價(jià)值就是巨大的。
在2018年世界肺癌大會(huì )上,法國B(niǎo)rest大學(xué)醫院的多中心、非干預的回顧性隊列研究,評估了真實(shí)世界中納武單抗治療伴腦轉移晚期NSCLC的顱內有效性。研究結果顯示,免疫治療在合并腦轉移的NSCLC患者中顯示出非常有前景的療效。
在2019年4月4日,輝瑞乳腺癌新藥Ibrance基于真實(shí)世界數據,獲批男性乳腺癌適應癥,震動(dòng)整個(gè)醫藥界。
看到真實(shí)世界數據在醫藥研發(fā)領(lǐng)域的潛力,2019年5月,CDE發(fā)布《真實(shí)世界證據支持藥物研發(fā)的基本考慮》(征求意見(jiàn)稿),確定了RWE在罕見(jiàn)病治療藥物、修訂適應癥或聯(lián)合用藥范圍、上市后藥物的再評價(jià)、中藥醫院制劑的臨床研發(fā)、指導臨床研究設計、精準定位目標人群等場(chǎng)景中的應用。引發(fā)行業(yè)熱議。
很多人在期待真實(shí)世界數據能解決行業(yè)的需求和痛點(diǎn)。
“然而……期待和現實(shí),總是有一些差距。”
在理想情況下,應用真實(shí)世界數據經(jīng)過(guò)數據提取、模型建立,就直達深度學(xué)習、人工智能。而現實(shí)是,應用真實(shí)世界數據,需要跨過(guò)一個(gè)個(gè)溝溝壑壑,包括需求討論、提取數據、數據清洗、錯失值處理、特征工程、模型評估……
越過(guò)溝溝壑壑
如何才能越過(guò)真實(shí)世界數據應用的溝溝壑壑?
“打造出真實(shí)、可信、可用的真實(shí)世界臨床數據庫,需解決病歷量大、非結構化、隨訪(fǎng)困難、行業(yè)無(wú)標準、安全性等五大問(wèn)題。”
建立疾病模型是首要的,“給每一個(gè)疾病設定一個(gè)通用式疾病模型,一個(gè)基礎模型中有不同的域,每個(gè)域里有不同的變量,每個(gè)變量要設計出相關(guān)的約束。”
接下來(lái),可以利用人工+人工智能相結合的方式,對海量數據進(jìn)行深度結構化處理,可以數倍、數十倍甚至百倍地提高數據處理速度,大幅度降低數據處理成本,并保障質(zhì)量。在極為重要的隨訪(fǎng)數據集成過(guò)程中,如零氪(LinkDoc)基于算法分配隨訪(fǎng)任務(wù),隨訪(fǎng)數據與臨床數據實(shí)時(shí)打通,患者個(gè)人信息脫敏,隱私充分保護,實(shí)現全程錄音,隨訪(fǎng)成功率達80%+。
“做好數據的結構化、隨訪(fǎng),只是起點(diǎn)。”接下來(lái)還需要依據國際臨床研究CDISC標準 ,建立的數據處理流程,最終使得真實(shí)世界原始醫療數據,轉化為科研級的標準數據庫。
同時(shí),在數據庫的應用過(guò)程中更要嚴格遵守“數據物理隔絕,訪(fǎng)問(wèn)權限控制,應用數據分層管理,患者知情授權”的規范化路徑。
基于這樣的真實(shí)世界數據庫,數據的價(jià)值就可以充分兌現。
高質(zhì)量的數據庫可以應用于大型的臨床研究,助力中國癌癥新藥研發(fā);通過(guò)創(chuàng )新的模式,助力創(chuàng )新藥開(kāi)展藥品重點(diǎn)監測;建立多中心數據平臺,幫助專(zhuān)家在頂級學(xué)術(shù)期刊上發(fā)表高質(zhì)量的學(xué)術(shù)文章,等等。
最后,張天澤認為,真實(shí)世界數據庫是基于臨床病歷,但遠遠不止于臨床病歷。“一個(gè)真實(shí)、可信、可用的臨床數據庫,需要清晰的目標、整體的設計、扎實(shí)的質(zhì)量控制,三者缺一不可。”或許也只有這樣,才可以回答那些“靈魂拷問(wèn)”,讓真實(shí)世界證據真正為臨床診療、藥物研發(fā)及醫藥產(chǎn)業(yè)所用,讓真實(shí)世界研究真正落地。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com