隨著時代的發(fā)展,制藥業(yè)正在經(jīng)歷翻天覆地的變化。2018年,一部現(xiàn)實(shí)主義電影《我不是藥神》讓仿制藥的話題引起了人們的關(guān)注。讓我們來看看一組原始的研究數(shù)據(jù),根據(jù)PharmaIntelligence根據(jù)公司在2021年提供的報告,在過去的十年里,只有不到10%的藥物能夠順利完成臨床實(shí)踐I,II,III期間實(shí)驗,并在NDA/BLA后來獲準(zhǔn)上市。
那么,作為仿制藥的對象,原研究藥物的重點(diǎn)是什么呢?原研發(fā)工作風(fēng)險巨大,投資時間長,投資成本高,所以所謂的行業(yè)流傳“雙十定律”也就是說,制藥企業(yè)在開發(fā)創(chuàng)新藥物時,通常需要花費(fèi)超過10億$,開發(fā)周期往往需要十年甚至更長的時間,從藥物設(shè)計到臨床實(shí)驗,再到申請上市。
也正因此,大量制藥企業(yè)正在期待利用計算機(jī)輔助藥物設(shè)計,降低研發(fā)成本、縮短研發(fā)周期,并最終提高成功率。
數(shù)字技術(shù)加速新藥研發(fā)
藥物的研發(fā)一般起始于藥物探索與發(fā)現(xiàn),隨后進(jìn)行臨床前研究與臨床實(shí)驗,在成功后進(jìn)行相關(guān)審批,通過審批的藥物則可以進(jìn)入商業(yè)化生產(chǎn)與藥物銷售流通環(huán)節(jié)。在藥物探索階段,靶點(diǎn)的發(fā)現(xiàn)可謂至關(guān)重要,如果靶點(diǎn)不是創(chuàng)新的,這便不能被稱作一款真正意義上的創(chuàng)新藥。為此,很多制藥企業(yè)選擇與國內(nèi)知名的轉(zhuǎn)化醫(yī)學(xué)中心進(jìn)行合作,進(jìn)行臨床數(shù)據(jù)挖掘與生物信息分析。
早在2017年,瑞金醫(yī)院國家轉(zhuǎn)化醫(yī)學(xué)研究中心已經(jīng)開始著手打造一個集存、傳、算、用(即:數(shù)據(jù)存儲、數(shù)據(jù)傳輸、數(shù)據(jù)分析計算和數(shù)據(jù)的整合應(yīng)用)為一體的定制化高密度計算平臺——ASTRA。
ASTRA擁有4000個CPU計算核心,存儲系統(tǒng)為總?cè)萘?0PB的高性能并行文件存儲系統(tǒng),同時配備了200GB的HDR IB網(wǎng)卡以及15 PetaFLOPS的AI計算能力。其采用的第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器更適用于需要兼顧生產(chǎn)和科研的平臺,能夠靈活滿足相關(guān)需求。同時,借助英特爾開發(fā)的DAOS(Distributed Asynchronos Object Storage,分布式異步對象存儲)開源文件系統(tǒng),使得瑞金醫(yī)院的ASTRA系統(tǒng)能夠突破存儲瓶頸,充分發(fā)揮性能,滿足實(shí)時、高頻和高效的數(shù)據(jù)訪問和處理需求。
借助這一平臺,瑞金醫(yī)院針對某基因組的變異分析耗時和某腫瘤全基因組分析的時長都大大降低。通過這樣的提升,此前的很多醫(yī)學(xué)設(shè)想也得以照進(jìn)現(xiàn)實(shí)。
在瑞金醫(yī)院的技術(shù)應(yīng)用實(shí)踐之外,借助AlphaFold2與GROMACS,科學(xué)計算在轉(zhuǎn)化醫(yī)學(xué)和新藥研發(fā)等領(lǐng)域的關(guān)鍵性驅(qū)動作用也愈發(fā)明顯。前者是DeepMind提出的深度神經(jīng)網(wǎng)絡(luò)蛋白質(zhì)形態(tài)預(yù)測方法,也被稱為迄今為止準(zhǔn)確度最高的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測模型;后者則是一個分子動力學(xué)軟件包,用于模擬設(shè)計新藥物的蛋白質(zhì)、脂質(zhì)和核酸。這些模擬為研究人員提供了所需的生物大分子結(jié)構(gòu)信息,以了解結(jié)構(gòu)與功能關(guān)系,用于指導(dǎo)藥物研發(fā)和設(shè)計過程?;陲@著提升了人工智能與深度學(xué)習(xí)性能的第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器,輔以英特爾AI套件的轉(zhuǎn)換與優(yōu)化,上述工具突破性地實(shí)現(xiàn)了23倍的性能提升,每日可預(yù)測的蛋白質(zhì)長度從4.56大幅提升至105.35,這也意味著藥物研發(fā)的試錯過程能夠被顯著縮短。因此,這一進(jìn)步也在醫(yī)藥行業(yè)大分子藥物研究領(lǐng)域產(chǎn)生了不小的震動。
而在小分子藥物的發(fā)現(xiàn)中,以晶泰科技為代表的本土研發(fā)團(tuán)隊則更有發(fā)言權(quán)——借助阿里云第七代云服務(wù)器ECS的計算單元,以及英特爾® oneAPI提供的編譯器數(shù)學(xué)庫和優(yōu)化能力,包括GATK,NAMD,LAMMPS,RELION和GROMACS在內(nèi)的諸多生命科學(xué)領(lǐng)域的前沿應(yīng)用運(yùn)行速度大幅度提升,部分增長高達(dá)60%以上,結(jié)構(gòu)晶體預(yù)測與碳化合物構(gòu)成的研究變得更加容易。對于晶泰科技們而言,這有助于研究人員更有效地設(shè)計和評估新藥,并能夠顯著節(jié)約資源。
化解隱私安全疑慮
當(dāng)一種藥物的靶點(diǎn)和化合物,包括化合物優(yōu)化完成后,新藥就已具雛形。不過距離來到患者手中,它還要經(jīng)歷六到七年的臨床試驗階段。在臨床藥物試驗過程中,第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器的一種獨(dú)特安全技術(shù)——英特爾® 軟件防護(hù)擴(kuò)展(SGX)——也在簡化和加速流程方面發(fā)揮著重要作用。
英特爾® 軟件防護(hù)擴(kuò)展(SGX)的核心是一組指令,可提高應(yīng)用代碼和數(shù)據(jù)的安全性,從而為它們提供更好的保護(hù),以防止泄露或修改。
2020年7月,國家藥品監(jiān)督管理局發(fā)布了《新冠肺炎疫情期間藥物臨床試驗管理指導(dǎo)原則(試行) 》,這意味著通過遠(yuǎn)程智能的臨床實(shí)驗,患者可以足不出戶,通過冷鏈配送獲取藥物,同時利用可穿戴設(shè)備完成數(shù)據(jù)的采集與上傳。在這種情況下,保護(hù)患者隱私與數(shù)據(jù)安全就可能形成一個巨大的技術(shù)挑戰(zhàn)。
但現(xiàn)在,情況出現(xiàn)了轉(zhuǎn)機(jī)。英特爾® 軟件防護(hù)擴(kuò)展(SGX)能在CPU的支持下,在內(nèi)存等特定硬件環(huán)境中構(gòu)建出一個可信安全的飛地。這種飛地獨(dú)立于操作系統(tǒng)、虛擬機(jī)以及BIOS系統(tǒng)之外,也就是說,即便這些比客戶應(yīng)用程序更底層的基礎(chǔ)軟件或系統(tǒng)在惡意攻擊中淪陷,由英特爾® 軟件防護(hù)擴(kuò)展(SGX)技術(shù)生成的飛地也可以通過基于硬件的、增強(qiáng)型的安全防護(hù)更有效地阻斷這些攻擊,盡力避免其中的數(shù)據(jù)或代碼被竊取或篡改。這有助于確保數(shù)據(jù)完整性和隱私,提供了在各方之間安全共享私有信息的工具,并創(chuàng)建一個協(xié)作、實(shí)時的臨床信息系統(tǒng)。而基于這一加密計算能力,阿里云ECS安全增強(qiáng)通用型g7t服務(wù)器持信息以更快、更安全的方式進(jìn)行共享和驗證,相關(guān)治療方法可以更快地提供給有需求的人。
算力加速新藥落地
多年之后,終于來到新藥上市前的生產(chǎn)與流通環(huán)節(jié),算力也在持續(xù)提供著加速。
如今,制藥企業(yè)可以利用機(jī)器視覺替代檢測人員,不僅減少了在整個生產(chǎn)環(huán)節(jié)的人工成本,更提升了檢測的準(zhǔn)確率與效率。目前,通過阿里云與英特爾等公司的合作,此類應(yīng)用已經(jīng)在部分企業(yè)率先落地。經(jīng)過簡單模型與復(fù)雜特征的多重訓(xùn)練后,機(jī)器視覺與人工標(biāo)注的一致率已經(jīng)高達(dá)98.879%。
而在最終的藥物流通上,數(shù)據(jù)仍然蘊(yùn)含著大量亟待挖掘的價值。因此,大量的AI算法應(yīng)運(yùn)而生,藥物需求的預(yù)測正在成為可能。憑借第三代英特爾® 至強(qiáng)® 可擴(kuò)展處理器強(qiáng)大的AI加速能力,以及英特爾在邊緣計算上的全面布局,藥物流通行業(yè)的參與者們也得以乘上數(shù)字化轉(zhuǎn)型的東風(fēng),通過邊緣實(shí)時的計算進(jìn)行更精準(zhǔn)的預(yù)測,從而制訂更科學(xué)合理的藥物銷售與存儲策略。
工具的極大豐富與快速迭代使醫(yī)療機(jī)構(gòu)與制藥企業(yè)從數(shù)字技術(shù)中獲得強(qiáng)大的助推力。借助算力與算法誕生的顆顆新藥,也正在為人類的健康提供更堅實(shí)的守衛(wèi)。