圖 1. 分子膠誘導蛋白相互作用功能示意圖[1]。
Section.02
已知的分子膠是如何被發(fā)現(xiàn)
以及改造優(yōu)化的?
小 M 為大家整理了 3 類高效篩選分子膠的案例,其基本研究思路為:① 構(gòu)建分子膠類似物化合物庫; ② 通過高通量篩選獲得苗頭分子; ③ Western blot 驗證被降解的目標蛋白; ④ AlphaScreening 或 NanoBit 實驗檢測蛋白-蛋白相互作用; ⑤ HiBiT 實驗檢測蛋白含量以獲得 DC50 (半數(shù)降解濃度) 和 Dmax (最大降解率)。
案例一
利用高通量表型篩選出一類分子膠降解劑,該分子膠可以誘導胎兒血紅蛋白 (HbF) 的表達,為治療鐮狀細胞病等血紅蛋白相關(guān)疾病提供了新的候選藥物。
研究人員開發(fā)了一種基于高通量流式細胞術(shù)的表型篩選方法,使用人源 CD34+ 細胞衍生的成紅細胞作為實驗模型來篩選胎兒 HbF 誘導劑。研究人員篩選了一個包含 2,814 種基于 CRBN 的分子膠類似化合物庫,發(fā)現(xiàn)了一組能夠增加 HbF 陽性細胞比例的化合物 (如圖 2),同時不影響成紅細胞的增殖和分化。這種表型在之前已知的 HbF 誘導劑類別中很少見。
圖 2. 表型篩選流程與結(jié)果分析[2]。
隨后進一步基于全局蛋白質(zhì)組學分析識別出在化合物 1 的處理下顯著變化的蛋白質(zhì),圖 3A 表明化合物 1 是通過 CRBN 依賴性降解轉(zhuǎn)錄因子 WIZ,進而驅(qū)動了體外 HbF 誘導。圖 3B 表明化合物 1 能夠顯著降解 WIZ 并誘導 HbF,因此被選為優(yōu)化的起點。
圖 3. 驗證化合物 1 的作用靶點[2]。
(a) log2 (倍數(shù)變化) 和 p 值的雙重標準,確保篩選結(jié)果的可靠性和顯著性),(b) 體外活性分析。
接下來,研究人員對化合物 1 進行了簡單的改造得到化合物 2,該化合物同樣能夠以 CRBN 依賴的方式強效誘導胎兒 HbF 并降解 WIZ,隨后研究人員進一步評估化合物 1 和化合物 2 的理化性質(zhì)和藥代動力學性質(zhì),如圖 4 所示,化合物 2 表現(xiàn)出更好的口服生物利用度 (BA%last = 12%),因此后續(xù)以化合物 2 作為進一步開發(fā)的先導分子。
表 1. 化合物 1 和化合物 2 的 ADME/PK 數(shù)據(jù)[2]。
案例二
戊二酰亞胺是 CRNB 分子膠降解劑的關(guān)鍵片段,研究人員開發(fā)一種利用多組分反應作為核心模塊化步驟合成含戊二酰亞胺分子膠庫的方法。通過對合成的化合物庫進行篩選發(fā)現(xiàn)了靶向酪蛋白激酶 1α (CK1α) 和 Wee 樣蛋白激酶 (WEE1) 的分子膠降解劑。并且通過分子對接和結(jié)構(gòu)分析,為進一步優(yōu)化分子膠提供結(jié)構(gòu)基礎。
研究人員首先設計了一種新的化學合成策略,即利用 GBB 反應 (Groebke−Blackburn−Bienayme,一種多組分縮合反應) 作為最后一步關(guān)鍵的合成步驟,快速高效地獲得 200 多個結(jié)構(gòu)多樣的 CRBN 分子膠庫。
圖 4. 基于多組分反應 (GBB reaction) 一步合成含 HRZ 骨架的化合物庫[3]。
隨后,研究人員在 CRBN 野生型和 CRBN 敲除的 MOLT-4 細胞 (人白血病細胞) 中進行 72 小時的細胞存活率實驗,以篩選出以 CRBN 依賴性方式誘導強效抗增殖的化合物,結(jié)果找到 3 個苗頭分子,其中化合物 2 的 EC50 低于 5 nM,化合物 1 和 3 的 EC50 分別為 12 nM 和 139 nM。
圖 5. 3 個苗頭分子結(jié)構(gòu)[3]。
接下來,研究人員基于化合物 2 來識別靶點,通過全細胞蛋白質(zhì)組學分析 (whole-cell proteome profiling) 檢測化合物 2 處理 MOLT-4 細胞 5 小時后的蛋白變化,發(fā)現(xiàn) CK1α (酪蛋白激酶 1α) 和 WEE1 (細胞周期調(diào)控激酶) 是主要降解靶點,并通過 Western blot 確認化合物 1,2,3 是 CRBN 依賴的 CK1α 和 WEE1 降解劑。
圖 6. 全細胞蛋白組學結(jié)果分析圖 (CSNK1A1 即為 CK1α) 以及 Western blot 驗證圖[3]。
隨后研究人員開始進行結(jié)構(gòu)優(yōu)化,以化合物 1 作為改構(gòu)起點。為了方便構(gòu)效關(guān)系分析,研究人員引入 HiBit 標簽,以定量監(jiān)測 Jurkat 細胞 (T 細胞白血病細胞) 中內(nèi)源性 WEE1 和 CK1α 蛋白的水平,將經(jīng)過改造的細胞系與不同濃度的化合物一起孵育 5 小時,然后通過終點熒光素酶測定法來檢測靶點的降解情況獲得 DC50 和 Dmax。改構(gòu)主要基于傳統(tǒng)的藥化改構(gòu)思路,圍繞化合物 1 的骨架進行較小的改動,以獲得活性和選擇性更好的化合物,最終得到化合物 10 是活性最好的分子。
表 2. HRZ-1 骨架苯胺取代基的 SAR 分析[3]。
值得一提的是,研究人員還通過實驗驗證了 2 個重要的問題,第一個問題是已報道的認為 CRBN 分子膠都是通過一個由含有甘氨酸殘基的 β 發(fā)夾環(huán) (G loop) 的降解標簽基序來與新底物結(jié)合的,研究人員分別測試了化合物 10 對野生型 WEE1 (WEE1-WT)、甘氨酸 322 突變?yōu)楸彼岬?WEE1 (WEE1-G322A) 以及甘氨酸 322 突變?yōu)樘於0返?WEE1 (WEE1-G322N) 的降解變化,結(jié)果和已報道的結(jié)論一致,WEE1-G322N 突變完全阻止了 WEE1 的降解。
第二個問題是化合物 10 是如何介導 WEE1 與 CRBN-DDB1 結(jié)合,通過 cryo-EM 獲得 WEE1-化合物 10-CRBN-DDB1 的復合物結(jié)合模式,結(jié)果顯示 WEE1 的 G loop 對介導三元復合物的形成很重要。與此同時,盡管化合物 10 具有高親和力,但它與復合物的結(jié)合并沒有使整個復合物變得剛性。如圖 7,化合物 10 主要存在兩種可能的構(gòu)象,且通過對化合物 13 進行分子對接顯示:化合物 10 和 13 的 pose 基本和 fit1 一致。作者又將 WEE1-化合物 10-CRBN-DDB1 復合物與已報道的 DDB1-CRBN-SJ3149-CK1α 復合物結(jié)構(gòu)進行疊合。在化合物 10 的兩種可能結(jié)合模式中,咪唑并吡啶和金剛烷基取代基都與 SJ3149 的苯并惡唑部分部分重合,這為進一步優(yōu)化分子膠提供結(jié)構(gòu)基礎。
圖 7. 冷凍電鏡呈現(xiàn)的 DDB1-CRBN-化合物 10-WEE1 的復合物密度圖以及放大后的 WEE1-CRBN 相互作用區(qū)域圖[3]。
其中顯示了化合物的 2 種可能結(jié)合模式 (左圖)。CRBN-CK1α 相互作用口袋中,化合物 10 與來那度胺 (Lenalidomide) 和 SJ3148 的結(jié)合模式比較 (右圖)。
案例三
構(gòu)建靶向 VHL 的 CIP-DEL 篩選文庫,該文庫包含約 938,730 個化合物。開發(fā)一種基于親和力的 CIP-DEL 篩選方法,利用“呈遞蛋白比率”來理性篩選具有高協(xié)同性的小分子化合物,對分子膠的發(fā)現(xiàn)具有重要意義。
諾華的研究人員參考已報道的 BRD7/BRD9 降解劑 VZ185 的 VHL 配體的連接方式,通過酚氧基團構(gòu)建基于三嗪的多樣化 DEL 文庫,DNA headpiece 和 DNA tag 連接在靶向 VHL 配體的遠端酰胺上。
基于三輪建庫,第一輪在三嗪和靶向 VHL 的配體之間引入 13 種連接子,第二輪和第三輪分別在三嗪骨架上引入 290 種和 249 種不同分子砌塊,最終構(gòu)建了一個包含 938,730 個分子的 DEL 篩選文庫。
圖 8. VHL CIP-DEL 文庫核心骨架[4]。
在 CIP-DEL 篩選試驗中,首先將 His-tag 的 BRD9 (靶蛋白) 固載在磁珠上,并使用 2 種不同的實驗方法來鑒定潛在的分子膠。如圖 10 所示,將文庫和固載的 BRD9 蛋白孵育 (允許形成二元復合物),文庫首先和 VCB (VHL–elongin C–elongin B) 預孵育,再和固載的 BRD9 蛋白孵育 (允許形成三元復合物)。為了控制非特異性結(jié)合,在不存在 BRD9 的情況下,將文庫和磁珠孵育。洗滌 3 次后,加熱使蛋白質(zhì)變性以釋放結(jié)合物,再將 DNA 條形碼進行 PCR 擴增和測序以鑒定結(jié)合物的結(jié)構(gòu)。
圖 9. DEL 篩選流程[4]。
為了計算富集,研究人員將 DNA 條形碼的計數(shù)數(shù)據(jù)建模為 Poisson 抽樣,通過這種建模方式,研究人員能根據(jù)總樣本計數(shù)對各個計數(shù)進行歸一化處理,同時也會考慮到測序數(shù)據(jù)的不確定性。二元富集度通過 BTL 的計數(shù)值除以 BL 的計數(shù)值來計算,三元富集度通過 BTLP 的計數(shù)值除以 BL 的計數(shù)值來計算,而呈遞蛋白比率則通過 BTLP 的計數(shù)值除以 BTL 的計數(shù)值來計算,本質(zhì)上得到的是三元富集度與二元富集度的比值。呈遞蛋白比率越高,表明 CIP-DEL 化合物與 BRD9 的結(jié)合越依賴于 VCB 的存在,這意味著該化合物具有更高的協(xié)同性。研究假設可以利用呈遞蛋白比率來篩選在與 BRD9 和 VCB 形成三元復合物時具有不同協(xié)同程度的小分子。
如圖 11,研究人員將結(jié)果分為三類:第一類是三元復合物富集度高但呈遞蛋白比率低 (主要是帶有 9 號連接子 (珊瑚色) 和 12 號連接子 (藍色) 化合物),第二類是三元復合物富集度中等和呈遞蛋白比率中等的化合物 (11 號連接子 (黃色) 化合物),第三類是三元復合物富集度低和呈遞蛋白比率高的化合物 (主要是 13 號連接子 (綠色) 化合物)。
圖 10. 三元復合物富集度與呈遞蛋白比率的關(guān)系圖[4]。
后續(xù)通過 AlphaScreen 進行協(xié)同性驗證,發(fā)現(xiàn)化合物 13-3 和 13-7 無鉤狀效應。在細胞實驗驗證中,13-7 在 NanoBiT 實驗中誘導三元復合物形成且無鉤狀效應,在 HiBit 實驗中對 BRD9 的降解也無鉤狀效應,且具有較好的選擇性。
圖 11. AlphScreen, NanoBiT 和 HiBiT 實驗結(jié)果圖[4]。
Section.03
為什么 CRBN 類分子膠的
研究熱度最高?
一家專注于分子膠降解劑開發(fā)的公司 Monte Rosa Therapeutics 對 CRBN 的底物進行了更廣泛的探索。已知的 Neo-substrate 有 CK1α、GSPT1、IKZF1、IKZF2、WIZ 等,這些都是傳統(tǒng)意義上的難成藥靶蛋白。這些 Neo-substrate 通過一個 G-loop 與 CRBN/CELMoD 結(jié)合,G-loop 由 β-hairpin α-turn 構(gòu)成,在特定位置有一個共同的甘氨酸,因此也被稱為 β-hairpin G-loop。
研究人員首先以 CK1α 的 β-hairpin G-loop 作為查詢模板 (該模板由 I35 到 E42 八個氨基酸組成,包含 5 個上游殘基 (G-5) 和 2 個下游殘基 (G+2)),在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫 (PDB) 和 AlphaFold2 (AF2) 預測的人類蛋白質(zhì)中進行搜索。選擇與查詢模板的均方根偏差 (RMSD) 小于 0.75Å 且與 CRBN 無空間位阻基序,并去除其中主要定位于細胞外的蛋白質(zhì),最終確定了 1,424 種含有 CRBN 兼容 β-hairpin G-loop 的蛋白質(zhì)。除此之外,還發(fā)現(xiàn)一種新的 helical G-loop 基序,存在于 184 種蛋白質(zhì)中,進一步擴展了 CRBN-neosubstrate 的范圍。
圖 12. β-hairpin G-loop 模版數(shù)據(jù)挖掘示意圖[5]。
Section.04
AI 能否助力分子膠的發(fā)現(xiàn)?
一直以來,分子膠的計算評估是一大難點,這包括三元復合物結(jié)構(gòu)難以準確預測,DC50 和親和力難以有很強的相關(guān)性。
3 月 22 日,VantAI 給制藥行業(yè)帶來了振奮人心的消息,推出 NEO-1 模型,該模型被譽為藥物研發(fā)領域一款具有開創(chuàng)性的人工智能模型。NEO-1 不僅能夠預測生物分子結(jié)構(gòu),還能從頭生成分子,尤其是具備從頭生成分子膠方面的能力。大家感興趣可以去官網(wǎng)進一步了解 vant.ai/neo-1。截止今日,該模型還無法試用且無公開的文獻,小 M 很期待該模型能公開,到時跟大家再進一步分享。
圖 13. 歷代結(jié)構(gòu)預測模型能力[6]。
MCE 一站式藥篩平臺聚焦于藥物發(fā)現(xiàn)早期,可為客戶提供多樣化的分子膠化合物庫 (HY-L918 & HY-L137),HY-L918 分子膠類似物庫由基于CRBN,VHL和DCAF14的分子膠類似物構(gòu)成。同時可提供 DEL 定制和篩選服務,蛋白定制服務,表型篩選服務以及分子膠的合成定制服務等,為科研客戶及新藥研發(fā)客戶提供—站式分子膠發(fā)現(xiàn)及研究服務。
產(chǎn)品推薦 |
由 80,000 種類藥化合物組成。本多樣性庫具備新穎性、類藥性,結(jié)構(gòu)多樣性等特點,庫中化合物可重復供應,是新藥研發(fā)的有力工具,可以廣泛地應用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |
由 5,000 種類藥化合物組成,每種化合物代表一種結(jié)構(gòu)骨架,最大程度保證了庫的結(jié)構(gòu)多樣性。庫中的化合物均經(jīng)過 MedChem & PAINS filters 篩選,剔除了不合適的化學結(jié)構(gòu),避免“目標錯誤”。本庫化合物數(shù)量少但結(jié)構(gòu)足夠多樣,是藥物篩選的有力工具。 |
Natural Product-like Compound Library 由 5,000 個類天然產(chǎn)物化合物組成,庫中每個分子含有天然產(chǎn)物關(guān)鍵骨架 (42 個) 或者和天然產(chǎn)物的谷本相似系數(shù) >0.6,且 Natural-likeness scoring >-2。該化合物庫同時具備類藥性和新穎性,庫中化合物可重復供應,是新藥研發(fā)的有力工具,可以廣泛地應用于高通量篩選 (HTS) 和高內(nèi)涵篩選 (HCS)。 |
由 5,000 多個具有潛在 RNA 相互作用活性的小分子化合物組成,我們收集了 PDB、R-BIND、ROBIN 和內(nèi)部數(shù)據(jù)庫中的已知 RNA 靶向小分子作為陽性數(shù)據(jù)集,并基于 ROBIN 數(shù)據(jù)集獲得非靶向 RNA 的小分子作為陰性數(shù)據(jù)集。基于 GeminiMol 預訓練模型,對這些分子進行編碼,并通過 Mordred 計算了 1,700+ 分子描述符作為模型的輸入。接著用 13 個深度學習模型對這些數(shù)據(jù)進行學習,所有模型都取得了良好的訓練結(jié)果,AUROC 均超過 0.75。選擇分類效果最好的 Finetune 模型(AUROC 值:0.82,預測準確率:0.76)對 HY-L901P 進行篩選。進一步基于 StaR Rules(cLogP≥1.5,Molar Refractivity≥4,Relative Polar Surface Area≤0.3)進行再過濾,該庫同時具備結(jié)構(gòu)多樣性,是 RNA 靶向藥物開發(fā)的有利工具。 |
[1] Holdgate, Geoffrey A. et al. SLAS Discovery, Volume 29, Issue 2, 100136
[2] John Ryan Kerrigan, Noel M.et al. Journal of Medicinal Chemistry 2024 67 (22), 20682-20694
[3] Hlib Razumkov.et al. Journal of the American Chemical Society 2024 146 (46), 31433-31443
[4] Liu S.et al. J Am Chem Soc. 2023 Oct 25;145(42):23281-23291
[5] Georg Petzold.et al. bioRxiv 2024.10.07.616933
[6] https://www.vant.ai/neo-1