香港大學李嘉誠醫學院(港大醫學院)研究團隊發現了更有效的 CRISPR-Cas9 變體,可應用於基因治療。是項研究將人工智能中的「機器學習」應用於大型蛋白質篩選,從有限的蛋白變體實驗數據,拓展出更龐大的虛擬數據作分析,令變體數據可大增至原有的20倍,大大加快篩選的速度。研究團隊將此方法成功地應用於改良多個Cas9蛋白,並設計出具有增強基因編輯效率的新金黃葡萄球菌Cas9(SaCas9)的變體。相關研究成果現已在國際科學期刊《自然-通訊》(按此瀏覽期刊文章),並就此提交了專利申請。
研究背景
金黃葡萄球菌Cas9(SaCas9)是體內基因治療的重要候選編輯酶,因為它體積小,可以包裝成腺相關病毒載體,然後輸送至人體細胞中,以便應用於治療。然而,對於某些特定的疾病位點,SaCas9的基因編輯活性仍需提高,才可達到治療效果。因此,從精準醫學的立場而言,在利用SaCas9成為治療人類疾病的可靠工具之前,進一步改良SaCas9尤其重要。這些改良包括改變Cas9蛋白以提高其效率和精確度。在尋找可改良蛋白性能的序列突變時,一般可透過定點飽和誘變方法來尋找最佳的氨基酸替換;可是若要進行多些定點突變,變體的數量將以幾何級數上升,即使運用最先進的高通量蛋白質構建技術,也難以滿足大增的通量。
是項研究探索了如何結合「機器學習」方法去進行多點突變的蛋白篩選,將結構導向的突變數據庫中的實證數據,再以「機器學習」方法進行虛擬篩選,以準確識別稀有和性能更好的變體,以作進一步的深入驗證。
研究成果
研究團隊亦根據早前發表的Cas9變體篩選之數據作為測試機器學習的框架,印證機器學習只需憑藉5%至20%的實驗數據,即可識別性能最佳的變體。
挑選定點突變的位置均集中於Cas9蛋白內的間隔序列前體臨近基序(PAM)相互作用(PI)結構域和WED結構域,因為這兩個結構域靠近目標脫氧核醣核酸(DNA),及圍繞帶有PAM的DNA雙鏈體的位置。研究團隊將「機器學習」融合至高通量篩選平台,結合PI和WED結構域中的多點突變以設計活性更強的SaCas9蛋白。PAM對於Cas9的可編輯目標相當重要,透過減弱PAM與DNA之間的相互作用,從而減少PAM所帶來的編輯限制,這樣可以讓Cas9編輯更廣泛的基因目標,為了彌補與DNA之間被減弱的相互作用,需要同時於WED結構域加強與DNA的相互作用,以增強Cas9的編輯能力。
在篩選和隨後的驗證中,研究人員辨別了新的變體,包括當中名為KKH-SaCas9-plus的變體,它在特定基因組位點的活性增強了高達33%。而蛋白質建模分析亦預測新改良的變體,有機會增加在WED和PI結構域與帶有PAM DNA雙鏈之間的新相互作用,這亦可解釋多點突變如何增強新變體的編輯效率。
研究意義
結構導向設計一直主導著Cas9改良工程的領域,然而,它只探索了少數位點、氨基酸殘基突變和多位點的組合突變。是項研究發現在結合「機器學習」到多點組合突變的篩選研究中,有助將實驗數據產出最大化,大大降低實驗的篩選時間和成本,並從更多的變體中尋找到更高效的變體KKH-SaCas9-plus。
領導是項研究的港大醫學院生物醫學學院助理教授黃兆麟博士表示:「這方法將大大加速Cas9蛋白的改良,使基因組編輯技術得以更有效地應用於治療遺傳疾病。」
研究團隊
是次項研究由港大醫學院生物醫學學院系助理教授黃兆麟博士領導。共同第一作者為港大醫學院生物醫學學院助理研究員Dawn Thean Gek-lian小姐及博士後研究員褚愷宜博士,並得到博士生方凱俊先生和陳迦靜小姐、博士後研究員周鵬博士、助理研究員郭翠珊小姐及博士後研究員蔡正姿博士的協助。其他合作研究人員包括:港大醫學院生物醫學學院副教授何永基博士及劉鳴煒復修醫學中心的鄭宗立助理教授團隊。
鳴謝
此項研究獲得國家優秀青年科學基金項目(32022089)、香港研究資助局(17104619)、香港特別行政區創新科技署Health@InnoHK創新平台腫瘤及免疫學研究中心與AIR@InnoHK,以及劉鳴煒復修醫學中心資助。
傳媒查詢
請聯絡香港大學李嘉誠醫學院(電郵︰[email protected])。