New publishment in Nature Communications 在NC新发表文章一篇

原文链接:
https://www.nature.com/articles/s41467-024-46901-9
液-液相分离 (Liquid-liquid phase separation, LLPS) 是介导蛋白质和核酸等大分子在细胞中区室化分布的重要机制之一,其广泛参与转录调控、自噬、DNA复制、染色质互作等多种重要生物学过程,。异常相分离与神经退行性疾病、肿瘤等多种重大疾病密切相关【1-3】。因此,解析相分离的功能对于破译细胞生命活动和疾病机制至关重要。
改变蛋白质关键区域以干扰相分离是常用的研究相分离功能的策略。考虑到内在无序区(Intrinsically disordered region, IDR)与其相分离能力之间的强相关性【4, 5】,截断IDRs可以破坏蛋白质的相分离【6-9】。此外,替换带电氨基酸或者多价相互作用中心也会影响蛋白质的相分离能力【10, 11】。然而,这些改变通常涵盖较大的蛋白质片段或大量氨基酸,不可避免地影响到它们的相分离属性以及非相分离功能【1, 12】。因此,识别“关键氨基酸”变得至关重要——这些氨基酸在最小改变的情况下对相分离产生最大影响,实现精准调控的同时最大程度地减少对非相分离功能的干扰,对推动相分离功能研究具有重要意义。
2024年3月26日,中山大学丁俊军课题组在Nature communications发表了题为Precise prediction of phase-separation key residues by machine learning的研究成果。该研究建立了一种机器学习算法PSPHunter(Phase-Separating Protein Hunter),通过整合相分离蛋白的序列和功能特征来预测相分离蛋白并识别关键氨基酸,进一步量化疾病相关突变对相分离的影响,剖析相分离与疾病之间的关系。
在该项研究中,研究人员首先整合现有的相分离蛋白数据以及相分离相关序列和功能特征,建立了机器学习算法PSPHunter,基于算法评分筛选出由898个相分离蛋白构成的相分离蛋白组PSProteome。进而,运用滑动窗口(Sliding-window)策略针对蛋白质序列进行连续截断,定义截断后使相分离能力下降最多的片段为关键氨基酸(Key residues)。通过现有研究与实验两种途径验证了算法可靠性之后,进一步解析了相分离关键氨基酸的内在特征,并评估了突变对于相分离的影响,对于相分离和致病突变之间的关系进行了全面解析。

在算法构建中,研究人员引入了多样化的特征以刻画蛋白质相分离特性,纳入了位置特异性打分矩阵(PSSM)、隐马尔可夫模型(HMM)等蛋白质进化特征,二级结构、氨基酸可及性等结构特征,以及修饰、突变、蛋白质丰度、蛋白质相互作用等功能特征。受“粘合子(sticker)-间隔子(spacer)”模型启发,创新性地引入了词向量特征量化蛋白质短序列片段的组合,发现其在预测蛋白质相分离能力方面表现优异,且有助于精细识别关键氨基酸。体内外实验表明,仅截断GATA3蛋白的6个关键氨基酸即可破坏其相分离属性,包括其斑点的流动性以及最低成相浓度等。此外,我们最近的研究成功地应用PSPHunter算法预测了核心多能性因子 OCT4[【13】(截断3个氨基酸)、SOX2(截断6个氨基酸)和PcG家族蛋白RYBP【14】(截断21个氨基酸)的关键氨基酸这些发现共同表明PSPHunter能够识别用于精确操纵相分离的氨基酸。
针对算法鉴定的关键氨基酸进行特征解析,研究人员发现Spacer氨基酸甘氨酸(G)和脯氨酸(P)在相分离关键氨基酸中富集,且倾向于形成序列尺度的串珠式结构。有意思的是,sticker氨基酸(通常是芳香族氨基酸)虽然已证实在驱动相分离的作用,但在相分离蛋白中却含量相对较少。sticker氨基酸可能不需要连续存在。即使序列中出现离散分布,也可以促进相分离。
研究人员进一步发现接近80%的相分离蛋白和疾病相关,且其相分离能力与所携带的致病突变数量正相关。应用PSPHunter评估基因突变的相分离效应,发现相分离蛋白存在更多错义突变和致病突变,且致病突变对蛋白质相分离能力的影响比中性突变更显著。值得注意的是,GP氨基酸的突变是相分离蛋白中的高频突变,且倾向于位于关键氨基酸内。这些结果提示致病突变,尤其是位于关键氨基酸内的致病突变,可能会影响蛋白质的相分离能力进而促进疾病的发生。研究人员进一步在乳腺癌细胞系MCF7中利用GATA3突变验证了这一点。GATA3关键氨基酸的截断不仅破坏其相分离能力,而且抑制肿瘤细胞生长,促进其迁移。有意思的是通过IDR回补GATA3的相分离,这些对应表型均可被恢复。
此外,研究人员开发了一个用户友好的网站(http://psphunter.stemcellding.org/) 实现PSPHunter功能,提供了三个模块,仅需输入蛋白质序列,即可实现识别关键氨基酸、预测蛋白质相分离能力以及评估突变对相分离的影响。目前基于该算法开发的网站已成功上线,并已处理计算任务2400+,为相分离领域的研究提供了重要的工具和支持。

综上所述,该研究报道了一种基于多信息融合的机器学习模型PSPHunter,可用于鉴定相分离蛋白和相分离关键氨基酸。利用该算法建立了相分离蛋白质组、相分离关键氨基酸图谱和相分离功能障碍致病突变图谱等资源,有助于阐明相分离蛋白的功能,探索相分离在转录调控、细胞命运转变和疾病发展中的机制。
四川大学华西医院的博士后孙隽、中山大学中山医学院博士生曲佳乐和博士生赵偲为本文的共同第一作者。中山大学丁俊军教授、四川大学华西医院于浩澎副研究员、袁勇教授和暨南大学范丽丽老师为该论文的共同通讯作者。
参考文献
1. Bouchard, J.J., et al., Cancer Mutations of the Tumor Suppressor SPOP Disrupt the Formation of Active, Phase-Separated Compartments. Mol Cell, 2018. 72(1): p. 19-36 e8.
2. Alberti, S. and D. Dormann, Liquid-Liquid Phase Separation in Disease. Annu Rev Genet, 2019. 53: p. 171-194.
3. Patel, A., et al., A Liquid-to-Solid Phase Transition of the ALS Protein FUS Accelerated by Disease Mutation. Cell, 2015. 162(5): p. 1066-77.
4. Li, P., et al., Phase transitions in the assembly of multivalent signalling proteins. Nature, 2012: p. 336-340.
5. Molliex, A., et al., Phase separation by low complexity domains promotes stress granule assembly and drives pathological fibrillization. Cell, 2015. 163(1): p. 123-133.
6. Dao, T.P., et al., Ubiquitin Modulates Liquid-Liquid Phase Separation of UBQLN2 via Disruption of Multivalent Interactions. Mol Cell, 2018. 69(6): p. 965-978 e6.
7. Conicella, A.E., et al., ALS Mutations Disrupt Phase Separation Mediated by alpha-Helical Structure in the TDP-43 Low-Complexity C-Terminal Domain. Structure, 2016. 24(9): p. 1537-49.
8. Arribas-Layton, M., et al., The C-Terminal RGG Domain of Human Lsm4 Promotes Processing Body Formation Stimulated by Arginine Dimethylation. Mol Cell Biol, 2016. 36(17): p. 2226-2235.
9. Banjade, S., et al., Conserved interdomain linker promotes phase separation of the multivalent adaptor protein Nck. Proc Natl Acad Sci U S A, 2015. 112(47): p. E6426-35.
10. Nott, T.J., et al., Phase transition of a disordered nuage protein generates environmentally responsive membraneless organelles. Molecular cell, 2015. 57(5): p. 936-947.
11. Sabari, B.R., et al., Coactivator condensation at super-enhancers links phase separation and gene control. Science, 2018. 361(6400).
12. Zaslavsky, B.Y., L.A. Ferreira, and V.N. Uversky, Driving Forces of Liquid-Liquid Phase Separation in Biological Systems. Biomolecules, 2019. 9(9).
13. Wang, J., et al., Phase separation of OCT4 controls TAD reorganization to promote cell fate transitions. Cell Stem Cell, 2021: p. 1868-1883.
14. Wei, C., et al., CTCF organizes inter-A compartment interactions through RYBP-dependent phase separation. Cell Research, 2022: p. 744-760.