衰老是导致慢性疾病和功能衰退的一个重要影响因素。识别与年龄相关的生物标志物一方面有助于揭示衰老的分子过程,另一方面可准确地估计个人的真实生物年龄,为人们潜在的生活方式改变提供建议,并为延缓衰老药物开发提供思路。近年来,与年龄相关的多组数数据的衰老生物标志物挖掘及其组学“时钟”取得了重大进展,如表观基因组、转录组、蛋白质组、代谢组、肠道微生物组等。但是组学层次内和跨组学层次“时钟”普遍缺乏一致性,且最优的衰老时钟对衰老的解析水平仍十分有限。因此,新型衰老生物标志物的研究有望为深入了解衰老的生物学过程提供思路。DNA损伤是一个重要的潜在研究对象。尽管有多项研究发现DNA损伤与衰老密切相关,但受限于高精度DNA损伤识别技术匮乏,目前DNA损伤的年龄生物标志物的研究仍处于起步阶段。
图1. 高精度的DNA损伤SSB和AP位点可以精准预测小鼠的时序年龄
近年来,bwin必赢基因组学研究所曹慧芬副教授和厦门大学Philipp Kapranov教授团队于2019年和2022年突破了技术瓶颈,针对复杂基因组中的两种最普遍的DNA损伤——DNA单链断裂(SSB)和DNA脱碱基(AP)位点,先后成功开发了高精度的、基因组范围的SSB检测方法SSiNGLe(Nature Communications,2019)和(AP)位点检测方法SSiNGLe-AP(Nature Communications,2022),这两项成果均被Nature Communications选为亮点研究。近日,该团队关于DNA损伤指标具有作为年龄相关生物标志物的强大潜力的后续研究在国际期刊Aging Cell在线发表,文章题为Genome-wide profiles of DNA damage represent highly accurate predictors of mammalian age。该研究发现基于高精度的DNA损伤SSB和AP位点的全基因组图谱确定的某些基因的DNA损伤SSB和AP位点水平具有年龄特异性,可以作为年龄相关生物标志物。
该研究应用了10种不同的机器学习方法对基于DNA损伤的年龄预测因子的特性进行深入评估,然后将其性能与基于RNA的度量指标进行比较。该研究使用SSB或AP位点的每千个碱基每百万(lesions per kb per million,LPKM)LPKM-SSB和LPKM-AP指标分别计算了每个样本中每个基因的DNA损伤的丰度,并利用方差分析方法筛选出与年龄最相关的前500个基因。通过多种机器学习方法对不同的基因数据基进行年龄预测模型建模,研究发现:(1)高精度的DNA损伤SSB和AP位点模式相较于基于RNA信息,在小鼠的不同的组织类型中检测与年龄显著相关的基因比例更高、受组织类型的影响更小;(2)基于全基因组DNA损伤模式分析的年龄预测模型比转录组分析具有更高的精度和准确性(图2);(3)每个基因集和方法的LPKM-SSB和LPKM-AP指标的性能高度相似(图2),表明这两个指标都是跨不同组织类型的衰老可靠的潜在预测指标;(4)除了预测个体时序年龄,高精度的DNA损伤SSB和AP位点模式还可以预测小鼠的组织类型,虽然其性能低于RNA信息。该研究说明高精度的DNA损伤的基因组特征模式具有丰富的生物学信息,具有预测哺乳动物年龄的生物标志物具有强大潜能,为后续年龄相关的基础研究和检测技术开发提供了新思路。
图2 不同高精度DNA损伤SSB和AP位点的年龄预测模型的性能评估
bwin必赢曹慧芬副教授为第一作者,硕士生邓柏林为共同第一作者,厦门大学生命科学学院Philipp Kapranov教授为通讯作者,博士生张雨菲、蔡烨,硕士生宋天荣、杨福建、王春莲,厦门大学第一附属医院连加辩医生和夏璐博士生、昌平实验室楚晓菁博士和华侨大学刁勇教授等参与了研究工作。
论文原址:https://onlinelibrary.wiley.com/doi/10.1111/acel.14122IF: 7.8 Q1