研究背景随着儿童超重肥胖和不健康生活方式的流行,儿童高血压已成为我国重要的公共卫生问题。儿童期高血压不仅会引起近期靶器官损害(如左心室肥厚、颈动脉内中膜厚度增加等),还会增加成年期心血管病风险。因此,加强对儿童高血压的影响因素、预测模型和相关机制的研究,有利于制定有针对性的预防和干预措施,从源头上缓解我国成人心血管病负担。儿童期属于快速生长发育时期,血压作为一项重要的生理指标,受到多种因素的影响,包括测量时间、测量环境、测量者心理以及“白大衣效应”等。因此,国内外儿童高血压指南均建议,应基于非同日三时点的血压测量值进行儿童高血压的判定,以降低儿童高血压的假阳性率。目前国内基于规范的非同日三时点血压测量来判定儿童高血压的研究较少。并且,在随访过程中,基于单时点、两时点和三时点的血压水平和变化规律尚不明确。此外,鲜有研究从多角度探索基于三时点血压测量判定的儿童高血压的影响因素。同时,构建准确可靠的儿童高血压预测模型,将有助于早期识别高血压高危儿童,从而尽早采取有针对性的预防和干预措施。机器学习算法为儿童高血压预测模型的构建带来了新的机遇。目前尚未见在一般儿童人群中采用机器学习算法构建非同日三时点定义的儿童高血压的预测模型。此外,相对于传统的logistic回归模型,机器学习能否显著提升儿童高血压预测模型的效果仍未可知。同时,有必要识别儿童高血压最重要的预测因子,为实现更准确、有效的儿童高血压早期识别和预防提供科学依据。再次,儿童高血压的病因机制尚未明确,肠道菌群为儿童高血压相关机制研究提供了新方向。目前已有动物实验和成年人群研究提示肠道菌群紊乱可能与高血压发生有关,但尚未见基于一般儿童人群来探讨儿童高血压的肠道菌群机制。基于机制研究探索儿童高血压相关的肠道菌群特征菌属及潜在差异代谢路径,一方面可为儿童高血压的准确识别提供新的视角,另一方面也为儿童高血压的临床干预和治疗提供潜在治疗靶点。研究目的本研究拟开展非同日三时点儿童高血压的影响因素探索、预测模型构建和相关肠道菌群机制研究。具体的研究目标如下:1.依托“桓台儿童心血管健康随访队列”,利用基线(2017年)和最新随访(2021年)数据,探讨基于非同日三时点血压测量判定的儿童高血压在基线期和随访期的血压变化情况,并从多角度探索儿童三时点高血压的影响因素及因素间的交互作用;2.依托“桓台儿童心血管健康随访队列”基线(2017年)和最新随访(2021年)数据,基于问卷调查信息和简单无创的体测指标,采用传统logistic回归和集成机器学习算法探索性初步构建非同日三时点儿童高血压的预测模型,比较不同模型对儿童高血压的预测能力,同时量化模型预测因子的相对重要性,并识别最重要的预测因子;3.基于“桓台儿童心血管健康随访队列”2021年最新随访数据,采用病例对照研究设计,比较非同日三时点高血压儿童与正常血压儿童肠道菌群构成和多样性的差异,识别儿童高血压的特征菌属,探讨与儿童高血压相关的肠道菌群,以及肠道菌群影响儿童高血压的潜在代谢途径。研究方法数据资料来源于“桓台儿童心血管健康随访队列”的2017年基线和2021年最新随访调查。该队列采用方便整群抽样的方法,以淄博市桓台县一所公立小学所有自愿参加的1~5年级儿童为研究对象,2017年基线共包含1515名6~11岁的健康儿童。采用统一的调查流程,每两年开展一次随访调查,调查内容包括问卷调查(人口学信息、生命早期信息、生活行为方式、疾病家族史等)、身体测量(体重、身高、腰围、血压)、超声检查(心脏、血管结构和功能等)以及生物样本采集(空腹静脉血、粪便)。于2021年11~12月完成最新的随访调查,共随访到1357名研究对象。研究基于规范的非同日三时点血压测量,连续三时点收缩压(Systolicbloodpressure,SBP)和(或)舒张压(Diastolicbloodpressure,DBP)均≥性别、年龄别、身高别P95者判定为儿童高血压。1.基于前瞻性队列研究,探讨非同日三时点儿童高血压的变化规律和影响因素(1)研究对象 首先分别纳入基线资料完整的1325名6-11岁儿童和最新随访资料完整的1344名10~15岁儿童,探讨随测量时点增加,高血压检出率的变化趋势;其次纳入同时参与基线和最新随访并具有完整信息的1178名儿童,探讨基线基于不同时点血压测量判定的高血压儿童在随访期的血压状态;纳入1151名基线和随访信息完整且基线时血压正常的儿童,探讨儿童三时点高血压的影响因素及因素间的交互作用。(2)统计学分析 采用多元线性回归和Cochran-Armitage趋势检验分析随测量时点增加,儿童血压水平和高血压检出率的变化趋势。描述并比较三时点高血压儿童与正常血压儿童的特征差异,采用单因素和多因素逐步logistic回归分析儿童三时点高血压的影响因素。进一步按性别和年龄分层探讨儿童高血压影响因素。最后,将与儿童高血压存在负向关联的分类变量进行反向计分,连续性变量乘以(-1),以保证所有变量与儿童高血压关联的方向一致,基于相乘模型与相加模型检验变量间交互作用对儿童三时点高血压的影响。2.基于前瞻性队列研究,构建非同日三时点儿童高血压的预测模型(1)研究对象 以同时参与基线和最新随访且具有完整信息的1151名基线正常血压儿童为研究对象。(2)统计学分析 以简便无创临床指标为视角,仅纳入来自问卷调查和体测指标的影响因素,采用logistic回归和两种集成机器学习算法(随机森林和梯度提升决策树)构建儿童高血压的预测模型,通过受试者工作特征曲线下面积(Area under the curve,AUC)、准确度、校准曲线等评价并比较不同模型的预测能力,对模型纳入的各预测因子进行相对贡献度量化和排序。3.基于病例对照研究,探讨非同日三时点儿童高血压相关肠道菌群机制(1)研究对象 以2021年“桓台儿童心血管健康随访队列”最新随访获得的51名高血压儿童和随机选择的51名正常血压儿童为研究对象,采集其粪便样本。纳入标准为自愿参与并保证过去三个月内无抗生素使用史、高血压药物使用史、呕吐史、腹泻史和胃肠道疾病史。(2)统计学分析 对粪便样本进行16S核糖体RNA基因测序。基于α多样性、β多样性和群落分析,比较高血压儿童和正常血压儿童肠道菌群多样性和物种组成差异。采用典范对应分析和冗余分析反映肠道菌群与环境影响因素的关联。通过随机森林模型识别与儿童高血压相关的重要菌属。调整体质指数(Body mass index,BMI)及其他影响因素,采用logistic回归筛选关键特征菌属。结合儿童高血压最重要的预测因子,采用受试者工作特征(Receiver operating characteristic,ROC)曲线分析、重分类改善指数(Net reclassification improvement,NRI)和综合判别改善指数(Integrateddiscriminationimprovement,IDI),评估对高血压儿童的判别能力。基于京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)数据库,通过 PICRUSt2(Phylogenetic investigation of communities by reconstruction of unobserved states)功能预测软件进行物种注释,预测并比较两组儿童菌群代谢通路。研究结果1.非同日三时点儿童高血压的变化规律和影响因素探索基线期单时点、两时点和三时点儿童SBP水平分别为106.4 mmHg,110.3 mmHg 和 114.0 mmHg,DBP 水平分别为 63.6 mmHg,66.3 mmHg 和 70.0 mmHg;随着测量时点增加,儿童高血压检出率随测量时点增加逐渐降低,分别为15.0%,3.8%和1.9%(P<0.001)。随访期单时点、两时点和三时点儿童SBP水平分别为115.1 mmHg,125.9 mmHg 和 129.8 mmHg,DBP 水平分别为 62.3 mmHg,63.4 mmHg和64.7 mmHg;同样,随着测量时点增加,儿童高血压检出率逐渐降低,分别为19.9%,10.3%和6.9%(P<0.05)。按性别进行亚组分析,结果相似。基线期至随访期儿童高血压患病率由1.9%上升至6.9%。多因素logistic回归分析显示,基线期BMI(比值比[Odds ratio,OR]=1.29,95%置信信区间[Confidence interval,CI]:1.18~1.41)、SBP(OR=1.14,95%CI:1.09~1.20)、谷草转氨酶(Aspartatetransaminase,AST)水平(OR=1.06,95%CI:1.02~1.10)和父母高血压史(OR=4.46,95%CI:1.98~10.08)与三时点儿童高血压存在正向关联;高密度脂蛋白胆固醇(High-density lipoprotein cholesterol,HDL-C)(OR=0.18,95%CI:0.07-0.45)与三时点儿童高血压存在负向关联。相乘交互作用检验结果显示,基线BMI与SBP间存在负相乘交互作用(交互项OR=0.71,95%CI:0.51~0.99)。相加交互作用检验结果显示,有两组影响因素间存在显著的正相加交互作用,包括:BMI与SBP(效应指数S=1.39,95%CI:1.12~1.78)、BMI与AST(S=1.38,95%CI:1.10-1.99);有两组影响因素间存在显著的负相加交互作用,包括:BMI 与 HDL-C(S=1.30,95%CI:1.01~1.79)、SBP 与 HDL-C(S=1.49,95%CI:1.06~2.22)。交叉滞后路径分析显示,从基线BMI→随访SBP的路径系数(ρ2=0.321,P<0.001)大于基线SBP→随访BMI的路径系数(ρ1=0.024,P=0.129),且两个路径系数的差异有统计学意义(ρ2>ρ1,P<0.001)。2.非同日三时点儿童高血压的预测模型构建基于传统logistic回归模型和两种集成机器学习算法(随机森林和梯度提升决策树),仅采用基线期简单无创的问卷变量和体测指标(包括性别、年龄、BMI、SBP、DBP、睡眠时长和父母高血压史)构建的儿童高血压预测模型在测试集上表现良好,模型AUC值均大于84%,logistic回归模型、随机森林模型和梯度提升决策树模型对应的AUC值分别为86.90%(81.08%~92.72%)、84.88%(77.75%~92.02%)和 84.99%(76.93%~93.05%),准确率均高于 79%,校准曲线均与45°参考线较为贴合。两种集成机器学习模型预测效果与传统logistic回归模型相似。无论采用何种算法构建模型,基线肥胖指标BMI均为儿童高血压最重要的预测因子,对模型的相对贡献度分别为35.76%(传统logistic回归),35.19%(随机森林)和49.37%(梯度提升决策树);基线SBP次之,相对贡献度分别为19.98%(传统logistic回归)、17.60%(随机森林)和18.14%(梯度提升决策树)。多种策略的敏感性分析均支持上述结果。3.非同日三时点儿童高血压的肠道菌群分析肠道菌群多样性和物种组成分析表明,与正常血压儿童相比,高血压儿童肠道菌群的多样性降低,群落构成发生改变。在门水平上,高血压儿童中Bacteroidota相对丰度增加,而Firmicute相对丰度减少,校正错误发现率(False discovery rate,FDR)后,组间差异消失;在属水平上,高血压组Blautia(PFDR=0.042)、Coprococcus(PFDR=0.042)、Eubacteriumventriosumgroup(PFDR=0.027)、ChristensenellaceaeR-7group(PFDR=0.027)和norankfLachnospiraceae(PDR=0.015)等相对丰度均显著减少。特定肠道菌群的差异因年龄和性别而异。通过随机森林和多元logistic回归分析筛选的特征菌属为norankfLachnospiraceae属和Dorea属,独立于BMI及其他影响因素,与儿童高血压呈负向关联,可显著改善最重要的预测因子BMI对于高血压儿童和正常儿童的区分能力(AUC:93.16%vs.86.33%,P<0.05;IDI=0.12,P<0.05)。此外,PICRUSt2功能预测分析显示,辅因子和维生素代谢途径、聚糖合成代谢途径以及萜类和聚酮代谢途径可能为肠道菌群潜在的差异代谢途径,提示这三种代谢途径可能有助于解释三时点儿童高血压的发生。研究结论1.相较于单一时点的血压测量值的判定,基于非同日三时点血压测量值判定的儿童高血压更为准确,可显著降低儿童高血压的假阳性,识别的基线高血压儿童在随访期保持高血压状态的可能性更高,强调对儿童高血压的判定应基于非同日三时点血压测量进行。基线期BMI、SBP、HDL-C、AST水平和父母高血压史是儿童三时点高血压的主要影响因素。其中,BMI与SBP间存在相乘交互作用,BMI与SBP、BMI与HDL-C、BMI与AST、SBP与AST间存在相加交互作用。影响因素分析有助于深入理解儿童高血压的病因机制,对制定科学合理的预防和干预措施具有重要意义。2.基于基线期简单无创的体测和问卷指标,两种集成机器学习算法(随机森林和梯度提升决策树)构建的三时点儿童高血压预测模型的预测性能与传统logistic回归算法相似;无论采用哪种模型,基线肥胖指标BMI均是儿童随访期新发高血压最重要的预测因子,强调了儿童期进行体重管理的重要性。儿童三时点高血压预测模型的探索性构建有助于早期识别高血压高危儿童,为制定优先干预措施提供科学依据和指导。3.肠道菌群失调可能与儿童期高血压有关。儿童高血压特征菌属norankflachnospiracae和Dorea,独立于BMI等影响因素,与高血压呈现负向关联,结合最重要的预测因子BMI对高血压儿童有较高的判别能力。辅因子和维生素代谢途径、聚糖合成代谢途径以及萜类和聚酮代谢途径可能为肠道菌群潜在的差异代谢路径。肠道菌群分析是对儿童高血压发病机制的有益探索,为儿童高血压的早期筛查和精确治疗提供了新方向。创新点1.鲜有研究报道非同日三时点筛查的儿童高血压的变化规律及影响因素。本研究基于随访数据,从体测指标、生化指标和生活方式等多个角度分析了儿童三时点高血压的影响因素及因素间的交互作用,为深入理解儿童高血压病因机制提供依据。2.目前尚缺乏非同日三时点儿童高血压预测模型构建的文献报道。本研究采用传统logistic回归和两种集成机器学习算法探索性初步构建了儿童高血压预测模型,并对模型性能进行了评估和比较,量化并证明肥胖指标BMI为儿童高血压最重要的预测因子。3.尚未见有研究报道非同日三时点儿童高血压的相关肠道菌群机制。本研究采用肠道菌群分析初步探索了儿童高血压的可能致病机制,识别出儿童高血压特征菌属和差异代谢途径。