安妮塔·萨维科夫斯卡
介绍了高通量 lc-ms 数据的综合数据分析。介绍了多因素实验的统计分析和整合方法。示例数据集来自对谷物对病原体感染的反应和大麦 (Hordeum vulgare) 在干旱胁迫下的反应的研究。分析了初级代谢物、次级代谢物和蛋白质。
数据预处理、分析及可视化在R系统中完成,统计分析采用Genstat包中的程序进行,并介绍了组学数据整合及网络可视化的方法。
构建了相关网络和差异相关网络,以比较不同条件下代谢物和蛋白质之间的关系。性状用节点表示,线(边)对应于性状对之间的相关性。检测到具有高度相关性状的模块 - 簇。指示具有许多连接(与其他性状相关)的性状的枢纽。
使用 R 中的 WGCNA 包进行相关网络分析,使用幂函数将 Pearson 相关矩阵转换为邻接矩阵。通过聚类检测模块。使用基于 Fisher 的 Z 变换的测试创建差异相关网络,并进行 Bonferroni 校正。在 Cytoscape 中对网络进行可视化。
该算法可适用于任何高通量液相色谱-质谱数据。