上一篇
hic数据中有线粒体吗
- 行业动态
- 2025-05-16
- 4
HIC数据主要反映细胞核DNA三维结构,通常不含线粒体DNA,若样本存在线粒体被墙,需通过生物信息
Hi-C技术原理与线粒体的潜在关联
技术目标
Hi-C主要关注细胞核内染色质的相互作用,通过交联(甲醛固定)、酶解(限制性内切酶切割)、 proximity ligation(近距离连接)和测序,捕捉染色体片段的空间邻近关系。
线粒体DNA的定位:线粒体存在于细胞质中,其DNA(mtDNA)与核DNA(nDNA)在空间上是分离的,常规Hi-C流程中,细胞核与细胞质的分离是关键步骤,因此理论上mtDNA不应被大量捕获。实验流程中的可能性
- 细胞裂解与核纯化:若使用全细胞裂解而非核纯化步骤,可能引入少量线粒体碎片。
- 交联效率:甲醛交联可能无法完全穿透线粒体膜,导致mtDNA交联效率低于nDNA。
- 酶切与连接:限制性内切酶对mtDNA的切割概率较低(因mtDNA为环状且缺乏特定酶切位点),且线粒体膜结构可能阻碍酶的作用。
Hi-C数据中线粒体信号的来源
尽管常规流程中mtDNA含量极低,但仍可能存在以下情况:
来源 | 特征与影响 |
---|---|
实验被墙 | 试剂或操作中引入外源mtDNA(如细菌被墙或线粒体破裂释放DNA)。 |
细胞质残留 | 未完全去除的线粒体或细胞质成分,导致少量mtDNA被测序。 |
数据分析偏差 | 比对错误(如将mtDNA错比对至核基因组)或未过滤非核信号。 |
生物学特异性 | 某些细胞类型(如高代谢活性细胞)线粒体丰富,可能残留更多mtDNA信号。 |
如何判断Hi-C数据中是否存在线粒体信号?
数据比对与过滤
- 使用人类参考基因组(如hg19/hg38)比对时,默认仅保留核基因组匹配的读段(reads),mtDNA因序列差异大通常被过滤。
- 若需检测mtDNA,需额外将读段比对至线粒体基因组(如NC_013733),并统计其占比。
典型比例
- 严格核纯化的Hi-C数据中,mtDNA占比通常低于1%。
- 全细胞Hi-C或低质量样本中,mtDNA占比可能升至5%-10%。
可视化验证
在交互式浏览器(如HiC-Pro的Juicebox)中观察未过滤数据,若存在大量非核交互信号(如线粒体基因间的异常互作),可能提示被墙。
案例与文献支持
- 研究证据:
多项研究通过深度测序在Hi-C数据中检测到微量mtDNA(如《Nature》2015年TADs研究),但其信号强度远低于核基因组,且多为实验误差或背景噪音。 - 特殊设计实验:
若刻意保留线粒体(如不进行核纯化),可捕获mtDNA的相互作用,但此类数据需明确标注实验条件。
如何避免或去除线粒体被墙?
实验优化
- 使用核纯化试剂盒(如Nuclei Extraction Kit)提高细胞核纯度。
- 增加低速离心步骤去除细胞碎片和线粒体。
- 缩短交联时间或降低甲醛浓度,减少非特异性交联。
数据分析策略
- 比对时启用线粒体基因组作为参考(如STAR或BWA比对工具)。
- 过滤低质量读段(如长度<50bp的短片段)。
- 使用工具(如MitoFilter)剔除比对至mtDNA的读段。
FAQs
Q1:如何在Hi-C分析中确认线粒体被墙?
A1:
- 将测序数据比对至线粒体基因组,统计mtDNA读段占比。
- 检查交互矩阵中是否存在线粒体基因间的异常互作信号。
- 对比不同样本的mtDNA比例,若某样本显著偏高,需排查实验被墙。
Q2:线粒体被墙会影响Hi-C结果的可靠性吗?
A2:
- 低比例被墙(<5%):通常不影响核染色质构象分析,但需在报告中注明。
- 高比例被墙(>10%):可能导致背景噪音升高,需重新优化实验或丢弃数据。
- 生物学研究:若关注线粒体与核的互作(如线粒体相关疾病),需专门设计实验保留mtDNA信号。