Cynthia SC (04-27-2026)
Contenido
- Estructura, interpretación y uso práctico en Seurat v5
- Primera idea clave: mismo dato, distinta estructura
- Segunda idea clave: eficiencia vs transparencia
- Recursos de consulta
Formatos H5 vs MTX en single-cell RNA-seq
Estructura, interpretación y uso práctico en Seurat v5
En el análisis de single-cell RNA-seq (scRNA-seq), los datos no se generan directamente como matrices listas para análisis. A partir de archivos sin procesar - raw data (FASTQ), herramientas como Cell Ranger realizan el procesamiento inicial: alineamiento, cuantificación y filtrado de células.
El resultado de este flujo son matrices de expresión conocidas como Filtered Feature-Barcode Matrix, que se entregan comúnmente en dos formatos: H5 y MTX.
En ambos formatos se representan el mismo dato biológico, es decir, la relación entre genes y células, pero tienen estructuras distintas que impactan directamente la eficiencia del análisis y la forma en que interactuamos con los datos en herramientas como Seurat v5.
¿Por qué existen distintos formatos para los mismos datos?
Cuando trabajamos con datos de single-cell RNA-seq (scRNA-seq) generados por plataformas como :contentReference[oaicite:1]{index=1}, es común encontrarnos con dos formatos principales:
- H5 (.h5)
- MTX (.mtx + .tsv)
A primera vista, esto puede generar confusión:
¿Son datos distintos? ¿Cambian los resultados? ¿Cuál debo usar?
La respuesta corta es:
No cambia el contenido biológico, solo la forma en que está almacenado
Primera idea clave: mismo dato, distinta estructura
Ambos formatos contienen exactamente la misma información:
- matriz de conteos (genes × células)
- barcodes celulares (UMIs)
- anotación de features (genes, picos, etc.)
La diferencia está en cómo se organizan:
| Formato | Estructura |
|---|---|
| H5 | Un solo archivo binario jerárquico |
| MTX | Tres archivos de texto separados |
Segunda idea clave: eficiencia vs transparencia
H5 (HDF5)
- Archivo único
- Lectura rápida
- Menor tamaño
- Ideal para pipelines
Pensado para eficiencia computacional
MTX (Matrix Market)
- Compuesto de tres archivos:
matrix.mtxbarcodes.tsvfeatures.tsv
- Formato legible
- Fácil de inspeccionar
Pensado para transparencia y entendimiento
Interpretación práctica
- H5 optimiza el análisis
- MTX facilita el aprendizaje
Aplicación directa en Seurat v5
Cargar datos desde H5
library(Seurat)
data <- Read10X_h5("filtered_feature_bc_matrix.h5")
seurat_obj <- CreateSeuratObject(counts = data)
Cargar datos desde MTX
library(Seurat)
data <- Read10X(data.dir = "filtered_feature_bc_matrix/")
seurat_obj <- CreateSeuratObject(counts = data)
Estructura de archivos MTX
filtered_feature_bc_matrix/
├── matrix.mtx
├── barcodes.tsv
└── features.tsv
El formato no cambia la biología, pero sí la experiencia de análisis. Aunque ambos formatos representan lo mismo, la forma en que interactuamos con los datos cambia nuestra comprensión del dato, usualmente con MTX entendemos la estructura y con H5 nos enfocamos en el análisis.
Recursos de consulta
© 2026 El Arkhe MultiOmics · México