Evaluación de la influencia de los recursos computacionales en la variabilidad y calidad de ensamblaje de novo de transcriptoma

Autores/as

  • Patricia Carvajal López Centro de Investigaciones Biológicas del Noroeste, S.C.
  • Fernando Daniel Von Borstel Luna Centro de Investigaciones Biológicas del Noroeste, S.C.
  • Joaquín Gutiérrez Jagüey Centro de Investigaciones Biológicas del Noroeste, S.C.
  • Humberto Mejía Ruíz Centro de Investigaciones Biológicas del Noroeste, S.C.
  • Gabriella Rustici University of Cambridge
  • Eduardo Romero Vivas Centro de Investigaciones Biológicas del Noroeste, S.C.

DOI:

https://doi.org/10.13053/cys-22-4-2883

Palabras clave:

ARN, secuenciación NGS, RNA-Seq, efecto de memoria en ensamblaje, HPC, optimización de ensamblaje.

Resumen

El contenido de ARN se descifra con fragmentación aleatoria, lo que genera millones de secuencias, que en ausencia de referencias se reconstruyen basándose en algoritmos que usan intensivamente recursos computacionales. Diversos factores afectan el resultado de dicho proceso. Este estudio considera por primera vez cómo la asignación de memoria/núcleos influye sobre la calidad y variabilidad del ensamblaje. Se realizaron múltiples ensamblajes para 2 organismos modelo, en una plataforma monolítica y dos de cómputo de alto desempeño. Se encontraron mayores variabilidades de contigs en equipos monolíticos con poca memoria (1.98 y 2.10 veces más que HPC); sin embargo, gran parte de estos (99.16% y 75.79%) mapearon al transcriptoma de referencia demostrando ser de calidad. Por tanto, contrariamente a lo esperado, se observó que una estrategia de ensamblajes múltiples en un equipo de bajos recursos supera el uso de plataformas de alto rendimiento para el descubrimiento de ARNs.

Biografía del autor/a

Patricia Carvajal López, Centro de Investigaciones Biológicas del Noroeste, S.C.

Estudiante de DoctoradoGrupo de Investigación en Bioinformática

Fernando Daniel Von Borstel Luna, Centro de Investigaciones Biológicas del Noroeste, S.C.

Investigador Grupo de Investigación en Bioinformática

Joaquín Gutiérrez Jagüey, Centro de Investigaciones Biológicas del Noroeste, S.C.

Investigador Grupo de Investigación en Bioinformática

Humberto Mejía Ruíz, Centro de Investigaciones Biológicas del Noroeste, S.C.

Investigador Programa de Acuicultura

Gabriella Rustici, University of Cambridge

Bioinformatics Training Manager Department of Genetics

Eduardo Romero Vivas, Centro de Investigaciones Biológicas del Noroeste, S.C.

InvestigadorGrupo de Investigación en Bioinformática

Descargas

Publicado

2018-12-30