30 July 2020 to 1 August 2020
zoom
America/Lima timezone

La importancia de los datos abiertos en la búsqueda de nuevas mutaciones en el SARS-CoV-2

Not scheduled
20m
zoom

zoom

Speaker

Dr Pedro Romero (Universidad Peruana Cayetano Heredia)

Description

La importancia de los datos abiertos en la búsqueda de nuevas mutaciones en el SARS-CoV-2
Autor: Pedro E. Romero 1
1. Facultad de Ciencias y Filosofía. Universidad Peruana Cayetano Heredia

Las nuevas tecnologías de secuenciamiento genético han acelerado la obtención de datos de genomas completos. Estos datos pueden ser usados, por ejemplo, para mejorar el diagnóstico y vigilancia de patógenos. Sin embargo, si trabajamos con secuencias de baja calidad o contaminadas, podemos obtener conclusiones erradas sobre estos genomas. Por ello, es necesario realizar un control de calidad exhaustivo utilizando herramientas bioinformáticas. Para el caso del nuevo coronavirus SARS-CoV-2, causante de la pandemia actual, la mayoría de genomas se encuentran depositados en bases de datos públicas como GISAID (>43000) o GenBank (>5000). Estos genomas sirven a investigadores de todo el mundo quienes los utilizan en el desarrollo de nuevos test de diagnóstico y vacunas. Sin embargo, pueden presentar errores en el ensamblaje del genoma. La manera más rápida de detectar estos errores es revisar los datos originales ("sequence reads"). Estos datos no se encuentran ni en GISAID ni en GenBank, pero sí en la base de datos NCBI SRA (>10000 genomas). Lamentablemente, en esta base de datos solo existen 3 registros para Sudamérica, 2 de Brasil y 1 de Perú. Utilicé los datos orginales del genoma reportado para Perú, realizando un control de calidad exhaustivo, seguido de un ensamblaje "de novo". Estos datos fueron comparados bioinformáticamente con el genoma de referencia de Wuhan (NC_045512.2). Encontré que mutaciones previamiente reportadas en el SARS-CoV-2 de Perú solo se encontraban en muy pocas secuencias por lo que podrian deberse a errores en el secuenciamiento o en el análisis bioinformático. Esta evidencia subraya la necesidad de compartir los datos orginales del secuenciamiento genómico bajo los principios de open data y open science. Los datos originales son necesarios para verificar si las mutaciones descritas en los genomas de SARS-CoV-2 son reales o, simplemente, artefactos o errores. Los problemas en la identificación de las mutaciones conllevarán a más problemas en el estudio de las relaciones evolutivas de SARS-CoV-2 así como en el desarrollo de vacunas o fármacos. Los datos abiertos son importantes en varios campos, y en el caso de la genómica, compartirlos y revisarlos, será vital para combatir al virus usando herramientas de biología molecula y bioinformática.

Author

Dr Pedro Romero (Universidad Peruana Cayetano Heredia)

Presentation materials

There are no materials yet.