10 may. 2012

Una macrobiblioteca del genoma del cáncer

La Universidad de California en Santa Cruz (EEUU) ha puesto en marcha el Cancer Genomics Hub (CGHub), una plataforma con capacidad para almacenar cinco pentabytes de información en la que se volcarán los datos de los tres principales programas de investigación sobre el genoma del cáncer. El proyecto está financiado por el Instituto Nacional del Cáncer de EEUU con 10,3 millones de dólares.



El CGHub, cuya versión beta ya está on-line, incluirá los datos de The Cancer Genome Atlas (TCGA), Therapeutically Applicable Research to Generate Effective Treatments (TARGET, un programa que se centra en los cinco cánceres infantiles más comunes) y Cancer Genome Characterization Initiative (CGCI, que contiene información sobre tumores asociados al VIH y carcinomas linfoides e infantiles).

El proyecto permitirá a los especialistas de todo el mundo combinar la gran cantidad de datos generada por estas tres 'librerías'. Esto evitará que los datos "se queden encerrados en diferentes centros médicos y que la gente se concentre en pequeñas cohortes y nunca alcancemos el poder estadístico que necesitamos para atacar la enfermedad", señalaba hace unos días David Haussler, líder del CGHub.

Esta biblioteca está diseñada, inicialmente, para albergar cinco pentabytes (un pentabyte son 1024 terabytes) de información y está previsto que se pueda ampliar hasta los 20 pentabytes. Además de este gran espacio, los responsables del proyecto cuentan con nuevas herramientas para comprimir los datos que cada mes generan los tres proyectos citados.

El Atlas del Genoma del Cáncer genera él sólo 10 terabytes de información al mes y está previsto que esto aumente 10 veces en los próximos dos años. "Cada archivo de un genoma, el ADN de un tumor o un tejido normal, son 300.000 millones de bytes. Y por cada caso existen dos archivos así, el genoma del cáncer y el normal. Si a esto sumamos los datos de la secuencia del ARN y la perspectiva de que en un futuro la secuenciación sea más profunda, debemos contar con un terabyte de espacio para cada caso", explica Haussler en una nota de prensa de la universidad.

Con toda esta información almacenada en el mismo sitio, los expertos esperan que el conocimiento acerca de las bases genéticas de los distintos tumores crezca a más velocidad. Esto permitirá una mejor clasificación de la enfermedad y una lucha cada vez más personalizada contra el cáncer.


No hay comentarios:

Hemeroteca

Etiquetas