La Universidad de California en Santa Cruz (EEUU) ha puesto en marcha
el Cancer Genomics Hub (CGHub), una plataforma con capacidad para
almacenar cinco pentabytes de información en la que se volcarán los
datos de los tres principales programas de investigación sobre el genoma
del cáncer. El proyecto está financiado por el Instituto Nacional del
Cáncer de EEUU con 10,3 millones de dólares.
El CGHub, cuya versión beta ya está on-line, incluirá los datos de The Cancer Genome Atlas
(TCGA), Therapeutically Applicable Research to Generate Effective
Treatments (TARGET, un programa que se centra en los cinco cánceres
infantiles más comunes) y Cancer Genome Characterization Initiative
(CGCI, que contiene información sobre tumores asociados al VIH y
carcinomas linfoides e infantiles).
El proyecto permitirá a los especialistas de todo el mundo combinar
la gran cantidad de datos generada por estas tres 'librerías'. Esto
evitará que los datos "se queden encerrados en diferentes centros
médicos y que la gente se concentre en pequeñas cohortes y nunca
alcancemos el poder estadístico que necesitamos para atacar la enfermedad", señalaba hace unos días David Haussler, líder del CGHub.
Esta biblioteca está diseñada, inicialmente, para albergar cinco
pentabytes (un pentabyte son 1024 terabytes) de información y está
previsto que se pueda ampliar hasta los 20 pentabytes. Además de este
gran espacio, los responsables del proyecto cuentan con nuevas
herramientas para comprimir los datos que cada mes generan los tres
proyectos citados.
El Atlas del Genoma del Cáncer genera él sólo 10 terabytes de
información al mes y está previsto que esto aumente 10 veces en los
próximos dos años. "Cada archivo de un genoma, el ADN de un tumor o un
tejido normal, son 300.000 millones de bytes. Y por cada caso existen
dos archivos así, el genoma del cáncer y el normal. Si a esto sumamos
los datos de la secuencia del ARN y la perspectiva de que en un futuro
la secuenciación sea más profunda, debemos contar con un terabyte de
espacio para cada caso", explica Haussler en una nota de prensa de la
universidad.
Con toda esta información almacenada en el mismo sitio, los expertos
esperan que el conocimiento acerca de las bases genéticas de los
distintos tumores crezca a más velocidad. Esto permitirá una mejor clasificación de la enfermedad y una lucha cada vez más personalizada contra el cáncer.
No hay comentarios:
Publicar un comentario