HIPERTEXTOS DEL ÁREA DE LA BIOLOGÍA
PRINCIPAL INTRODUCCIÓN ANIMACIONES CÉLULAS BIODIVERSIDAD HERENCIA EVOLUCIÓN

Genoma Humano


Definición ||Enlaces | Glosario |Bibliografía

Principal ] Arriba ] Introducción a la genética ] Interacción genética ] Genética humana ] [ Genoma Humano ] X vs. Y ] Genoma Extranuclear ] Mutación ] Glosario de Genética ]


Genoma es la dotación genética completa de un organismo contenida en cromosomas, incluídos los genes y las regiones no codificantes.

En cada organismo el genoma tiene toda la información necesaria para construir y mantener el cuerpo del organismo. El genoma de todos los organismos celulares (procariotas, archeas y eucariotas) está compuesto de ADN; algunos vius tiene un genoma de ARN. Recordar que ambos ac. nucléicos están formados por cadenas de nucleótidos.

El genoma del ser humano está compuesto de dos partes distintas:

  • Genoma nuclear con aprox.  3.200.000.000 nucleótidos de ADN, dividido en 24 moléculas lineales de ADN que son los 22 autosomasy los dos cromosomassexuales: X eY.

  • Genoma mitocondrial: es la molécula circular de ADN de unos 16.500 nucleótidos ubicada en las mitocondrias

Los vegetales tienen una tercer componente que es el genoma del cloroplasto. 
El genoma cloroplástico y mitocondrial se estudian en detalle en ADN Extranuclear.

Los eucariotas superan ampliamente la cantidad de ADN de los procariotas, los seres humanos tenemos unos 2.500 Mpb (millones de pares de bases) por célula. No todas esos pb son genes. 

La definición mas actual de un GEN es la secuencia de ADN que codifica una molécula de ARN  funcional, que puede ser una molécula de función estructural, regulatoria o un ARN mensajero que traduce para la síntesis de un polipéptido.

Claes Wahlestedt, del Instituto Karoliska (Estocolmo, Suecia), dice respecto al término "gen", tendemos a no utilizar el término gen, nos referimos a segmentos que son transcriptos a ARN como  una "unidad transcripcional".

Elconjunto de ARN expresados por los genes de un organismo se denomina TRANSCRIPTOMA.

El conjunto de polipéptidos producidos por la traducción del transcriptoma se denomina PROTEOMA

Los componentes del genoma humano (el nuclear) son:

1. Genes y secuencias relacionadas

Los genes son la parte mas importante ya que son los que contienen la información biológica. Se estima un número de 25.000 a 30.000 genes en los seres humanos. De este número:

  • La mayoría de los genes expresan (o codifican) para una o más proteínas. Tarea que realizan con el ARNm como intermediario. Esta parte es menos del 5% del genoma total


Imagen (c) http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=genomes.figgrp.5288

  • Unos 700 genes codifican ARN del tipo ARNt, ARNribosómico y otros ARN pequeños que no codifica para proteínas, siendo el ARN no codificante su producto final.

La mayoría de los genes humanos son discontinuos, con un promedio de 9 exones por gen interrumpidos por regiones no codificantes llamadas intrones. Durante la transcripción, el  ARNm (en realidad es un transcrito primario de ARN o pre-ARN) es una copia del gen completo: exones e intrones. Luego de la transcripción, un proceso de corte de intrones y empalme de exones (splicing)   forma el ARNm procesado que va a continuar con la traducción a proteínas. 

Genes que codifican proteínas

Las secuencias que codifican proteínas están interrumpidas por regiones que no codifican. Las secuencias no codificantes se denominan intrones. Las secuencias codificantes exones.

 
 

Transcripción, eliminación de los segmentos resultantes de los intrones transcriptos, y unión de los exones. Escenas seleccionadas de Animación de Intrones y exones

La mayor parte de los genes estructurales de los eucariotas contienen intrones. Si bien se transcriben, estos intrones son cortados (solo en apariencia un proceso ineficiente) antes de la síntesis proteica. Es decir el ARN sufre un proceso de edición, que puede resultar en diferentes péptidos (para el caso de un mARN). El número de intrones varía para cada gen, pueden encontrarse inclusive en tARN y genes virales!. Generalmente cuanto mas complejo y de reciente evolución el organismo, mas numerosos y grandes los intrones. ¿Que surgió primero? ¿genes continuos sin intrones o genes interrumpidos por intrones?. Se ha propuesto que los intrones promueven la recombinación genética (vía crossing-over), y por lo tanto aumentan la velocidad de evolución. Los exones codifican diferentes regiones funcionales de las proteínas.

Imagen  modificada de McGill University's Genetics Pages (http://www.mcgill.ca/nrs/regenk_i.htm).

Las familias de genes están formadas de genes similares pero no idénticos. La familia de genes de la globina es la familia de genes mejor estudiada. La hemoglobina consiste (en el caso humano) en dos cadenas a y dos cadenas b alrededor de un grupo Hemo. Los genes de la beta globina se encuentran distribuidos en cinco loci en el cromosoma humano Nro. 11. Estos genes se expresan secuencialmente durante el desarrollo y tienen intrones de la misma longitud en posiciones similares en cada gen.
Algunos de estos genes son copias inactivas, otros solo son funcionales durante determinada fase del desarrollo (recordar la hemoglobina fetal y la adulta). La familia de genes de la actina, tiene un patrón similar.

Splicing alternativo

Actualmente se sabe que existe un splicing alternativo donde se corta de diversas maneras, pudiendo combinarse intrones y exones de diversas formas. Este recorte o splicing alternativo permitiría obtener varias proteínas a partir de una única secuencia de ADN o proteínas nuevas. También se ha sugerido que este sistema permitiría una evolución más rápida.

Resumen de las Funciones de los genes humanos:

  • La gran mayoría de los 30 000–40 000  genes humanos codifican para proteínas

  • Menos de 2500 genes especifican para ARN no codificante

  • Un 17.5% de los genes codifican enzimas responsables de las funciones bioquímicas

  • Los restantes genes están involucrados en actividades como transporte desde o hacia la célula, sistema inmune, el plegado fnal de las proteínas, entre otras muchas funciones.

2. Pseudogenes

Es un gen que fue inactivado por que su secuencia de nucleótidos cambió por una mutación que lo transformó en un gen completamente infuncional. Una vez que un gen sufrió este proceso, generalmente se sigue degradando por acumulación de mutaciones sucesivas.

3. Regiones intergénicas

Casi el  62% del genoma humano esta formado por regiones repetitivas integenica (entre genes) que no transcriben en ARN mensajero, siendo de función desconocida. Es lo que se suele llamar ADN basura (junk DNA), sin embargo este término es incorrecto,ya que el hecho que no se haya encontrado su función no significa que no la tenga eventualmente.

El ADN Repetitivo puedo dividirse en dos categorías:

  • Existen secuencias altamente repetitivas en tandem (de función desconocida, salvo para la secuenciación génica del hombre):

    • SATÉLITES: 5-50 pares de bases, repetidas hasta un millón de veces. 

    • MINISATÉLITES: 12-100 pares de bases, repetidas un número variable de veces, son marcadores genéticos moleculares de cada persona.

    • MICROSATÉLITES: 1-5 pares de bases, en grupos de 10-50 copias. 

  • Secuencias moderadamente repetitivas:

    • Telómeros, se encuentran en los extremos de los cromosomas. En el ser humano esta secuencia es TTAGGG y se repite unas 2500 veces. Recordando la replicación del ADN... la cadena avanzada puede replicarse hasta el extremo, pero como la cadena retrasada no tiene un cebador en el extremo 5´ del cromosoma, en cada replicación se produce un acortamiento de la nueva hebra formada. De este modo el nuevo ADN carece de esta última porción repetitiva ya que el mecanismo de reparación corta este extremo. En células en activa división (médula ósea y línea germinal) una telomerasa cataliza el agregado de la porción faltante.

    • Secuencias codificadores de ARNt y ARNr: existen múltiples copias de ADN que codifican para estos ARN, ya que se precisan en grandes cantidades

Estas regiones repetidas parecen derivar de la actividad de los transposones o genes saltarines, son elementos móviles del ADN que van dejando copias de si mismo al moverse por distintos lugares del genoma. Estas regiones repetitivas del genoma pueden alcanzar el  44% algo así como  1400 Mb del ADN

El Proyecto genoma humano, un poco de historia

En febrero del 2001 Nature publicó la versión del genoma humano dada a conocer por el HGP (Proyecto genoma humano) cuyo director es Francis Collins  y  Science, la versión  producida por el grupo de Craig Venter  (® (del latín= rápido) Empresa creada en 1997 entre Craig Venter y Perkin-Elmer cuyo propósito es secuenciar el genoma humano.) ambas con las correspondientes versiones  digitales.
La secuencia asciende a unas 2.100 millones de bp y deriva del estudio de la eucromatina.  La heterocromatina (que representa  aproximadamente un 5% del total) y que es difícil de secuenciar, posiblemente contenga algunos genes. En ambas publicaciones se detallan los métodos utilizados, las perspectivas y significado de la secuenciación para la ciencia y la humanidad.

Celera utilizó par la secuenciación el ADN de cinco individuos (un latino, un asiático, dos caucásicos y un afroamericano) y las cinco secuenciaciones fueros coincidentes en un 99.9%. 
Una rumor se ha esparcido: uno de los caucásicos seria el  propio Craig Venter.

Collins  señala que para identificar los genes funcionales los científicos dependen de una variedad de indicios.  Algunos surgen de la comparación con las bases de datos de ADNc (complementario), que son copias exactas de los ARNm. También ayuda la comparación con el ya secuenciado genoma de la rata en razón de que los genes de la rata y de los humanos son a menudo muy parecidos. Sus secuencias se encuentran conservadas en ambos genomas, mientras que no sucede lo mismo en una gran cantidad de ADN que los rodea. Cuando estos  (u otros) indicios no están disponibles  los científicos dependen para la identificación exclusivamente de las  predicciones realizadas en computadoras ("gene-predicting computer algorithms").

  • Los resultados señalan la existencia de entre 30.000 y 40.000 genes, solo aproximadamente el doble de los de Drosophila melanogaster. Esta cifra esta en el orden de lo pronosticado en base a la secuenciación del cromosoma 21 y resulta ser notablemente inferior  a los 140.000 estimados  en base a la complejidad funcional del ser humano.

  •  Los voceros del proyecto aluden a las diferentes formas en la que puede introducirse complejidad en un sistema por mecanismos se dan en humanos y en otros genomas de organismos superiores a saber:

    • Proteínas multifuncionales

    • Cortes y ensambles alternativos durante el proceso de edición del ARNm (al menos un tercio de los genes humanos producen diferentes proteínas por medio de ediciones alternativas del mensaje  ("alternative splicing" ) codificado en el  "pre ARNm".

  • Como los algoritmos nos son un 100% fiables (a veces "ven" genes donde no hay tales, o pasan por alto algunos de los  existentes) algunos científicos dudan del contaje realizado, entre ellos, William Haseltine  ( el CEO  de  Human Genome Sciences  considera que existen mas del  doble de genes de los reportados por los dos grupos

  • Causa cierta perplejidad  encajar el significado de la presencia de unos 200 genes bacterianos que "invadieron" el "futuro genoma humano"  en alguna etapa evolutiva muy primitiva (millones de años atrás) producto de una transferencia horizontal de genes.

  • El genoma contiene grandes regiones pobres en genes ("desiertos"). Mas de la mitad del genoma humano  consiste en secuencias repetitivas sin función conocida  ("junk DNA" o "ADN basura") destacándose que el cromosoma 19 que tiene un 57% de ADN repetitivo.
    La mayor parte del mismo deriva  de la actividad parasitaria de transposones que se replicaron e insertaron copias de si mismos en otros sitios. Actualmente  las diferentes familias de transposones parecen haber dejado de "vagar" por el genoma  y solo quedan en el sus "fósiles". Unos 50 genes parecen haber sido originados en transposones lo cual sugiere un cierto rol protagónico en la evolución del genoma.

  • Sumándose a  la repetición de secuencias causada por los transposones grandes segmentos, tanto dentro como entre cromosomas del genoma,  parecen haberse duplicado a lo largo de los tiempos. Los investigadores creen que esto permitió a la evolución "realizar ensayos" con los mismos sin destruir la función original y probablemente permitió la expansión de muchas familias de genes humanos.

  • Tanto el  HGP como Celera  identificaron en el ADN una  multitud de posiciones de bases que difieren entre individuos los llamados "snips" o SNPs (single polynucleotide polymorphism). HGP si bien el 99,9% de las secuencias son idénticas en todos los individuos el aproximadamente  0,1%, que corresponde a los SNPs, difiere de uno a otro. Se espera aprender de ellos como los genes hacen diferentes a los individuos y, en particular, la razón por la cual algunos son mas susceptibles a ciertas enfermedades.

Número de genes

Virus de la 
gripe
Mycoplasma
genitalium
Escherichia
 coli
Drosophila 
melanogaster
Caenorhabitis
 elegans
Arabidopsis
 thaliana
Oriza
 sativa
Homo 
sapiens
~1.800 ~500 ~4.000 ~13.000 ~18.000 ~25.500 ~50.000 30.000 o
 ¿40.000?

Los avances realizados en este campo fueron espectaculares  y, mas allá de los informes que parecen destinados a impactar a la opinión pública (en especial inversores actuales  y futuros..), resta todavía una enorme cantidad de trabajo a realizar: completar la ya señalada secuenciación  de la heterocromatina, rellenar los "huecos" ("gaps") dejados en secuencias muy difíciles, encontrar la totalidad de los genes que codifican para proteínas y aquellos que solo codifican para ARN, descubrir secuencias regulatorias, "blancos" donde las moléculas interactúan con lo genes e identificar mas funciones de los mismos, sin dejar de lado las necesarias revisiones para la corrección de los errores que pudieron escaparse en estas primeras versiones.

El Genoma humano es igual para TODOS los seres humanos?

Al estudiar este tema debemos tener en mente que hablamos de GENOMA HUMANO  por una cuestión práctica, pero que la secuencia de nucleótidos es única para cada persona, con la sola excepción de los gemelos idénticos. 

Las diferencias que aparecen entre los genomas de dos personas se deben al polimorfismo de un solo nucleótido o SNP (Single Nucleotide Polymorphism, pronunciado esnip) es la variación en la secuencia de ADN que afecta a solo un nucleótido del genoma. Dicho de otro modo es el lugar del genoma en que algunas personas tienen una Adenina y otras tienen una Timina. Los SNP aparecen cada 100 a 300 bases 

Se identificaron mas de 1.4 millones de SNP, de los que hasta dos tercios corresponden a la sustitución de una citosina (C) por una timina (T). En promedio hay un SNP cada 2.0 kb.

2004, Mas allá del Proyecto Genoma Humano

Sydney Brenner del Instituto Salk, Nobel 2002 escribió, "Los antiguos genetistas conocían de lo que estaban hablando cuando utilizaban el término "gene", pero el término parece haber sido "corrompido" por la moderna genómica pasando a significar cualquier segmento de una secuencia que se expresa.
Claes Wahlestedt del Instituto Karolinska  (Suecia, Sweden,)  nos dice  "tendemos a no hablar mas acerca de "genes“ ; nos referimos a cualquier segmento que es trascripto [a ARN] como una "unidad trascripcional" .

 Carmen Sapienza  de la Universidad de Temple (casi emitiendo un nuevo postulado de la ley de Murphi aplicable al genoma) nos dice: "todo aquello que pueda ocurrir en el genoma, sucederá"

  El genoma, la suma de la información heredable contenida en los cromosomas y que gobierna el desarrollo de un organismo, no es un texto estático pasado de una generación a otra,  en vez de ello  el genoma es una maquinaria bioquímica de extraordinaria complejidad que, como cualquier maquinaria, opera en el espacio tridimensional  y esta constituido por  partes diferentes e interactuantes. Estas partes conformas por lo menos tres niveles de información. 
El 98% del genoma que ha sido considerado durante mucho tiempo como "silencioso", en el mejor de los casos , o como "basura" (junk) en muchos otros, no se estudió en profundidad en general por falta de métodos adecuados. En estos últimos años los genetistas  han explorado las partes no visibles del genoma en busca de explicaciones  a anomalías que que contradicen el dogma central de la biología: enfermedades familiares que se manifiestan de manera impredecible (aún en gemelos.....) o el "encendido y apagado" de genes en canceres que no presentan mutaciones. Estos estudios se centraron en los otros dos niveles adicionales de información  encontrándose que se encuentran profundamente relacionados con la herencia conectándola con  el desarrollo y las enfermedades. Existen nuevos esfuerzos colaborativos que están tratando  de examinar estas regiones tales como el Proyecto ENCODE ( (Encyclopedia of DNA Elements)  y empresas particulares entre ella la pionera Affymetrix   que explora la organización y función de la totalidad el Genoma Humano. 

  • La primera de estas  partes, los genes que codifican para proteínas (aproximadamente 30.000 regiones del Genoma Humano), conforman y representan alrededor de un 2% del ADN total. 

  • La segunda de estas partes, esta conformada (entre otros) por los genes "solo a ARN" (RNA only genes) a partir de los cuales no se sintetizan proteínas.   Estos genes no convencionales dan origen a ARNs activos  y por medio de ellos alteran el comportamiento de "genes normales".  

  • La tercera  parte  esta conformada por la información epigenética  guardada en las proteínas y otras moléculas (por ej. grupos metilo) que se encuentran rodeando o esta pegadas al ADN. Estas  marcas epigenéticas  pueden influir en las características o en la salud de un individuo (algunas pasan de padres a hijos) sin alterar la secuencia del ADN. 



En construcción.


Gibson & Muse. A Primer of Genome Science, 2nd Edition. Sinauer Associates. 2004

JC. Venter, MD. Adams, and EW. Myers, et al. (2001). The sequence of the human genome Science 291: 1304-1351. (PubMed)

 

 

 HIPERTEXTOS DEL ÁREA DE LA BIOLOGÍA  © 1998-2007

• Universidad Nacional del Nordeste • 

Fac. de Agroindustrias, Saenz Peña, Chaco República Argentina • 

Consultas y sugerencias a los autores lito3400@yahoo.com y ana@unne.edu.ar