Genoma Humano

Definición ||Enlaces | Glosario
|Bibliografía
[ Principal ] [ Arriba ] [ Introducción a la genética ] [ Interacción genética ] [ Genética humana ] [ Genoma Humano ] [ X vs. Y ] [ Genoma Extranuclear ] [ Mutación ] [ Glosario de Genética ]


Genoma es la
dotación genética completa de un organismo contenida
en cromosomas, incluídos los genes y las regiones no
codificantes.
En cada organismo el genoma tiene toda
la información necesaria para construir y mantener el
cuerpo del organismo.
El genoma de todos los organismos celulares
(procariotas, archeas y eucariotas) está compuesto de ADN; algunos vius tiene un genoma de
ARN. Recordar que
ambos ac. nucléicos están formados por cadenas de
nucleótidos.
El genoma del ser humano está compuesto
de dos partes distintas:
-
Genoma nuclear con aprox. 3.200.000.000
nucleótidos de ADN, dividido en 24 moléculas
lineales de ADN que son los 22 autosomasy los dos
cromosomassexuales: X eY.
-
Genoma mitocondrial: es la molécula
circular de ADN de unos 16.500 nucleótidos ubicada
en las mitocondrias
Los vegetales tienen una tercer
componente que es el genoma del cloroplasto.
El genoma cloroplástico y mitocondrial se estudian en
detalle en ADN Extranuclear.
Los eucariotas superan ampliamente la
cantidad de ADN de los procariotas, los seres humanos
tenemos unos 2.500 Mpb (millones de pares de bases) por
célula. No todas esos pb son genes.
La definición mas actual de un GEN
es la secuencia de ADN que codifica una molécula de
ARN funcional, que puede ser una molécula de
función estructural, regulatoria o un ARN mensajero que
traduce para la síntesis de un polipéptido.
Claes Wahlestedt, del Instituto
Karoliska (Estocolmo, Suecia), dice respecto al término
"gen", tendemos a no utilizar el término
gen, nos referimos a segmentos que son transcriptos a
ARN como una "unidad transcripcional".
Elconjunto de ARN expresados por los
genes de un organismo se denomina TRANSCRIPTOMA.
El conjunto de polipéptidos producidos
por la traducción del transcriptoma se denomina PROTEOMA
Los componentes del genoma humano (el
nuclear) son:
Los genes son la parte mas importante ya
que son los que contienen la información
biológica. Se estima un número de 25.000 a 30.000
genes en los seres humanos. De este número:

Imagen (c) http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=genomes.figgrp.5288
La mayoría de los genes humanos son
discontinuos, con un promedio de 9 exones por gen
interrumpidos por regiones no codificantes llamadas intrones.
Durante la transcripción, el ARNm (en realidad es
un transcrito primario de ARN o pre-ARN) es una copia
del gen completo: exones e intrones. Luego de la
transcripción, un proceso de corte de intrones y
empalme de exones (splicing) forma el ARNm
procesado que va a continuar con la traducción a
proteínas.
Genes que codifican proteínas
Las secuencias que codifican proteínas están interrumpidas
por regiones que no codifican. Las secuencias no codificantes se denominan intrones. Las secuencias
codificantes exones.
La mayor parte de los genes estructurales de los eucariotas contienen
intrones. Si bien se transcriben, estos intrones son cortados (solo
en apariencia un proceso ineficiente) antes de la síntesis proteica.
Es decir el ARN sufre un proceso de edición, que puede resultar
en diferentes péptidos (para el caso de un mARN). El número
de intrones varía para cada gen, pueden encontrarse inclusive en
tARN y genes virales!. Generalmente cuanto mas complejo y de reciente evolución
el organismo, mas numerosos y grandes los intrones. ¿Que surgió
primero? ¿genes continuos sin intrones o genes interrumpidos por
intrones?. Se ha propuesto que los intrones promueven la recombinación
genética (vía crossing-over),
y por lo tanto aumentan la velocidad de evolución. Los exones codifican
diferentes regiones funcionales de las proteínas.
Imagen modificada de McGill University's Genetics
Pages (http://www.mcgill.ca/nrs/regenk_i.htm).
Las
familias de genes
están formadas de genes similares pero no idénticos.
La familia de genes de la globina es la familia de genes mejor estudiada.
La hemoglobina consiste (en el caso humano) en dos cadenas a y dos cadenas
b alrededor de un grupo Hemo. Los genes de la beta globina se encuentran
distribuidos en cinco loci en el cromosoma humano Nro. 11. Estos genes
se expresan secuencialmente durante el desarrollo y tienen intrones de
la misma longitud en posiciones similares en cada gen.
Algunos de estos genes son copias inactivas, otros solo son funcionales
durante determinada fase del desarrollo (recordar la hemoglobina fetal
y la adulta). La familia de genes de la actina, tiene un patrón
similar.
Splicing alternativo
Actualmente se sabe que existe un splicing
alternativo donde se corta de diversas maneras,
pudiendo combinarse intrones y exones de diversas
formas. Este recorte o splicing alternativo permitiría
obtener varias proteínas a partir de una única
secuencia de ADN o proteínas nuevas. También se ha
sugerido que este sistema permitiría una evolución más
rápida.
Resumen de las Funciones de los genes humanos:
-
La gran mayoría de los 30 000–40
000 genes humanos codifican para proteínas
-
Menos de 2500 genes especifican para
ARN no codificante
-
Un 17.5% de los genes codifican
enzimas responsables de las funciones bioquímicas
-
Los restantes genes están
involucrados en actividades como transporte desde o
hacia la célula, sistema inmune, el plegado fnal de
las proteínas, entre otras muchas funciones.
2. Pseudogenes
Es un gen que fue inactivado por que su
secuencia de nucleótidos cambió por una mutación que
lo transformó en un gen completamente infuncional. Una
vez que un gen sufrió este proceso, generalmente se
sigue degradando por acumulación de mutaciones
sucesivas.
3. Regiones intergénicas
Casi el 62% del genoma humano esta
formado por regiones repetitivas integenica (entre genes)
que no transcriben en ARN mensajero, siendo de función
desconocida. Es lo que se suele
llamar ADN basura (junk DNA), sin embargo este término
es incorrecto,ya que el hecho que no se haya encontrado
su función no significa que no la tenga eventualmente.
El ADN Repetitivo puedo dividirse en dos
categorías:
-
Existen secuencias altamente repetitivas en
tandem (de función
desconocida, salvo para la secuenciación génica del hombre):
-
SATÉLITES: 5-50 pares de bases, repetidas hasta un
millón de veces.
-
MINISATÉLITES: 12-100 pares de bases, repetidas un
número variable de veces, son marcadores genéticos moleculares de cada
persona.
-
MICROSATÉLITES: 1-5 pares de bases, en grupos de 10-50
copias.
-
Secuencias moderadamente repetitivas:
-
Telómeros, se encuentran en los extremos de los
cromosomas. En el ser humano esta secuencia es TTAGGG y se repite unas
2500 veces. Recordando la replicación del ADN... la cadena avanzada
puede replicarse hasta el extremo, pero como la cadena retrasada no
tiene un cebador en el extremo 5´ del cromosoma, en cada replicación
se produce un acortamiento de la nueva hebra formada. De este modo el
nuevo ADN carece de esta última porción repetitiva ya que el mecanismo
de reparación corta este extremo. En células en activa división
(médula ósea y línea germinal) una telomerasa cataliza el agregado de
la porción faltante.
-
Secuencias codificadores de ARNt y ARNr: existen
múltiples copias de ADN que codifican para estos ARN, ya que se precisan
en grandes cantidades
Estas regiones repetidas parecen derivar
de la actividad de los transposones o genes
saltarines, son elementos móviles del ADN que van
dejando copias de si mismo al moverse por distintos
lugares del genoma. Estas regiones repetitivas del
genoma pueden alcanzar el 44% algo así como
1400 Mb del ADN
En febrero del 2001 Nature
publicó la versión del genoma humano dada a
conocer por el HGP
(Proyecto genoma humano) cuyo director es Francis Collins y
Science,
la versión producida por el grupo de
Craig Venter (®
)
ambas con las correspondientes versiones digitales.
La secuencia asciende a unas 2.100 millones de bp y deriva del
estudio de la eucromatina.
La
heterocromatina (que representa aproximadamente un 5% del total) y que es difícil de
secuenciar, posiblemente contenga algunos
genes. En ambas publicaciones se detallan los métodos utilizados, las
perspectivas y significado de la secuenciación para la ciencia y la humanidad.
Celera utilizó par la secuenciación el ADN de cinco individuos (un latino, un
asiático, dos caucásicos y un afroamericano) y las cinco
secuenciaciones fueros coincidentes en un 99.9%.
Una rumor se ha esparcido: uno de los caucásicos seria
el propio Craig Venter.
Collins señala que para identificar los genes
funcionales los científicos dependen de una variedad de indicios. Algunos surgen de la comparación con las bases de datos de
ADNc
(complementario), que son
copias exactas de los ARNm. También ayuda la comparación con el ya
secuenciado genoma de
la rata en razón de que los genes de la rata y de los humanos son a menudo
muy parecidos. Sus secuencias se encuentran conservadas en ambos
genomas, mientras que no sucede lo mismo
en una gran cantidad de ADN que los rodea.
Cuando estos (u otros) indicios no están disponibles los científicos
dependen para la identificación exclusivamente de las predicciones realizadas
en computadoras ("gene-predicting computer
algorithms").
-
Los resultados señalan la existencia de entre 30.000 y 40.000
genes,
solo aproximadamente el doble de los de Drosophila melanogaster.
Esta cifra esta en el orden de lo pronosticado en base a la secuenciación
del cromosoma 21 y resulta
ser notablemente inferior a los
140.000 estimados en base a la complejidad
funcional del ser humano.
-
Los voceros del proyecto aluden a las
diferentes formas en la que puede introducirse complejidad en
un sistema por mecanismos se dan en humanos y en
otros genomas de organismos superiores a saber:
-
Proteínas multifuncionales
-
Cortes y ensambles alternativos durante el proceso de edición
del ARNm (al menos un tercio de los genes humanos producen diferentes proteínas
por medio de ediciones alternativas del mensaje ("alternative splicing"
) codificado en el "pre ARNm".
-
Como los algoritmos nos son un 100%
fiables (a veces "ven" genes donde no hay tales, o pasan por alto
algunos de los existentes) algunos científicos dudan del contaje
realizado, entre ellos, William Haseltine ( el CEO de
Human Genome
Sciences considera que existen mas del doble de genes de los
reportados por los dos grupos
-
Causa cierta perplejidad encajar el significado de la presencia de unos
200 genes
bacterianos que "invadieron" el "futuro genoma humano"
en alguna etapa evolutiva muy primitiva (millones de años atrás) producto
de una transferencia horizontal de
genes.
-
El genoma contiene grandes regiones pobres en genes ("desiertos").
Mas de la mitad del genoma humano consiste en secuencias repetitivas
sin función conocida ("junk DNA" o "ADN basura") destacándose que el cromosoma 19
que tiene un 57% de ADN repetitivo.
La mayor parte del mismo deriva de la actividad parasitaria
de transposones que se replicaron e insertaron copias de si mismos en otros
sitios. Actualmente las diferentes familias de transposones
parecen haber dejado de "vagar" por el genoma y solo quedan
en el sus "fósiles". Unos 50 genes parecen haber sido originados
en transposones lo cual sugiere un cierto rol protagónico en la evolución
del genoma.
-
Sumándose a la repetición de secuencias causada por los
transposones grandes segmentos, tanto dentro como entre cromosomas del genoma,
parecen haberse duplicado a lo largo de los tiempos. Los investigadores
creen que esto permitió a la evolución "realizar ensayos" con
los mismos sin destruir la función original y probablemente permitió la
expansión de muchas familias de genes humanos.
-
Tanto el HGP como Celera identificaron en el ADN una multitud
de posiciones de bases que difieren entre individuos los llamados
"snips" o SNPs (single polynucleotide polymorphism).
HGP si bien el 99,9% de las secuencias son idénticas en todos los
individuos el aproximadamente 0,1%, que corresponde a los SNPs,
difiere de uno a otro. Se espera aprender de
ellos como los genes hacen diferentes a los individuos y, en
particular, la razón por la cual algunos son mas susceptibles a ciertas
enfermedades.
Los avances realizados en este campo fueron espectaculares y, mas
allá de los informes que parecen destinados a impactar a la opinión
pública (en especial inversores actuales y futuros..), resta
todavía una enorme cantidad de trabajo a realizar: completar la ya
señalada secuenciación de la heterocromatina, rellenar los "huecos"
("gaps") dejados en secuencias muy difíciles, encontrar la
totalidad de los genes que codifican para proteínas y aquellos que solo
codifican para ARN, descubrir secuencias regulatorias, "blancos"
donde las moléculas interactúan con lo genes e identificar mas funciones
de los mismos, sin dejar de lado las necesarias revisiones para la
corrección de los errores que pudieron escaparse en estas primeras
versiones.
El Genoma humano es igual para TODOS
los seres humanos?

Al estudiar este tema debemos tener en
mente que hablamos de GENOMA HUMANO por una
cuestión práctica, pero que la secuencia de
nucleótidos es única para cada persona, con la sola
excepción de los gemelos idénticos.
Las diferencias que aparecen entre los
genomas de dos personas se deben al polimorfismo de
un solo nucleótido o SNP (Single Nucleotide
Polymorphism, pronunciado esnip) es la variación
en la secuencia de ADN que afecta a solo un nucleótido
del genoma. Dicho de otro modo es el lugar del
genoma en que algunas personas tienen una Adenina y
otras tienen una Timina. Los SNP aparecen cada 100 a 300
bases
Se identificaron mas de 1.4 millones de
SNP, de los que hasta dos tercios corresponden a la
sustitución de una citosina (C) por una timina (T). En
promedio hay un SNP cada 2.0 kb.
2004, Mas allá del Proyecto Genoma Humano
| Sydney
Brenner del Instituto
Salk, Nobel 2002 escribió, "Los antiguos genetistas
conocían de lo que estaban hablando cuando utilizaban el
término "gene", pero el término parece haber sido
"corrompido" por la moderna genómica pasando a
significar cualquier segmento de una secuencia que se
expresa. |
| Claes
Wahlestedt del Instituto
Karolinska (Suecia, Sweden,) nos dice "tendemos
a no hablar mas acerca de "genes“ ; nos referimos a
cualquier segmento que es trascripto [a ARN] como una
"unidad trascripcional" . |
|
Carmen
Sapienza de la Universidad
de Temple (casi emitiendo un nuevo postulado de la ley
de Murphi aplicable al genoma) nos dice: "todo aquello que
pueda ocurrir en el genoma, sucederá"
|
El genoma, la suma de la información heredable contenida
en los cromosomas y que gobierna el desarrollo de un organismo, no es
un texto estático pasado de una generación a otra, en vez de
ello el genoma es una maquinaria bioquímica de extraordinaria
complejidad que, como cualquier maquinaria, opera en el espacio
tridimensional y esta constituido por partes diferentes e
interactuantes. Estas partes conformas por lo menos tres niveles de
información.
El 98% del genoma que ha sido considerado durante mucho tiempo
como "silencioso", en el mejor de los casos , o como
"basura" (junk) en muchos otros, no se estudió en profundidad en general por falta de
métodos
adecuados. En estos últimos años los genetistas han
explorado las partes no visibles del genoma en busca de
explicaciones a anomalías que que contradicen el dogma central de
la biología: enfermedades familiares que se manifiestan de manera
impredecible (aún en gemelos.....) o el "encendido y apagado" de genes en canceres
que no presentan mutaciones. Estos estudios se centraron en los otros dos niveles
adicionales de información encontrándose que se encuentran
profundamente relacionados con la herencia conectándola con el
desarrollo y las enfermedades. Existen nuevos esfuerzos colaborativos
que están tratando de examinar estas regiones tales como el
Proyecto ENCODE
( (Encyclopedia of
DNA Elements) y empresas particulares entre ella la pionera
Affymetrix que explora la organización y función de la
totalidad el Genoma Humano.
-
La
primera de estas partes, los genes que codifican para proteínas (aproximadamente 30.000
regiones del Genoma Humano), conforman y representan alrededor de un 2%
del ADN total.
-
La segunda de estas partes, esta conformada (entre
otros) por los genes "solo a ARN" (RNA only genes)
a partir de los cuales no se sintetizan proteínas.
Estos genes
no convencionales dan origen a ARNs activos y por medio de
ellos alteran el comportamiento de "genes
normales".
La
tercera parte esta conformada por la información
epigenética guardada en las proteínas y otras
moléculas (por ej. grupos metilo) que se encuentran rodeando o esta pegadas al ADN.
Estas marcas epigenéticas pueden influir en las
características o en la salud de un individuo (algunas pasan de
padres a hijos) sin alterar
la secuencia del ADN.




En construcción.


Gibson & Muse. A Primer of Genome
Science, 2nd Edition. Sinauer Associates. 2004
JC. Venter, MD. Adams, and EW. Myers, et
al. (2001). The sequence of the human genome Science
291: 1304-1351. (PubMed)
|