(b) Enseguida se muestran las estructuras de tres compuestos. 15. Se muestran las estructuras de las bases nitrogenadas uracilo y
Con base en su respuesta a la parte (a), ¿cuál de los tres com- citosina. ¿En qué difieren sus grupos funcionales?
puestos agregaría a un alimento de modo que pareciera que
contiene más proteína? Explique. O NH2
(c) ¿Cuál de los tres compuestos ya estaría presente en una mues-
tra de alimento que en efecto contiene proteína? Explique. HN N
(a) (b) (c) O ON ON
H H
OH NH2 ϩH3N CH C OϪ
C NN Uracilo Citosina
H2N N
H C OH CH2 16. ¿Cuáles son los componentes estructurales de las moléculas
CH2OPO32Ϫ biológicas llamadas nucleótidos?
NH2 CH2
CO 17. Compare las solubilidades en agua de alanina, glucosa, palmi-
tato y colesterol, y explique su razonamiento.
OϪ
18. Las membranas celulares son en gran medida estructuras hi-
8. Se muestra la estructura del compuesto urea. La urea es un drófobas. ¿Cuál compuesto pasará por una membrana con mayor
producto de desecho del metabolismo, que se excreta a través de los facilidad, glucosa o 2,4-dinitrofenol? Explique.
riñones en la orina. ¿Por qué los médicos indican a los pacientes con
daño renal que deben consumir una dieta baja en proteína? OH
NO2
O NO2
H2N C NH2 2,4-Dinitrofenol
Urea 19. ¿Cuál molécula polimérica forma una estructura más regular,
DNA o proteína? Explique esta observación en términos de las fun-
9. Hay 20 aminoácidos distintos que forman parte de las proteí- ciones celulares de estas moléculas.
nas (véase figura 4-2). Todos tienen la misma estructura básica con
la excepción del grupo R, que es único para cada aminoácido. ¿Qué 20. ¿Cuáles son las dos principales funciones biológicas de los
grupos funcionales están presentes en los aminoácidos? polisacáridos?
10. Trace la estructura del aminoácido alanina. ¿Qué tiene de es- 1-3. Energía y metabolismo
pecial el átomo de carbono central de la alanina?
21. ¿Cuál es el signo del cambio de entropía para cada uno de los
11. En la página 4 se presentan las estructuras de los aminoácidos siguientes procesos?
asparagina (Asn) y cisteína (Cys). ¿Qué grupo funcional tiene Asn
que no se encuentran en Cys? ¿Qué grupo funcional tiene Cys que (a) Congelación del agua.
no se encuentran en Asn? (b) Evaporación del agua.
(c) Sublimación del hielo seco.
12. Trace un dipéptido (un polipéptido con dos residuos) que (d) Disolución de cloruro de sodio en agua.
contenga los aminoácidos Asn y Cys mostrados en la página 4. Al (e) Ensamblaje de tipos distintos de moléculas lipídicas para
formarse el enlace peptídico entre los dos residuos, ¿cuáles átomos formar una membrana.
se pierden? ¿Qué grupos funcionales se pierden? ¿Qué nuevo grupo (f ) Combustión de glucosa en una célula a fin de obtener ener-
funcional se forma? gía para realizar trabajo celular.
13. Trace la estructura de “cadena recta” de la glucosa. ¿Qué gru- 22. ¿Qué tiene más entropía, una molécula polimérica o una mez-
pos funcionales están presentes en la molécula de glucosa? cla de sus monómeros constituyentes?
14. Considere el monosacárido fructosa. 23. Una entrenadora siempre lleva un par de compresas de hielo
(a) ¿En qué difiere esta fórmula de la glucosa?
(b) ¿En qué difiere esta estructura de la glucosa? instantáneo por si una de sus jugadoras se lesiona. Las compresas de
CH2OH hielo instantáneo contienen una bolsa de agua más pequeña y nitra-
CO to de amonio sólido. Para activar la compresa, la bolsa de agua en su
HO C H interior se comprime para romperla, esto permite que el agua libera-
H C OH da disuelva el nitrato de amonio. La ecuación para la disolución del
H C OH nitrato de amonio en agua se muestra enseguida. ¿Cómo funciona la
CH2OH compresa fría?
Fructosa H2O
NH4NO3(s) NHϩ4 (aq) ϩ NOϪ3 (aq)
ΔH ϭ 26.4 kJ ؒ molϪ1
24. Los excursionistas a menudo llevan compresas calientes con
ellos, en particular cuando acampan en los meses de invierno o a
grandes altitudes. El diseño es similar al descrito en el problema 23,
Problemas | 21
excepto que se usa cloruro de calcio en vez de nitrato de amonio. (c) De los componentes ΔH y ΔS, ¿cuál hace una mayor contri-
La ecuación para la disolución de cloruro de calcio en agua es como bución al valor de energía libre? Comente sobre la importancia
sigue. ¿Cómo funciona la compresa caliente? de esta observación.
H2O Ca2ϩ (aq) ϩ 2ClϪ(aq) ΔH ϭ Ϫ81 kJ ؒ molϪ1 31. Disponga las siguientes moléculas en orden de la más oxidada
a la más reducida.
CaCl2(s)
25. O H
H C OH
(a) ¿Es favorable la conversión de glucosa en glucosa 6-fosfato? H CH OCO
A
Explique. H C
glucosa ϩ fosfato glucosa 6-fosfato ϩ H2O B
ΔG ϭ 13.8 kJ ؒ molϪ1
(b) Supónga que la síntesis de glucosa 6-fosfato se acopla a la 32. Identifique como una oxidación o una reducción el proceso
hidrólisis de ATP. Escriba la ecuación global para el proceso descrito en los enunciados que siguen.
acoplado y calcule ΔG de la reacción acoplada. ¿Es la conversión
de glucosa en glucosa 6-fosfato favorable en estas condiciones? (a) Las plantas sintetizan monosacáridos a partir de dióxido de
Explique. carbono durante la fotosíntesis.
(b) Un animal come plantas y degrada los monosacáridos a fin
ATP ϩH2O ADP ϩ fosfato de obtener energía para sus procesos celulares.
ΔG ϭ Ϫ30.5 kJ ؒ molϪ1
33. De las siguientes reacciones, indique si el reactivo se oxida o se
reduce. Es posible que las reacciones no estén balanceadas.
26. Para la reacción en la cual el reactivo A se convierte en el O O
producto B, diga si este proceso es favorable en (a) 4 °C y (b) 37 °C. (a) CH3 (CH2)14 C OϪ 8 CH3 C S CoA
H (kJ • molϪ1) S (J • KϪ1 • molϪ1) (b) COOϪ COOϪ
CH2 CH2
A 54 22 CH OH CO
B 60 43 COOϪ COOϪ
27. Para una reacción dada, el valor de ΔH es de 15 kJ ؒ mol–1 y (c) COOϪ COOϪ
el valor de ΔS es de 51 J ؒ mol–1. ¿Por arriba de cuál temperatura esta
reacción será espontánea?
28. Indique si la entropía aumenta o disminuye en las siguientes
reacciones en solución acuosa.
(a) COOϪ COOϪ CH CH2
C O ϩ CO2(g) CO CH CH OH
CH3 CH2
COOϪ COOϪ COOϪ
O
(b) COOϪ H (d) ϩH3N CH C OϪ O
C O ϩ Hϩ C O ϩ CO2(g) CH2 2 ϩH3N CH C OϪ
CH3 CH3 S
ϩ H2 CH2
S SH
29. ¿Cuáles de los siguientes procesos son espontáneos? CH2
(a) Una reacción que ocurre con cualquier decremento de ental- ϪO C CH NHϩ3
pía y cualquier aumento de entropía.
(b) Una reacción que ocurre con un incremento pequeño de O
entalpía y un incremento grande de entropía.
(c) Una reacción que ocurre con un decremento grande de ental- 34. Para cada una de las reacciones del problema 33, diga si se
pía y un decremento pequeño de entropía. necesita un agente oxidante o uno reductor para efectuar la reacción.
(d) Una reacción que ocurre con cualquier incremento de ental-
pía y cualquier decremento de entropía. 35. En algunas células, son lípidos como el palmitato (que se
muestra en la página 6) en vez de monosacáridos los que sirven
30. El valor de ΔG a 37 °C para la reacción de la arginina cinasa como combustible metabólico primario.
se determinó en fecha reciente. El ΔH para la reacción es de –8.19
kJ ؒ mol–1 y el ΔS es de 2.20 J ؒ K–1 ؒ mol–1. (a) Considere el estado de oxidación de los átomos de carbono
del palmitato y explique cómo se ajusta esto a un esquema como
(a) ¿Es la reacción exotérmica o endotérmica? el que se muestra en la figura 1-9.
(b) ¿Cuál es el valor de ΔG de la reacción? ¿Es ésta espontánea? (b) Sobre una base carbono por carbono, diga si el palmitato
o la glucosa haría disponible más energía libre para reacciones
metabólicas.
22 | CAPÍTULO 1 Base química de la vida
36. ¿Cuál genera más energía libre cuando se oxida por completo, amoniaco e hidrógeno gaseosos a una descarga eléctrica e hicieron
el estearato o el α-linolenato? recircular la mezcla, de modo que cualesquiera compuestos forma-
dos se disolvieran y acumularan en el agua. Luego de una semana,
H3C (CH2)16 COOϪ analizaron la solución y encontraron glicina, alanina, ácido láctico,
urea y otros aminoácidos y pequeños ácidos orgánicos. ¿Cuáles fue-
Estearato ron las implicaciones de este experimento?
H3C CH2 (CH CHCH2)3 (CH2)6 COOϪ 38. Para dar origen a estructuras más complejas, ¿qué capacidades
debieron tener las primeras moléculas biológicas?
␣-linolenato
39. ¿Por qué es importante la información molecular para clasifi-
1-4. Origen y evolución de la vida car y rastrear la relación evolutiva de especies bacterianas, pero lo es
menos para las especies de vertebrados?
37. En el decenio de 1920-29, Oparin y Haldane sugirieron de
manera independiente que la energía de tormentas eléctricas en el 40. Las primeras teorías propuestas para explicar las semejanzas
mundo prebiótico podría haber transformado algunos gases de la entre bacterias y mitocondrias o cloroplastos sugerían que una célula
atmósfera primitiva en pequeñas moléculas orgánicas. En 1953, Mi- eucariótica primitiva engulló una célula procariótica de vida libre,
ller y Urey realizaron un experimento en el cual demostraron que pero no la digirió por completo. ¿Por qué es improbable que tal
ese escenario era plausible. Sometieron una mezcla de agua, metano, suceso explique el origen de mitocondrias o cloroplastos?
BIBLIOGRAFÍA RECOMENDADA
Koshland DE: The seven pillars of life, Science 2002;295:2215– acerca de la Tierra primitiva y el origen de la vida, incluida la
2216 [Describe algunos de los atributos esenciales de todos los posibilidad de que la vida se haya originado en chimeneas hi-
organismos, incluidos un programa de DNA, capacidad de mu- drotermales.]
tar, compartimentalización, necesidad de energía, capacidad de
regenerarse, adaptabilidad y separación.] Tinoco I Jr, Sauer K, Wang JC: Physical Chemistry: Princi-
ples and Applications in Biological Sciences, 4th ed. Chapters 2–5,
Nee S: More than meets the eye, Nature 2004;429:804–805. Prentice Hall, 2002. [Éste y otros libros de texto de fisicoquímica
[Un breve comentario acerca de la apreciación de la diversidad presentan las ecuaciones básicas de la termodinámica.]
metabólica de la vida microbiana.]
Nisbet EG, Sleep NH: The habitat and nature of early life,
Nature 2001;409:1083–1091. [Explica algunas de las hipótesis
Bibliografía recomendada | 23
CUADRO 3-3 | Código genético estándara
Primera Segunda posición Tercera
posición posición
(extremo 5´) U CA G (extremo 3´)
U UUU Phe UCU Ser UAU Tyr UGU Cys U
UUC Phe UCC Ser UAC Tyr UGC Cys C
C UUA Leu UCA Ser UAA Stop UGA Stop A
UUG Leu UCG Ser UAG Stop UGG Trp G
A
CUU Leu CCU Pro CAU His CGU Arg U
G CUC Leu CCC Pro CAC His CGC Arg C
CUA Leu CCA Pro CAA Gln CGA Arg A
CUG Leu CCG Pro CAG Gln CGG Arg G
AUU Ile ACU Thr AAU Asn AGU Ser U
AUC Ile ACC Thr AAC Asn AGC Ser C
AUA Ile ACA Thr AAA Lys AGA Arg A
AUG Met ACG Thr AAG Lys AGG Arg G
GUU Val GCU Ala GAU Asp GGU Gly U
GUC Val GCC Ala GAC Asp GGC Gly C
GUA Val GCA Ala GAA Glu GGA Gly A
GUG Val GCG Ala GAG Glu GGG Gly G
a Los 20 aminoácidos se abrevian como sigue: Ala, alanina; Arg, arginina; Asn, asparagina; Asp, aspartato; Cys,
cisteína; Gly, glicina; Gln, glutamina; Glu, glutamato; His, histidina; Ile, isoleucina; Leu, leucina; Lys, lisina; Met,
metionina; Phe, fenilalanina; Pro, prolina; Ser, serina; Thr, treonina; Trp, triptófano; Tyr, tirosina; Val, valina.
cleótidos en su DNA, incluso si ello significa examinar un gen a la vez. Se han iden-
tificado miles de genes mediante estudios de sus productos proteínicos, y millones
más se han catalogado a través de los proyectos de secuenciación del genoma (sec-
ción 3-3). Si una proteína defectuosa se relaciona con una enfermedad específica,
identificar el gen puede ser un paso necesario para comprender el desarrollo y la posi-
bilidad de tratamiento de la enfermedad. Sin embargo, en el caso del gen de la fibrosis
quística nunca se ha identificado un producto génico. Uno de los signos diagnósti-
cos de la FQ es la concentración elevada de cloruro en el sudor (según la creencia
medieval, un niño que sabía salado al besarlo moriría pronto). Pero ni esta caracte-
rística ni otros síntomas, como el moco espeso en las vías respiratorias, podrían im-
plicar de manera inequívoca un defecto en ninguna proteína conocida. A fin de
identificar la base molecular de la enfermedad, los investigadores deben identificar el
gen cuya mutación (alteración) produce los síntomas característicos de la fibrosis
quística.
Equipos de investigadores analizaron el DNA de individuos afectados, que tenían
dos copias del gen defectuoso, y de familiares que eran portadores asintomáticos al
tener una copia normal y una defectuosa del gen. Los individuos con una o dos co-
pias del gen de FQ defectuoso compartían otros dos rasgos genéticos que pueden
detectarse mediante una prueba de laboratorio. Estos dos DNA marcadores se usa-
ron para definir una región cromosómica que era probable que contuviera el gen de
la fibrosis quística. En particular, un segmento de DNA resultó estar presente en
varias especies de mamíferos, lo cual sugería que el segmento contenía un gen esen-
cial (alrededor de 98% del DNA de los mamíferos no codifica proteína). Los inves-
tigadores utilizaron un método descrito en la sección 3-4 para determinar la
secuencia de nucleótidos en esta región del DNA, y finalmente identificaron un
tramo de 250 000 pb como el gen de la fibrosis quística.
Como ocurre para casi todos los genes de los mamíferos, sólo determinadas por-
ciones del gen de la FQ corresponden de manera directa a un producto proteínico,
porque algunos segmentos de la molécula de mRNA transcritos a partir del gen se
eliminan (en un proceso llamado empalme) antes de que el mensaje se traduzca en
proteína (el empalme se considera con mayor detalle en la sección 21-3). Además,
determinadas secuencias en cada extremo del mRNA no se traducen. Después del
empalme, el mRNA tiene sólo 6 129 nucleótidos de largo. De esta molécula, 4 440
nucleótidos (4 440 ¸ 3 = 1 480 codones) especifican los 1 480 residuos aminoácidos
del producto proteínico.
3-2. Los genes codifican proteínas | 63
DNA 250 000 pb
Transcripción
mRNA sin
empalmar
Empalme
6 129 bases
mRNA empalmado
4 440 bases = 1 480 codones
Traducción
1 480 aminoácidos
Proteína
Haciendo corresponder cada trio de bases en la secuencia de mRNA que se dedu-
jo, con el aminoácido apropiado (cuadro 3-3) se obtuvo la secuencia de aminoácidos
de la proteína.
Estudios de secuenciación adicionales mostraron que en alrededor de 70% de los
pacientes con FQ, el gen tiene un faltante de tres nucleótidos. Esto da por resultado
la deleción de un solo residuo fenilalanina (Phe) en la posición 508 (el residuo nú-
mero 508 en la proteína codificada):
Gen normal 504 505 506 507 508 509 510 511 512
mRNA . . . GAA AAT ATC ATC TTT GGT GTT TCC TAT . . .
Proteína . . . Glu Asn Ile Ile Phe Gly Val Ser Tyr . . .
Gen mutado 504 505 506 507 508 509 510 511 512
mRNA
Proteína . . . GAA AAT ATC AT– – –T GGT GTT TCC TAT . . .
. . . Glu Asn Ile Ile Gly Val Ser Tyr . . .
Observe que si bien la deleción del nucleótido afecta los codones 507 y 508, la
redundancia del código genético significa que la isoleucina (Ile) en la posición 507
no es afectada (porque los codones ATC y ATT especifican Ile). La proteína que
carece de Phe 508 es procesada de modo anormal por la célula, por lo que hay muy
poco de ella en la forma funcional.
Los investigadores han identificado más de 200 mutaciones adicionales dispersas
en el gen de la FQ, que explican la mayor parte de 30% restante de casos de FQ.
Algunas de estas mutaciones causan formas más leves de la enfermedad, que no se
detectan sino hasta la edad adulta. Se han identificado genes relacionados con otras
enfermedades del humano, y se les ha secuenciado por algunos de los métodos que
se usaron para rastrear el gen de la fibrosis quística.
Una vez que se determina la secuencia de un gen, se deposita esta información en
una base de datos pública, como GenBank. Es posible acceder a esos datos por com-
putadora a fin de comparar una nueva secuencia con secuencias de otros genes (Pro-
yecto de bioinformática 2, Secuencias de nucleótidos). Esas comparaciones son
vitales para asignar funciones a genes recién descubiertos, dado que genes con fun-
ciones similares en especies distintas tienden a tener secuencias similares. Además,
las semejanzas de secuencia a menudo indican un origen común y una historia evo-
lutiva compartida para las especies que poseen esas secuencias. Por ejemplo, la divi-
sión de los procariotes en dos grupos (arqueas y bacterias; sección 1-4) se basa en los
resultados de estudios de secuenciación.
64 | CAPÍTULO 3 De los genes a las proteínas
REPASO DE CONCEPTOS
• ¿Cómo codifica información genética el DNA y cómo se expresa esta
información?
• ¿Cuál es la relación entre la secuencia de nucleótidos en un gen y la secuencia de
aminoácidos en una proteína?
• Numere algunas razones por las cuales podría ser útil conocer la secuencia de un gen.
3-3. Genómica
La capacidad de secuenciar tramos largos de DNA ha hecho posible secuenciar ge- CONCEPTOS CLAVE
nomas enteros, desde las moléculas pequeñas de DNA de bacterias parásitas hasta los • Los genomas de las especies
enormes genomas multicromosómicos de plantas y mamíferos. Dado que incluso un
cromosoma bacteriano relativamente pequeño resulta demasiado grande para se- diferentes varían en tamaño y
cuenciarlo en un solo paso, el DNA debe dividirse en varios segmentos con super- número de genes.
posición que se secuencian de manera individual. La secuencia de nucleótidos del • El análisis de los datos genéticos
DNA entero puede reconstruirse por análisis computarizado de las secuencias con pueden proporcionar información
superposición. Aunque este procedimiento fragmento por fragmento puede efec- sobre la función del gen y el riesgo
tuarse de manera sistemática, suele ser más eficiente generar un gran número de de la enfermedad.
fragmentos de DNA al azar o “por escopetazo” y luego examinar los fragmentos se-
cuenciados en busca de superposición.
DNA original
Segmentos por
secuenciar de
manera individual
En el cuadro 3-4 se numeran algunos de los miles de organismos cuyos genomas
se han secuenciado. La lista incluye especies que se usan ampliamente como organis-
mos modelo para diferentes tipos de estudios bioquímicos (recuadro 3-A).
CUADRO 3-4 | Tamaño del genoma y número de genes de algunos
organismos
Organismo Tamaño del genoma (kb) Número de genes
Bacterias 580 525
Mycoplasma genitalium 1 830 1 789
Haemophilus influenzae 3 947 3 618
Synechocystis PCC6803 4 643 4 630
Escherichia coli
1 830
Arqueas 1 740 2 486
Methanocaldococcus jannaschii 2 178
Archaeglobus fulgidus 6 200
Hongos 12 069 33 300
Saccharomyces cerevisiae (levadura) 29 300
∼25 000
Plantas 120 000
Arabidopsis thaliana 370 000 19 500
Oryza sativa (arroz) ∼2 400 000 13 600
Zea mays (maíz) 22 000
Animales
Caenorhabditis elegans (nematodo) 100 000
Drosophila melanogaster (mosca de la fruta) 180 000
Homo sapiens 3 200 000
(Datos de NCBI Genome Project).
3-3. Genómica | 65
RECUADRO 3-A UN VISTAZO MÁS DE CERCA
Algunos organismos modelo
Aparte del humano, unas pocas especies de los 14 millones que se
estima hay en el mundo se estudian con mayor detalle que el resto.
Estos organismos modelo, que a menudo se eligen en un principio
por su amplia disponibilidad o facilidad de cultivo, permiten a los
investigadores de distintos laboratorios comparar de manera directa
resultados experimentales y construir cuerpos coherentes de
conocimiento a partir de estudios sobre la genética, el metabolismo
o el comportamiento de esos organismos. Cuatro organismos
modelo que representan algunas de las principales formas de vida
son la bacteria Escherichia coli, la levadura Saccharomyces cerevisiae,
el nematodo (gusano redondo) Caenorhabditis elegans, y la planta
Arabidopsis thaliana.
(Dr. Kari Lounatmaa/Science Photo Library/Photo Researchers). (Sinclair Stammers/Science Photo Library/Photo Researchers).
E. coli, una bacteria del tubo digestivo de los mamíferos, ha servido C. elegans es un gusano redondo pequeño (1 mm) y transparente.
como organismo modelo por décadas. Es una bacteria metabólica Como organismo multicelular, porta genes que no se encuentran
versátil, que utiliza diferente compuestos como fuentes de carbono en organismos unicelulares, como los que codifican hormonas y
y nitrógeno, y tolera tanto condiciones aeróbicas como anaeróbi- receptores hormonales implicados en la coordinación de las
cas. Debido a sus requerimientos nutricionales simples, es fácil de actividades de sus 959 células. De hecho, alrededor de 300 de estas
cultivar en el laboratorio. De hecho, se desarrolla con rapidez, con células son parte del sistema nervioso del gusano. Dado que se han
un tiempo de duplicación de 20 min en condiciones óptimas. documentado los orígenes y destinos de todas sus células durante el
desarrollo, C. elegans es invaluable para estudios sobre el desarrollo
y neurológicos.
(Andrew Syred/Science Photo Library/Photo Researchers). (Dr. Jeremy Burgess/Science Photo Library/Photo Researchers).
La levadura de panificación, S. cerevisiae, es uno de los organismos El reino vegetal está representado por A. thaliana, un pequeño
eucarióticos más simples. Sus genes se distribuyen en 16 cromoso- miembro de la familia de la mostaza. Aunque no es una especie de
mas. Aunque no es tan versátil desde el punto de vista metabólico importancia comercial, A. thaliana tiene corto tiempo de genera-
como E. coli, S. cerevisiae se puede desarrollar en medios definidos, ción y capta con facilidad DNA ajeno. Esto la hace una planta
de modo que su ambiente químico y físico se puede variar con ideal para estudios de laboratorio.
diferentes objetivos experimentales. Cada uno de sus 6 000 genes
se ha analizado de manera sistemática.
66 | CAPÍTULO 3 De los genes a las proteínas
El número de genes se correlaciona de manera
aproximada con la complejidad de los organismos
No debe causar sorpresa que los organismos con los modos de vida más simples
tienden a poseer la menor cantidad de DNA y el menor número de genes. Por ejem-
plo, M. genitalium y H. influenzae (cuadro 3-4) son parásitos del ser humano que
dependen de los nutrimentos aportados por su hospedador; estos organismos no
contienen tantos genes como las bacterias de vida libre, por ejemplo Sinechocystis
(una bacteria fotosintética). Por lo general, los organismos multicelulares tienen in-
cluso más DNA y más genes, para sostener las actividades de sus muchos tipos celu-
lares especializados. Resulta interesante que los seres humanos contienen sólo unos
pocos genes más que los nematodos, lo cual sugiere que la complejidad de los orga-
nismos resulta no sólo del simple número de genes sino del modo en que los genes
se transcriben y traducen en proteínas. El ser humano y otros organismos son di-
ploides (tienen dos juegos de información genética, uno procedente de cada proge-
nitor), de modo que cada célula humana contiene alrededor de 6 400 millones de
pares de bases de DNA. La información genética suele proporcionarse en el estado
haploide, equivalente a un juego de instrucciones genéticas.
En los genomas de los procariotes, todo el DNA salvo un pequeño porcentaje re-
presenta genes para proteínas y RNA. La proporción de DNA no codificador suele
aumentar con la complejidad del organismo. Por ejemplo, alrededor de 30% del
genoma de las levaduras, más o menos la mitad del genoma de Arabidopsis, y más de
98% del genoma humano consta de DNA no codificador. Aunque 80% del genoma
humano puede transcribirse en realidad a RNA, los segmentos codificadores de pro-
teína sólo representan alrededor de 1.5% del total (figura 3-12).
La mayor parte del DNA no codificador consta de secuencias repetitivas sin función
conocida. La presencia de DNA repetitivo ayuda a explicar por qué determinados
genomas muy largos en realidad sólo incluyen un número pequeño de genes. Por
ejemplo, los genomas de maíz y arroz contienen casi el mismo número de genes,
pero el genoma del maíz es 10 veces mayor que del arroz. Más de la mitad del geno-
ma del maíz está compuesto pro elementos transponibles, es decir segmentos cor-
tos de DNA que se copian muchas veces y se insertan al azar en los cromosomas.
Secuencias únicas Secuencias moderadamente
repetitivas
Secuencias codificadoras Secuencias altamente
de proteína repetitivas
Figura 3-12. Porciones codificadora y no codificadora del genoma humano.
Alrededor de 1.5% del genoma codifica proteínas. Secuencias moderadamente
repetitivas constituyen 5% del genoma, y secuencias altamente repetitivas alrededor de
3%, de modo que más o menos la mitad del genoma humano consta de secuencias
de DNA únicas cuya función se desconoce. Sin embargo, puede transcribirse hasta
80% del genoma.
3-3. Genómica | 67
El genoma humano contiene varios tipos de secuencias de DNA repetitivas, in-
cluidos los remanentes inactivos de elementos transponibles. Alrededor de 45% del
DNA humano consta de secuencias moderadamente repetitivas, que son bloques
de cientos o miles de nucleótidos dispersos por el genoma. Los más numerosos de
éstos se encuentran en cientos de miles de copias. Las secuencias altamente repeti-
tivas constituyen otro 3% del genoma humano. Estos segmentos de 2 a 10 bases
están presentes en millones de copias. Se repiten en tándem (lado a lado), en ocasio-
nes miles de veces. El número de repeticiones de una secuencia dada a menudo varía
entre individuos, incluso en la misma familia, de modo que esta información puede
analizarse para producir una “huella dactilar” de DNA (sección 3-4).
¿Cómo se identifican los genes?
Para muchos genomas aún no se determina el número exacto de genes, y diferentes
métodos para identificar genes producen diferentes estimaciones. Por ejemplo, una
computadora puede analizar una secuencia de DNA en busca de un marco de lec-
tura abierto (MLA), es decir, un tramo de nucleótidos con el potencial de transcri-
birse o traducirse. En el caso de un gen que codifica proteína, el MLA comienza con
un codón “de inicio”: ATG en la cadena de DNA codificadora, que corresponde a
AUG en RNA (cuadro 3-3). Este codón especifica metionina, el residuo inicial de
todas las proteínas recién sintetizadas. El MLA termina con uno de los tres codones
“de detención”: las secuencias de DNA codificadoras TAA, TAG o TGA, que corres-
ponden a los tres codones de detención del mRNA (cuadro 3-3). Otros métodos para
identificación de genes ab initio (“desde el comienzo”) analizan el DNA en busca de
otros rasgos que caracterizan los extremos iniciales y finales de los genes. Estos mé-
todos sobreestiman el número de genes.
Un método más para identificar genes en un genoma se basa en comparaciones
de la secuencia con genes conocidos (por lo cual es probable que se subestime el
número real de genes). Las comparaciones genoma a genoma son posibles debido a
la naturaleza universal del código genético y la relación de todos los organismos en-
tre sí a través de la evolución (sección 1-4). Los genes con funciones similares en
diferentes especies a menudo se parecen. Incluso una comparación cruda puede in-
dicar la categoría funcional de una proteína, por ejemplo enzima o receptor hormo-
nal, aunque tal vez no sea obvia su función exacta en la célula. Los genes que al
parecer carecen de contrapartes en otras especies se denominan genes huérfanos. En
la actualidad, el número de genes conocidos excede el número de productos génicos
conocidos (proteínas y moléculas de RNA). Esto no debe causar sorpresa, dado que
algunos genes se expresan en niveles bajos o generan productos que aún no se han
detectado por los métodos de aislamiento bioquímico ordinarios. Aún no se asigna
una función alrededor de 20% de los genes en el bien estudiado organismo E. coli.
Los mapas genómicos, como los que se muestran en la figura 3-13, indican la
posición y orientación de los genes en un cromosoma. Las flechas en sentidos opuestos
representan genes codificados por cadenas diferentes del cromosoma bicatenario. Nó-
tese que los genes de los mamíferos suelen ser más largos que los genes de las bacterias
(27 kb en promedio), dado que contienen secuencias que se eliminan del transcrito en
el empalme antes de la traducción. Además, los espacios entre genes son mayores en los
genomas de los mamíferos. Compilar un catálogo de los genes de un organismo no es
tan útil como conocer cuáles genes se expresan realmente, y cuándo (recuadro 3-B).
Los proyectos de mapeo génico han descubierto algunos aspectos interesantes de
la evolución, incluida la transferencia génica horizontal. Ésta ocurre cuando un gen
se transfiere entre especies y no de un progenitor a su descendencia en la misma espe-
cie (transferencia génica vertical). La transferencia génica horizontal puede ser media-
da por virus, los cuales es posible que capten DNA extra cuando se insertan y se
cortan a sí mismos de los cromosomas del hospedero. Esta actividad puede generar,
por ejemplo, lo que parece ser un gen de mamífero dentro de un genoma bacteriano.
La facilidad con que muchos organismos bacterianos intercambian sus genes ha dado
origen a la idea de que los grupos de bacterias deben ser vistos como un continuo de
variaciones genómicas y en lugar de especies separadas con genomas bien definidos.
68 | CAPÍTULO 3 De los genes a las proteínas
(a)
(b)
Figura 3-13. Ejemplos de mapas genómicos. a) Genes localizados en un tramo de
10 kb del cromosoma de E. coli, mostrados como bloques de color. b) Genes
de un segmento de 2 500 kb rico en genes del genoma murino.
RECUADRO 3-B UN VISTAZO MÁS DE CERCA
Transcriptómica y proteómica
Durante su desarrollo, una célula contiene de moléculas de mRNA con mRNA que tienen una marca fluorescente y provienen de una
que representan los genes que están activos o que se transcriben en preparación celular. La intensidad de la fluorescencia indica cuánto
ese momento. El estudio de estos mRNA se conoce como mRNA se une a una secuencia de DNA complementaria específica.
transcriptómica. Identificar y cuantificar todos los transcritos de El conjunto de secuencias de DNA se conoce como micromatriz o
mRNA (transcriptoma) de un solo tipo celular proporciona un chip de DNA porque en unos cuantos centímetros cuadrados se
perfil de genes activos. Esto se hace ensamblando tramos cortos de disponen miles de secuencias. La micromatriz puede representar un
DNA con secuencias conocidas en un soporte sólido, y luego genoma completo o sólo algunos genes selectos. Cada punto
permitiéndoles hibridarse, o formar estructuras de doble cadena, brillante en el chip de DNA mostrado en la figura representa una
secuencia de DNA a la cual se unió una molécula de mRNA
(Voker Steger/Science Photo Library/Photo Researchers). fluorescente.
Los biólogos utilizan chips de DNA para identificar genes cuya
expresión cambia en determinadas condiciones o en diferentes fases
del desarrollo. Los investigadores del cáncer emplean chips de
DNA para delinear el patrón de expresión génica en células
tumorales, ya que diferentes tipos de tumores sintetizan distintas
proteínas. Esta información puede ser útil para decidir cómo tratar
el cáncer.
Desafortunadamente, la correlación entre la cantidad de un
mRNA específico y la cantidad de su producto proteínico no es
perfecta; algunos mRNA se degradan con rapidez, mientras que
otros se traducen muchas veces, lo que genera grandes cantidades
de la proteína correspondiente. Así, una manera más confiable de
valorar la expresión génica es mediante la proteómica: el examen
del proteoma de una célula, es decir el juego completo de
proteínas que la célula sintetiza en un instante específico de su ciclo
vital. Sin embargo, este método es limitado por los problemas
técnicos para detectar cantidades diminutas de miles de proteínas
distintas. Los ácidos nucleicos pueden amplificarse por medio de la
reacción en cadena de la polimerasa (sección 3-4), pero no existe
un procedimiento comparable para amplificar proteínas.
3-3. Genómica | 69
(A) Ser humano (B) Drosophila
Señalización
Sistema inmunitario
Figura 3-14. Clasificación funcional de los genes. Existen 25 431 genes en el ser
humano (A) y 14 115 genes en Drosophila (B), que se agrupan conforme a la función
bioquímica del producto génico. Ambos genomas contienen un número grande de
genes sin función asignada (31% en el ser humano y 36.5% en Drosophila), pero el ser
humano dedica una mayor proporción de genes a la señalización celular (9.3 vs. 5.6%
en Drosophila) y a inmunidad y defensa (3.6 vs. 2.2% en Drosophila). (Datos de Protein
Analysis Trough Evolutionary Relationships, www.pantherdb.org/).
Cl− ¿Qué nos dicen los datos genómicos?
LÍQUIDO La genómica, el estudio de los genomas, tiene varias aplicaciones prácticas. El nú-
EXTRACELULAR mero de genes y sus funciones constituyen una instantánea aproximada de las capa-
cidades metabólicas de un organismo dado. Por ejemplo, el ser humano y la mosca
Membrana de la fruta difieren en el número de genes que codifican para vías de señalización
celular celular y funciones del sistema inmunitario (figura 3-14). Un número inusual de
genes pertenecientes a una categoría podría indicar alguna propiedad biológica in-
CITOSOL RTFQ usual de un organismo. Este tipo de conocimiento podría ser útil para desarrollar
fármacos encaminados a inhibir el crecimiento de un organismo patógeno con base
Figura 3-15. Regulador de en su metabolismo único.
conductancia transmembrana de la Otra aplicación práctica de la genómica surge de la idea de que la mayoría de los
genes humanos tienen un homólogo en un organismo modelo (los genes homólogos
fibrosis quística. En esta representación derivan de un ancestro común y tienen secuencias y funciones similares en diferentes
esquemática, la proteína RTFQ se especies). Esto hace que valga la pena alterar o eliminar ese gen en el organismo
coloca en la membrana celular de modo modelo y observar si se pierde alguna función. También es posible mutar de manera
que constituye un canal para que el Cl– sistemática cada gen de S. cerevisiae o C. elegans a fin de asignar una función a cada
salga de la célula. gen. Los resultados pueden extrapolarse al genoma humano, que puede contener
una familia de genes similares.
La función supuesta del producto del gen de la fibrosis quística se iden-
tificó por su similitud de secuencia con una gran familia de proteínas impli-
cadas en el transporte de sustancias de un lado a otro de las membranas
celulares (en la sección 2-2 se vio que sólo sustancias no polares pueden
atravesar de manera espontánea una bicapa lipídica; todas las demás sustan-
cias requieren una proteína transportadora). Cada miembro de esta familia
de proteínas tiene 1 o 2 segmentos que colocan la proteína en la membrana.
La proteína de la FQ también contiene un dominio adicional que se piensa
tiene función regulatoria. En consecuencia, la proteína se llamó regulador
de conductancia transmembrana de la fibrosis quística (RTFQ).
Cuando el RTFQ se introdujo en diferentes tipos celulares fue posible
estudiar su función. La proteína RTFQ es en efecto una proteína trans-
membrana que actúa como canal para permitir la salida de Cl– de la célula (figura
3-15). También regula la captación de Na+ por la célula. Por tanto, el que la proteína
RTFQ sea defectuosa o esté ausente altera la distribución normal de Na+ y Cl–. En
el pulmón con FQ, las concentraciones de iones son bajas en el espacio extracelular.
Como resultado, no se encuentra el agua que normalmente sería extraída por las
altas concentraciones de estos iones. En un pulmón normal, el líquido extracelular
70 | CAPÍTULO 3 De los genes a las proteínas