§inh §oµn Long
viÖc s¾p xÕp l¹i c¸c ph©n ®o¹n ADN trong tÕ bµo soma cïng víi qu¸ tr×nh biÖt hãa c¸c tÕ
bµo T tõ c¸c tÕ bµo gèc, còng gièng nh− c¸ch c¸c gen m· hãa kh¸ng thÓ h×nh thµnh trong
qu¸ tr×nh biÖt hãa c¸c tÕ bµo lympho B. C¸c chuçi polypeptide thô thÓ kiÓu α vµ β ®−îc
m· hãa bëi c¸c ph©n ®o¹n gen ®−îc s¾p xÕp trong c¸c côm locut gièng nh− c¸c ph©n ®o¹n
ADN m· hãa cho c¸c chuçi nÆng vµ nhÑ cña kh¸ng thÓ. ë ng−êi, côm locut gen m· hãa
cho c¸c chuçi α vµ β cña thô thÓ tÕ bµo T n»m t−¬ng øng trªn c¸c NST sè 14 vµ 7.
9.9. §iÒu hßa sù biÓu hiÖn cña c¸c gen m· hãa kh¸ng thÓ
Trong tÕ bµo gèc m¸u, th«ng th−êng c¸c ph©n ®o¹n gen m· hãa kh¸ng thÓ chØ ®−îc
phiªn m· ë møc rÊt thÊp, thËm chÝ kh«ng ®−îc phiªn m·. Trong khi ë c¸c t−¬ng bµo, 10 -
20% tæng sè mARN lµ b¶n phiªn m· cña gen m· hãa kh¸ng thÓ. YÕu tè nµo ®· ho¹t hãa
c¸c gen m· hãa kh¸ng thÓ trong qu¸ tr×nh biÖt hãa c¸c tÕ bµo lympho? T¹i sao mçi lo¹i
t−¬ng bµo chØ s¶n sinh mét lo¹i kh¸ng thÓ ®Æc tr−ng cho kh¸ng nguyªn duy nhÊt?
9.9.1. Lo¹i bá alen lµ c¬ chÕ ®Ó mçi tÕ bµo chØ biÓu hiÖn mét b¶n sao cña gen
T¹i sao mçi t−¬ng bµo chØ t¹o ra mét lo¹i kh¸ng thÓ? Chóng ta biÕt r»ng, c¸c tÕ bµo
soma ë ®éng vËt cã vó th−êng ë d¹ng l−ìng béi. Chóng mang hai b¶n sao kh¸c nhau cña
gen m· hãa c¸c chuçi polypeptide kh¸ng thÓ. Tuy vËy, sau qu¸ tr×nh biÖt hãa c¸c tÕ bµo
B, chØ cã mét chuçi nhÑ duy nhÊt vµ chuçi nÆng duy nhÊt ®−îc t¹o ra. HiÖn t−îng nµy
®−îc gäi lµ sù lo¹i bá alen (v× mét trong hai b¶n sao kh«ng biÓu hiÖn). §iÒu nµy x¶y ra
nh− thÕ nµo? C¬ chÕ chi tiÕt liªn quan ®Õn hiÖn t−îng nµy ®Õn nay ch−a râ. Nh−ng, mét
sè b»ng chøng cho thÊy, ë phÇn lín tr−êng hîp sù t¸i tæ hîp tr×nh tù ADN x¶y ra trªn c¶
hai alen trong mét tÕ bµo (theo c¬ chÕ m« t¶ ë trªn), tuy vËy chØ cã mét kiÓu t¸i tæ hîp
(mét alen) ®−îc biÓu hiÖn. C¸c alen kh«ng biÓu hiÖn th−êng chØ ®−îc r¸p nèi mét phÇn
hoÆc bÞ c¾t bá ®i mét sè tr×nh tù quan träng. HËu qu¶ cña sù lo¹i bá alen lµ nguyªn lý c¬
b¶n cña viÖc cã thÓ t¹o ra mét l−îng lín kh¸ng thÓ nhÊt ®Þnh cã kh¶ n¨ng g¾n kÕt ®Æc
thï víi mét lo¹i epitop nµo ®ã. Kh¸ng thÓ ®−îc t¹o ra nh− vËy ®−îc gäi lµ c¸c kh¸ng
thÓ ®¬n dßng.
9.9.2. Sù t¨ng c−êng biÓu hiÖn c¸c gen m· hãa chuçi nÆng ë c¸c m«
B»ng c¬ chÕ nµo c¸c gen m· hãa kh¸ng thÓ ®−îc ho¹t hãa (biÓu hiÖn m¹nh) sau qu¸
tr×nh r¸p nèi c¸c ph©n ®o¹n gen? Trong c¶ hai tr−êng hîp c¸c gen m· hãa chuçi nÆng vµ
nhÑ, c©u tr¶ lêi lµ sù r¸p nèi c¸c ph©n ®o¹n gen m· hãa kh¸ng thÓ ®· ®−a c¸c promoter
n»m ng−îc dßng ph©n ®o¹n LV ®Õn gÇn mét tr×nh tù enhancer (®−îc kÝ hiÖu lµ E trªn c¸c
h×nh 9.8 vµ 9.9) ho¹t ®éng m¹nh trong vïng intron gi÷a hai ph©n ®o¹n J vµ C. Mçi ph©n
®o¹n LV chøa mét promoter (kÝ hiÖu P trªn h×nh). Tr−íc khi x¶y ra c¸c qu¸ tr×nh t¸i tæ
hîp hÖ gen, c¸c promoter n»m c¸ch xa c¸c enhancer (kÝ hiÖu E trªn h×nh) hµng tr¨m
ngµn baz¬ nit¬; lóc nµy, c¸c enhancer kh«ng thÓ ho¹t hãa ®−îc c¸c promoter, nªn c¸c
kh¸ng thÓ kh«ng ®−îc tæng hîp. Trong qu¸ tr×nh biÖt hãa tÕ bµo B, sù ghÐp nèi c¸c ph©n
®o¹n gen ®· ®−a c¸c promoter ®Õn gÇn c¸c enhancer (kho¶ng c¸ch < 2 Kb). Lóc nµy,
enhancer ho¹t hãa m¹nh c¸c promoter nªn sù tæng hîp c¸c kh¸ng thÓ diÔn ra m¹nh mÏ.
§iÓm ®¸ng chó ý lµ ho¹t ®éng cña enhancer th−êng cã tÝnh ®Æc tr−ng m«; nghÜa lµ, nã chØ
“ho¹t ®éng” ë c¸c tÕ bµo B vµ t−¬ng bµo, mµ kh«ng ho¹t ®éng ë c¸c tÕ bµo kh¸c. Cã thÓ dù
®o¸n sù ho¹t hãa nµy cÇn mét hoÆc mét sè c¸c yÕu tè phiªn m· chØ ®−îc tæng hîp trong
c¸c tÕ bµo cña hÖ miÔn dÞch.
284
Ch−¬ng 10
di truyÒn häc ph©n tö vµ tiÕn hãa
N¨m 1859, Charles Darwin c«ng bè t¸c phÈm “Nguån gèc c¸c loµi” vµ ®−îc coi lµ
thuyÕt tiÕn hãa quan träng bËc nhÊt ®Õn nay. Trong 6 n¨m (1931 - 1936), Darwin ®· ®i
cïng ®oµn th¸m hiÓm cña Beagle vµ thu thËp ®−îc nhiÒu sè liÖu, h×nh ¶nh, mÉu hãa
th¹ch cña c¸c loµi ®éng, thùc vËt tõ nhiÒu vïng ®Þa lý kh¸c nhau trªn Tr¸i ®Êt. Sau nµy,
«ng sö dông nhiÒu n¨m ®Ó so s¸nh, ph©n tÝch c¸c sè liÖu vµ mÉu vËt. Trªn c¬ së c¸c
nghiªn cøu cña m×nh, Darwin lµ ng−êi ®Çu tiªn ®−a ra nhËn ®Þnh r»ng “tÊt c¶ c¸c d¹ng
sèng ®· vµ ®ang tån t¹i trªn Tr¸i ®Êt cã lÏ ®Òu xuÊt ph¸t tõ mét tæ tiªn nguyªn thñy nµo
®ã” vµ “mçi loµi sinh vËt kh«ng bÊt biÕn mµ c¸c quÇn thÓ cña chóng biÕn ®æi dÇn dµ liªn
tôc qua thêi gian lµ nguyªn nh©n dÉn ®Õn sù h×nh thµnh c¸c loµi míi d−íi t¸c ®éng cña
chän läc tù nhiªn”. §ã còng chÝnh lµ nh÷ng néi dung c¬ b¶n cña ThuyÕt tiÕn hãa Darwin.
Dï ngay trong ngµy ®Çu c«ng bè, t¸c phÈm cña «ng víi 1250 b¶n in ®· ®−îc b¸n hÕt,
nh−ng thùc tÕ lý thuyÕt mµ Darwin ®−a ra lóc ®ã ®· g©y nªn nhiÒu hoµi nghi.
§Õn nay, dï ®· trßn 150 n¨m kÓ tõ ngµy t¸c phÈm “Nguån gèc c¸c loµi” ®−îc c«ng
bè, thuyÕt tiÕn hãa Darwin vÉn ®−îc xem lµ mét lý thuyÕt c¬ b¶n cña sinh häc hiÖn ®¹i.
Tuy vËy, tõ n¨m 1953 khi Watson vµ Crick lµm s¸ng tá cÊu tróc cña vËt chÊt di truyÒn
(ADN), c¸c nghiªn cøu di truyÒn häc ph©n tö ®· “bïng næ” vµ bæ sung ngµy cµng ®Çy ®ñ
h¬n c¸c c¬ së khoa häc cho thÊy sù tiÕn hãa thùc chÊt b¾t ®Çu tõ cÊp ph©n tö, mµ cô thÓ
lµ tõ bªn trong c¸c chuçi xo¾n kÐp ADN (ë hÇu hÕt sinh vËt) vµ ARN (ë mét sè virut).
Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn mét sè néi dung c¬ b¶n cña TiÕn hãa ph©n tö.
10.1. Sù gièng nhau trong hÖ gen hÇu hÕt c¸c loµi ®éng vËt
ViÖc so s¸nh hÖ gen gi÷a c¸c loµi ®éng vËt trong thêi gian gÇn ®©y ®−a ®Õn mét
nhËn ®Þnh chung næi bËt lµ c¸c loµi ®éng vËt cã phÇn lín gen gièng nhau. C¶ ba hÖ gen
®éng vËt cã x−¬ng sèng (§VCXS) ®· ®−îc gi¶i tr×nh tù hoµn chØnh, gåm c¸ nãc (Fugu
rubripes), chuét (Mus musculus) vµ ng−êi (Homo sapiens) ®Òu chøa kho¶ng 20.000 –
25.000 gen. Trõ mét vµi ngo¹i lÖ, hÇu hÕt c¸c gen ®−îc t×m thÊy ë ng−êi ®Òu cã “b¶n sao”
t−¬ng øng ë chuét. Nãi c¸ch kh¸c, hÇu nh− kh«ng cã mét “ph¸t minh” nµo míi trong
kho¶ng 50 triÖu n¨m kÓ tõ khi chuét vµ ng−êi t¸ch li tiÕn hãa tõ tæ tiªn chung. T−¬ng tù
nh− vËy, hÖ gen ng−êi vµ c¸ nãc cïng së h÷u mét l−îng lín c¸c gen gièng nhau ®−îc h×nh
thµnh tõ kho¶ng 400 triÖu n¨m tr−íc. Mét ®iÒu ng¹c nhiªn lµ sè gen trong hÖ gen ng−êi
vµ c¸ nãc gÇn t−¬ng ®−¬ng nhau, trong ®ã 3/4 sè gen cña hai loµi t−¬ng ®ång víi nhau.
Sù b¶o thñ trong hÖ gen c¸c loµi §VCXS thËm chÝ cßn më réng ®Õn mét sè loµi kh¸c
thuéc ngµnh d©y sèng, nh− søa biÓn Ciona intestinalis. Mét nöa sè gen trong hÖ gen loµi
søa nµy ®−îc t×m thÊy ë c¸c loµi §VCXS vµ tæ tiªn chung cña chóng ph©n li kho¶ng 500
triÖu n¨m tr−íc. C¸c nghiªn cøu di truyÒn gÇn ®©y cho thÊy, viÖc t¨ng sè l−îng c¸c gen ë
§VCXS chñ yÕu lµ do sù lÆp l¹i cña c¸c gen vèn ®· cã s½n tõ thêi kú xuÊt hiÖn tæ tiªn
chung cña §VCXS vµ søa biÓn. Ch¼ng h¹n, søa biÓn cã 6 gen m· hãa yÕu tè t¨ng tr−ëng
nguyªn bµo sîi FGF. Mçi gen nµy ®−îc lÆp l¹i trung b×nh kho¶ng 4 lÇn ë c¸c hÖ gen ®éng
vËt cã vó nãi chung; trong ®ã, c¸c hÖ gen chuét vµ ng−êi chøa Ýt nhÊt 22 gen FGF. Sù b¶o
thñ trong hÖ gen c¸c loµi thuéc ngµnh d©y sèng cßn më réng tíi c¸c ngµnh kh¸c. HÖ gen
cña ba loµi ®éng vËt thuéc liªn ngµnh ®éng vËt lét x¸c (Ecdysozoa) lµ giun trßn, ruåi
giÊm vµ muçi, ®· ®−îc gi¶i tr×nh tù hoµn chØnh. KÕt qu¶ so s¸nh hÖ gen cña chóng cho
thÊy: hÖ gen mçi loµi ®Òu chøa kho¶ng 15.000 gen, t−¬ng ®−¬ng víi hÖ gen cña søa biÓn.
285
§inh §oµn Long
Sù t¨ng lªn vÒ sè l−îng gen ë §VCXS t−¬ng ®ång víi c¸c loµi ®éng vËt lét x¸c nªu trªn
còng chñ yÕu lµ do sù lÆp l¹i cña c¸c gen chø kh«ng ph¶i do sù h×nh thµnh c¸c gen míi.
Mét c©u hái ®Æt ra lµ: b»ng c¸ch nµo sù lÆp l¹i cña c¸c gen l¹i t¹o ®−îc sù ®a d¹ng
phong phó ë ®éng vËt nh− chóng ta thÊy hiÖn nay? Cã hai c¸ch gi¶i thÝch ®iÒu nµy:
- Theo c¸ch thø nhÊt, gen nguyªn thñy qua nhiÒu lÇn nh©n ®«i (lÆp l¹i) t¹o nªn
nhiÒu b¶n sao kh¸c nhau. Sau ®ã, vïng m· hãa cña c¸c b¶n sao nµy bÞ ®ét biÕn,
dÉn ®Õn sù thay ®æi ho¹t tÝnh hoÆc ®«i chót vÒ chøc n¨ng gen. Trong nhiÒu
tr−êng hîp, kiÓu thay ®æi nµy kh«ng nhÊt thiÕt dÉn ®Õn sù h×nh thµnh c¸c gen
cã chøc n¨ng hoµn toµn míi. Thay vµo ®ã, nã th−êng t¹o nªn c¸c lo¹i protein cã
chøc n¨ng liªn quan tíi nhau, chØ kh¸c nhau chñ yÕu vÒ ho¹t tÝnh hoÆc ho¹t lùc.
- Theo c¸ch thø hai, c¸c gen sau khi ®−îc lÆp l¹i còng bÞ ®ét biÕn nh−ng kh«ng
liªn quan ®Õn vïng m· hãa. Thay vµo ®ã, nã ®−îc tæ hîp víi c¸c tr×nh tù ADN
®iÒu hßa míi (hoÆc tr×nh tù ®iÒu hßa cò bÞ biÕn ®æi ®i). Qua ®ã, c¸c b¶n sao
kh¸c nhau cña gen ®−îc biÓu hiÖn theo c¸ch míi trong qu¸ tr×nh ph¸t triÓn c¸
thÓ ë mçi loµi.
VÝ dô ë gen FGF cña §VCXS nªu trªn, víi 22 b¶n sao cã trong tÕ bµo, c¸ch biÓu
hiÖn cña gen nµy ë c¸c loµi §VCXS ®a d¹ng h¬n nhiÒu so víi khi nã chØ cã mét b¶n sao
duy nhÊt ë ruåi Drosophila. NÕu nh− ë c¬ quan h« hÊp trong qu¸ tr×nh ph¸t triÓn ph«i
cña c¶ ruåi giÊm vµ §VCXS, gen FGF ®Òu ®−îc biÓu hiÖn; th× ë §VCXS, gen nµy cßn
®−îc biÓu hiÖn ë ch©n, trong khi ë ruåi giÊm th× kh«ng. Nh− vËy, ë ®©y, sù “tiÕn hãa” cña
c¸c tr×nh tù ®iÒu hßa cã vai trß quyÕt ®Þnh vµ lµm thay ®æi c¸ch biÓu hiÖn cña c¸c b¶n sao
kh¸c nhau cña cïng mét gen ë c¸c m«, c¬ quan kh¸c nhau; còng nh− lµ kh¸c nhau ë c¸c
loµi kh¸c nhau.
Víi hai c¸ch tiÕn hãa nªu trªn, chóng ta thÊy: sù ®a d¹ng sinh häc cã thÓ ®−îc t¹o
ra tõ sù lÆp l¹i cña c¸c gen. Theo c¸ch thø nhÊt, chøc n¨ng cña gen ®−îc c¶i biÕn ®«i chót
bëi c¸c ®ét biÕn trong vïng m· hãa gen. Cßn theo c¸ch thø hai, c¸c b¶n sao kh¸c nhau
cña gen ®−îc biÓu hiÖn theo c¸ch kh¸c nhau ë c¸c c¬ quan kh¸c nhau trªn cïng c¬ thÓ.
Víi mét sè gen, ng−êi ta thÊy c¶ hai c¬ chÕ nµy cïng ho¹t ®éng. VÝ dô nh− ë côm gen m·
hãa globin cña ng−êi, sù lÆp l¹i cña c¸c gen kh«ng chØ t¹o nªn sù ®a d¹ng vÒ chøc n¨ng
cña c¸c lo¹i globin kh¸c nhau, mµ c¸ch biÓu hiÖn cña chóng còng kh¸c nhau. TÊt c¶ c¸c
protein do c¸c gen globin m· hãa ®Òu cã chøc n¨ng (trong hemoglobin) liªn kÕt vµ vËn
chuyÓn oxy. Tuy nhiªn, mçi lo¹i globin kh¸c nhau vÒ ¸i lùc liªn kÕt víi oxy vµ chóng ®−îc
biÓu hiÖn vµo c¸c giai ®o¹n kh¸c nhau cña qu¸ tr×nh ph¸t triÓn c¬ thÓ. H×nh 10.1 minh
Gen β C¸c loµi c¸ mËp L−ìng c− vµ chim β (c¸ mËp)
§éng vËt cã x−¬ng sèng Thó ®¬n huyÖt β (gµ)
gen ε
gen γ β (r¸i c¸)
ε (ng−êi)
§éng vËt Thó cã gen “γ” γ (ng−êi)
cã vó guèc "γ" (bß)
β (bß)
Thó cã Linh tr−ëng gen δ-globin δ (ng−êi)
nhau thai β (ng−êi)
β (khØ rezut)
H×nh 10.1. Sù lÆp l¹i c¸c gen thuéc hä gen β-globin trong qu¸ tr×nh tiÕn hãa ë ®éng vËt cã x−¬ng sèng
(theo Griffiths et al, 2000, An Introduction to genetic analysis, tr.787)
286
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
häa sù tiÕn hãa c¸c gen β-globin. ë ng−êi, bèn gen cã liªn quan ®Õn β-globin ®−îc h×nh
thµnh theo c¬ chÕ lÆp l¹i, gåm ε-, γ-, δ- vµ β-globin. Bèn gen nµy kh¸c nhau ®«i chót vÒ
c¸ch biÓu hiÖn vµ cÊu tróc cña protein mµ chóng m· hãa. C¸c chuçi ε- vµ γ-globin cã ¸i
lùc víi oxy lín h¬n δ vµ β. Nh÷ng chuçi nµy ®−îc tæng hîp vµ sö dông trong giai ®o¹n bµo
thai (lµ lóc mµ chøc n¨ng phæi ch−a ®Çy ®ñ vµ sù hÊp thu khÝ oxy cña bµo thai chñ yÕu
qua m¸u cña mÑ). C¸c chuçi δ- vµ β-globin liªn kÕt víi oxy víi ¸i lùc thÊp h¬n, ®−îc tæng
hîp ë giai ®o¹n s¬ sinh vµ tr−ëng thµnh. Nh− vËy, víi c¸c gen m· hãa globin, sù “tiÕn
hãa” trong tr×nh tù m· hãa còng nh− trong tr×nh tù ®iÒu hßa cña c¸c gen ®Òu gãp phÇn
vµo sù chuyªn hãa cña c¸c lo¹i chuçi globin kh¸c nhau ®−îc t¹o ra ë §VCXS.
Nh−ng, cÇn kh¼ng ®Þnh r»ng sù tiÕn hãa cña c¸c sinh vËt nãi chung ®Ó cã ®−îc sù
®a d¹ng nh− ngµy nay kh«ng nhÊt thiÕt ph¶i th«ng qua sù lÆp l¹i cña c¸c gen. Cô thÓ lµ,
trong tÊt c¶ c¸c c¬ thÓ sèng, vi khuÈn cã hÖ gen ®a d¹ng nhÊt vµ chóng cã kh¶ n¨ng sèng
trong nh÷ng ®iÒu kiÖn m«i tr−êng rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt h×nh
thµnh c¸ch ®©y kho¶ng 3 tØ n¨m, trong khi c¸c loµi ®éng vËt cæ x−a nhÊt h×nh thµnh c¸ch
®©y kho¶ng trªn d−íi 500 triÖu n¨m. §Æc ®iÓm tiÕn hãa nhanh cña hÖ gen vi khuÈn, cïng
víi lÞch sö tiÕn hãa l©u dµi cña chóng ®· gióp chóng cã ®−îc nhiÒu c¬ chÕ trao ®æi chÊt
kh¸c nhau. Nhê vËy, chóng sèng ®−îc ë nhiÒu m«i tr−êng sèng rÊt kh¸c nhau. Mét sè vi
khuÈn cã kh¶ sèng ®−îc trong m«i tr−êng nhiÖt ®é cao ë gÇn c¸c miÖng nói löa n»m s©u
d−íi ®¸y biÓn, mét sè kh¸c cã thÓ sèng ë c¸c suèi n−íc nãng cã hµm l−îng l−u huúnh (S)
cao. Sè l−îng gen vµ lo¹i gen (chuyªn hãa vÒ chøc n¨ng) trong hÖ gen cña c¸c loµi vi
khuÈn kh¸c nhau lµ rÊt kh¸c nhau. C¸c vi khuÈn ®¬n gi¶n nhÊt (mycoplasma) chØ cã
kho¶ng 500 gen, trong khi nh÷ng vi khuÈn phøc t¹p nhÊt (nh− Streptomyces) cã trªn
7000 gen. Nh− vËy, sù kh¸c biÖt vÒ sè l−îng gen trong hÖ gen c¸c loµi vi khuÈn lªn ®Õn
hµng chôc lÇn. §iÒu nµy lµ kh¸c víi c¸c hÖ gen ®éng vËt vèn cã sè gen kh¸c biÖt tèi ®a chØ
kho¶ng 2 lÇn. ë vi khuÈn, thËm chÝ c¸c loµi cã quan hÖ gÇn còng cã møc ®é kh¸c biÖt lín
vÒ hÖ gen. Ch¼ng h¹n, vi khuÈn Staphococcus vµ E. coli t¸ch ra tõ tæ tiªn chung c¸ch ®©y
kho¶ng 50 triÖu n¨m, tøc lµ t−¬ng ®−¬ng víi thêi gian ph©n li gi÷a tæ tiªn cña ng−êi vµ
chuét. Nh−ng, c¸c gen m· hãa protein cña hai vi khuÈn nµy chØ gièng nhau 75%, cßn 25%
sè gen cßn l¹i cña chóng lµ ®Æc thï vµ kh«ng cã ë loµi kia.
Nh− vËy, nÕu nh− ®éng vËt vèn cã m«i tr−êng sèng h¹n chÕ vµ c¸c con ®−êng trao
®æi chÊt gièng nhau vµ sù ®a d¹ng kiÓu h×nh cña chóng cã xu h−íng phô thuéc vµo sù lÆp
l¹i vµ thay ®æi ho¹t tÝnh (chø kh«ng ph¶i chøc n¨ng) cña c¸c “tæ hîp” gen vèn cã; th×,
ng−îc l¹i, hÖ gen cña c¸c loµi vi khuÈn cã møc ®é t−¬ng ®ång rÊt thÊp. D−êng nh− ®Ó tån
t¹i vµ ph¸t triÓn ®−îc trong c¸c m«i tr−êng sèng kh¸c nhau, sù h×nh thµnh c¸c gen míi
(vÒ chøc n¨ng) gi÷ vai trß quyÕt ®Þnh.
10.2. C¸c con ®−êng thay ®æi sù biÓu hiÖn cña gen trong tiÕn hãa
C¸c gen ®−îc thay ®æi c¸ch ®iÒu hßa biÓu hiÖn trong qu¸ tr×nh tiÕn hãa nh− thÕ
nµo? ë ch−¬ng 5, chóng ta ®· biÕt, hÖ gen cña mäi sinh vËt ®Òu chøa c¸c gen m· hãa
protein cã vai trß ®iÒu khiÓn sù biÓu hiÖn cña c¸c gen kh¸c trong hÖ gen, gäi lµ c¸c gen
®iÒu hßa. PhÇn lín c¸c protein do c¸c gen nµy m· hãa lµ c¸c yÕu tè ®iÒu hßa phiªn m·,
nh−ng còng cã mét sè protein t¸c ®éng vµo c¸c b−íc kh¸c cña qu¸ tr×nh biÓu hiÖn gen (tõ
phiªn m· ®Õn sau dÞch m·). Mét nhãm gen ®iÒu hßa ®−îc t×m thÊy gÇn ®©y ®−îc gäi lµ
“c¸c gen quy ®Þnh kiÓu biÓu hiÖn”. Sù thay ®æi vÒ ho¹t tÝnh còng nh− kiÓu biÓu hiÖn cña
nh÷ng gen nµy trong qu¸ tr×nh tiÕn hãa ®· dÉn ®Õn sù thay ®æi c¸c ®Æc ®iÓm ph¸t sinh
h×nh th¸i vµ ph¸t triÓn ë ®éng vËt. Chøc n¨ng ®Æc thï cña nh÷ng gen thuéc nhãm nµy lµ
®iÒu khiÓn sù h×nh thµnh chÝnh x¸c c¸c cÊu tróc trong qu¸ tr×nh ph¸t triÓn c¬ thÓ. Nªn,
nÕu nh÷ng gen nµy ho¹t ®éng kh«ng chÝnh x¸c, th× c¸c cÊu tróc c¬ thÓ cã thÓ ®−îc h×nh
thµnh sai vÞ trÝ. VÝ dô nh− ë ruåi giÊm, mét gen quy ®Þnh kiÓu biÓu hiÖn kÝ hiÖu lµ Pax6
287
§inh §oµn Long
khi kh«ng biÓu hiÖn ®óng, dÉn ®Õn “®ét biÕn” h×nh thµnh m¾t ë ch©n. Trong phÇn sau,
chóng ta sÏ thÊy mét sè vÝ dô kh¸c n÷a.
Mét hÖ gen ®éng vËt trung b×nh chøa kho¶ng 1000 gen m· hãa c¸c protein ®iÒu hßa
kh¸c nhau. §Õn nay, ch−a cã sè liÖu vÒ sè l−îng c¸c “gen x¸c ®Þnh kiÓu biÓu hiÖn” cã mÆt
trong mçi hÖ gen. Nh−ng, chóng ®−îc xÕp lµ mét nhãm nhá cña c¸c gen ®iÒu hßa. §Ó x¸c
®Þnh ®−îc sè l−îng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”, cã lÏ ph¶i t¹o ra c¸c ®ét biÕn mang
c¸c gen ®iÒu hßa biÓu hiÖn sai, råi theo dâi c¸c bÊt th−êng xuÊt hiÖn trong qu¸ tr×nh ph¸t
sinh h×nh th¸i cña ®éng vËt. HiÖn nay, ng−êi ta −íc ®o¸n cã kho¶ng 10% gen ®iÒu hßa ë
®éng vËt cã thÓ lµ c¸c “gen quy ®Þnh kiÓu biÓu hiÖn”. NghÜa lµ, mét hÖ gen ®éng vËt trung
b×nh sÏ cã kho¶ng 100 gen cã chøc n¨ng quy ®Þnh kiÓu biÓu hiÖn cña nh÷ng gen kh¸c
trong hÖ gen. ë phÇn tiÕp theo, chóng ta sÏ thÊy b»ng c¸ch nµo sù thay ®æi ho¹t tÝnh vµ
c¸ch huy ®éng c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” l¹i cã thÓ t¹o ra sù ®a d¹ng sinh häc
trong qu¸ tr×nh tiÕn hãa.
Nh×n chung, cã ba c¸ch c¬ b¶n lµm thay ®æi ho¹t tÝnh cña gen quy ®Þnh kiÓu biÓu hiÖn:
1) B¶n th©n mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ ®−îc biÓu hiÖn theo mét c¸ch
míi. Sù thay ®æi nµy dÉn ®Õn viÖc nh÷ng gen kh¸c mµ nã ®iÒu khiÓn (gäi lµ c¸c
gen ®Ých) còng sÏ biÓu hiÖn theo c¸c c¸ch míi.
2) C¸c protein ®iÒu hßa ®−îc c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” m· hãa cã thÓ cã
chøc n¨ng míi. Ch¼ng h¹n, miÒn ho¹t hãa phiªn m· cña mét yÕu tè phiªn m· trë
thµnh mét miÒn øc chÕ phiªn m·. V× vËy, mét protein ®iÒu hßa vèn lµ yÕu tè
ho¹t hãa phiªn m· cña mét nhãm gen trë thµnh yÕu tè øc chÕ phiªn m· cña
chÝnh nhãm gen ®ã. Mét ®iÓm ®¸ng chó ý lµ sù thay ®æi ë ®©y liªn quan ®Õn chøc
n¨ng cña protein ®iÒu hßa, nh−ng hËu qu¶ g©y ra ®èi víi qu¸ tr×nh tiÕn hãa l¹i
lµ sù thay ®æi kiÓu biÓu hiÖn cña c¸c gen ®Ých.
3) C¸c gen ®Ých cña mét “gen quy ®Þnh kiÓu biÓu hiÖn” cã thÓ “nhËn” mét tr×nh tù
(ADN) ®iÒu hßa míi, dÉn ®Õn viÖc nã ®−îc ®iÒu khiÓn bëi mét gen ®iÒu hßa míi.
B»ng c¸ch nµy, kiÓu biÓu hiÖn cña gen ®Ých còng thay ®æi.
10.2.1. §ét biÕn “gen quy ®Þnh kiÓu biÓu hiÖn” lµm thay ®æi h×nh th¸i ®éng vËt
10.2.1.1. Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 g©y nªn sù h×nh thµnh m¾t sai vÞ trÝ
“Gen quy ®Þnh kiÓu biÓu hiÖn” ®−îc biÕt ®Õn réng r·i nhÊt cã lÏ lµ gen Pax6. Gen
nµy ®iÒu khiÓn sù h×nh thµnh vµ ph¸t triÓn cña m¾t ë phÇn lín (còng cã thÓ lµ tÊt c¶) c¸c
loµi ®éng vËt. Sù thay ®æi vÒ kiÓu biÓu hiÖn cña gen Pax6 cã thÓ lµ nguyªn nh©n c¬ b¶n
dÉn ®Õn sù ®a d¹ng vÒ kiÓu h×nh m¾t gi÷a c¸c loµi ®éng vËt kh¸c nhau.
Th«ng th−êng gen Pax6 chØ ®−îc biÓu hiÖn trong m« m¾t trong qu¸ tr×nh ph¸t triÓn
cña ph«i. Nh−ng, khi ®−îc biÓu hiÖn ë mét m« kh¸c, gen Pax6 cã thÓ lµm h×nh thµnh
“m¾t phô” ë vÞ trÝ m« bÊt th−êng (h×nh 10.2). Thùc nghiÖm ë ruåi giÊm cho thÊy sù thay
®æi biÓu hiÖn gen Pax6 cã thÓ dÉn ®Õn sù h×nh thµnh “m¾t” ë c¸nh vµ ch©n. §iÒu nµy chØ
ra r»ng, cã thÓ sù thay ®æi biÓu hiÖn cña gen Pax6 ®· dÉn ®Õn viÖc m¾t ®−îc h×nh thµnh
t¹i c¸c vÞ trÝ kh¸c nhau ë c¸c ®éng vËt kh¸c nhau. HÇu hÕt c¸c ®éng vËt ®Òu cã mét cÆp
m¾t n»m trong hép sä. Nh−ng sù thay ®æi biÓu hiÖn gen Pax6 cã thÓ lµ nguyªn nh©n dÉn
®Õn sù h×nh thµnh “®iÓm m¾t” ë phÇn ch©n ®Çu cña èc.
Sù thay ®æi kiÓu biÓu hiÖn cña gen Pax6 d−êng nh− kh«ng lµm thay ®æi chøc n¨ng
cña protein Pax6, mµ chñ yÕu t¹o nªn sù ®a d¹ng vÒ vÞ trÝ h×nh thµnh m¾t ë c¸c loµi kh¸c
nhau. §iÒu nµy ®−îc chøng minh bëi nghiªn cøu chuyÓn gen Pax6 tõ mùc èng vµo ruåi
giÊm ®· t¹o nªn c¸ thÓ ruåi giÊm cã “m¾t phô” ë c¸nh vµ ch©n gièng víi c¸ thÓ ruåi giÊm
288
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
cã gen Pax6 cña chÝnh nã ®−îc biÓu hiÖn bÊt th−êng ë nh÷ng m« nµy, dï r»ng hai protein
Pax6 cña mùc èng vµ ruåi giÊm chØ cã 30% tr×nh tù axit amin gièng nhau.
(a) §Üa mÇm m¾t §Üa mÇm ch©n (b)
Êu trïng
Drosophila
Drosophila
tr−ëng thµnh
C¸ thÓ b×nh th−êng (kiÓu d¹i) C¸ thÓ mang gen "h×nh thµnh m¾t" Pax6 ®−îc
biÓu hiÖn ë tÕ bµo tiÒn ph«i h×nh thµnh ch©n
TÕ bµo tiÒn ph«i m¾t TÕ bµo tiÒn ph«i ch©n TÕ bµo tiÒn ph«i ch©n cã gen Pax6 ®−îc biÓu hiÖn “bÊt th−êng”
H×nh 10.2. Sù biÓu hiÖn gen Pax6 (cßn gäi lµ gen ey) vµ h×nh thµnh “m¾t phô” ë ruåi giÊm.
(a) Sù h×nh thµnh m¾t ë ruåi kiÓu d¹i (b×nh th−êng); (b) "M¾t phô" bÊt th−êng h×nh thµnh ë ch©n do sù
biÓu hiÖn sai vÞ trÞ cña gen Pax6 (theo Albert B. et al, 2002, Molecular Biology of the Cell, tr.426)
10.2.1.2. Sù thay ®æi kiÓu biÓu hiÖn cña gen Antp lµm "¨ngten" chuyÓn thµnh "ch©n"
Mét gen quy ®Þnh kiÓu biÓu hiÖn thø hai ®−îc t×m thÊy ë ruåi giÊm lµ gen Antp.
Gen nµy ®iÒu khiÓn sù ph¸t triÓn phÇn th©n gi÷a cña c«n trïng trong qu¸ tr×nh ph¸t
triÓn ph«i. Tõ phÇn th©n gi÷a nµy h×nh thµnh nªn mét cÆp ch©n cã h×nh th¸i kh¸c biÖt
víi c¸c ch©n tr−íc vµ ch©n sau. Gen Antp m· hãa mét protein ®iÒu hßa b×nh th−êng chØ
®−îc biÓu hiÖn ë phÇn th©n gi÷a, nh−ng kh«ng ®−îc biÓu hiÖn ë phÇn ®Çu. Nh−ng nÕu
mét ®ét biÕn tréi g©y ra bëi ®¶o ®o¹n NST ®−a tr×nh tù m· hãa protein Antp tíi gÇn mét
tr×nh tù ADN ®iÒu hßa míi vèn cã vai trß ®iÒu hßa biÓu hiÖn c¸c gen ë phÇn ®Çu (bao gåm
c¶ ¨ngten) th× ch©n sÏ h×nh thµnh thay cho ¨ng ten t¹i vÞ trÝ ¨ngten.
10.2.1.3. ChuyÓn ®o¹n t−¬ng hç gi÷a hai gen ftz vµ Antp cho thÊy vai trß quan träng vÒ
chøc n¨ng cña protein ®iÒu hßa
§Ó t¹o ra sù ®a d¹ng h×nh th¸i, c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” kh«ng nhÊt thiÕt
ph¶i ho¹t ®éng t¹i c¸c vÞ trÝ kh¸c nhau trong c¬ thÓ. Mét c¬ chÕ thø hai t¹o nªn sù ®a
d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi vÒ tr×nh tù axit amin vµ chøc n¨ng cña
c¸c protein ®iÒu hßa do nh÷ng gen nµy m· hãa.
ë ®©y, chóng ta sÏ xem vÝ dô vÒ hai “gen quy ®Þnh kiÓu biÓu hiÖn” cã liªn quan víi
nhau ë ruåi giÊm lµ ftz (®iÒu khiÓn sù ph©n ®èt) vµ Antp (®iÒu khiÓn sù h×nh thµnh c¸c c¬
quan phÇn th©n gi÷a). Hai gen nµy h×nh thµnh vµ ph©n li xuÊt ph¸t tõ mét sù kiÖn
“nh©n ®«i” gen tæ tiªn x¶y ra tr−íc khi cã sù t¸ch li tiÕn hãa gi÷a c¸c loµi gi¸p x¸c vµ c«n
trïng kho¶ng 400 triÖu n¨m tr−íc. Hai protein t−¬ng øng ®−îc c¸c gen nµy m· hãa (lµ
289
§inh §oµn Long
Ftz vµ Antp) cã liªn quan víi nhau vµ miÒn liªn kÕt ADN cña chóng rÊt gièng nhau. Tuy
vËy, Ftz vµ Antp l¹i nhËn ra c¸c ®o¹n tr×nh tù ADN kh¸c nhau trong hÖ gen, v× khi ho¹t
®éng, chóng t¹o “dÞ phøc kÐp” víi hai lo¹i protein kh¸c nhau. Mèi t−¬ng t¸c protein –
protein ®−îc quy ®Þnh bëi mét mÉu h×nh (motif) peptide ng¾n n»m ngoµi miÒn liªn kÕt
ADN cña hai protein. Antp chøa motif gåm 4 axit amin lµ YPWM quyÕt ®Þnh sù t¹o “dÞ
phøc kÐp” cña protein nµy víi mét protein ®iÒu hßa phæ biÕn gäi lµ Exd. Ng−îc l¹i, Ftz
mang mét motif gåm 5 axit amin lµ LRALL quyÕt ®Þnh sù t−¬ng t¸c cña protein nµy víi
mét protein ®iÒu hßa phæ biÕn kh¸c cã tªn lµ FtzF1.
DÞ phøc kÐp Ftz-FtzF1 nhËn ra tr×nh tù ADN kh¸c víi Antp-Exd. V× vËy, Ftz vµ
Antp ®iÓu khiÓn sù biÓu hiÖn cña c¸c gen ®Ých kh¸c nhau. Cã mét ®iÒu thó vÞ lµ gen ftz ë
mét sè loµi c«n trïng cæ x−a (nh− loµi mät ngò cèc Tribolium castaneum) cã ®ång thêi hai
motif LRALL vµ YPWM. §iÒu nµy cho thÊy Ftz cña Tribolium cã ®Æc ®iÓm “lai”. Trong
thùc tÕ, khi ng−êi ta chuyÓn gen Ftz cña Tribolium vµo ruåi giÊm, th× c¸ thÓ biÕn ®æi gen
®ång thêi bÞ háng c¶ qu¸ tr×nh ph©n ®èt lÉn sù ph¸t triÓn phÇn th©n gi÷a.
10.2.1.4. BiÕn ®æi nhá trong tr×nh tù t¨ng c−êng cã thÓ t¹o ra kiÓu biÓu hiÖn gen míi
Mét c¬ chÕ thø ba t¹o nªn sù ®a d¹ng trong qu¸ tr×nh tiÕn hãa lµ nh÷ng thay ®æi
trong c¸c enhancer (tr×nh tù t¨ng c−êng) cña c¸c gen ®Ých ®−îc ®iÒu khiÓn bëi c¸c “gen
quy ®Þnh kiÓu biÓu hiÖn”. Trong tr−êng hîp nµy, hoÆc lµ gen ®Ých kh«ng ®−îc biÓu hiÖn
b×nh th−êng, hoÆc lµ chøc n¨ng (hoÆc ho¹t tÝnh) cña protein ®iÒu hßa bÞ thay ®æi.
C¸c nghiªn cøu trªn mét “gen quy ®Þnh kiÓu biÓu hiÖn” ë ruåi giÊm lµ Ubx ®ång
thêi minh häa cho ba c¬ chÕ tiÕn hãa: c¸c gen ®Ých cã kiÓu biÓu hiÖn míi khi gen Ubx cã
sù thay ®æi kiÓu biÓu hiÖn, hoÆc s¶n phÈm protein mµ gen nµy m· hãa thay ®æi, hoÆc cã
sù thay ®æi trong tr×nh tù enhancer cña nã. Gen Ubx b×nh th−êng m· hãa cho mét protein
®iÒu hßa ®iÒu khiÓn sù ph¸t triÓn ®èt th©n thø ba trong qu¸ tr×nh ph¸t triÓn ph«i cña
ruåi giÊm. Gen nµy øc chÕ ®Æc hiÖu sù biÓu hiÖn cña c¸c gen cÇn cho sù ph¸t triÓn ®èt
th©n thø hai (trong ®ã cã Antp). §Ó biÖt hãa ®èt th©n thø ba, Ubx øc chÕ sù biÓu hiÖn cña
Antp ë ®èt th©n nµy. §ét biÕn thiÕu protein øc chÕ Ubx lµm gen Antp ®−îc biÓu hiÖn
m¹nh ë c¶ ®èt th©n thø hai vµ ®èt th©n (a) (b)
thø ba, dÉn ®Õn sù h×nh thµnh hai ®èt
th©n gièng nhau.
10.2.1.5. Sù biÓu hiÖn bÊt th−êng cña gen H×nh 10.3. ThÓ ®ét biÕn Ubx cã ®èt th©n thø hai (T2)
Ubx lµm thay ®æi h×nh th¸i ë ruåi giÊm ph¸t triÓn gièng ®èt th©n thø ba (T3). (a) Ruåi kiÓu d¹i
cã mét ®«i c¸nh thËt (®èt T2) vµ mét ®«i c¸nh phô ë phÝa
ë ruåi giÊm tr−ëng thµnh b×nh sau (®èt T3); (b) Ruåi cã gen Ubx kh«ng biÓu hiÖn ë ®èt
th−êng, ®èt th©n thø hai (T2) mang mét T3 h×nh thµnh hai ®«i c¸nh thËt (ë c¶ hai ®èt T2,T3).
®«i ch©n vµ mét ®«i c¸nh, trong khi ®èt
th©n thø ba (T3) chØ mang mét ®«i ch©n (a) (b)
vµ mét ®«i c¸nh phô. C¸nh phô cã kÝch
th−íc nhá h¬n nhiÒu so víi c¸nh thËt vµ H×nh 10.4. BiÓu hiÖn sai vÞ trÝ cña gen Ubx dÉn ®Õn
chØ cã vai trß gi÷ th¨ng b»ng khi bay thÓ ®ét biÕn mÊt c¸nh thËt ë ruåi giÊm. (a) C¸ thÓ kiÓu
(h×nh 10.3). §ét biÕn gen Ubx dÉn ®Õn d¹i cã gen Ubx chØ biÓu hiÖn ë ®èt T3; (b) C¸ thÓ mang
thÓ ®ét biÕn cã kiÓu h×nh gåm 4 c¸nh ®ét biÕn Cbx "ph¸ háng" vïng ®iÒu hßa cña gen Ubx,
thËt. KiÓu h×nh ®ét biÕn nµy mét phÇn do lµm gen nµy biÓu hiÖn sai vÞ trÝ (ë c¶ hai ®èt T2 vµ T3),
sù biÓu hiÖn bÊt th−êng cña gen Antp. dÉn ®Õn sù h×nh thµnh nªn hai ®«i c¸nh phô.
Gen Ubx ®iÒu khiÓn sù h×nh thµnh c¸nh
phô th«ng qua øc chÕ mét sè gen ®Ých
thiÕt yÕu cho sù ph¸t triÓn cña c¸nh thËt,
bao gåm gen Antp.
290
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
Sù biÓu hiÖn cña gen Ubx ë ®èt th©n T3 phô thuéc vµo mét tr×nh tù ®iÒu hßa cã
kÝch th−íc kho¶ng 80 kb. Cã mét ®ét biÕn gäi lµ Cbx lµm háng tr×nh tù ®iÒu hßa nµy
cña gen Ubx nh−ng kh«ng lµm thay ®æi vïng m· hãa protein Ubx. §ét biÕn Cbx lµm
gen Ubx biÓu hiÖn sai vÞ trÝ ë ®èt th©n T2, ngoµi vÞ trÝ biÓu hiÖn b×nh th−êng cña nã lµ ë
®èt th©n T3 (h×nh 10.4). Lóc nµy, gen Ubx sÏ øc chÕ sù biÓu hiÖn cña gen Antp còng
nh− c¸c gen kh¸c cÇn cho sù ph¸t triÓn b×nh th−êng cña ®èt th©n T2. KÕt qu¶ lµ ®èt
th©n T2 trë thµnh mét “b¶n sao” cña ®èt th©n T3. ThÓ ®ét biÕn nµy gåm tÊt c¶ c¸c c¸nh
®Òu lµ c¸nh phô.
10.2.1.6. Sù thay ®æi chøc n¨ng protein Ubx ¶nh h−ëng ®Õn h×nh th¸i ph«i ruåi giÊm
Trªn ®©y, chóng ta ®· nãi ®Õn chøc n¨ng cña protein Ubx nh− yÕu tè phiªn m· øc
chÕ sù biÓu hiÖn cña gen Antp vµ c¸c “gen ®èt th©n thø hai” trong qu¸ tr×nh ph¸t triÓn
cña ®èt th©n thø ba. Nh−ng theo mét c¬ chÕ kh¸c, mét ®ét biÕn chuyÓn hãa Ubx thµnh
mét yÕu tè ho¹t hãa phiªn m· nh÷ng “gen ®èt th©n thø hai” ®· lµm gen nµy cã chøc n¨ng
gièng gen Antp lµ thóc ®Èy sù ph¸t triÓn cña ®èt th©n thø hai. VÝ dô nµy cho thÊy, sù
thay ®æi chøc n¨ng protein ®iÒu hßa cã thÓ trùc tiÕp lµm thay ®æi kiÓu h×nh.
Protein øc chÕ Ubx ®−îc chuyÓn thµnh protein ho¹t hãa b»ng c¸ch kÕt hîp miÒn
liªn kÕt ADN cña gen Ubx víi miÒn ho¹t hãa cña protein virut VP16. §o¹n gen m· hãa
protein øc chÕ Ubx b×nh th−êng n»m ngoµi miÒn liªn kÕt ADN cña Ubx vµ kh«ng n»m
trong ®o¹n kÕt hîp Ubx-VP16. Sù biÓu hiÖn bÊt th−êng cña protein “dung hîp” Ubx-
VP16 lµm cho tÊt c¶ c¸c ®èt th©n ®Òu ph¸t triÓn gièng ®èt th©n thø hai, chø kh«ng gièng
®èt th©n thø ba nh− trong tr−êng hîp gen Ubx biÓu hiÖn bÊt th−êng. Nh− vËy, chøc n¨ng
cña protein dung hîp Ubx-VP16 gièng protein Antp, chø kh«ng gièng Ubx.
10.2.1.7. Sù thay ®æi tr×nh tù t¨ng c−êng cña gen Ubx lµm thay ®æi kiÓu biÓu hiÖn gen
Gièng víi protein Antp (môc 10.2.1.3), (a) VÞ trÝ liªn kÕt VÞ trÝ liªn kÕt
Ubx chøa mét motif gåm 4 axit amin YPMM protein Exd protein HOX
lµ vÞ trÝ t−¬ng t¸c víi Exd. Protein Antp liªn
kÕt víi ADN d−íi d¹ng dÞ phøc kÐp Antp- TGAT NNATKR
Exd. T−¬ng tù nh− vËy, Ubx liªn kÕt ADN ë ADN
d¹ng dÞ phøc kÐp Ubx-Exd. NhiÒu protein
®iÒu hßa liªn kÕt ADN th«ng qua sù t¹o phøc (b)
kÐp víi protein Exd. Phøc hÖ nµy (gäi t¾t lµ Exd Ubx
Exd-HOX) liªn kÕt vµo mét tr×nh tù nhËn
biÕt “lai ghÐp”, nghÜa lµ Exd liªn kÕt vµo mét TGAT TT ATKR
bªn cña tr×nh tù nhËn biÕt (TGAT), cßn c¸c
protein HOX (nh− Ubx) liªn kÕt vµo bªn liÒn ADN
kÒ cßn l¹i cña tr×nh tù nhËn biÕt (cã tr×nh tù
A-T-T/G-A/G, xem h×nh 10.5). Hai nöa cña (c)
Exd Labial
tr×nh tù nhËn biÕt (cßn gäi lµ tr×nh tù liªn
T G A T GG A T K R
øng) th−êng t¸ch biÖt nhau bëi 2 nucleotide.
Hai nucleotide nµy cã vai trß x¸c ®Þnh phøc ADN
hÖ Exd-HOX nµo ®−îc −u tiªn liªn kÕt. VÝ
dô, phøc hÖ Exd-Ubx −u tiªn tr×nh tù liªn H×nh 10.5. Sù ho¸n ®æi vÞ trÝ liªn kÕt cña c¸c
øng cã vÞ trÝ trung t©m T-T, cßn phøc hÖ protein Ubx vµ Labial. HÇu hÕt cña protein HOX
Exd-Labial −u tiªn vÞ trÝ trung t©m lµ G-G. ®Òu chøa mét miÒn motif YPWM t−¬ng t¸c víi Exd.
§iÒu nµy cho thÊy sù thay ®æi trong tr×nh tù Mçi tiÓu phÇn cña "dÞ phøc kÐp" Exd-HOX nhËn biÕt
t¨ng c−êng vèn ®−îc ®iÒu khiÓn bëi mét mét bªn cña tr×nh tù liªn øng. Trong ®ã, Exd liªn kÕt
protein HOX nµy cã thÓ trë thµnh tr×nh tù vµo tr×nh tù TGAT, cßn protein HOX liªn kÕt vµo
®iÒu hßa ®−îc ®iÒu khiÓn bëi mét protein ATKR (K = T/G; R = A/G). HOX ®ång thêi cã liªn kÕt
thø cÊp vµo 2 nucleotide trung t©m (NN). Hai
nucleotide nµy x¸c ®Þnh tÝnh ®Æc tr−ng cña protein
HOX thuéc "dÞ phøc kÐp". VÝ dô: Exd-Ubx liªn kÕt khi
tr×nh tù liªn øng cã hai nucleotide trung t©m lµ TT,
cßn Exd-Labial liªn kÕt khi hai nucleotide nµy lµ GG.
291
§inh §oµn Long
HOX kh¸c. Nguyªn lý nµy gióp gi¶i thÝch sù ®a d¹ng vÒ h×nh th¸i c¸nh ë ruåi giÊm vµ
c¸c loµi b−ím (®−îc nªu ë môc d−íi ®©y). Nh÷ng vÝ dô trªn còng cho thÊy sù thay ®æi
chøc n¨ng, hay sù biÓu hiÖn cña protein Ubx, hoÆc tr×nh tù enhancer ®Ých cña nã ®Òu cã
thÓ trùc tiÕp dÉn ®Õn nh÷ng thay ®æi lín vÒ h×nh th¸i ph¸t triÓn ph«i ë ruåi giÊm.
10.2.2. Sù biÕn ®æi h×nh th¸i ë c¸c loµi gi¸p x¸c vµ c«n trïng
10.2.2.1. Sù ®a d¹ng h×nh th¸i ë ®éng vËt ch©n ®èt
C¸c ®éng vËt ch©n ®èt gåm 5 nhãm chÝnh: bä ba thïy (®· tuyÖt chñng), bä s¸u ch©n
(c«n trïng), gi¸p x¸c (t«m, cua,...), bä nhiÒu ch©n (nh− rÕt) vµ c¸c loµi ch©n k×m (nh− cua
mãng ngùa, nhÖn, bä c¹p,...). C¸c loµi ch©n ®èt ®· thÝch nghi “thµnh c«ng” trong suèt qu¸
tr×nh tiÕn hãa l©u dµi mét phÇn lµ nhê cÊu tróc kiÓu m«®un cña chóng. C¬ thÓ cña chóng
®−îc cÊu tróc tõ c¸c ®èt th©n lÆp l¹i nh−ng cã sù biÕn ®æi d−êng nh− kh«ng giíi h¹n. Mét
sè ®èt th©n mang c¸nh, trong khi c¸c ®èt th©n kh¸c mang ¨ngten, ch©n, hµm, hay c¬
quan giao phèi. §Õn nay, hiÓu biÕt vÒ sù tiÕn hãa dÉn ®Õn sù ®a d¹ng cña c¸c ®éng vËt
ch©n ®èt lµ râ h¬n bÊt cø nhãm ®éng vËt nµo kh¸c.
10.2.2.2. Thay ®æi biÓu hiÖn gen Ubx dÉn ®Õn sù ®a d¹ng h×nh th¸i ch©n ë gi¸p x¸c
Gi¸p x¸c bao gåm hÇu hÕt (nh−ng kh«ng ph¶i tÊt c¶) c¸c loµi ®éng vËt ch©n ®èt cã
thÓ b¬i trong n−íc. Mét sè sèng ë biÓn, mét sè sèng trong m«i tr−êng n−íc ngät (phæ biÕn
nhÊt lµ t«m vµ cua). Mét trong nh÷ng nhãm gi¸p x¸c ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ
Artemia. Ph«i cña chóng ngõng ph¸t triÓn ë d¹ng bµo tö cøng, nh−ng nÕu ®−a c¸c bµo tö
nµy vµo n−íc muèi, chóng sÏ ph¸t triÓn trë l¹i. PhÇn ®Çu cña c¸c loµi t«m nµy chøa c¸c
phÇn phô miÖng. §èt th©n gÇn ®Çu nhÊt (T1) cã phÇn phô b¬i (ch©n b¬i) còng gièng nh−
c¸c ®èt th©n kh¸c tõ thø hai ®Õn m−êi mét (T2 – T11). Artemia thuéc bé branchiopod
(ch©n mang) vµ ®−îc ph©n biÖt víi bé isopod
(®¼ng tóc). Isopod kh¸c biÖt branchiopod ë PhÇn ®Çu PhÇn th©n
chç chóng chØ cã ch©n b¬i gièng branchiopod
ë c¸c ®èt th©n tõ T2 ®Õn T8; cßn ë ®èt T1,
ch©n nµy cã kÝch th−íc nhá vµ cã chøc n¨ng
b¾t thøc ¨n, nªn ®−îc gäi lµ “ch©n miÖng” Blanchiopod T1 T2 T3 T4 T5
hay “ch©n hµm” (h×nh 10.6). Ch©n miÖng (Bé ch©n mang)
nµy gièng víi phÇn phô miÖng ë ®Çu (kh«ng
vÏ trªn h×nh).
Lý do dÉn ®Õn sù h×nh thµnh c¸c lo¹i T1 T2 T3 T4 T5
“ch©n” kh¸c nhau ë ®èt th©n thø nhÊt (T1)
gi÷a isopod vµ branchipod lµ do sù biÓu hiÖn Isopod
(Bé ®¼ng tóc)
kh¸c nhau cña gen Ubx ë hai bé gi¸p x¸c nµy.
Cã lÏ, tæ tiªn chung cña chóng cã ch©n b¬i ë Ch©n hµm C¸c ch©n b¬i
tÊt c¶ c¸c ®èt th©n (gièng branchipod). Trong
qu¸ tr×nh tiÕn hãa ph©n li cña isopod vµ C¸c ®èt biÓu hiÖn Scr C¸c ®èt biÓu hiÖn Ubx
branchipod, tr×nh tù ®iÒu hßa cña gen Ubx ®· H×nh 10.6. Sù thay ®æi h×nh th¸i ë gi¸p x¸c.
biÕn ®æi ë c¸c loµi isopod. KÕt qu¶ cña sù
ë blanchiopod, protein Scr chØ ®−îc biÓu hiÖn ë phÇn
thay ®æi nµy lµ gen Ubx kh«ng ®−îc biÓu ®Çu (protein Scr cã vai trß thóc ®Èy sù ph¸t triÓn cña
hiÖn ë ®èt T1, mµ chØ ®−îc biÓu hiÖn ë c¸c ®èt c¸c phÇn phô miÖng); cßn protein Ubx ®−îc biÓu
hiÖn ë c¸c ®èt th©n (thóc ®Èy sù ph¸t triÓn cña c¸c
T2 - T8. Còng cã thÓ gi¶i thÝch lµ, gen Ubx cã
t¸c ®éng øc chÕ lªn c¸c “gen quy ®Þnh kiÓu "ch©n b¬i"). ë isopod, protein Scr ®−îc biÓu hiÖn ë
biÓu hiÖn” ë phÇn ®Çu. ThÕ nªn, ë c¸c loµi c¶ phÇn ®Çu vµ ®èt th©n thø nhÊt (T1), dÉn ®Õn
"ch©n b¬i" ë T1 chuyÓn thµnh "ch©n hµm" cã chøc
Artemia, nh÷ng gen phÇn ®Çu nµy bÞ øc chÕ ë n¨ng nh− mét phÇn phô miÖng bæ sung. Sù biÓu hiÖn
tÊt c¶ 11 ®èt th©n (T1-T11); trong khi ë c¸c cña Scr ë ®©y lµ do ®ét biÕn bÊt ho¹t Ubx (Ubx lµ
loµi isopod, c¸c gen phÇn ®Çu kh«ng bÞ øc chÕ protein øc chÕ ho¹t ®éng cña Scr).
292
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
ë ®èt T1 do thiÕu protein øc chÕ Ubx. Trong thùc tÕ, ë isopod, ng−êi ta ®· x¸c ®Þnh ®−îc
protein Src ho¹t ®éng c¶ ë phÇn ®Çu vµ ®èt th©n T1 dÉn ®Õn sù h×nh thµnh ch©n hµm ë
®èt th©n nµy.
C¬ chÕ ph©n tö nµo dÉn ®Õn sù biÓu hiÖn cña gen Ubx kh¸c nhau ë isopod vµ
branchipod? Cã mét sè gi¶ thiÕt, nh−ng gi¶ thiÕt ®−îc chÊp nhËn réng r·i h¬n cho r»ng
®ét biÕn ®· x¶y ra trong tr×nh tù ®iÒu hßa cña gen Ubx ë c¸c loµi isopod. Theo gi¶ thiÕt
nµy, tr×nh tù t¨ng c−êng cña gen Ubx kh«ng cßn ®iÒu khiÓn ®−îc sù biÓu hiÖn cña gen
nµy ë ®èt T1. Tõ thùc tÕ, ng−êi ta thÊy cã mèi t−¬ng quan chÆt gi÷a sù bÊt ho¹t gen Ubx
víi sù ph¸t triÓn c¸c d¹ng cÊu tróc ch©n hµm ë c¸c loµi gi¸p x¸c. Ch¼ng h¹n, ph«i cña
t«m hïm thiÕu sù biÓu hiÖn gen Ubx ë hai ®èt th©n ®Çu tiªn dÉn ®Õn sù h×nh thµnh hai
®«i ch©n hµm. T−¬ng tù nh− vËy, mét sè loµi t«m thiÕu sù biÓu hiÖn cña gen Ubx ë ba ®èt
th©n ®Çu tiªn, nªn cã ®Õn ba ®«i ch©n hµm.
10.2.2.3. T¹i sao c«n trïng thiÕu ch©n bông ?
TÊt c¶ c«n trïng ®Òu cã 6 ch©n; mçi ®èt th©n trong ba ®èt th©n cña chóng ®Òu
mang mét ®«i ch©n. TÊt c¶ c¸c loµi c«n trïng (−íc l−îng trªn 1 triÖu loµi) ®Òu cã ®Æc ®iÓm
chung nµy. §iÒu ng¹c nhiªn lµ ë c¸c loµi ch©n ®èt kh¸c (nh− gi¸p x¸c), sè l−îng ch©n l¹i
rÊt biÕn ®éng. Trong ®ã, mét sè loµi gi¸p x¸c cã ch©n ë mäi ®èt th©n vµ ®èt bông. Sù tiÕn
hãa dÉn ®Õn sù thiÕu ch©n ë bông cña c¸c loµi c«n trïng kh«ng ph¶i do sù thay ®æi biÓu
hiÖn cña c¸c “gen quy ®Þnh kiÓu biÓu hiÖn” nh− tr−êng hîp h×nh thµnh ch©n miÖng ë c¸c
loµi isopod nªu trªn. Thay vµo ®ã, sù thiÕu ch©n bông ë c«n trïng lµ kÕt qu¶ cña sù thay
®æi chøc n¨ng protein ®iÒu hßa Ubx.
ë c«n trïng, hai gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña mét gen quy ®Þnh sù
ph¸t triÓn cña c¸c ch©n ë mçi ®èt th©n, gäi lµ gen Dll. Trong qu¸ tr×nh ph¸t triÓn ph«i
ruåi giÊm, gen Ubx ®−îc biÓu hiÖn ë møc cao t¹i ®èt th©n thø ba vµ c¸c ®èt bông phÝa
tr−íc; riªng sù biÓu hiÖn cña gen abd-A cßn më réng tiÕp ®Õn c¸c ®èt bông phÝa sau. KÕt
hîp víi nhau, c¸c gen Ubx vµ abd-A øc chÕ sù biÓu hiÖn cña gen Dll t¹i 7 ®èt bông ®Çu
tiªn. MÆc dï gen Ubx còng biÓu hiÖn ë ®èt th©n T3, nh−ng nã kh«ng øc chÕ sù biÓu hiÖn
cña gen Dll còng nh− sù h×nh thµnh ch©n ë ®èt th©n nµy; bëi v×, ë ®©y trong qu¸ tr×nh
ph¸t triÓn ph«i, gen Dll ®−îc ho¹t hãa tr−íc khi gen Ubx ®−îc biÓu hiÖn.
ë c¸c loµi gi¸p x¸c, ch¼ng h¹n nh− bé branchiopod, c¶ hai gen Ubx vµ Dll ®Òu ®−îc
biÓu hiÖn ë møc cao t¹i tÊt c¶ 11 ®èt th©n. Sù biÓu hiÖn m¹nh cña gen Dll thóc ®Èy sù
h×nh thµnh ch©n b¬i ë c¶ 11 ®èt th©n nµy. VËy, t¹i sao gen Ubx kh«ng øc chÕ ®−îc sù
biÓu hiÖn cña gen Dll ë c¸c ®èt bông cña gi¸p x¸c? C©u tr¶ lêi thùc thÕ lµ ®· cã sù tiÕn
hãa ph©n li (vÒ cÊu tróc vµ chøc n¨ng) cña protein Ubx ë c«n trïng vµ gi¸p x¸c.
C¸c thÝ nghiÖm ho¹t hãa vµ bÊt ho¹t gen ë ruåi giÊm cho thÊy: nÕu gen Ubx cña
ruåi giÊm ®−îc biÓu hiÖn ë tÊt c¶ c¸c m« thuéc phÇn bông th× ch©n kh«ng h×nh thµnh
®−îc do gen Dll bÞ øc chÕ. Nh−ng nÕu gen Ubx nµy cã nguån gèc tõ gi¸p x¸c th× nã kh«ng
øc chÕ sù biÓu hiÖn cña gen Dll vµ tÊt c¶ c¸c ch©n ®Òu h×nh thµnh b×nh th−êng. §iÒu nµy
chøng tá “chøc n¨ng” cña protein Ubx cña ruåi giÊm vµ gi¸p x¸c lµ kh¸c nhau. Protein
cña ruåi giÊm øc chÕ biÓu hiÖn gen Dll, nh−ng protein cña gi¸p x¸c th× kh«ng.
Nguyªn nh©n nµo lµm chøc n¨ng cña protein Ubx ë ruåi giÊm vµ gi¸p x¸c biÓu hiÖn
kh¸c nhau? Ph©n tÝch tr×nh tù axit amin cña hai protein nµy cho thÊy, chóng chØ gièng
nhau 32%, nh−ng 59/60 axit amin thuéc vïng liªn kÕt ADN lµ gièng nhau hoµn toµn.
Protein Ubx ë gi¸p x¸c cã mét motif ng¾n gåm 29 axit amin cã vai trß “ph¶n øc chÕ”. Khi
motif nµy bÞ lo¹i bá, protein Ubx cña gi¸p x¸c biÓu hiÖn chøc n¨ng gièng nh− cña ruåi
giÊm vµ g©y øc chÕ biÓu hiÖn gen Dll.
Protein Ubx cña c¶ ruåi giÊm vµ gi¸p x¸c ®Òu chøa nhiÒu miÒn øc chÕ kh¸c nhau.
Nh÷ng miÒn nµy cã kh¶ n¨ng t−¬ng t¸c víi mét hoÆc nhiÒu phøc hÖ øc chÕ phiªn m·.
293
§inh §oµn Long
§o¹n peptide “ph¶n øc chÕ” cã mÆt trong cÊu tróc protein Ubx cña gi¸p x¸c ng¨n c¶n sù
huy ®éng phøc hÖ øc chÕ cña protein nµy. Khi chuçi peptide “ph¶n øc chÕ” nµy ®−îc g¾n
vµo protein Ubx cña ruåi giÊm, th× ph©n tö protein lai biÓu hiÖn chøc n¨ng gièng protein
Ubx cña gi¸p x¸c (tøc lµ mÊt kh¶ n¨ng øc chÕ gen Dll).
10.2.2.4. KiÓu h×nh c¸nh ®a d¹ng ë c¸c loµi ch©n ®èt do biÕn ®æi c¸c tr×nh tù ®iÒu hßa
ë c¸c môc trªn, chóng ta ®· ®Ò cËp ®Õn vai trß cña gen Ubx trong viÖc t¹o ra sù ®a
d¹ng c¸c kiÓu h×nh ch©n bông vµ ch©n miÖng ë c¸c loµi gi¸p x¸c vµ c«n trïng. Trong thùc
tÕ, sù thay ®æi tr×nh tù ®iÒu hßa cña gen nµy cßn gióp gi¶i thÝch tÝnh ®a d¹ng kiÓu h×nh
c¸nh (“ch©n bay”) ë ruåi giÊm vµ c¸c loµi b−ím (h×nh 10.7).
ë ruåi giÊm, Ubx cã vai trß lµ protein øc chÕ sù h×nh thµnh c¸nh thËt (c¸nh ®Çy
®ñ). Trong qu¸ tr×nh nµy, Ubx øc chÕ kho¶ng tõ 5 ®Õn 10 gen ®Ých kh¸c nhau. Nh÷ng gen
nµy m· hãa c¸c protein thiÕt yÕu thóc ®Èy sù h×nh thµnh vµ ph¸t triÓn c¸nh thËt. ë c¸nh
phô (®èt T3), nh÷ng gen nµy bÞ øc chÕ bëi Ubx. Nh−ng khi gen Ubx bÞ ®ét biÕn, “c¸nh
phô” ph¸t triÓn thµnh “c¸nh thËt”, dÉn ®Õn thÓ ®ét biÕn cã bèn c¸nh thËt.
Ruåi giÊm thuéc bé c«n trïng hai c¸nh - Dipteran. C¸c loµi thuéc bé nµy cã ®Æc ®iÓm
chung lµ chØ cã mét ®«i c¸nh thËt duy nhÊt bªn c¹nh mét hoÆc mét sè ®«i c¸nh phô.
Protein Ubx ho¹t ®éng víi vai trß lµ protein øc chÕ h×nh thµnh c¸nh thËt ë Dipteran. C¸c
loµi b−ím thuéc mét bé c«n trïng kh¸c, gäi lµ bé c¸nh v¶y (hay c¸nh phÊn) -
Lepidopteran. C¸c loµi Lepidopteran ®Òu cã hai ®«i c¸nh thËt vµ mét hoÆc mét sè ®«i
c¸nh phô. Nguyªn nh©n nµo dÉn ®Õn kh¸c biÖt nµy?
Trong lÞch sö, hai bé c«n trïng nµy tiÕn hãa t¸ch li khái nhau kho¶ng trªn 250
triÖu n¨m tr−íc. §ã còng lµ kho¶ng thêi gian c¸c loµi ®éng vËt cã x−¬ng sèng (bao gåm
ng−êi) vµ kh«ng x−¬ng sèng (nh− Õch) t¸ch li khái nhau. Trong thêi kú nµy, d−êng nh−
gen Ubx tÝch lòy ®ñ c¸c ®ét biÕn (cã thÓ theo mét hoÆc c¶ ba c¬ chÕ tiÕn hãa) ®Õn møc
chøc n¨ng cña nã thay ®æi. Gi¶ thiÕt ®¬n gi¶n nhÊt ®−îc ®−a ra lµ sù thay ®æi kiÓu biÓu
hiÖn cña gen Ubx (lµm gen nµy kh«ng biÓu hiÖn ë c¸c c«n trïng c¸nh v¶y) dÉn ®Õn sù
h×nh thµnh ®«i c¸nh thø hai. HiÖn t−îng “ch©n b¬i” biÕn thµnh “ch©n miÖng” ë bé ®¼ng
tóc (isopod) ®· tõng ®−îc
gi¶i thÝch bëi c¬ chÕ nµy. (a)
Tuy vËy, trong thùc tÕ ®·
kh«ng t×m thÊy sù kh¸c
biÖt râ rÖt vÒ kiÓu biÓu hiÖn
cña gen Ubx gi÷a ruåi giÊm
vµ c¸c loµi b−ím. Cô thÓ, lµ C«n trïng hai c¸nh C«n trïng c¸nh phÊn
(Dipteran) (Lepidopteran)
gen Ubx ®−îc biÓu hiÖn ë
møc cao trong suèt qu¸ (b)
tr×nh ph¸t triÓn ®«i c¸nh
thø hai ë c¸c loµi b−ím.
§iÒu nµy cho thÊy cã hai wg Ubx "T¾t" "BËt"
kh¶ n¨ng. Kh¶ n¨ng thø +1 +1
nhÊt lµ sù biÓu hiÖn chøc DSRF Ubx "T¾t" "BËt"
n¨ng cña protein Ubx +1 +1
kh«ng gièng nhau ë ruåi
giÊm vµ ë b−ím. Kh¶ n¨ng H×nh 10.7. Sù thay ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých lµ môc tiªu
thø hai lµ c¸c gen ®Ých t¸c ®éng cña protein Ubx. (a) Protein øc chÕ Ubx ®−îc biÓu hiÖn ë ®«i
thiÕt yÕu cho sù ph¸t triÓn "c¸nh phô" cña c«n trïng hai c¸nh, vµ ë ®«i c¸nh sau (mµu sÉm) cña c«n
c¸nh thËt vèn bÞ øc chÕ bëi trïng c¸nh phÊn. (b) ë c«n trïng hai c¸nh, c¸c gen ®Ých mang c¸c tr×nh tù
protein Ubx (ë c«n trïng) ®iÒu hßa lµ vÞ trÝ g¾n cña protein Ubx (h×nh tr¸i); trong khi, ë c«n trïng
cã tr×nh tù ®iÒu hßa bÞ biÕn c¸nh phÊn (b−ím, h×nh ph¶i), c¸c tr×nh tù g¾n protein Ubx bÞ mÊt, dÉn ®Õn
c¸c gen ph¸t triÓn c¸nh thËt ®−îc biÓu hiÖn (theo Watson, 2004).
294
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
®æi khi c¸c loµi b−ím tiÕn hãa ph©n li, dÉn ®Õn viÖc c¸c gen ®Ých nµy ë b−ím kh«ng cßn bÞ
øc chÕ bëi protein Ubx n÷a. Cã lÏ phÇn lín chóng ta ®Òu cho r»ng kh¶ n¨ng thø nhÊt dÔ
x¶y ra h¬n, bëi kh¶ n¨ng thø hai chØ x¶y ra khi ®ång thêi cã tõ 5 ®Õn 10 gen ®Ých (thiÕt
yÕu cho sù ph¸t triÓn c¸nh ë b−ím) ®Òu cã sù biÕn ®æi trong tr×nh tù ®iÒu hßa cña chóng.
Nh−ng thËt ng¹c nhiªn, sù biÕn ®æi tr×nh tù ®iÒu hßa cña c¸c gen ®Ých cña protein
Ubx l¹i ®−îc t×m thÊy lµ nguyªn nh©n chÝnh dÉn ®Õn sù ®a h×nh kiÓu c¸nh ë b−ím, cßn
protein Ubx biÓu hiÖn sù duy tr× chøc n¨ng gièng nhau ë ruåi giÊm vµ ë b−ím.
10.2.3. Xu h−íng ®ét biÕn thay thÕ trong c¸c tr×nh tù ADN vµ protein
Mét c©u hái ®−îc ®Æt ra tõ l©u trong c¸c nghiªn cøu tiÕn hãa lµ: kiÓu ®ét biÕn vµ
tÇn sè ®ét biÕn cã gièng nhau ë c¸c phÇn kh¸c nhau cña gen kh«ng? Ngay tõ nh÷ng n¨m
70 cña thÕ kû tr−íc, ®· cã nh÷ng nghiªn cøu so s¸nh tr×nh tù axit amin trong c¸c ph©n tö
protein cã chøc n¨ng gièng nhau. C¸c nghiªn cøu nµy ®· chØ ra r»ng, cã mét sè kiÓu thay
®æi vÒ axit amin gi÷a c¸c protein t−¬ng ®ång th−êng x¶y ra h¬n so víi c¸c kiÓu thay
®æi kh¸c. §Æc biÖt, c¸c axit amin thay thÕ nhau th−êng cã tÝnh chÊt hãa häc gièng nhau
vµ thuéc cïng nhãm ph©n lo¹i (xem b¶ng 1.5, ch−¬ng 1). Xu h−íng thay thÕ axit amin
nh− vËy cñng cè hai nguyªn t¾c tiÕn hãa quan träng, ®ã lµ: 1) c¸c ®ét biÕn chØ xuÊt hiÖn ë
tÇn sè thÊp, vµ 2) hÇu hÕt c¸c ®ét biÕn thay ®æi lín (ch¼ng h¹n, do thay thÕ c¸c axit amin
thuéc c¸c nhãm kh¸c nhau) ®Òu bÞ chän läc tù nhiªn ®µo th¶i.
C¸c axit amin cã tÝnh chÊt hãa häc gièng nhau cßn cã xu h−íng ®−îc m· hãa bëi c¸c
m· bé ba gièng nhau (xem b¶ng 4.5, ch−¬ng 4). Nhê vËy, sù xuÊt hiÖn c¸c ®ét biÕn thay
thÕ gi÷a c¸c axit amin cïng lo¹i dÔ x¶y ra h¬n. Ch¼ng h¹n nh− ®Ó xuÊt hiÖn ®ét biÕn Leu
↔ Ile chØ cÇn mét nucleotide trong gen ®−îc thay thÕ (CUU ↔ AUU); nh−ng ®Ó x¶y ra
®ét biÕn Leu ↔ Arg, cÇn ®Õn sù thay thÕ cña hai nucleotide trong gen (CUU ↔ AAU).
C¸c enzym ADN polymerase cã lçi sao chÐp vµo kho¶ng 10-9 – 10-6. NghÜa lµ, cø kho¶ng 1
triÖu ®Õn 1 tØ nucleotide, chóng míi sao chÐp sai mét lÇn. Do vËy, kh¶ n¨ng xuÊt hiÖn c¸c
®ét biÕn thay thÕ hai hay nhiÒu nucleotide t¹i cïng mét vÞ trÝ trong qu¸ tr×nh sao chÐp lµ
rÊt thÊp. H¬n n÷a, chän läc tù nhiªn ®· t¸c ®éng trªn c¸c hÖ thèng sinh häc qua hµng
triÖu n¨m tiÕn hãa, nªn phÇn lín c¸c protein hiÖn cã (kiÓu d¹i) ë c¸c sinh vËt lµ d¹ng cã
biÓu hiÖn chøc n¨ng thÝch nghi cao víi m«i tr−êng sèng hiÖn t¹i. Nªn, phÇn lín c¸c thay
®æi râ rÖt trong cÊu tróc bËc 1 cña ph©n tö protein ®Òu lµm gi¶m sù biÓu hiÖn chøc n¨ng
cña nã vµ g©y h¹i cho sinh vËt. KÕt qu¶ lµ chóng th−êng bÞ chän läc tù nhiªn ®µo th¶i
nhanh chãng.
10.3. C¸c h−íng nghiªn cøu tiÕn hãa ph©n tö
10.3.1. So s¸nh c¸c tr×nh tù ADN
10.3.1.1. Sù thay thÕ c¸c nucleotide vµ m« h×nh Jukes - Cantor
Trong qu¸ tr×nh tiÕn hãa, sau khi hai tr×nh tù nucleotide t¸ch li khái nhau (ch¼ng
h¹n, 2 gen t−¬ng ®ång ë 2 loµi cïng t¸ch li tõ tæ tiªn chung), chóng b¾t ®Çu tÝch lòy c¸c
®ét biÕn ®éc lËp víi nhau. Trong c¸c nghiªn cøu tiÕn hãa dïng phÐp so s¸nh tr×nh tù
ADN, sè nucleotide thay thÕ (K) th−êng lµ th«ng sè c¬ b¶n ®Ó nhËn ®Þnh sù kh¸c biÖt
gi÷a c¸c gen cña c¸c loµi hoÆc c¸ thÓ kh¸c nhau. Theo ®ã, c¸c gen cã Ýt nucleotide thay
thÕ ®−îc xem lµ cã quan hÖ gÇn, vµ ng−îc l¹i. Tuy vËy, ngay tõ n¨m 1969, T. Jukes vµ C.
Cantor ®· nhËn ®Þnh r»ng “viÖc so s¸nh c¸c tr×nh tù chØ dùa trªn c¸c ®¬n ph©n ®¬n lÎ cã
thÓ dÉn ®Õn viÖc ®¸nh gi¸ sai vÒ quan hÖ di truyÒn gi÷a chóng”. Cô thÓ trong ph©n tö
ADN, ë vÞ trÝ dÔ x¶y ra sù thay thÕ nucleotide, th× rÊt cã thÓ t¹i vÞ trÝ ®ã ®· x¶y ra mét
hoÆc nhiÒu lÇn c¸c ®ét biÕn thuËn vµ ®ét biÕn ng−îc (h×nh 10.8). §Ó ph¶n ¸nh kh¶ n¨ng
®ã, Jukes vµ Cantor ®· gi¶ thiÕt r»ng: mçi lo¹i nucleotide ®Òu cã thÓ ®−îc thay thÕ bëi 3
lo¹i nucleotide kh¸c víi kh¶ n¨ng nh− nhau; trong ®ã, qui −íc tØ lÖ thay thÕ mét
295
§inh §oµn Long
nucleotide thµnh mét trong 3 lo¹i nucleotide cßn t=0 T×nh huèng 1 T×nh huèng 2
l¹i lµ α. Khi ®ã, tØ lÖ thay thÕ mét nucleotide nãi C C
chung lµ 3α. Theo m« h×nh nµy, nÕu mét vÞ trÝ
nucleotide trªn gen t¹i thêi ®iÓm 0 (t = 0) lµ C, t=1 A T
th× x¸c suÊt (P) t¹i thêi ®iÓm 1 (t = 1) vÞ trÝ
nucleotide ®ã vÉn lµ C sÏ lµ PC(1) = 1 – 3α. Vµo t=2 T C
c¸c thêi ®iÓm sau ®ã (vÝ dô: t = 2), ph¶i tÝnh ®Õn
kh¶ n¨ng ®ét biÕn “ng−îc” (®ét biÕn “phôc håi”). H×nh 10.8. Hai t×nh huèng thay thÕ
NÕu nucleotide gèc lµ C chuyÓn thµnh mét nucleotide x¶y ra t¹i cïng mét vÞ trÝ cã thÓ
nucleotide kh¸c (vÝ dô lµ A) t¹i t = 1, th× t¹i t = dÉn ®Õn viÖc −íc l−îng sai sè lÇn ®ét biÕn
2, gi¸ trÞ PC(2) sÏ b»ng (1 - 3α)PC(1) + α[1 – PA(1)]. thay thÕ nucleotide ® x¶y ra ë mét gen (t lµ
TiÕp tôc më réng c«ng thøc nµy, vµo thêi ®iÓm thêi gian).
bÊt kú trong t−¬ng lai (t), kh¶ n¨ng mét vÞ trÝ
trªn m¹ch ADN mang nucleotide C sÏ lµ:
PC(t) = 1/4 = (3/4)e-4α (ph−¬ng tr×nh 10.1)
C«ng thøc nµy cã thÓ dïng ®Ó tÝnh gi¸ trÞ
cña α, qua ®ã ph¶n ¸nh tÇn sè (tèc ®é) thay thÕ
nucleotide t¹i mét vÞ trÝ trªn ph©n tö ADN.
Tuy vËy, so víi thùc tÕ, c«ng thøc Jukes - Cantor lµ mét c«ng thøc qu¸ gi¶n l−îc.
Ch¼ng h¹n, c¸c ®ét biÕn ®ång ho¸n (thay thÕ purine nµy b»ng purine kh¸c, hoÆc
pyrimidine nµy b»ng pyrimidine kh¸c) trong thùc tÕ th−êng dÔ x¶y ra h¬n so víi c¸c ®ét
biÕn dÞ ho¸n (thay thÕ mét purine b»ng mét pyrimidine hoÆc ng−îc l¹i). Dï vËy, tõ viÖc
më réng c«ng thøc Jukes – Cantor cã thÓ x¸c ®Þnh ®−îc sè lÇn thay thÕ nucleotide thùc
sù ®· x¶y ra (K) t¹i mét vÞ trÝ nucleotide trªn m¹ch ADN dùa theo ph−¬ng tr×nh sau:
K = -3/4 ln [1 – (4/3)p] (ph−¬ng tr×nh 10.2)
trong ®ã, p lµ tØ sè c¸c nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN ®−îc so s¸nh sau mét
lÇn ®Õm ®éc lËp. C«ng thøc nµy phï hîp víi quan ®iÓm cho r»ng nÕu hai tr×nh tù ADN
chØ cã Ýt vÞ trÝ kh¸c biÖt, th× gi¸ trÞ p nhá vµ kh¶ n¨ng thay thÕ nhiÒu lÇn t¹i mét vÞ trÝ lµ
thÊp (vÝ dô: trªn m¹ch ADN cã 100 nucleotide, nÕu p = 0,02 th× K = 0,02). §ång thêi c«ng
thøc nµy cho thÊy: nÕu sè nucleotide kh¸c nhau gi÷a hai tr×nh tù ADN cµng lín, th× tÇn
sè nucleotide thay thÕ thËt cµng lín h¬n tÇn sè quan s¸t (vÝ dô: trªn m¹ch ADN cã 100
nucleotide, nÕu p = 0,50 th× K = 0,82).
10.3.1.2. Tèc ®é thay thÕ c¸c nucleotide
Sè lÇn thay thÕ nucleotide mµ hai tr×nh tù ADN ®· tr¶i qua tõ khi chóng t¸ch li
khái tr×nh tù tæ tiªn ®−îc xem lµ th«ng sè quan träng nhÊt trong nghiªn cøu tiÕn hãa sö
dông phÐp so s¸nh ADN. Khi kÕt hîp sè lÇn thay thÕ nucleotide (K) víi kho¶ng thêi gian
tiÕn hãa (T) th× x¸c ®Þnh ®−îc tÇn sè thay thÕ nucleotide (r). V×, sù thay thÕ nucleotide
x¶y ra ®ång thêi vµ ®éc lËp ë c¶ hai tr×nh tù, nªn r ®−îc tÝnh b»ng c«ng thøc:
r = K/(2T) (ph−¬ng tr×nh 10.3)
§iÒu cÇn l−u ý lµ ®Ó −íc tÝnh ®−îc gi¸ trÞ K, ph¶i thu thËp ®−îc d÷ liÖu vÒ tr×nh tù
ADN tõ Ýt nhÊt 2 loµi trë lªn. ViÖc so s¸nh tÇn sè thay thÕ nucleotide trong ph¹m vi mét
gen hay gi÷a c¸c gen kh¸c nhau cho phÐp dù ®o¸n c¬ chÕ ph©n tö dÉn ®Õn sù thay thÕ
nucleotide trong c¸c tr×nh tù ADN. NÕu tèc ®é tiÕn hãa trong mét nhãm loµi lµ æn ®Þnh
th× tÇn sè thay thÕ nucleotide cã thÓ gióp dù ®o¸n thêi gian x¶y ra mét sù kiÖn tiÕn hãa.
296
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
10.3.1.3. Tèc ®é tiÕn hãa cña c¸c phÇn kh¸c nhau trong gen
KÕt qu¶ so s¸nh tr×nh tù ADN ë nhiÒu gen kh¸c nhau ®· x¸c nhËn r»ng: c¸c phÇn
kh¸c nhau trong gen cã tÇn sè biÕn ®æi kh¸c nhau. Nãi c¸ch kh¸c, chän läc tù nhiªn t¸c
®éng víi møc ®é kh¸c nhau lªn c¸c phÇn kh¸c nhau cña gen. Chóng ta biÕt r»ng, mét gen
sinh vËt nh©n thËt ®iÓn h×nh bao gåm c¸c tr×nh tù m· hãa (quy ®Þnh c¸c axit amin trong
ph©n tö protein) vµ c¸c tr×nh tù kh«ng m· hãa. C¸c tr×nh tù kh«ng m· hãa bao gåm c¸c
intron, c¸c ®o¹n dÉn ®Çu vµ theo sau vïng m· hãa (®−îc phiªn m·, nh−ng kh«ng ®−îc
dÞch m·) vµ c¸c ®o¹n vïng biªn kh«ng ®−îc phiªn m· n»m ng−îc dßng (®Çu 5’) vµ xu«i
dßng (®Çu 3’) cña gen (dï chóng cÇn thiÕt cho sù phiªn m·). Ngoµi ra, trong hÖ gen cßn cã
c¸c gen gi¶ (cïng lµ tr×nh tù kh«ng m· hãa) vèn kh«ng cßn kh¶ n¨ng biÓu hiÖn vµ cho ra
c¸c s¶n phÈm ho¹t ®éng chøc n¨ng b×nh th−êng bëi chóng ®· tÝch lòy nhiÒu ®ét biÕn lµm
mÊt chøc n¨ng trong qu¸ tr×nh tiÕn hãa. Ngay trong tr×nh tù m· hãa cña gen, kh«ng ph¶i
mäi thay thÕ nucleotide ®Òu dÉn ®Õn thay ®æi axit amin trong ph©n tö protein. NhÊt lµ, sù
thay thÕ nucleotide t¹i vÞ trÝ thø ba trong mét m· bé ba (codon) nhiÒu khi kh«ng lµm ¶nh
h−ëng ®Õn thµnh phÇn vµ tr×nh tù axit amin trªn ph©n tö protein do hiÖn t−îng “tho¸i
hãa” cña m· bé ba (xem thªm ch−¬ng 4).
10.3.1.4. C¸c vÞ trÝ ®ång nghÜa vµ kh¸c nghÜa trong gen
B¶ng 10.1 cho thÊy tèc ®é thay ®æi t−¬ng ®èi ë c¸c phÇn kh¸c nhau cña c¸c gen
®éng vËt cã vó. §iÓm ®¸ng chó ý ë c¸c gen biÓu hiÖn chøc n¨ng lµ tÇn sè thay thÕ
nucleotide cao nhÊt t¹i c¸c vÞ trÝ ®ång nghÜa trong vïng m· hãa cña gen. TÇn sè thay thÕ
nucleotide ®ång nghÜa cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c nghÜa quan
s¸t ®−îc. C¸c ®ét biÕn thay thÕ nucleotide ®ång nghÜa lµ c¸c ®ét biÕn kh«ng lµm thay ®æi
tr×nh tù axit amin trªn ph©n tö protein; do vËy, kh«ng lµm thay ®æi sù biÓu hiÖn chøc
n¨ng cña protein. §Õn ®©y, chóng ta nhí l¹i: c¸c biÕn ®æi trong tr×nh tù nucleotide cã thÓ
xuÊt hiÖn nh− thÕ nµo? VÒ tæng thÓ, cã thÓ nãi tÊt c¶ nh÷ng thay ®æi nucleotide trong
tr×nh tù ADN lµ do sai sãt cña qu¸ tr×nh sao chÐp hoÆc söa ch÷a ADN. TÊt c¶ c¸c enzym
tham gia sao chÐp vµ söa ch÷a ADN
®Òu kh«ng cã kh¶ n¨ng ph©n biÖt B¶ng 10.1. Tèc ®é thay thÕ nucleotide trung b×nh trong c¸c
mét ®ét biÕn lµ ®ång nghÜa hay vïng tr×nh tù ADN kh¸c nhau thuéc gen ë ®éng vËt cã vó
kh¸c nghÜa. Do vËy, cã thÓ suy ®o¸n Tr×nh tù ADN Sè nucleotide trung b×nh
r»ng: kh¶ n¨ng xuÊt hiÖn cña c¸c thay thÕ t¹i mçi vÞ trÝ
®ét biÕn thay thÕ nucleotide ®ång hµng n¨m (x 10-9)
nghÜa vµ kh¸c nghÜa lµ nh− nhau.
Nh−ng, c¸c ®ét biÕn kh¸c nghÜa C¸c gen biÓu hiÖn chøc n¨ng 2,36
th−êng g©y h¹i nªn cã xu h−íng bÞ Vïng biªn ®Çu 5’ cña gen 1,74
chän läc tù nhiªn ®µo th¶i; trong khi §o¹n tr×nh tù dÉn ®Çu gen 4,65
®ã, c¸c ®ét biÕn ®ång nghÜa v−ît qua Tr×nh tù m· hãa, ®ång nghÜa
®−îc c¸c “hµng rµo” chän läc, nªn Tr×nh tù m· hãa, kh¸c nghÜa 0,88
®−îc duy tr×. Nhê vËy, chÝnh c¸c ®ét C¸c tr×nh tù intron 3,70
biÕn ®ång nghÜa cã ý nghÜa ph¶n ¸nh §o¹n tr×nh tù theo sau gen 1,88
tèc ®é ®ét biÕn x¶y ra ë mét hÖ gen, Vïng biªn ®Çu 3’ cña gen 4,46
trong khi c¸c ®ét biÕn kh¸c nghÜa th× C¸c gen gi¶ 4,85
kh«ng.
10.3.1.5. Sù biÕn ®æi ë c¸c vïng biªn cña gen
B¶ng 10.1 cho thÊy møc ®é biÕn ®æi ë vïng biªn ®Çu 3’ cña c¸c gen còng rÊt cao.
Gièng nh− c¸c ®ét biÕn ®ång nghÜa, c¸c tr×nh tù vïng biªn ®Çu 3’ kh«ng ¶nh h−ëng ®Õn
tr×nh tù axit amin cña protein vµ Ýt ¶nh h−ëng ®Õn qu¸ tr×nh biÓu hiÖn cña gen. KÕt qu¶
lµ, phÇn lín c¸c ®ét biÕn thay thÕ ë vïng nµy ®−îc duy tr× qua chän läc tù nhiªn. TÇn sè
thay thÕ nucleotide trong vïng intron cña gen còng cao, nh−ng thÊp h¬n ®ét biÕn ®ång
297
§inh §oµn Long
nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’. MÆc dï c¸c tr×nh tù intron kh«ng ph¶i
tr×nh tù m· hãa c¸c axit amin trong protein, nh−ng vïng tiÕp gi¸p gi÷a chóng víi c¸c
exon liÒn kÒ cã vai trß ®¶m b¶o cho qu¸ tr×nh c¾t intron vµ kÕt nèi exon diÔn ra chÝnh
x¸c. Mét sè tr×nh tù bªn trong intron, nh− tr×nh tù ph©n nh¸nh, lµ thiÕt yÕu cho qu¸
tr×nh c¾t intron. Mét sè intron bÞ c¾t bá t¹i m« nµy, nh−ng l¹i ®−îc dïng ®Ó m· hãa axit
amin t¹i m« kh¸c trong m« h×nh “c¸c c¸ch c¾t intron kh¸c nhau” (xem thªm ch−¬ng 5).
Ngoµi ra, ë mét sè gen, intron cßn lµ vÞ trÝ liªn kÕt cña mét sè yÕu tè phiªn m· nªn cã ¶nh
h−ëng ®Õn kh¶ n¨ng vµ tèc ®é phiªn m· cña gen. Do vËy, kh«ng ph¶i mäi thay ®æi trong
tr×nh tù intron cña tÊt c¶ c¸c gen ®Òu v−ît qua ®−îc “hµng rµo” chän läc tù nhiªn.
Nh−ng, nh×n chung tÇn sè thay ®æi cña chóng chØ thÊp h¬n ®«i chót so víi c¸c ®ét biÕn
®ång nghÜa vµ ®ét biÕn thay thÕ ë vïng biªn ®Çu 3’ cña gen.
So víi vïng biªn ®Çu 3’ cña gen, vïng biªn ®Çu 5’ cã møc ®é thay ®æi thÊp h¬n. MÆc
dï vïng nµy còng kh«ng ®−îc phiªn m· vµ dÞch m·, nh−ng nã mang tr×nh tù khëi ®Çu
phiªn m· (promoter) bªn c¹nh c¸c tr×nh tù ®iÒu hßa phiªn m· kh¸c cña gen; v× vËy, vïng
nµy rÊt quan träng cho sù biÓu hiÖn cña gen. ThËm chÝ, nh÷ng thay ®æi nhá trong
promoter, nh− hép TATA, cã thÓ ng¨n c¶n sù phiªn m· cña gen vµ th−êng cã h¹i cho thÓ
®ét biÕn. Chän läc tù nhiªn th−êng ®µo th¶i nh÷ng ®ét biÕn nµy vµ gi¶m thiÓu tèi ®a
nh÷ng thay ®æi trong c¸c vïng quan träng cña hÖ gen, trong ®ã cã c¸c promoter.
Trong c¸c gen, tÇn sè biÕn ®æi thÊp h¬n n÷a thuéc vÒ c¸c vïng dÉn ®Çu vµ theo sau
vïng m· hãa cña gen. MÆc dï nh÷ng vïng nµy kh«ng ®−îc dÞch m· nh−ng chóng ®−îc
phiªn m·, vµ tr×nh tù cña chóng th−êng cã vai trß mang tÝn hiÖu ®iÒu khiÓn hoÆc qu¸
tr×nh hoµn thiÖn mARN (trong nh©n tÕ bµo) hoÆc qu¸ tr×nh dÞch m· tæng hîp protein (ë
tÕ bµo chÊt). Do vËy, c¸c ®ét biÕn thay thÕ nucleotide ë c¸c vïng tr×nh tù nµy Ýt ®−îc duy
tr× còng lµ ®iÒu dÔ hiÓu. Trong ph¹m vi mét gen, tÇn sè c¸c ®ét biÕn thay thÕ thÊp nhÊt
lµ c¸c ®ét biÕn kh¸c nghÜa x¶y ra trong vïng m· hãa cña gen. Nh− chóng ta ®· biÕt,
phÇn lín c¸c protein kiÓu d¹i cña sinh vËt cã tr×nh tù axit amin ®· ®−îc chän läc tù nhiªn
sµng läc nªn th−êng ë d¹ng thÝch nghi nhÊt víi m«i tr−êng sèng hiÖn t¹i; thÕ nªn, phÇn
lín c¸c thay ®æi tr×nh tù axit amin ®Òu dÉn ®Õn sù kÐm thÝch nghi h¬n vµ bÞ chän läc tù
nhiªn ®µo th¶i. TÊt nhiªn møc ®é t¸c ®éng cña chän läc tù nhiªn lµ kh«ng gièng nhau ë
c¸c axit amin kh¸c nhau trong ph©n tö protein, còng nh− cßn phô thuéc vµo viÖc axit
amin thay thÕ cã tÝnh chÊt hãa häc gièng hay kh¸c axit amin gèc.
10.3.1.6. Gen gi¶
TÇn sè ®ét biÕn ®−îc t×m thÊy cao nhÊt ë c¸c gen gi¶. VÝ dô, ë c¸c gen gi¶ globin cña
ng−êi, tÇn sè thay ®æi nucleotide cao gÊp 5 lÇn so víi tÇn sè thay thÕ nucleotide kh¸c
nghÜa ë vïng m· hãa cña gen globin thËt. Së dÜ c¸c gen gi¶ cã tÇn sè thay thÕ nucleotide
cao, v× chóng kh«ng cßn ®−îc dïng ®Ó tæng hîp protein. ThÕ nªn, nh÷ng thay ®æi trong
gen gi¶ hÇu nh− kh«ng bÞ t¸c ®éng bëi chän läc tù nhiªn.
Nãi tãm l¹i, mét xu h−íng dÔ nhËn thÊy trong qu¸ tr×nh tiÕn hãa lµ: c¸c vïng tr×nh tù
(nucleotide hoÆc axit amin) cµng cã vai trß quan träng trong biÓu hiÖn chøc n¨ng cña c¸c
®¹i ph©n tö sinh häc (ADN, ARN vµ protein) cµng cã tèc ®é tiÕn hãa chËm.
10.3.1.7. Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa
Xu h−íng chän läc c¸c m· bé ba ®ång nghÜa lµ vÝ dô cho thÊy nh÷ng thay ®æi dï rÊt
nhá vÒ kh¶ n¨ng thÝch nghi ë sinh vËt ®Òu ®−îc chän läc tù nhiªn t¸c ®éng qua hµng
ngh×n, hµng triÖu thÕ hÖ. B¶ng 10.1 cho thÊy, tèc ®é tiÕn hãa cña c¸c ®ét biÕn ®ång
nghÜa chØ chËm h¬n chót Ýt so víi tèc ®é biÕn ®æi cña c¸c gen gi¶. §iÒu nµy còng ph¶n
¸nh r»ng, c¸c ®ét biÕn ®ång nghÜa kh«ng ph¶i lóc nµo còng lµ trung tÝnh; cô thÓ, mét sè
m· bé ba ®−îc chän läc tù nhiªn d−êng nh− “−u tiªn” chän lùa h¬n nh÷ng m· bé ba ®ång
nghÜa kh¸c. Gi¶ thiÕt nµy ®−îc cñng cè b»ng hiÖn t−îng c¸c m· bé ba ®ång nghÜa ®−îc sö
298
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
dông víi tÇn sè kh¸c nhau trong vïng m· hãa cña hÖ gen nhiÒu loµi sinh vËt. Ch¼ng
h¹n, tÝnh tho¸i hãa cña m· bé ba biÓu hiÖn ë 6 m· bé ba cïng m· hãa axit amin Leu lµ
UUA, UUG, CUU, CUC, CUA vµ CUG. Nh−ng trong thùc tÕ, 60% m· bé ba ®−îc dïng ®Ó
m· hãa Leu ë E. coli lµ CUG, vµ 80% m· bé ba ®−îc dïng m· hãa axit amin nµy ë nÊm
men lµ UUG. §Õn ®©y, chóng ta nhí r»ng: thùc tÕ c¸c m· bé ba ®ång nghÜa “kÕt cÆp” víi
bé ba ®èi m· cña c¸c ph©n tö tARN kh¸c nhau nh−ng cïng vËn chuyÓn mét lo¹i axit
amin (nãi c¸ch kh¸c, së dÜ cã tÝnh tho¸i hãa cña m· bé ba lµ do cã nhiÒu lo¹i tARN tuy
kh¸c nhau ë c¸c bé ba ®èi m· nh−ng cïng vËn chuyÓn mét lo¹i axit amin). V× vËy, cã thÓ
c¸c m· bé ba ®ång nghÜa kh«ng lµm thay ®æi c¸c axit amin trong ph©n tö protein, nh−ng
chóng lµm thay ®æi lo¹i tARN mµ ribosome sö dông trong qu¸ tr×nh dÞch m·. C¸c nghiªn
cøu nh×n chung cho thÊy: sè l−îng c¸c lo¹i tARN ®ång ®¼ng (cïng vËn chuyÓn mét lo¹i
axit amin) kh«ng gièng nhau; vµ lo¹i tARN phæ biÕn nhÊt còng chÝnh lµ lo¹i mang bé ba
®èi m· t−¬ng øng víi m· bé ba ®ång nghÜa ®−îc dïng phæ biÕn nhÊt. Chän läc tù nhiªn cã
lÏ ®· “−u tiªn” lùa chän mét sè m· bé ba ®ång nghÜa nµy so víi c¸c m· bé ba ®ång nghÜa
kh¸c v× lo¹i tARN t−¬ng øng víi m· bé ba ®−îc lùa chän lµ phæ biÕn h¬n. Ngoµi ra, n¨ng
l−îng liªn kÕt gi÷a c¸c m· bé ba trªn mARN víi bé ba ®èi m· trªn tARN lµ kh«ng gièng
nhau do thµnh phÇn cña c¸c baz¬ nit¬. Sù kh¸c biÖt vÒ n¨ng l−îng liªn kÕt trong qu¸
tr×nh dÞch m· cã thÓ lµ ®èi t−îng chÞu t¸c ®éng cña chän läc tù nhiªn. §iÒu nµy ®Æc biÖt
®óng ë nh÷ng gen ®−îc biÓu hiÖn m¹nh vµ ë c¸c loµi cã vßng ®êi ng¾n, kÝch th−íc quÇn
thÓ lín (nh− vi khuÈn, nÊm men vµ ruåi dÊm). Xu h−íng chän läc c¸c m· bé ba ®ång
nghÜa nh− vËy lµ mét b»ng chøng cho thÊy “søc m¹nh” cña chän läc tù nhiªn trong tiÕn
hãa. Ch¼ng h¹n, ngay gi÷a hai chñng vi khuÈn gièng nhau hoµn toµn vÒ mäi ho¹t ®éng
sèng, ngoµi mét kh¸c biÖt duy nhÊt ë mét bé ba m· ®ång nghÜa, th× kh¸c biÖt nhá ®ã còng
®ñ dÉn ®Õn viÖc chØ mét trong hai chñng tÕ bµo ®−îc duy tr× qua hµng triÖu thÕ hÖ tiÕn
hãa d−íi t¸c ®éng cña chän läc tù nhiªn. Chóng ta cã thÓ liªn t−ëng ®iÒu nµy qua h×nh
¶nh: mét c«ng ty A ph¶i tr¶ gi¸ cao 1% cho mét mÆt hµng mµ mçi n¨m hä ph¶i mua hµng
ngµn lÇn, víi mét c«ng ty B ph¶i tr¶ gi¸ cao 30% cho mét mÆt hµng hä chØ ph¶i mua mét
vµi lÇn, th× “lîi nhuËn” ®Çu t− cña c«ng ty B vÉn cao h¬n c«ng ty A vµ søc c¹nh tranh cña
c«ng ty B lµ lín h¬n.
B¶ng 10.2 cho thÊy, c¸c gen biÓu hiÖn m¹nh cã xu h−íng “−u tiªn” sö dông c¸c axit
amin cã chi phÝ n¨ng l−îng tæng hîp thÊp nÕu chóng cã cïng tÝnh chÊt hãa häc vµ cã thÓ
thay thÕ ®−îc. Trong tÕ bµo, n¨ng l−îng tiªu hao cho sù tæng hîp 20 lo¹i axit amin kh¸c
nhau lµ kh¸c nhau. VÝ dô, ®Ó tæng hîp mét ph©n tö Gly cÇn n¨ng l−îng t−¬ng ®−¬ng lµ
11,7 ph©n tö ATP; cßn ®Ó tæng hîp mét ph©n tö Trp cÇn n¨ng l−îng t−¬ng ®−¬ng lµ 78,3
ph©n tö ATP. Trong cÊu tróc cña c¸c protein, cã nh÷ng vÞ trÝ kh«ng thÓ thay thÕ ®−îc
axit amin Trp, nh−ng ë bÊt cø vÞ trÝ Trp nµo cã thÓ thay thÕ ®−îc b»ng Gly (hoÆc thËm
chÝ xãa bá hoµn toµn) th× chän läc tù nhiªn cã xu h−íng “−u tiªn” cho sù thay ®æi nh−
vËy. ë c¸c gen ®−îc biÓu hiÖn m¹nh, sù thay ®æi nµy t¹o ra hiÖu qu¶ tiÕt kiÖm n¨ng
l−îng cao nhÊt. ViÖc gi¶i tr×nh tù hoµn chØnh hµng tr¨m hÖ gen vi khuÈn gÇn ®©y ®· x¸c
nhËn nhËn ®Þnh nµy.
10.3.1.8. Trong hÖ gen, c¸c gen cã tèc ®é tiÕn hãa kh¸c nhau
Tèc ®é tiÕn hãa gi÷a c¸c gen trong hÖ gen, thËm chÝ gi÷a c¸c vïng kh¸c nhau trong
mét gen, lµ kh«ng gièng nhau. Sù kh¸c nhau nµy phô thuéc vµo hai yÕu tè: 1) sù kh¸c
nhau trong tÇn sè ®ét biÕn ë mçi gen, vµ 2) møc ®é t¸c ®éng cña chän läc tù nhiªn lªn mçi
locut. §Ó x¸c ®Þnh mét thay ®æi nucleotide trong hÖ gen lµ do tÝnh thÝch nghi hay chØ lµ
sù kiÖn ngÉu nhiªn, McDonald-Kreitman (1991) ®−a ra m« h×nh so s¸nh sù ®a h×nh di
truyÒn trong ph¹m vi mét loµi víi sù ph©n li gi÷a c¸c loµi kh¸c nhau t¹i c¸c vÞ trÝ ®ét
biÕn ®ång nghÜa vµ kh¸c nghÜa trong vïng m· hãa cña gen. NÕu ë mét gen, tØ sè gi÷a ®ét
biÕn kh¸c nghÜa so víi ®ét biÕn ®ång nghÜa trong ph¹m vi mét loµi t−¬ng ®−¬ng víi gi÷a
299
§inh §oµn Long
B¶ng 10.2. TÇn sè sö dông axit amin trong 10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn cao nhÊt vµ
10% c¸c s¶n phÈm cña gen cã møc biÓu hiÖn ë møc thÊp nhÊt ë 3 loµi sinh vËt nh©n s¬
Chi phÝ n¨ng §é lÖch tõ Escherichia coli K12 Streptococcus Bacillus subtilis subsp.
l−îng tæng chi phÝ pneumonia R6 subtilis str. 168
Axit hîp (sè ATP)
amin(*) n¨ng l−îng ThÊp Cao §é lÖch ThÊp Cao §é lÖch ThÊp Cao §é lÖch
trung b×nh tÇn sè tÇn sè tÇn sè
sö dông sö dông sö dông
Gly (G) 11,7 - 15,66 6,40 8,16 1,76 6,01 8,30 2,29 6,12 8,11 1,99
Ser (S) 11,7 - 15,66 6,65 4,99 - 1,67 6,47 4,96 - 1,51 6,24 5,84 - 0,40
Ala (A) 11,7 - 15,66 8,48 9,76 1,27 5,85 9,80 3,95 7,40 8,70 1,30
Asp (D) 12,7 - 14,66 4,81 5,95 1,15 4,85 6,04 1,19 5,06 5,42 0,36
Asn (N) 14,7 - 12,66 4,45 3,92 - 0,52 3,64 4,60 0,96 3,32 4,24 0,92
Glu (E) 15,3 - 12,06 5,23 7,10 1,87 6,54 7,91 1,37 6,71 8,11 1,40
Gln (Q) 16,3 - 11,06 4,48 3,83 - 0,66 4,43 3,33 - 1,10 3,98 3,46 - 0,52
Thr (T) 18,7 - 8,66 5,41 5,22 - 0,19 4,78 5,97 1,19 4,92 5,82 0,89
Pro (P) 20,3 - 7,06 4,22 4,08 - 0,15 3,17 3,72 0,55 3,87 3,62 - 0,25
Val (V) 23,3 - 4,06 6,24 7,64 1,39 6,54 8,13 1,59 6,59 7,94 1,35
Cys (C) 24,7 - 2,66 1,50 0,92 - 0,57 0,88 0,33 - 0,55 1,02 0,52 - 0,50
Arg (R) 27,3 - 0,06 5,38 5,45 0,07 4,61 4,21 - 0,40 4,71 3,99 - 0,72
Leu (L) 27,3 - 0,06 11,56 8,96 - 2,59 12,70 7,97 - 4,73 10,85 8,40 - 2,45
Lys (K) 30,3 + 2,94 4,34 5,66 1,32 5,96 7,16 1,19 6,25 7,55 1,30
Ile (I) 32,3 + 4,94 6,72 6,03 - 0,69 7,74 6,41 - 1,33 6,79 7,14 0,35
Met (M) 34,3 + 6,94 2,39 2,70 0,31 2,29 2,07 - 0,22 2,65 2,28 - 0,37
His (H) 38,3 + 10,94 2,50 2,05 - 0,45 2,21 1,61 - 0,60 2,74 1,80 - 0,93
Tyr (Y) 50,0 + 22,64 3,15 2,82 - 0,34 4,44 2,96 - 1,48 3,94 2,85 - 1,09
Phe (F) 52,0 + 24,64 4,35 3,71 - 0,64 5,76 3,69 - 2,07 5,56 3,53 - 2,04
Trp (W) 74,3 + 46,94 1,73 1,05 - 0,69 1,13 0,81 - 0,32 1,27 0,67 - 0,60
(*) C¸c axit amin ®−îc xÕp theo thø tù møc chi phÝ n¨ng l−îng cÇn ®Ó tæng hîp nªn mét ph©n tö axit amin t¨ng dÇn (tÝnh t−¬ng ®−¬ng víi sè liªn kÕt
pyrophosphate cÇn “®øt g·y” tõ ATP ®Ó gi¶i phãng n¨ng l−îng tù do cÇn cho qu¸ tr×nh tæng hîp)(theo Akashi vµ Gojobori, 2002)
c¸c loµi kh¸c nhau, th× hÇu hÕt c¸c ®ét B¶ng 10.3. Tèc ®é thay thÕ nucleotide trung b×nh
biÕn ë gen nµy lµ trung tÝnh; tøc lµ, sù trong tr×nh tù ADN cña c¸c gen ®éng vËt cã vó
thay thÕ nucleotide cã khuynh h−íng C¸c gen Tèc ®é ®ét biÕn(*) Tèc ®é ®ét biÕn
ngÉu nhiªn. Nh−ng nÕu nh÷ng tØ sè nµy kh¸c nghÜa ®ång nghÜa
kh¸c nhau, th× cã sù t¸c ®éng cña chän Histone H4
läc tù nhiªn lªn locut. Nãi c¸ch kh¸c, sù Insulin 0,004 1,43
thay thÕ nucleotide ë ®©y cã khuynh Prolactin 0,16 5,41
h−íng lµm t¨ng tÝnh thÝch nghi cña sinh α-Globin 1,29 5,59
vËt. β-Globin 0,56 3,94
0,87 2,96
ë ®éng vËt cã vó, tØ sè gi÷a ®ét Albumin 0,92 6,72
biÕn thay thÕ kh¸c nghÜa víi ®ång nghÜa
lµ kh¸c nhau râ rÖt ë c¸c locut kh¸c α-Fetoprotein 1,21 4,90
nhau (b¶ng 10.3). §iÒu nµy ph¶n ¸nh, MHC 5,10 2,40
chän läc tù nhiªn t¸c ®éng víi “c−êng ®é” Apolipoprotein E 0,98 4,04
kh¸c nhau lªn mçi locut. VÝ dô vÒ hai
(*) Tèc ®é ®ét biÕn ë ®©y lµ sè lÇn thay ®æi nucleotide t¹i mçi vÞ trÝ nucleotide
trªn gen x¶y ra trung b×nh hµng n¨m (x 10-9)
nhãm gen m· hãa cho protein lµ histone vµ apolipoprotein minh häa cho thÊy hiÖu qu¶
t¸c ®éng cña chän läc tù nhiªn cßn tïy thuéc vµo chøc n¨ng cña protein. Cô thÓ, histone
lµ c¸c protein tÝch ®iÖn d−¬ng, cã chøc n¨ng liªn kÕt ADN vµ lµ thµnh phÇn thiÕt yÕu cña
300
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
chÊt nhiÔm s¾c ë tÊt c¶ c¸c sinh vËt nh©n thËt. HÇu nh− tÊt c¶ c¸c axit amin cã trong
ph©n tö histone (vÝ dô H4) ®Òu t−¬ng t¸c víi c¸c gèc hãa häc kh¸c nhau trªn ph©n tö
ADN tÝch ®iÖn ©m. V× vËy, gÇn nh− tÊt c¶ mäi sù thay ®æi trªn ph©n tö histone H4 ®Òu
¶nh h−ëng ®Õn kh¶ n¨ng t−¬ng t¸c cña protein nµy víi ADN. Nh− vËy, histone lµ mét
trong nh÷ng nhãm protein cã tèc ®é tiÕn hãa chËm nhÊt. ThËm chÝ, cã thÓ thay thÕ
histone H4 cña ng−êi b»ng histone H4 cña nÊm men mµ kh«ng lµm thay ®æi hiÖu qu¶
kiÓu h×nh (dï r»ng nÊm men vµ ng−êi ®· t¸ch li tiÕn hãa tõ hµng tr¨m triÖu n¨m). §iÒu
nµy ng−îc víi c¸c apolipoprotein phæ biÕn trong hÖ miÔn dÞch ë §VCXS, vèn cã chøc n¨ng
t−¬ng t¸c vµ vËn chuyÓn kh«ng ®Æc hiÖu nhiÒu hîp chÊt lipide kh¸c nhau. MiÒn liªn kÕt
lipide cña protein nµy gåm thµnh phÇn chñ yÕu lµ c¸c axit amin kÞ n−íc. C¸c axit amin
cã tÝnh kÞ n−íc (vÝ dô: Leu, Ile vµ Val) ®Òu cã thÓ thay thÕ nhau trong miÒn liªn kÕt nµy
mµ kh«ng lµm thay ®æi chøc n¨ng cña protein. KÕt qu¶ lµ, nÕu nh− histone H4 chØ thÊy
cã mét d¹ng duy nhÊt ë ng−êi, th× apolipoprotein cã hµng chôc d¹ng kh¸c nhau.
MÆc dï phÇn lín nh÷ng thay ®æi axit amin ë hÇu hÕt protein th−êng lµ cã h¹i vµ bÞ
chän läc tù nhiªn ®µo th¶i, nh−ng còng cã mét sè locut gen chän läc tù nhiªn l¹i “−u tiªn”
t¨ng sù biÕn ®æi. VÝ dô ®iÓn h×nh vÒ xu h−íng nµy lµ c¸c nhãm gen cña hÖ thèng miÔn
dÞch, bao gåm phøc hÖ t−¬ng hîp m«, c¸c côm gen m· hãa kh¸ng thÓ hoÆc thô thÓ tÕ bµo
T (xem ch−¬ng 9). Ch¼ng h¹n, c¸c gen m· hãa phøc hÖ t−¬ng hîp m« MHC lu«n kh¸c
nhau gi÷a mçi c¸ thÓ (trõ tr−êng hîp ®a sinh cïng trøng). V× vËy, tØ lÖ ®é biÕn kh¸c
nghÜa trong c¸c gen MHC lín h¬n nhiÒu so víi tØ lÖ ®ét biÕn ®ång nghÜa (b¶ng 10.3).
MHC lµ mét hä lín cña nhiÒu gen mµ s¶n phÈm do chóng m· hãa quyÕt ®Þnh kh¶ n¨ng
nhËn biÕt c¸c kh¸ng nguyªn l¹ cña hÖ thèng miÔn dÞch. Trong c¸c quÇn thÓ ng−êi,
kho¶ng 90% c¸c c¸ thÓ nhËn c¸c nhãm gen MHC kh¸c nhau tõ bè vµ mÑ. Khi ph©n tÝch
mét nhãm bÊt kú gåm kho¶ng 200 c¸ thÓ, sè alen kh¸c biÖt cña locut MHC dao ®éng tõ
15 ®Õn 30 alen. Møc ®é ®a d¹ng cao cña nh÷ng vïng gen nµy ®−îc chän läc tù nhiªn duy
tr×. Bëi v× sè lo¹i virut vµ c¸c thÓ g©y nhiÔm lµ rÊt lín, nªn viÖc duy tr×nh tÝnh ®a h×nh
cao sÏ gióp t¨ng sè c¸ thÓ (trong quÇn thÓ) cã kh¶ n¨ng kh¸ng víi nhiÒu lo¹i virut (thùc
chÊt lµ ph¸t hiÖn ®−îc kh¸ng nguyªn cña virut ®ã). Nh−ng, trong qu¸ tr×nh tiÕn hãa,
song song víi viÖc c¸c quÇn thÓ vËt chñ duy tr× tÝnh ®a d¹ng cao cña hÖ thèng miÔn dÞch
th× c¸c virut còng cã tèc ®é tiÕn hãa rÊt nhanh. C¸c gen virut cóm cã tèc ®é thay thÕ
nucleotide ®¹t 1,9x10-3 nucleotide mçi n¨m, tøc lµ gÊp 1 triÖu lÇn tèc ®é ®ét biÕn ®ång
nghÜa ë vïng m· hãa cña c¸c gen ®éng vËt cã vó.
10.3.2. So s¸nh c¸c hÖ gen
10.3.2.1. So s¸nh hÖ gen lµ c«ng cô nghiªn cøu tiÕn hãa vµ x¸c ®Þnh chøc n¨ng gen
Xu h−íng tiÕn hãa chËm cña c¸c tr×nh tù ADN lµ c¬ së cña lÜnh vùc nghiªn cøu hÖ
gen häc so s¸nh (comparative genomics). Trong ®ã, toµn bé hÖ gen cña c¸c loµi kh¸c
nhau ®−îc so s¸nh víi nhau. Mét trong nh÷ng môc tiªu cña c¸c dù ¸n gi¶i tr×nh tù hÖ
gen ë mçi loµi sinh vËt lµ lËp b¶n ®å ®Çy ®ñ cña c¸c gen, nghÜa lµ x¸c ®Þnh vÞ trÝ cña
chóng trªn mçi NST. ViÖc lËp b¶n ®å c¸c gen trong hÖ gen ng−êi ®−îc coi lµ nÒn t¶ng cho
tiÒm n¨ng øng dông kü thuËt thuËt di truyÒn vµ liÖu ph¸p gen trong viÖc ch÷a trÞ c¸c
gen sai háng ë c¸c bÖnh do ®ét biÕn g©y ra, nh− bÖnh hãa x¬ nang hay c¸c bÖnh ung th−.
Nh−ng trong thùc tÕ, nÕu chØ x¸c ®Þnh ®−îc vÞ trÝ mét gen nµo ®ã trªn NST th× kh«ng ®ñ
®Ó chØ ra chøc n¨ng cña gen ®ã, còng nh− kh«ng râ gen ®ã t−¬ng t¸c thÕ nµo víi c¸c gen
vµ c¸c tr×nh tù kh¸c trong hÖ gen. Cã ®Õn 95% tr×nh tù ADN thuéc c¸c hÖ gen sinh vËt
bËc cao lµ c¸c tr×nh tù kh«ng m· hãa. V× vËy, ngay c¶ khi toµn bé tr×nh tù mét hÖ gen ®·
®−îc gi¶i m·, th× viÖc x¸c ®Þnh ph©n ®o¹n nµo lµ vïng m· hãa vµ chøc n¨ng cña s¶n
phÈm do chóng m· hãa th−êng kh«ng dÔ dµng. Trong bèi c¶nh ®ã, viÖc so s¸nh c¸c tr×nh
301
§inh §oµn Long
tù hÖ gen lµ mét trong nh÷ng c¸ch tèt nhÊt ®Ó dù ®o¸n chøc n¨ng cña mét tr×nh tù nhÊt
®Þnh trong hÖ gen. Cô thÓ lµ, viÖc ph¸t hiÖn ra c¸c tr×nh tù gièng nhau ë hai loµi kh¸c xa
nhau lµ dÊu hiÖu cho thÊy vai trß rÊt quan träng cña nh÷ng tr×nh tù nµy. VÝ dô, ng−êi vµ
chuét cã tæ tiªn chung c¸ch ®©y kho¶ng 80 – 100 triÖu n¨m. NÕu c¸c gen gi¶ cã tèc ®é thay
thÕ nucleotide lµ 5x10-9 t¹i mçi nucleotide mçi n¨m, th× gÇn 1/2 tæng sè nucleotide cña
nh÷ng gen nµy (kh«ng bÞ chän läc tù nhiªn ®µo th¶i) sÏ biÕn ®æi Ýt nhÊt mét lÇn kÓ tõ khi
tæ tiªn cña ng−êi vµ chuét b¾t ®Çu t¸ch li. Trªn c¬ së ®ã, khi so s¸nh c¸c hÖ gen, cã thÓ
nhËn biÕt c¸c vïng cã vai trß quan träng, nh− c¸c ®o¹n m· hãa hay c¸c tr×nh tù liªn kÕt
protein ®iÒu hßa t¹i promoter,...
Ph−¬ng ph¸p so s¸nh hÖ gen lµ mét c«ng cô kh«ng chØ h÷u hiÖu trong viÖc x¸c ®Þnh
vai trß c¸c tr×nh tù trong hÖ gen mµ cßn trong c¸c nghiªn cøu tiÕn hãa. Tuy vËy, ph−¬ng
ph¸p so s¸nh hÖ gen còng cã mét sè h¹n chÕ. Ch¼ng h¹n, mét sè gen ë ng−êi kh«ng t×m
thÊy gen “®èi t¸c” ë mét sè ®éng vËt bËc thÊp nªn kh«ng thÓ so s¸nh. Ngoµi ra, mét sè
protein cã vai trß ®a chøc n¨ng nh−ng sù biÓu hiÖn chøc n¨ng cña nh÷ng protein ®ã
kh«ng gièng nhau ë tÊt c¶ c¸c loµi.
10.3.2.2. Tèc ®é tiÕn hãa cña hÖ gen ti thÓ
So víi hÖ gen nh©n, hÖ gen ti thÓ cã ph−¬ng thøc sao chÐp vµ di truyÒn kh¸c biÖt.
Do vËy, hËu qu¶ cña c¸c ®ét biÕn thay thÕ trong hÖ gen ti thÓ vÒ c¨n b¶n còng kh¸c hÖ
gen nh©n. HÖ gen ti thÓ ®éng vËt cã vó chøa mét ph©n tö ADN (kÝ hiÖu lµ mtADN) cã
d¹ng sîi kÐp, m¹ch vßng, dµi kho¶ng 15.000 bp. Ph©n tö mtARN cña ng−êi kh¸ ®Æc
tr−ng víi kÝch th−íc b»ng kho¶ng 1/10.000 hÖ gen nh©n; m· hãa cho 2 lo¹i rARN, 22 lo¹i
tARN vµ 13 lo¹i protein. Víi kÝch th−íc nhá vµ tØ lÖ ®ét biÕn thay thÕ nucleotide ®Æc biÖt
cao, hÖ gen ti thÓ lµ mét ®èi t−îng nghiªn cøu tiÕn hãa phï hîp.
TØ lÖ ®ét biÕn thay thÕ nucleotide ®ång nghÜa ë c¸c gen ti thÓ ng−êi vµo kho¶ng
5,7x10-8 nucleotide mçi n¨m, gÊp 10 lÇn tØ lÖ ®ét biÕn ®ång nghÜa trung b×nh trong vïng
m· hãa cña hÖ gen nh©n. TØ lÖ ®ét biÕn kh¸c nghÜa ë c¸c gen m· hãa protein thuéc hÖ gen
ti thÓ rÊt kh¸c nhau. Nh−ng, trong mäi tr−êng hîp, tØ lÖ nµy ®Òu cao h¬n nhiÒu tØ lÖ ®ét
biÕn kh¸c nghÜa ë c¸c gen thuéc hÖ gen nh©n. C¬ chÕ nµo dÉn ®Õn viÖc mtADN cã tèc ®é
thay ®æi nucleotide lín h¬n nhiÒu so víi ADN hÖ gen nh©n ®Õn nay ch−a râ, nh−ng cã thÓ
liªn quan ®Õn tÇn sè sai sãt cao trong qu¸ tr×nh sao chÐp vµ söa ch÷a mtADN (ti thÓ
kh«ng cã nhiÒu c¬ chÕ söa ch÷a ADN nh− hÖ gen nh©n). Ngoµi ra, nång ®é cao h¬n cña
c¸c chÊt g©y ®ét biÕn, bao gåm c¸c gèc tù do chøa oxy (nh− O2-) vèn lµ s¶n phÈm cña qu¸
tr×nh trao ®æi chÊt diÔn ra trong ti thÓ còng cã thÓ lµ mét nguyªn nh©n dÉn ®Õn tÇn sè
®ét biÕn trong c¸c gen ti thÓ cao h¬n. Mét nguyªn nh©n kh¸c còng cã thÓ lµ do ¸p lùc
thÊp h¬n cña chän läc tù nhiªn ®èi víi hÖ gen ti thÓ v× trong mçi tÕ bµo cã hµng chôc ti
thÓ kh¸c nhau, trong ®ã trung b×nh mçi ti thÓ chøa 2 b¶n sao mtADN. §ã lµ ch−a kÓ ®Õn
c¸c thay ®æi x¶y ra trong phÇn lín c¸c protein, tARN vµ rARN ®−îc hÖ gen ti thÓ m· hãa
Ýt g©y ¶nh h−ëng tíi søc sèng cña c¬ thÓ sinh vËt h¬n so víi nh÷ng thay ®æi t−¬ng tù
trong hÖ gen nh©n (®Æc biÖt ë c¸c sinh vËt ®a bµo). Mét kh¸c biÖt n÷a gi÷a hÖ gen ti thÓ
vµ hÖ gen nh©n lµ hÖ gen ti thÓ chñ yÕu ®−îc di truyÒn theo dßng mÑ. Ti thÓ n»m trong tÕ
bµo chÊt, mµ hÇu nh− chØ cã tÕ bµo chÊt tõ trøng (cña mÑ) ®ãng gãp vµo tÕ bµo chÊt hîp
tö. KÕt qu¶ lµ, mtADN kh«ng tr¶i qua gi¶m ph©n mµ cã kiÓu gen gièng mÑ. ViÖc hÖ gen
ti thÓ tån t¹i ë tr¹ng th¸i ®¬n béi vµ kh«ng tr¶i qua gi¶m ph©n (nghÜa lµ kh«ng cã t¸i tæ
hîp do trao ®æi chÐo nh− cÆp NST t−¬ng ®ång trong hÖ gen nh©n) dÉn ®Õn quan ®iÓm cho
r»ng hÇu hÕt c¸c ®ét biÕn thay thÕ nucleotide trong hÖ gen ti thÓ lµ do ®ét biÕn (chø
kh«ng ph¶i do t¸i tæ hîp di truyÒn) sinh ra. KiÓu di truyÒn nµy cïng víi tèc ®é thay ®æi
nhanh cña hÖ gen ti thÓ cung cÊp mét c«ng cô hiÖu qu¶ cho nghiªn cøu tiÕn hãa vµ so
s¸nh hÖ gen gi÷a c¸c loµi; hoÆc gi÷a c¸c dßng, gièng, chñng téc … cña cïng mét loµi.
302
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
10.3.3. So s¸nh nhiÔm s¾c thÓ
ViÖc so s¸nh kiÓu h×nh NST gi÷a c¸c loµi, ®Æc biÖt ë sinh vËt nh©n thËt, lµ mét
ph−¬ng ph¸p nghiªn cøu c¬ b¶n ®· cung cÊp nhiÒu th«ng tin quan träng vÒ qu¸ tr×nh
h×nh thµnh c¸c loµi. C¸c ®o¹n NST, c¸c gen (hoÆc c¸c ph©n ®o¹n gen) vµ protein (hoÆc
c¸c ®o¹n tr×nh tù axit amin) gièng nhau ë nhiÒu loµi kh¸c nhau ®−îc gäi lµ c¸c ®o¹n
tr×nh tù b¶o thñ cao. KiÓu h×nh nhuém b¨ng NST (cßn gäi lµ “kiÓu nh©n”) cña ng−êi
gièng víi tinh tinh h¬n c¶, sau ®ã lµ víi khØ Gorilla vµ ®−êi −¬i (h×nh 10.9). KiÓu nh©n
cña ng−êi, tinh tinh vµ c¸c loµi v−în ng−êi chñ yÕu kh¸c nhau do mét sè ®ét biÕn ®¶o
®o¹n NST (x¶y ra trªn cïng NST). Cßn sù kh¸c biÖt chñ yÕu gi÷a kiÓu nh©n cña ng−êi vµ
ba loµi v−în ng−êi nµy víi c¸c loµi linh tr−ëng l©u ®êi h¬n chñ yÕu lµ do c¸c ®ét biÕn
chuyÓn ®o¹n NST (x¶y ra gi÷a c¸c NST). NÕu c¶ hai b¶n sao NST sè 2 cña ng−êi bÞ “®øt”
lµm ®«i th× kiÓu nh©n cña ng−êi sÏ cã 48 NST vµ lóc ®ã sÏ gièng víi kiÓu nh©n cña c¸c
loµi v−în ng−êi. KiÓu h×nh nhuém b¨ng NST sè 1 cña ng−êi, tinh tinh, khØ Gorilla vµ
®−êi −¬i gièng víi kiÓu h×nh nhuém b¨ng cña hai NST nhá t×m thÊy ë mét loµi khØ ®u«i
xanh Ch©u Phi. §iÒu nµy cho thÊy, loµi khØ nµy cã quan hÖ di truyÒn, hoÆc thËm chÝ lµ tæ
tiªn cña c¸c loµi linh tr−ëng kh¸c. Khi so s¸nh kiÓu h×nh nhuém b¨ng NST cña c¸c loµi
cã quan hÖ xa h¬n, ng−êi ta nhËn thÊy kiÓu h×nh nhuém b¨ng cña NST X gièng nhau ë
tÊt c¶ c¸c loµi ®éng vËt cã vó.
KiÓu h×nh nhuém b¨ng NST gièng nhau ë nhiÒu loµi ®éng vËt rÊt kh¸c nhau vÒ
h×nh th¸i lµ mét b»ng chøng cho thÊy nguån gèc chung cña c¸c sinh vËt trªn Tr¸i ®Êt.
Nh−ng, v× c¸c ®o¹n NST cã kiÓu h×nh nhuém b¨ng gièng nhau nh−ng ch−a ch¾c mang
c¸c gen cã tr×nh tù hoµn toµn gièng nhau nªn viÖc so s¸nh NST kh«ng ph¶i lµ ph−¬ng
ph¸p lý t−ëng ®Ó x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a c¸c loµi. Kü thuËt nhuém b¨ng
NST theo nguyªn t¾c lai huúnh quang t¹i chç - FISH (xem ch−¬ng 11), sö dông c¸c
mÉu dß ADN ®¸nh dÊu huúnh quang, cho phÐp so s¸nh c¸c NST t¹i c¸c vÞ trÝ gen ®Æc
thï. Sù t−¬ng quan vÒ trËt tù c¸c gen trªn NST gi÷a c¸c loµi lµ c¬ së x¸c ®Þnh mèi quan
hÖ tiÕn hãa gi÷a chóng. Ch¼ng h¹n, mét nhãm gåm 11 gen liªn kÕt ®−îc t×m thÊy ®ång
thêi trªn vai dµi NST sè 11 cña ng−êi, trªn NST sè 16 cña chuét vµ NST U10 ë bß. Tuy
vËy, mét sè gen liªn kÕt trªn NST sè 3 vµ NST sè 21 cña ng−êi ®−îc t×m thÊy cïng n»m
p
q
N T G§ NT G § NTG§ NTG§ NTG§ NTG§
NST sè 1 NST sè 2 NST sè 3 NST sè 4 NST sè 5 NST sè 6
H×nh 10.9. Sù gièng nhau vÒ kiÓu h×nh nhuém b¨ng NST gi÷a ng−êi vµ c¸c loµi linh tr−ëng. NST c¸c loµi
®−îc xÕp theo thø tù tõ tr¸i qua ph¶i gåm ng−êi (N), tinh tinh (T), khØ Gorilla (G) vµ ®−êi −¬i (§). §©y lµ c¸c NST
t−¬ng øng víi c¸c NST tõ 1 ®Õn 6 cña ng−êi. C¸c NST kh¸c gi÷a c¸c loµi nµy còng cã sù t−¬ng ®ång cao. NÕu
NST sè 2 cña ng−êi “®øt” lµm ®«i th× ng−êi còng cã kiÓu nh©n gåm 48 NST nh− c¸c loµi linh tr−ëng kh¸c.
303
§inh §oµn Long
trªn mét NST ë chuét vµ bß. §iÒu nµy ®−a ®Õn gi¶ thiÕt lµ: loµi ®éng vËt cã vó vèn lµ tæ
tiªn chung cña ba loµi nªu trªn cïng cã c¸c gen nµy liªn kÕt víi nhau trªn mét NST; sau
®ã, chóng “ph¸t t¸n” ®Õn c¸c NST kh¸c trong qu¸ tr×nh tiÕn hãa.
10.3.4. So s¸nh c¸c tr×nh tù protein
Sù kiÖn tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt ®Òu sö dông mét m· di truyÒn chung ®Ó
tæng hîp nªn c¸c lo¹i protein lµ b»ng chøng cho thÊy tÊt c¶ mäi d¹ng sèng trªn Tr¸i ®Êt
cã chung mét tæ tiªn. ViÖc so s¸nh c¸c tr×nh tù protein gi÷a c¸c loµi sinh vËt kh¸c nhau
còng bæ sung thªm d÷ liÖu ñng hé gi¶ thiÕt nµy. VÝ dô, c¸c gen m· hãa keratin tæng hîp
protein l«ng cõu cã ®o¹n t−¬ng ®ång n»m trªn NST sè 11 cña ng−êi. Sù gièng nhau vÒ
thµnh phÇn vµ tr×nh tù axit amin trong c¸c lo¹i protein t−¬ng øng ë ng−êi vµ tinh tinh lµ
®¸ng ng¹c nhiªn (kho¶ng 99%). Mét sè protein cña hai loµi gièng nhau hoµn toµn. Trªn
c¬ së ®ã, khi ph©n tÝch chøc n¨ng cña mét gen míi, c¸c nhµ nghiªn cøu cã thÓ tham kh¶o
c¸c d÷ liÖu cã s½n vÒ nh÷ng gen ®· biÕt ë c¸c sinh vËt kh¸c. Hai vÝ dô d−íi ®©y lµ vÒ hai
trong sè nh÷ng lo¹i protein cã tÝnh b¶o thñ nhÊt
10.3.4.1. Cytochrome C B¶ng 10.4. Sù tiÕn hãa trong tr×nh tù axit
amin cña protein cytochrom C
Cã lÏ, cytochrome C lµ mét protein ®−îc
nghiªn cøu kü nhÊt ®Õn nay vÒ khÝa c¹nh tiÕn Loµi Sè axit amin kh¸c biÖt víi
hãa. Protein nµy cã vai trß “b¾t gi÷” n¨ng l−îng cytochrom C cña ng−êi
tõ c¸c chÊt dinh d−ìng trong qu¸ tr×nh h« hÊp tÕ
bµo ë ti thÓ. 20 trong tæng sè 104 axit amin cña Tinh tinh 0
protein nµy cã vÞ trÝ gièng hÖt nhau ë tÊt c¶ c¸c
loµi eukaryote. Hai loµi cµng cã quan hÖ gÇn, th× KhØ Rhesus 1
cã møc ®é gièng nhau vÒ tr×nh tù axit amin trªn
ph©n tö cytochrome C cµng cao. VÝ dô, Thá 9
cytochrome C cña ng−êi kh¸c cña ngùa lµ 12 axit
amin, kh¸c víi cytochrome C cña k¨ng¬ru lµ 8 Bß 10
axit amin, nh−ng gièng hÖt cytochrome C cña
tinh tinh (b¶ng 10.4). Chim bå c©u 12
Õch 20
Ruåi giÊm 24
Lóa m× 37
NÊm men 42
10.3.4.2. C¸c protein homeobox
Mét nhãm gen kh¸c còng thay ®æi rÊt Ýt trong suèt qu¸ tr×nh tiÕn hãa ®−îc gäi lµ
c¸c gen homeobox, gäi t¾t lµ HOX. C¸c gen nµy m· hãa cho c¸c yÕu tè phiªn m· ®iÒu
khiÓn thø tù “bËt” vµ “t¾t” c¸c gen trong qu¸ tr×nh ph¸t triÓn ph«i. Sù phèi hîp gi÷a c¸c
yÕu tè phiªn m· nµy víi c¸c yÕu tè phiªn m· kh¸c quy ®Þnh vÞ trÝ vµ thêi ®iÓm ph¸t sinh
c¸c c¬ quan ë ph«i. C¸c protein homeobox cã mét ®o¹n tr×nh tù b¶o thñ cao gåm 60 axit
amin, gäi lµ miÒn homeo (hay cßn gäi lµ miÒn ®ång h×nh, homeodomain), ®−îc m· hãa bëi
mét ®o¹n tr×nh tù 180 nucleotide trªn ADN (còng ®−îc gäi lµ homeobox). TÊt c¶ c¸c gen
mang ®o¹n tr×nh tù homeobox ®−îc gäi lµ c¸c gen kiÓu homeo. C¸c gen kiÓu homeo
®−îc t×m thÊy ë c¶ ®éng bËc thÊp (cã cÊu t¹o c¬ thÓ ®¬n gi¶n nh− søa) còng nh− ë ®éng
vËt bËc cao (cã cÊu t¹o c¬ thÓ phøc t¹p nh− con ng−êi). ë tÊt c¶ c¸c loµi mµ c¸c gen
HOX ®· ®−îc gi¶i tr×nh tù, c¸c gen nµy ®Òu cã vai trß “bè trÝ cÊu tróc c¬ thÓ”. HÖ gen
ng−êi vµ c¸c loµi ®éng vËt cã x−¬ng sèng cã 39 gen HOX, ®−îc tæ chøc thµnh 4 côm gen,
kÝ hiÖu lµ A, B, C vµ D. C¸c gen nµy ®Òu chøa rÊt Ýt intron. §iÓm ®¸ng l−u ý ë c¸c côm
gen HOX lµ mçi gen chØ ®−îc biÓu hiÖn vµo mét thêi ®iÓm nhÊt ®Þnh vµ theo mét trËt tù
nhÊt ®Þnh ®−îc ®iÒu khiÓn nghiªm ngÆt trong qu¸ tr×nh ph¸t triÓn ph«i. Thø tù biÓu
hiÖn c¸c gen t−¬ng øng ®óng víi thø tù vÞ trÝ cña chóng trªn NST. C¸c thuËt ng÷
304
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
“homeobox” vµ “homeodomain” cã xuÊt xø tõ “homeotic” nghÜa lµ “thuéc phÇn ®ét biÕn”.
Së dÜ nh− vËy, v× nh÷ng gen homeobox ®Çu tiªn ®−îc t×m thÊy liªn quan ®Õn c¸c ®ét
biÕn g©y rèi lo¹n cÊu tróc th©n ë ruåi giÊm. Vai trß trong tiÕn hãa cña mét sè gen
homeobox ®· ®−îc nªu ë môc 10.2.
C¸c ®ét biÕn ë c¸c gen homeobox g©y nªn mét sè bÖnh di truyÒn ë ng−êi. ë mét
d¹ng bÖnh “m¸u tr¾ng”, mét ®ét biÕn gen homeobox lµm cho mét sè tÕ bµo b¹ch cÇu ch−a
thµnh thôc (ch−a chÝn) chuyÓn sang con ®−êng ph¸t triÓn c¬ quan bÊt th−êng. TÕ bµo bÊt
th−êng nµy duy tr× tèc ®é ph©n chia nhanh vèn cã cña tÕ bµo b¹ch cÇu ch−a chÝn dÉn ®Õn
bÖnh ung th−. Mét bÖnh kh¸c còng cã nguyªn nh©n tõ ®ét biÕn gen homeobox ®−îc gäi lµ
Héi chøng §i-Gioãcd¬ (DiGeorge). MÆc dï c¸c c¸ thÓ bÞ bÖnh nµy kh«ng cã kiÓu h×nh
“ch©n mäc tõ ®Çu” nh− ë c«n trïng (xem môc 10.2) nh−ng kiÓu biÓu hiÖn th× t−¬ng tù.
Nh÷ng c¸ thÓ m¾c héi chøng nµy th−êng thiÕu tuyÕn øc vµ tuyÕn cËn gi¸p; c¸c c¬ quan
nh− tai, mòi, miÖng, cæ ... ph¸t triÓn bÊt th−êng. Nh− vËy, vÞ trÝ cña c¸c c¬ quan bÊt
th−êng nµy còng t−¬ng quan víi c¸c ®èt th©n phÝa tr−íc ë c«n trïng.
Mét sè thÝ nghiÖm chuyÓn gen homeobox tõ loµi nµy sang loµi kh¸c cho thÊy vai trß
thiÕt yÕu vµ chøc n¨ng gièng nhau cña c¸c gen homeobox cã nguån gèc tõ c¸c loµi kh¸c
nhau. Khi ruåi giÊm ®−îc chuyÓn gen homeobox tõ chuét, kiÓu h×nh ®ét biÕn xuÊt hiÖn
còng gièng hÖt nh− khi gen homeobox cña chÝnh ruåi giÊm biÓu hiÖn bÊt th−êng. T−¬ng
tù nh− vËy, khi gen homeobox cña ng−êi ®−îc chuyÓn vµo chuét, sù biÓu hiÖn chøc n¨ng
cña nã gièng víi gen “®èi t¸c” cña chuét. Nh− vËy, ho¹t ®éng cña c¸c gen homeobox cã lÏ
lµ c¬ chÕ c¬ b¶n ®iÒu khiÓn qu¸ tr×nh ph¸t triÓn ë mäi sinh vËt ®a bµo.
10.4. §ång hå ph©n tö vµ x©y dùng c©y chñng lo¹i ph¸t sinh
10.4.1. ThuyÕt ®ång hå ph©n tö
10.4.1.1. C¬ së h×nh thµnh thuyÕt ®ång hå ph©n tö
Nh− nªu ë trªn, møc ®é thay thÕ nucleotide t¹i mçi vïng ADN cña hÖ gen còng nh−
sù thay thÕ axit amin trong c¸c ph©n tö protein ®−îc c¸c gen m· hãa lµ kh¸c nhau, vµ
phô thuéc vµo ¸p lùc cña chän läc tù nhiªn lªn mçi locut vµ chøc n¨ng cña c¸c s¶n phÈm
gen. Tuy vËy, ë c¸c locut cã ¸p lùc chän läc t−¬ng ®−¬ng th× tèc ®é thay ®æi trong c¸c
tr×nh tù ADN lµ æn ®Þnh, khi xÐt trong qu·ng thêi gian tiÕn hãa l©u dµi.
Vµo nh÷ng n¨m 1960, Zuckerkandl vµ Linus Pauling lµ nh÷ng ng−êi ®Çu tiªn tiÕn
hµnh so s¸nh tr×nh tù c¸c protein vµ rót ra nhËn xÐt r»ng: tèc ®é thay thÕ c¸c axit amin
trong cïng ph©n tö protein vÒ c¬ b¶n lµ æn ®Þnh qua hµng triÖu n¨m tiÕn hãa. Trªn c¬ së
nhËn ®Þnh nµy, hä ®· vÝ sù tÝch lòy c¸c ®ét biÕn thay thÕ axit amin nh− nhÞp ®Õm cña
®ång hå tiÕn hãa vµ gäi lµ thuyÕt ®ång hå ph©n tö. §ång hå ph©n tö cã thÓ ch¹y víi tèc
®é kh¸c nhau khi xÐt ë c¸c protein kh¸c nhau, nh−ng sù kh¸c nhau gi÷a hai protein
t−¬ng ®ång th× t−¬ng quan chÆt víi kho¶ng thêi gian kÓ tõ khi hai loµi (mang hai lo¹i
protein t−¬ng ®ång) t¸ch li tiÕn hãa tõ tæ tiªn chung (h×nh 10.10). ThuyÕt ®ång hå ph©n
tö ngay lËp tøc ®· thóc ®Èy c¸c nghiªn cøu tiÕn hãa. Tèc ®é thay ®æi æn ®Þnh gi÷a c¸c
tr×nh tù t−¬ng ®ång kh«ng chØ gióp x¸c ®Þnh ®−îc mèi quan hÖ di truyÒn gi÷a c¸c loµi,
mµ cßn gióp −íc tÝnh qu·ng thêi gian mµ chóng ph©n li khái nhau (gièng nh− c¸ch ®ång
vÞ phãng x¹ ®−îc dïng ®Ó x¸c ®Þnh tuæi hãa th¹ch). Dï vËy, trong thùc tÕ thuyÕt ®ång hå
ph©n tö còng nhËn ®−îc nh÷ng ý kiÕn kh«ng ®ång t×nh. Ch¼ng h¹n, c¸c nhµ tiÕn hãa
kinh ®iÓn cho r»ng nhÞp ®iÖu tiÕn hãa thÊt th−êng cña nhiÒu ®Æc ®iÓm h×nh th¸i kh«ng
t−¬ng ®ång víi tèc ®é thay ®æi æn ®Þnh ë møc ph©n tö. Trong mét sè tr−êng hîp, kÕt qu¶
−íc tÝnh thêi gian ph©n li tiÕn hãa dùa trªn c¸c ph−¬ng ph¸p kinh ®iÓn vµ ph©n tö kh«ng
thèng nhÊt víi nhau.
305
§inh §oµn Long
Sè axit amin thay ®æi trong 100 axit amin Sù t¸ch li tæ tiªn
Ph©n li tiÕn hãa cña c¸c thùc vËt vµ ®éng
loµi ®éng vËt cã vó vËt (1,2 tû n¨m)
Chim/ bß s¸t (240 triÖu n¨m)C¸c Hemoglobin
§éng vËt cã vó / bß s¸tfibrinopeptide (5,8 triÖu n¨m)
(300 triÖu n¨m)(1,1 triÖu n¨m)
Bß s¸t / c¸ (400 triÖu n¨m) Cytochrome C
C¸ x−¬ng / c¸ miÖng trßn (20 triÖu n¨m)
(500 triÖu n¨m)
§éng vËt cã x−¬ng sèng /
c«n trïng (600 triÖu n¨m)
TriÖu n¨m tiÕn hãa
H×nh 10.10. Tèc ®é tiÕn hãa kh¸c nhau cña c¸c protein. C¸c protein Fibrinogen chÞu ¸p lùc chän läc tù
nhiªn thÊp h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thay thÕ nucleotide cao, cßn cytochrom C chÞu ¸p lùc chän
läc tù nhiªn cao h¬n vµ cã tÇn sè ®ét biÕn trung tÝnh thÊp. Sè liÖu tÝnh trung b×nh tõ nhiÒu sinh vËt kh¸c nhau.
10.4.1.2. C¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi
PhÇn lín kho¶ng thêi gian tiÕn hãa ph©n li (biÕn sè T trong ph−¬ng tr×nh 10.3)
gi÷a c¸c loµi hoÆc nhãm loµi sinh vËt trong c¸c nghiªn cøu tiÕn hãa ®−îc tÝnh to¸n dùa
trªn c¸c mÉu hãa th¹ch kh«ng hoµn chØnh ®· cã tuæi hµng ngh×n thËm chÝ hµng triÖu
n¨m. Do ®ã, gi¸ trÞ T x¸c ®Þnh ®−îc th−êng chØ lµ gi¸ trÞ t−¬ng ®èi vµ ®«i khi cã sai sè lín.
§Ó gi¶m thiÓu sai sè nµy, Sarich vµ Wilson (1973) ®· ®Ò ra mét c¸ch tÝnh ®¬n gi¶n gäi lµ
c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi. Theo m« h×nh nµy, ®Ó x¸c ®Þnh tèc ®é thay thÕ
nucleotide t−¬ng ®èi ë hai loµi (1) vµ (2) thuéc cïng mét dßng tiÕn hãa, ng−êi ta sö dông
mét loµi thø (3) cã quan hÖ xa h¬n hai loµi (1) vµ (2), ®−îc gäi lµ loµi ngoµi nhãm (h×nh
10.11). Ch¼ng h¹n, nÕu loµi (1) vµ (2) lÇn l−ît lµ ng−êi vµ khØ Gorilla, th× loµi thø (3) cã
thÓ lµ mét loµi linh tr−ëng nµo ®ã, ch¼ng h¹n nh− khØ ®Çu chã - Papio. NÕu thêi ®iÓm
trong qu¸ tr×nh tiÕn hãa mµ loµi (1) vµ (2) t¸ch li khái nhau ®−îc kÝ hiÖu lµ A, th× sè
nucleotide kh¸c biÖt (d) cã thÓ cã gi÷a hai loµi sÏ b»ng tæng sè nucleotide thay ®æi xuÊt
hiÖn ë mçi loµi kÓ tõ thêi ®iÓm A, v× vËy:
d13 = dA1 + dA3 (ph−¬ng tr×nh 10.4)
d23 = dA2 + dA3 (ph−¬ng tr×nh 10.5)
d12 = dA1 + dA2 (ph−¬ng tr×nh 10.6)
trong ®ã, sè nucleotide kh¸c biÖt gi÷a c¸c loµi (1), (2) vµ (3) (tøc lµ d13, d23 vµ d12) cã thÓ
x¸c ®Þnh ®−îc tõ thùc nghiÖm. Khai triÓn c¸c ph−¬ng tr×nh ®¹i sè ®¬n gi¶n trªn, ta sÏ thu
306
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
®−îc sè nucleotide thay ®æi t−¬ng ®èi ë mçi loµi (1) vµ (2) kÓ tõ thêi ®iÓm A (tøc lµ tõ khi
chóng b¾t ®Çu ph©n li tõ tæ tiªn chung) lµ:
dA1 = (d12 + d13 – d23)/2 (ph−¬ng tr×nh 10.7)
dA2 = (d12 + d23 – d13)/2 (ph−¬ng tr×nh 10.8)
Theo thuyÕt ®ång hå ph©n tö, kho¶ng thêi gian tÝnh tõ thêi ®iÓm A cña hai loµi (1)
vµ (2) lµ nh− nhau, nªn dA1 = dA2. Khi d÷ liÖu vÒ tr×nh tù hÖ gen cña c¸c loµi còng nh− sè
l−îng loµi ®−îc gi¶i m· tr×nh tù hÖ gen ngµy cµng t¨ng vµ ®Çy ®ñ th× tiÒn ®Ò cña thuyÕt
®ång hå ph©n tö cho r»ng tèc ®é tiÕn hãa cña mçi gen nhÊt ®Þnh sÏ æn ®Þnh qua thêi gian
ë tÊt c¶ c¸c dßng tiÕn hãa. Thùc nghiÖm thùc tÕ cho thÊy tèc ®é thay thÕ nucleotide trong
c¸c gen ë chuét ®ång vµ chuét nh¾t nh×n chung lµ t−¬ng ®−¬ng nhau. Nh−ng ng−îc l¹i, ë
nhãm loµi linh tr−ëng, ng−êi vµ c¸c loµi v−în ng−êi cã møc ®é thay thÕ nucleotide chØ
b»ng mét nöa so víi c¸c loµi khØ kÓ tõ khi cã sù ph©n li tiÕn hãa tõ tæ tiªn chung. T−¬ng
tù nh− vËy, khi sö dông c¸ch tÝnh tèc ®é tiÕn hãa t−¬ng ®èi dùa trªn so s¸nh c¸c gen
t−¬ng ®ång gi÷a ng−êi vµ chuét ®ång, th× tèc ®é thay
thÕ nucleotide cña c¸c loµi linh tr−ëng d−êng nh− chØ 1 2 3
b»ng mét nöa so víi c¸c loµi gÆm nhÊm kÓ tõ khi cã sù
ph©n li tiÕn hãa cña c¸c ®éng vËt cã vó (c¸ch ®©y tõ 80
®Õn 100 triÖu n¨m). Nh− vËy, cã sù kh¸c nhau vÒ tèc
®é cña ®ång hå ph©n tö ë c¸c nhãm loµi kh¸c nhau. V× A
lý do ®ã, ®é lÖch thùc tÕ tõ tèc ®é tiÕn hãa trung b×nh ë
mçi nhãm ph©n lo¹i (cña c¸c loµi ®ang tån t¹i) lµ mét
khã kh¨n ®Ó cã thÓ x¸c ®Þnh chÝnh x¸c thêi ®iÓm xuÊt
hiÖn vµ qu·ng thêi gian tån t¹i cña c¸c loµi tæ tiªn, tõ
®ã tiÕn hãa ph©n li thµnh c¸c loµi sinh vËt ngµy nay.
§Ó cã thÓ tÝnh to¸n ®−îc ®óng, cÇn x¸c ®Þnh c¸c loµi H×nh 10.11. X©y dùng c©y tiÕn hãa
®−îc ®em so s¸nh vµ ®èi chiÕu víi nhau cã dïng dïng loµi ®èi chøng ngoµi nhãm. Loµi
3 lµ loµi ®èi chøng ngoµi nhãm (tiÕn hãa
“chung” mét ®ång hå ph©n tö (nh− c¸c loµi chuét nªu ®éc lËp tr−íc khi cã sù ph©n li cña hai loµi 1
trªn) hay kh«ng? vµ 2). A lµ tæ tiªn chung cña hai loµi 1 vµ 2.
10.4.1.3. T¹i sao tèc ®é tiÕn hãa l¹i kh¸c nhau gi÷a c¸c nhãm loµi?
Cã mét sè nguyªn nh©n cã thÓ gióp gi¶i thÝch hiÖn t−îng nµy. Ch¼ng h¹n, yÕu tè
vßng ®êi vµ chu tr×nh sinh s¶n ng¾n cña c¸c loµi khØ vµ chuét so víi ng−êi cã thÓ lµ
nguyªn nh©n lµm tèc ®é tiÕn hãa t−¬ng ®èi cña chóng nhanh h¬n. Trong mçi thÕ hÖ, cã
thÓ sè lÇn sao chÐp ADN cña c¸c dßng tÕ bµo ph¸t sinh giao tö (vèn kh¸c biÖt lín gi÷a c¸c
nhãm loµi) míi thùc sù cã t−¬ng quan chÆt víi tÇn sè thay thÕ nucleotide cña c¸c gen,
chø kh«ng ph¶i lµ kho¶ng thêi gian tiÕn hãa ph©n li. Mét nguyªn nh©n kh¸c lµ: kÓ tõ khi
tiÕn hãa ph©n li, c¸c nhãm loµi (thËm chÝ c¸c loµi trong cïng nhãm) ngµy cµng cã nhiÒu
kh¸c biÖt trong c¸c c¬ chÕ di truyÒn vµ sinh s¶n, bao gåm hiÖu qu¶ cña c¸c c¬ chÕ söa
ch÷a ADN, tèc ®é vµ qui m« sinh s¶n, møc ph¬i nhiÔm víi c¸c t¸c nh©n ®ét biÕn vµ kh¶
n¨ng thÝch nghi víi c¸c æ sinh th¸i trong m«i tr−êng sèng cña chóng, v.v...
10.4.2. X©y dùng c©y tiÕn hãa dùa trªn c¸c dÊu hiÖu ph©n tö
10.4.2.1. C¸c dÊu hiÖu ®−îc dïng ®Ó x©y dùng c©y ph¸t sinh chñng lo¹i
Trªn c¬ së thuyÕt ®ång hå ph©n tö, mèi quan hÖ di truyÒn gi÷a tÊt c¶ c¸c d¹ng sèng
®Òu cã thÓ ®−îc x¸c ®Þnh dùa trªn viÖc so s¸nh c¸c dÊu hiÖu ph©n tö gi÷a chóng víi
nhau. Theo ®ã, c¸c loµi cµng cã nhiÒu dÊu hiÖu gièng nhau, cµng cã quan hÖ gÇn.
307
§inh §oµn Long
Tr−íc ®©y, khi ch−a cã c¸c c«ng cô sinh häc ph©n tö, mèi quan hÖ di truyÒn gi÷a
c¸c loµi ®−îc x¸c ®Þnh chñ yÕu dùa trªn viÖc so s¸nh c¸c dÊu hiÖu h×nh th¸i. NÒn t¶ng
cña viÖc sö dông c¸c dÊu hiÖu h×nh th¸i lµ quan ®iÓm cho r»ng: nÕu c¸c dÊu hiÖu h×nh
th¸i gièng nhau th× c¸c gen chi phèi c¸c ®Æc ®iÓm h×nh th¸i ®ã còng gièng nhau, vµ ng−îc
l¹i. Bªn c¹nh c¸c dÊu hiÖu h×nh th¸i, mét sè dÊu hiÖu kh¸c, bao gåm tËp tÝnh, cÊu tróc tÕ
bµo, hãa sinh … còng ®−îc kÕt hîp sö dông trong c¸c nghiªn cøu tiÕn hãa. ViÖc sö dông
c¸c dÊu hiÖu nµy cã hiÖu qu¶ khi nghiªn cøu tiÕn hãa ë nhiÒu nhãm ®éng vËt vµ thùc vËt
bËc cao; vµ hiÖn nay vÉn lµ mét ph−¬ng ph¸p nghiªn cøu tiÕn hãa c¬ b¶n.
Tuy vËy, viÖc sö dông ®¬n thuÇn c¸c dÊu hiÖu h×nh th¸i béc lé mét sè h¹n chÕ. Cô
thÓ, kiÓu h×nh gièng nhau cã thÓ thÊy ë nh÷ng loµi rÊt xa nhau do hiÖn t−îng tiÕn hãa
®ång qui. Ch¼ng h¹n nh−, c¸c loµi chim, d¬i vµ c«n trïng cã thÓ ®−îc xÕp vµo cïng mét
nhãm, bëi v× chóng ®Òu “cã c¸nh”. Nh−ng thùc tÕ ®©y lµ nh÷ng loµi cã quan hÖ rÊt xa
nhau. VÝ dô nµy kh«ng chØ cho thÊy viÖc sö dông dÊu hiÖu h×nh th¸i ®¬n thuÇn cã thÓ x¸c
®Þnh nhÇm mèi quan hÖ di truyÒn gi÷a mét sè loµi, mµ ®ång thêi cho thÊy, mét sè kiÓu
h×nh gièng nhau kh«ng nhÊt thiÕt ph¶i cã kiÓu gen gièng nhau. Ngoµi ra, ë mét sè ®èi
t−îng sinh vËt, ®Æc ®iÓm kiÓu h×nh cña chóng rÊt khã quan s¸t vµ so s¸nh. VÝ dô ®iÓn
h×nh vÒ ®iÒu nµy lµ c¸c vi sinh vËt (nh− vi khuÈn vµ virut) cã c¸c ®Æc ®iÓm h×nh th¸i khã
quan s¸t, hay viÖc so s¸nh gi÷a c¸c loµi ®éng vËt cã vó vµ vi khuÈn hÇu nh− kh«ng t×m
thÊy ®Æc ®iÓm h×nh th¸i nµo lµ gièng nhau. Trong nh÷ng tr−êng hîp nµy, c¸c dÊu hiÖu
ph©n tö (chñ yÕu lµ ADN) cã thÓ gióp kh¾c phôc c¸c khã kh¨n nªu trªn. Dï vËy, kh«ng
cã nghÜa lµ c¸c dÊu hiÖn ph©n tö cã thÓ thay thÕ hoµn toµn c¸c dÊu hiÖu h×nh th¸i, tËp
tÝnh hay hãa sinh trong c¸c nghiªn cøu tiÕn hãa.
ViÖc sö dông c¸c dÊu hiÖu ph©n tö cho thÊy, tèc ®é tiÕn hãa cã kh¸c nhau ë c¸c
dßng tiÕn hãa kh¸c nhau. Do vËy, viÖc x¸c ®Þnh thêi ®iÓm ph©n li tiÕn hãa cña nhiÒu
nhãm sinh vËt cÇn kÕt hîp sö dông c¸c dÊu hiÖu ph©n tö víi c¸c lo¹i dÊu hiÖu kh¸c.
Trong thùc tÕ, c¸c dÊu hiÖu ADN gióp x©y dùng c©y ph¸t sinh chñng lo¹i hiÖu qu¶ vµ
chÝnh x¸c nhÊt khi chóng ®−îc sö dông trong ph¹m vi c¸c nhãm loµi ®· ®−îc ph©n lo¹i s¬
bé b»ng c¸c dÊu hiÖu h×nh th¸i vµ hãa sinh. Trong mét sè tr−êng hîp, khi c¸c dÊu hiÖu
h×nh th¸i vµ ph©n tö kh«ng ®−a ra kÕt luËn thèng nhÊt, th× chÝnh lµ c¬ héi ®Ó x¸c ®Þnh
møc ®é t¸c ®éng cña chän läc tù nhiªn ®Õn c¸c kiÓu h×nh th¸i kh¸c nhau nh− thÕ nµo.
10.4.2.2. C¸c lo¹i c©y ph¸t sinh chñng lo¹i
Tr−íc khi cã c¸c c«ng cô sinh häc ph©n tö, ®· cã nhiÒu ph−¬ng ph¸p kh¸c ®−îc thiÕt
lËp nh»m x¸c ®Þnh mèi quan hÖ di truyÒn gi÷a c¸c loµi. Mét trong nh÷ng ph−¬ng ph¸p c¬
b¶n nhÊt lµ x©y dùng s¬ ®å h×nh c©y ®Ó m« t¶ mèi quan hÖ gi÷a c¸c loµi, gäi lµ c©y ph¸t
sinh chñng lo¹i hay c©y tiÕn hãa. C¸c b»ng chøng sinh häc ®Õn nay ®Òu cho r»ng: mäi
d¹ng sèng trªn Tr¸i ®Êt, kÓ c¶ ®ang tån t¹i hay ®· tuyÖt chñng, ®Òu cã mét tæ tiªn chung
duy nhÊt cã mÆt trªn Tr¸i ®Êt c¸ch ®©y kho¶ng 4 tØ n¨m. Mçi c©y ph¸t sinh chñng lo¹i
th−êng chØ lµ mét phÇn cña c©y tiÕn hãa xuÊt ph¸t tõ tæ tiªn chung ®ã. Nãi c¸ch kh¸c, nã
th−êng chØ gåm mét hay mét sè nh¸nh tiÕn hãa. Mçi cµnh tËn cïng cña mét c©y tiÕn hãa
th−êng gåm mét hoÆc mét sè taxon (®¬n vÞ ph©n lo¹i). §iÓm ph©n nh¸nh n»m ë gi÷a c©y
tiÕn hãa ®¹i diÖn cho tæ tiªn chung tr−íc khi cã sù ph©n li tiÕn hãa thµnh c¸c nhãm loµi
riªng biÖt. ChiÒu dµi cña mçi cµnh ph¶n ¸nh møc ®é kh¸c biÖt gi÷a c¸c taxon. C©y tiÕn
hãa nµo cã ®iÓm x¸c ®Þnh tæ tiªn chung cña c¸c nh¸nh cßn l¹i (phÇn ngän) trong c©y tiÕn
hãa th× ®−îc gäi lµ c©y tiÕn hãa cã gèc. Ng−îc l¹i, c©y tiÕn hãa kh«ng gèc chØ ph¶n
¸nh mèi quan hÖ vµ sù kh¸c biÖt gi÷a c¸c taxon (t−¬ng øng víi c¸c cµnh) mµ kh«ng ph¶n
¸nh sù tiÕn hãa tõ gèc nh− thÕ nµo. ViÖc x©y dùng c©y tiÕn hãa cã gèc hay kh«ng gèc ®Òu
cÇn ®Õn c¸c mÉu taxon ®èi chøng ngoµi nhãm. Ch¼ng h¹n, khi nghiªn cøu mèi quan hÖ di
308
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
truyÒn gi÷a ng−êi vµ khØ Gorilla, ng−êi ta cã thÓ dïng loµi khØ Papio lµm loµi ®èi chøng
ngoµi nhãm.
VÒ sè l−îng c©y ph¸t sinh chñng lo¹i. Sè l−îng c©y tiÕn hãa t¨ng lªn cïng sè
l−îng taxon ®−îc ®em so s¸nh (b¶ng 10.5). Cô thÓ, khi nghiªn cøu ®ång thêi n taxon, th×
sè c©y tiÕn hãa cã gèc (NR) vµ kh«ng gèc (NU) t−¬ng øng cã thÓ cã lµ:
NR = (2n – 3)!/[2n-2(n-2)!] (ph−¬ng tr×nh 10.9)
Nu = (2n – 5)!/[2n-3(n-3)!] (ph−¬ng tr×nh 10.10)
Trong ®ã, ph−¬ng tr×nh 10.9 ®−îc ¸p dông víi n ≥ 2, cßn ph−¬ng tr×nh 10.10
®−îc ¸p dông víi n ≥ 3. Tuy nhiªn, trong thùc tÕ, c©y tiÕn hãa th−êng ®−îc vÏ ®Ó ph¶n
¸nh mèi quan hÖ gi÷a mét sè l−îng lín c¸c mÉu kh¸c nhau, bao gåm tõ hµng chôc ®Õn
hµng tr¨m c¸ thÓ hoÆc taxon. ThÕ nªn sè c©y tiÕn hãa cã thÓ cã thùc tÕ lµ rÊt lín.
B¶ng 10.5. Sè l−îng c©y tiÕn hãa cã gèc vµ kh«ng
gèc cã thÓ cã t¨ng lªn cïng víi sè l−îng taxon
Sè taxon Sè c©y tiÕn hãa Sè c©y tiÕn hãa C¸c alen chung
cã gèc kh«ng gèc
2 H×nh 10.12. HiÖn t−îng giao thoa gi÷a c¸c loµi
3 1 1 cã thÓ x¶y ra nÕu loµi tæ tiªn mang locut ®a
4 3 1 h×nh gåm hai hay nhiÒu alen, vµ c¸c alen nµy
5 15 3 ®Òu ®−îc duy tr× ë c¸c loµi míi sau khi t¸ch li.
10 105 15
20 34.459.425 2.027.025
8,20 x 1021 2,22 x 1020
30
4,95 x 1038 8,69 x 1036
VÒ c©y tiÕn hãa gen vµ c©y tiÕn hãa loµi. Mét c©y ph¸t sinh chñng lo¹i ®−îc x©y
dùng trªn c¬ së so s¸nh tr×nh tù mét nhãm gen t−¬ng ®ång gi÷a c¸c loµi hoÆc c¸ thÓ kh¸c
nhau ®−îc gäi lµ c©y tiÕn hãa gen. Lo¹i c©y tiÕn hãa nµy cã thÓ ph¶n ¸nh lÞch sö tiÕn
hãa cña mét gen, nh−ng kh«ng nhÊt thiÕt t−¬ng quan víi sù ph¸t sinh cña c¸c loµi t−¬ng
øng. Ng−îc l¹i, c¸c c©y tiÕn hãa loµi th−êng thu ®−îc tõ viÖc kÕt hîp ph©n tÝch nhiÒu
gen kh¸c nhau vµ ph¶n ¸nh sù ph¸t sinh cña c¸c loµi. Nghe qua, d−êng nh− c©y tiÕn hãa
gen vµ c©y tiÕn hãa loµi “kh«ng t−¬ng ®ång” víi nhau. Nh−ng ®iÒu nµy lµ hîp logic, bëi
sù “ph©n li” cña c¸c gen th−êng xuÊt hiÖn tr−íc sù “c¸ch li” cña c¸c quÇn thÓ dÉn ®Õn sù
“ph©n li tiÕn hãa” h×nh thµnh c¸c loµi míi. H×nh 10.12 minh häa sù ph©n li cña mét
locut. Khi ph©n tÝch locut nµy, mét sè c¸ thÓ cña loµi 1 vµ loµi 2 cßn gièng nhau h¬n khi
so s¸nh chóng víi mét sè c¸ thÓ kh¸c cïng loµi. Ch¼ng h¹n nh− locut MHC (xem ch−¬ng
9) vèn cã tÝnh ®a h×nh rÊt cao. NÕu sö dông c¸c alen cña locut nµy ®Ó vÏ c©y tiÕn hãa loµi,
th× mét sè c¸ thÓ cña ng−êi vµ khØ Gorilla cã thÓ ®−îc xÕp chung cïng mét nhãm do kiÓu
alen cña c¸c c¸ thÓ nµy rÊt gièng nhau.
Tõ c¸c ph−¬ng tr×nh 10.9 vµ 10.10, cã thÓ thÊy vÒ lý thuyÕt sè c©y tiÕn hãa cã thÓ
cã gi÷a c¸c taxon lµ rÊt lín, nh−ng thùc tÕ bao giê còng chØ cã mét c©y ph¶n ¸nh ®óng
mèi quan hÖ gi÷a c¸c taxon. §Ó x¸c ®Þnh ®−îc c©y tiÕn hãa nµy, c¸c d÷ liÖu ph©n tö
th−êng ®−îc ph©n tÝch b»ng c¸c thuËt to¸n x¸c suÊt. C©y tiÕn hãa thu ®−îc tõ viÖc ph©n
tÝch c¸c d÷ liÖu nh− vËy ®−îc gäi lµ c¸c c©y tiÕn hãa néi suy. Th−êng th× viÖc xö lý c¸c d÷
liÖu kh¸ phøc t¹p (do l−îng d÷ liÖu lín) vµ cÇn sù hç trî cña c¸c hÖ thèng m¸y tÝnh vµ
309
§inh §oµn Long
c¸c phÇn mÒm tin sinh häc. Cã 3 d¹ng thuËt to¸n phæ biÕn h¬n c¶ ®−îc dïng trong c¸c
phÇn mÒm m¸y tÝnh nh»m x©y dùng c¸c c©y tiÕn hãa, gåm ma trËn kho¶ng c¸ch
(distance matrix), tÝch ph©n tiÕn hãa (parsimony-based) vµ hîp lý tèi ®a (maximum
likelihood).
10.4.2.3. C¸c ph−¬ng ph¸p x©y dùng c©y ph¸t sinh chñng lo¹i
a) Ph−¬ng ph¸p "Ma trËn kho¶ng c¸ch"
“Ma trËn kho¶ng c¸ch” lµ nhãm c¸c thuËt to¸n ®¬n gi¶n nhÊt, ®−îc sö dông tõ l©u
trong c¸c nghiªn cøu tiÕn hãa. §−îc b¾t ®Çu sö dông tõ nh÷ng n¨m 1960, c¸c thuËt to¸n
nµy ®−îc dïng ®Ó x¸c ®Þnh mèi quan hÖ gi÷a c¸c loµi dùa trªn c¸c dÊu hiÖu h×nh th¸i.
Trong sè ®ã, thuËt to¸n UPGMA (unweighted pair group with arthmetic mean) ph©n tÝch
tÊt c¶ c¸c dÊu hiÖu, qua ®ã x¸c ®Þnh kho¶ng c¸ch di truyÒn gi÷a tÊt c¶ c¸c cÆp mÉu; råi
gép nhãm tõng cÆp mÉu cã kho¶ng c¸ch di truyÒn thÊp nhÊt. §Ó minh häa cho viÖc ¸p
dông thuËt to¸n UPGMA, gi¶ sö chóng ta ph©n tÝch 4 taxon kÝ hiÖu lµ A, B, C vµ D, biÕt
r»ng kho¶ng c¸ch gi÷a tõng cÆp taxon ®−îc x¸c ®Þnh nh− sau:
Taxon A B C
B dAB - -
C dAC dBC -
D dAD dBD dCD
Trong ma trËn nµy, dAB lµ kho¶ng c¸ch di truyÒn ®−îc x¸c ®Þnh b»ng so s¸nh trùc
tiÕp c¸c dÊu hiÖu gi÷a taxon A vµ B (cã thÓ tÝnh theo c«ng thøc Jukes-Carton), cßn dAC
ph¶n ¸nh kho¶ng c¸ch gi÷a taxon A vµ C, v.v… ThuËt to¸n UPGMA ®Çu tiªn sÏ gép
nhãm 2 taxon cã kho¶ng c¸ch nhá nhÊt thµnh mét nhãm (taxon phøc hîp) míi. Gi¶ sö
gi¸ trÞ dAB lµ nhá nhÊt, th× taxon phøc hîp ®Çu tiªn sÏ lµ (AB). Sau lÇn gép nhãm ®Çu
tiªn nµy, kho¶ng c¸ch gi÷a c¸c taxon sÏ ®−îc tÝnh l¹i gi÷a taxon phøc hîp (AB) víi c¸c
taxon cßn l¹i (C vµ D), theo c«ng thøc: d(AB)C = 1/2 (dAC + dBC) vµ d(AB)D = 1/2(dAD + dBD).
C¸c taxon cã kho¶ng c¸ch nhá nhÊt l¹i tiÕp tôc ®−îc gép nhãm thµnh mét taxon phøc hîp
thø hai. Ch¼ng h¹n ë ®©y d(AB)C < d(AB)D th× phøc hîp tiÕp theo sÏ lµ (ABC), tøc lµ C cã
kho¶ng c¸ch di truyÒn gÇn A vµ B h¬n D. Qu¸ tr×nh gép nhãm nh− vËy cø tiÕp tôc cho
®Õn khi tÊt c¶ c¸c taxon ®Òu ®−îc ph©n nhãm hÕt. Trong c©y tiÕn hãa ®−îc x©y dùng theo
ph−¬ng thøc UPGMA, nÕu chiÒu dµi mçi cµnh ph¶n ¸nh kho¶ng c¸ch gi÷a c¸c taxon, th×
®iÓm xuÊt ph¸t cña mçi cµnh lu«n ë trung ®iÓm kho¶ng c¸ch gi÷a chóng (vÝ dô: dAB/2 cho
cÆp taxon A vµ B). ¦u ®iÓm cña thuËt to¸n UPGMA lµ phÐp ph©n tÝch nhanh vµ ®¬n
gi¶n. Nh−ng nh−îc ®iÓm cña UPGMA lµ nã coi tèc ®é tiÕn hãa lµ gièng nhau ë mäi nh¸nh
tiÕn hãa (®iÒu nµy kh«ng ph¶i lóc nµo còng ®óng). §iÒu nµy cã nghÜa lµ, UPGMA sÏ phï
hîp nhÊt khi x©y dùng c©y tiÕn hãa ë c¸c nh¸nh cã tèc ®é tiÕn hãa t−¬ng ®èi æn ®Þnh.
Trong c¸c thuËt to¸n “ma trËn kho¶ng c¸ch”, ngoµi UPGMA, cßn cã mét sè thuËt to¸n
kh¸c, nh− “kho¶ng c¸ch khai triÓn” (transformed distance) hay “kÕt nèi l©n cËn”
(neighbor-joining, NJ). Nh÷ng thuËt to¸n nµy cho phÐp kÕt hîp tèc ®é tiÕn hãa kh¸c
nhau ë c¸c nh¸nh tiÕn hãa vµo cïng c©y tiÕn hãa.
Nh×n chung, c¸c thuËt to¸n dùa trªn “ma trËn kho¶ng c¸ch” cho kÕt qu¶ ph©n tÝch
nhanh, phï hîp ®Ó xö lý mét l−îng d÷ liÖu lín; cho biÕt kho¶ng c¸ch di truyÒn t−¬ng ®èi
gi÷a c¸c loµi, nh−ng kh«ng ph¶n ¸nh ®−îc sù tiÕn hãa ë mçi gen. §«i khi, do sù “gi¶n
310
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
l−îc hãa” qu¸ møc c¸c d÷ liÖu nªn kÕt qu¶ ph©n tÝch kh«ng thèng nhÊt khi dïng c¸c
thuËt to¸n kh¸c nhau (ch¼ng h¹n, khi dïng UPGMA vµ NJ). Th−êng th× NJ ®−îc coi lµ
cho kÕt qu¶ chi tiÕt h¬n UPGMA.
b) Ph−¬ng ph¸p "TÝch ph©n tiÕn hãa" (tiÕt kiÖm tèi ®a)
NÕu nh− c¸c thuËt to¸n “ma trËn kho¶ng c¸ch” ®¬n thuÇn lµ c¸c thuËt to¸n x¸c
suÊt th× “tÝch ph©n tiÕn hãa” dùa trªn nguyªn t¾c sinh häc lµ “®ét biÕn hiÕm khi x¶y ra”.
ThuËt to¸n nµy cho r»ng: c©y tiÕn hãa phï hîp nhÊt lµ c©y cã sè ®ét biÕn thÊp nhÊt trong
tÊt c¶ nh÷ng c©y tiÕn hãa cã thÓ cã gi÷a c¸c taxon ®−îc ph©n tÝch. Do vËy, c©y tiÕn hãa
thu ®−îc tõ “tÝch ph©n tiÕn hãa” ®−îc gäi lµ c©y tÝch ph©n tiÕn hãa tèi −u.
§Ó minh häa ph−¬ng ph¸p “tÝch ph©n tiÕn hãa”, h·y xem vÝ dô vÒ 4 tr×nh tù sau ®©y:
VÞ trÝ
1 2 3 4 5(*) 6(*)
Tr×nh tù G C G A T G
GTGTTG
GT TGC A
GTCCCA
Khi so s¸nh gi÷a c¸c tr×nh tù nµy, chØ hai vÞ trÝ 5 vµ 6 (®¸nh dÊu *) ®−îc xem lµ “cã
t¸c dông th«ng tin”. H×nh 10.13 (trang sau) cho thÊy: cã thÓ cã 3 lo¹i c©y tiÕn hãa kh«ng
gèc ph¶n ¸nh mèi quan hÖ gi÷a 4 taxon. C¸c c©y tiÕn hãa kh«ng gèc gép nhãm tr×nh tù 1
víi 2, t¸ch biÖt víi nhãm tr×nh tù 3 víi 4, vµ chØ ®ßi hái mét ®ét biÕn duy nhÊt ®Ó nèi gi÷a
hai nhãm. Khi ph©n tÝch tõng vÞ trÝ, chóng ta sÏ thÊy: vÞ trÝ sè 1 “kh«ng cã t¸c dông
th«ng tin” bëi v× ®ét biÕn kh«ng x¶y ra ë vÞ trÝ nµy, nªn kh«ng ph©n biÖt ®−îc c¸c taxon.
VÞ trÝ sè 2 còng vËy, bëi c¶ ba c©y tiÕn hãa ®Òu chØ cÇn 1 ®ét biÕn. Cßn c¸c c©y tiÕn hãa
dùa trªn vÞ trÝ sè 3 ®Òu cÇn 2 ®ét biÕn ; trong khi c¸c c©y tiÕn hãa dùa trªn vÞ trÝ sè 4 ®Òu
cÇn 3 ®ét biÕn. V× kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo cã kh¶ n¨ng x¶y ra h¬n, nªn c¸c
vÞ trÝ 1, 2, 3 vµ 4 ®−îc xem lµ “kh«ng cã t¸c dông th«ng tin”.
ThuËt to¸n “tÝch ph©n tiÕn hãa” ®Çu tiªn x¸c ®Þnh tÊt c¶ c¸c vÞ trÝ cã t¸c dông th«ng
tin b»ng c¸ch so s¸nh tÊt c¶ c¸c tr×nh tù t¹i mçi vÞ trÝ, råi x¸c ®Þnh c©y tiÕn hãa nµo cÇn
Ýt ®ét biÕn nhÊt t¹i mçi vÞ trÝ. C©y tiÕn hãa nµo cÇn Ýt ®ét biÕn nhÊt khi xÐt ë tÊt c¶ c¸c vÞ
trÝ ®−îc gäi lµ c©y tiÕn hãa "pháng ®o¸n". Ngoµi viÖc x©y dùng ®−îc c©y tiÕn hãa, thuËt
to¸n “tÝch ph©n cùc ®¹i” cßn cung cÊp mét th«ng tin h÷u Ých kh¸c. §ã lµ, nã cã thÓ pháng
®o¸n tr×nh tù tæ tiªn ë mçi nh¸nh cña c©y tiÕn hãa, bao gåm c¶ c¸c tr×nh tù ë c¸c loµi ®·
tuyÖt chñng. §©y lµ mét −u ®iÓm cña phÐp “tÝch ph©n tiÕn hãa”. Trong vÝ dô nªu trªn,
phÐp “tÝch ph©n tiÕn hãa” ®· gi¶ thiÕt mçi nucleotide ®Òu cã kh¶ n¨ng ®ét biÕn thay thÕ
thµnh mét trong ba lo¹i nucleotide kh¸c víi "tÇn suÊt" nh− nhau. Trong thùc tÕ, mét sè
phÐp “tÝch ph©n tiÕn hãa” phøc t¹p h¬n ®· ®−îc söa ®æi ®Ó ph¶n ¸nh sù kh¸c nhau gi÷a
tÇn sè ®ét biÕn ®ång ho¸n vµ dÞ ho¸n. Tuy vËy, phÐp “tÝch ph©n tiÕn hãa” ®«i khi ch−a
ph¶n ¸nh thËt chÝnh x¸c vÒ thêi gian x¶y ra sù t¸ch li tiÕn hãa gi÷a c¸c loµi v× tèc ®é thay
thÕ nucleotide gi÷a c¸c nh¸nh tiÕn hãa cã thÓ kh¸c nhau.
c) Ph−¬ng ph¸p "Hîp lý tèi ®a"
Ph−¬ng ph¸p “hîp lý tèi ®a” lµ mét ph−¬ng ph¸p x¸c suÊt thuÇn tóy, th−êng ®−îc
sö dông ®Ó kiÓm chøng l¹i c¸c c©y tiÕn hãa ®−îc x©y dùng bëi c¸c ph−¬ng ph¸p kh¸c.
311
§inh §oµn Long
Ph−¬ng ph¸p nµy ®¸nh C©y 1 C©y 2 C©y 3
gi¸ mét gi¶ thiÕt tiÕn
hãa b»ng viÖc x©y dùng G g g GG g g GG g gG
tÊt c¶ c¸c c©y tiÕn hãa VÞ trÝ 1 GG GG G
cã thÓ cã trªn c¬ së gi¶
G
thiÕt ®ã, råi x¸c ®Þnh C t t TT t t CT t tT
c©y tiÕn hãa néi suy lµ VÞ trÝ 2 TT TC T
c©y cã x¸c suÊt x¶y ra
cao nhÊt qua viÖc ph©n T
tÝch c¸c yÕu tè tiÕn hãa.
Ch¼ng h¹n, vÒ ®¹i thÓ G g g TT g g GG g gC
tÇn sè c¸c ®ét biÕn ®ång CG CT G
VÞ trÝ 3
G
ho¸n cao h¬n kho¶ng 3 A g g TT g g AA g gG
lÇn so víi c¸c ®ét biÕn dÞ VÞ trÝ 4
ho¸n. Trong mét nhãm G C G CT C
cã 3 tr×nh tù kh¸c nhau VÞ trÝ 5 T t t TC t t TT t cC
ë mét vÞ trÝ nucleotide C CT CT C
mang c¸c baz¬ t−¬ng
øng lµ C, T vµ A. Tr×nh G g g GA g g AG g a A
tù mang c¸c baz¬ C vµ T VÞ trÝ 6
®−îc xem lµ cã quan hÖ
di truyÒn gÇn nhau h¬n A A G GG A
so víi tr×nh tù mang
baz¬ A. Ph−¬ng ph¸p H×nh 10.13. Gi÷a 4 taxon, t¹i mçi vÞ trÝ (nucleotide), cã thÓ cã 3 c©y tiÕn
“hîp lý tèi ®a” th−êng hãa kh«ng gèc kh¸c nhau. C¸c nucleotide viÕt b»ng ch÷ in hoa lµ c¸c
®−îc xem lµ ph−¬ng nucleotide ®−îc t×m thÊy ë mçi taxon t−¬ng øng víi tõng vÞ trÝ. C¸c nucleotide
ph¸p cung cÊp th«ng tin viÕt b»ng ch÷ th−êng biÓu diÔn lo¹i nucleotide cã ë tæ tiªn "pháng ®o¸n".
chÝnh x¸c vµ chi tiÕt h¬n §−êng liÒn nÐt cã vßng trßn biÓu diÔn lo¹i ®ét biÕn thay thÕ nucleotide cÇn x¶y
c¶ so víi c¸c ph−¬ng ra ®Ó thu ®−îc sù ®a h×nh tr×nh tù ADN thùc tÕ. C¶ 3 c©y tiÕn hãa cã thÓ cã ë
ph¸p kh¸c. Nh−ng thùc vÞ trÝ 1 ®Òu kh«ng cÇn ®ét biÕn nµo; trong khi ë vÞ trÝ 2 ®Òu cÇn mét ®ét biÕn, ë
tÕ, tèc ®é xö lý th«ng tin vÞ trÝ 3 ®Òu cÇn 2 ®ét biÕn vµ vÞ trÝ 4 ®Òu cÇn 3 ®ét biÕn. V× vËy, tõ sù thay thÕ
theo ph−¬ng ph¸p nµy nucleotide ë c¸c vÞ trÝ 1, 2, 3 vµ 4 kh«ng x¸c ®Þnh ®−îc c©y tiÕn hãa nµo "dÔ"
rÊt chËm vµ kh«ng “kh¶ x¶y ra h¬n. Trong ph−¬ng ph¸p tÝch ph©n tiÕn hãa, c¸c vÞ trÝ nµy ®−îc coi lµ
"kh«ng cã t¸c dông th«ng tin". Ng−îc l¹i, c¸c vÞ trÝ 5 vµ 6 cho thÊy mét c©y tiÕn
hãa cÇn Ýt ®ét biÕn h¬n so víi nh÷ng c©y kh¸c; nªn nh÷ng vÞ trÝ nµy ®−îc xem
lµ "cã t¸c dông th«ng tin". C©y tiÕn hãa "pháng ®o¸n" lµ c©y cÇn sè ®ét biÕn Ýt
thi” khi ph©n tÝch mét nhÊt trong tÊt c¶ c¸c c©y tiÕn hãa cã thÓ cã khi xÐt ë tÊt c¶ c¸c vÞ trÝ.
sè l−îng d÷ liÖu lín, kÓ
c¶ khi sö dông c¸c hÖ thèng m¸y tÝnh m¹nh nhÊt hiÖn nay (vÝ dô: tõ b¶ng 10.5 ta thÊy,
nÕu sè taxon ≥ 30, th× sè c©y tiÕn hãa cã thÓ cã ≥ 5x1038). Tuy vËy, víi tèc ®é ph¸t triÓn
nhanh chãng cña lÜnh vùc tin sinh häc vµ c¸c “c¶i tiÕn” trong øng dông c¸c thuËt to¸n,
ph−¬ng ph¸p “hîp lý tèi ®a” cã tiÒm n¨ng øng dông ngµy cµng réng r·i. Tuy vËy, hiÖn
nay nh×n chung ch−a cã m« h×nh nµo −u thÕ h¬n h¼n c¸c m« h×nh kh¸c. Nh− mét qui −íc
chung, nÕu mét tËp hîp sè liÖu nhÊt ®Þnh khi ®−îc ph©n tÝch bëi hay ba thuËt to¸n (m«
h×nh) kh¸c nhau cïng ®−a ®Õn mét kiÓu h×nh c©y tiÕn hãa, th× c©y tiÕn hãa ®ã cã thÓ tin
cËy ®−îc. Trong nh÷ng tr−êng hîp kh¸c, c¸c m« h×nh cã thÓ dÉn ®Õn c¸c kÕt luËn kh¸c
nhau. V× vËy, víi tõng ®èi t−îng cô thÓ, cÇn c©n nh¾c lùa chän m« h×nh phï hîp vµ cÇn
m« t¶ m« h×nh ®−îc sö dông trong c¸c b¸o c¸o khoa häc.
312
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
10.5. TiÕn hãa hÖ gen vµ nguån gèc loµi ng−êi
10.5.1. HÖ gen ng−êi chøa mét sè gen Ýt ®Õn ng¹c nhiªn
Nh÷ng n¨m cuèi cña thÓ kû XX ®¸nh dÊu mét b−íc ngoÆt quan träng trong c¸c
nghiªn cøu tiÕn hãa häc vµ ph©n tÝch chøc n¨ng hÖ gen ë ng−êi hiÖn ®¹i (Homo sapiens,
gäi t¾t lµ ng−êi). §ã lµ viÖc hÖ gen ng−êi ®−îc gi¶i tr×nh tù hoµn chØnh nhê thµnh qu¶ cña
Dù ¸n hÖ gen ng−êi (HGP) ®−îc triÓn khai tõ n¨m 1990 tíi n¨m 2006. C¸c môc tiªu cña
dù ¸n HGP bao gåm: 1) x¸c ®Þnh tr×nh tù cña toµn bé hÖ gen ng−êi (kho¶ng trªn 3 triÖu
cÆp nucleotide), 2) x¸c ®Þnh tÊt c¶ c¸c gen cã trong hÖ gen ng−êi, 3) l−u gi÷ th«ng tin hÖ
gen ng−êi trong c¸c hÖ thèng c¬ së d÷ liÖu, 4) c¶i tiÕn c¸c c«ng cô qu¶n lý vµ ph©n tÝch d÷
liÖu liªn quan ®Õn hÖ gen ng−êi, 5) chuyÓn giao c«ng nghÖ vµ tuyªn truyÒn c¸c nguyªn
t¾c ®¹o ®øc sinh häc trong viÖc khai th¸c th«ng tin tõ hÖ gen ng−êi. MÆc dï ngµy 26
th¸ng 6 n¨m 2000, Tæng thèng Mü Bill Clinton vµ Thñ t−íng Anh Tony Blair ®· tuyªn bè
b¶n th¶o ®Çu tiªn hÖ gen ng−êi ®· hoµn thµnh, nh−ng thùc tÕ ®Õn cuèi n¨m 2003, dù ¸n
hÖ gen ng−êi míi kÕt thóc; vµ ®Õn th¸ng 6/2006, viÖc gi¶i m· vµ lËp b¶n ®å NST lín nhÊt
cña hÖ gen ng−êi (NST sè 1) míi thùc sù hoµn thµnh.
§Õn nay, mÆc dï hÖ gen ng−êi ®· ®−îc gi¶i tr×nh tù hoµn chØnh, th× sè gen trong hÖ
gen ng−êi vÉn chØ lµ −íc tÝnh (kho¶ng 20.000 – 25.000 gen). Con sè nµy ban ®Çu ®· thùc
sù g©y “sèc” nhiÒu nhµ di truyÒn häc. Bëi, tr−íc khi triÓn khai dù ¸n, trªn c¬ së cÊu tróc
phøc t¹p cña c¬ thÓ ng−êi, sù ®a d¹ng cao cña h×nh th¸i vµ tËp tÝnh, phÇn lín c¸c nhµ di
truyÒn ®Òu dù ®o¸n hÖ gen ng−êi chøa trªn d−íi 100.000 gen. NhiÒu phÇn mÒm m¸y tÝnh
®· ®−îc dïng ®Ó dù ®o¸n sè gen trong hÖ gen ng−êi, chñ yÕu dùa vµo c¸c dÊu hiÖu cña
gen, nh− khung ®äc më (ORF), c¸c tÝn hiÖu nhËn biÕt intron, promoter ... Sau ®ã, c¸c gen
dù ®o¸n th−êng ®−îc kiÓm chøng bëi c¸c nghiªn cøu ®éc lËp, nh− qua viÖc t¸ch dßng c¸c
ph©n tö cADN xuÊt ph¸t tõ b¶n phiªn m· (mARN) t−¬ng øng cña gen. Nh−ng, nh×n
chung ch−a cã phÇn mÒm m¸y tÝnh nµo ®Õn nay cã thÓ x¸c ®Þnh ®−îc ®Çy ®ñ tÊt c¸c gen
tõ toµn bé tr×nh tù hÖ gen ®· biÕt. Bëi v×, c¸c ORF ng¾n, ngÉu nhiªn cã thÓ ®−îc x¸c ®Þnh
nhÇm lµ gen. Ng−îc l¹i, c¸c gen “thËt” vèn gåm nhiÒu exon ng¾n kh«ng cã cÊu tróc ORF
râ rµng cã thÓ bÞ bá sãt. Ngoµi ra, còng cßn nh÷ng “lçi” kh¸c n÷a mµ chóng ta ch−a biÕt
®Çy ®ñ trong c¸c d¹ng cÊu tróc exon-intron cña c¸c gen, hoÆc do “tÝnh tho¸i hãa” cña c¸c
tr×nh tù tÝn hiÖu ®iÒu khiÓn sù c¾t – nèi cña c¸c intron vµ exon trong qu¸ tr×nh hoµn
thiÖn mARN.
Trªn c¬ së c¸c th«ng tin mµ chóng ta ®· nªu, mét ®iÓm ®¸ng l−u ý lµ c¸c loµi ®éng
vËt cã vó (gåm c¶ loµi ng−êi) cã c¸c c¬ chÕ ®iÒu khiÓn gen phøc t¹p ®Ó cã thÓ ®ång thêi cã
nhiÒu kiÓu biÓu hiÖn gen kh¸c nhau. Nãi c¸ch kh¸c lµ d−êng nh−, tÝnh phøc t¹p cña c¬
thÓ kh«ng nhÊt thiÕt t−¬ng quan víi sè gen cã trong hÖ gen, mµ thay vµo ®ã, nã phô
thuéc vµo sè kiÓu biÓu hiÖn cña gen. H·y chó ý lËp luËn sau ®©y: giun trßn (C. elegans) cã
kho¶ng 20.000 gen, trong khi ruåi giÊm (D. melanogaster) cã sè gen Ýt h¬n ®¸ng kÓ (d−íi
14.000 gen). Nh−ng, trong thùc tÕ, sù ®a d¹ng vÒ h×nh th¸i vµ tËp tÝnh cña ruåi giÊm l¹i
cao h¬n nhiÒu so víi giun trßn. Sù phøc t¹p trong biÓu hiÖn kiÓu h×nh nh− vËy cã thÓ lµ
do sù t¨ng lªn vÒ sè kiÓu biÓu hiÖn cña gen. VÝ dô, mét gen ë ruåi giÊm trung b×nh cã thÓ
®−îc ®iÒu khiÓn bëi tõ 3 ®Õn 4 tr×nh tù enhancer kh¸c nhau (t¹i c¸c vÞ trÝ kh¸c nhau cña
c¬ thÓ), t¹o nªn kho¶ng 50.000 kiÓu biÓu hiÖn cña gen kh¸c nhau. Ng−îc l¹i, mçi gen ë
giun trßn trung b×nh chØ ®−îc ®iÒu khiÓn bëi 1 ®Õn 2 tr×nh tù enhancer. V× vËy, giun trßn
chØ cã kho¶ng 30.000 kiÓu biÓu hiÖn gen kh¸c nhau, Ýt h¬n nhiÒu so víi ruåi giÊm (mÆc
dï chóng cã nhiÒu gen h¬n).
313
§inh §oµn Long
10.5.2. HÖ gen ng−êi gièng hÖ gen chuét vµ kh«ng kh¸c mÊy hÖ gen tinh tinh
Ng−êi vµ chuét chøa mét sè l−îng gen t−¬ng ®èi gièng nhau (−íc l−îng ®Òu vµo
kho¶ng 20.000 – 25.000 gen). Kho¶ng 80% sè gen trong hÖ gen cña hai loµi t−¬ng ®ång
víi nhau. C¸c protein ®−îc m· hãa bëi c¸c gen t−¬ng ®ång nµy cã tÝnh b¶o thñ cao vµ cã
®Õn 80% tr×nh tù axit amin lµ gièng nhau hoµn toµn. PhÇn lín sù kh¸c nhau trong sè
20% c¸c gen cßn l¹i gi÷a ng−êi vµ chuét lµ do c¸c sù kiÖn lÆp ®o¹n ë nh÷ng tr×nh tù nhÊt
®Þnh. VÝ dô, chuét cã nhiÒu b¶n sao gen cytochrome P450 h¬n so víi ng−êi. TÊt nhiªn,
ng−îc l¹i, cã nhiÒu vÝ dô cho thÊy c¸c hä gen ë ng−êi cã møc ®é “më réng” cao h¬n ë
chuét. Nh−ng, nh×n chung ®iÓm næi bËt nhÊt khi so s¸nh hÖ gen ng−êi vµ chuét lµ chØ cã
rÊt Ýt gen “míi” (nÕu cã) trong hÖ gen ng−êi.
Sù gièng nhau gi÷a hÖ gen ng−êi víi hÖ gen c¸c loµi linh tr−ëng, ®iÓn h×nh lµ tinh
tinh, thËm chÝ cßn cao h¬n nhiÒu. ChØ cã kho¶ng 2% tr×nh tù hÖ gen gi÷a ng−êi vµ tinh
tinh lµ kh¸c nhau. NghÜa lµ trong mét ®o¹n tr×nh tù 100bp ngÉu nhiªn, trung b×nh chØ cã
2 nucleotide thay ®æi. §iÒu nµy cho thÊy tÝnh b¶o thñ cao trong hÖ gen c¸c ®éng vËt cã
x−¬ng sèng. Trong khi ®ã, viÖc so s¸nh ngÉu nhiªn hai c¸ thÓ mùc èng trong cïng mét
quÇn thÓ cho thÊy hÖ gen cña chóng kh¸c nhau kho¶ng 1%, cßn gi÷a hai quÇn thÓ kh¸c
nhau vµo kho¶ng 2,5%. ë ng−êi vµ tinh tinh, tÝnh b¶o thñ trong liªn kÕt gen còng rÊt
cao. TrËt tù vµ kho¶ng c¸ch gi÷a c¸c gen liªn kÕt lµ rÊt gièng nhau. Thùc tÕ, c¸c tr×nh tù
ADN ®iÒu hßa cã tèc ®é biÕn ®æi (tiÕn hãa) nhanh h¬n so víi c¸c tr×nh tù protein. Cã lÏ,
sù tiÕn hãa ph©n li gi÷a ng−êi vµ tinh tinh chØ lµ nh÷ng thay ®æi nhá trong hÖ gen nh−ng
®ñ lµm thay ®æi ho¹t tÝnh cña c¸c tr×nh tù ADN ®iÒu hßa chñ chèt.
10.5.3. Ng−êi vµ mèi quan hÖ di truyÒn víi c¸c loµi linh tr−ëng cì lín
Ng−êi ph©n biÖt víi c¸c loµi linh tr−ëng cì lín kh¸c, nh− tinh tinh hay khØ Gorilla,
ë mét sè ®Æc ®iÓm ngo¹i h×nh. Trong ®ã c¸c loµi v−în ng−êi cã r¨ng cöa vµ r¨ng nanh lín
h¬n nhiÒu so víi ng−êi; x−¬ng hµm cña chóng còng lín h¬n vµ nÆng h¬n. N·o cña v−în
ng−êi nhá h¬n n·o ng−êi. §iÓm g¾n gi÷a n·o vµ tñy sèng ë v−în ng−êi bÞ “®Èy” vÒ phÝa
sau hép sä, xa h¬n so víi ë ng−êi. H×nh d¸ng vµ tØ lÖ gi÷a c¸c phÇn c¬ thÓ cña ng−êi kh¸c
biÖt víi v−în ng−êi; trong ®ã, nÕu ë v−în ng−êi phÇn th©n cã xu h−íng më réng vÒ phÝa
d−íi th× ë ng−êi trung b×nh kÝch th−íc phÇn th©n cña c¬ thÓ cã xu h−íng æn ®Þnh tõ vai
cho ®Õn th¾t l−ng. TØ sè chiÒu dµi ch©n/th©n cña v−în ng−êi nhá h¬n so víi ng−êi khi ®¹t
tuæi tr−ëng thµnh; x−¬ng chËu cña chóng kh«ng cã cÊu tróc phï hîp cho t− thÕ ®øng
th¼ng. MÆc dï c¸c loµi v−în ng−êi còng cã thÓ ®i b»ng hai ch©n, nh−ng bµn ch©n cña
chóng kh«ng ®ñ v÷ng ®Ó duy tr× viÖc ®i th¼ng l−ng mét c¸ch liªn tôc vµ l©u dµi. Ng−îc
l¹i, ng−êi hoµn toµn ®i b»ng hai ch©n (tÊt nhiªn, trõ trÎ s¬ sinh). Bµn tay vµ bµn ch©n
ng−êi vµ v−în ng−êi kh¸c nhau; trong ®ã, ngãn tay c¸i cña v−în ng−êi kh«ng «m ®−îc
vµo lßng bµn tay vµ n¾m lÊy c¸c ngãn tay kh¸c nh− ë ng−êi.
Nh− ®· nªu ë trªn, dï cã nhiÒu ®Æc ®iÓm h×nh th¸i kh¸c nhau nh− vËy, nh−ng hÖ
gen ng−êi kh«ng kh¸c mÊy hÖ gen v−în ng−êi, ®Æc biÖt lµ tinh tinh. Sù gièng nhau ®Õn
98 - 99% gi÷a hÖ gen ng−êi vµ tinh tinh cho thÊy sù ph©n li tiÕn hãa cña hai loµi tõ tæ
tiªn chung chØ x¶y ra gÇn ®©y (−íc tÝnh tõ 5 ®Õn 9 triÖu n¨m tr−íc). So víi tinh tinh, c¸c
loµi v−în ng−êi kh¸c (nh− khØ Gorilla) cã mèi quan hÖ di truyÒn víi ng−êi xa h¬n.
10.5.4. Nguån gèc loµi ng−êi theo b»ng chøng hãa th¹ch
MÆc dï hiÕm c¸c b»ng chøng hãa th¹ch ®· cung cÊp nh÷ng th«ng tin quan träng vÒ
nguån gèc vµ sù tiÕn hãa cña loµi ng−êi (h×nh 10.14, trang sau). B»ng chøng hãa th¹ch
l©u ®êi nhÊt liªn quan ®Õn dßng tiÕn hãa cña loµi ng−êi t×m thÊy ë Ch©u Phi cã tuæi niªn
®¹i kho¶ng 4 - 5 triÖu n¨m. Sinh vËt cã d¹ng gièng ng−êi (hominid) ®Çu tiªn nµy ®−îc gäi
314
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
lµ ng−êi v−în A®ipitÕc Homo
(Ardipithecus ramidus). Hãa 0 sapiens
Homo
th¹ch cã tuæi niªn ®¹i l©u ®êi tiÕp
erectus
theo h×nh thµnh c¸ch ®©y kho¶ng
1 Homo
3 - 4 triÖu n¨m thuéc mét d¹ng TriÖu n¨m tr−íc ergaster Homo Homo
habilis rudolfensis
hominid kh¸c, ®−îc ®Æt tªn lµ
2 Dßng
ng−êi v−în ¤xtral«pitÕc 3 tiÕn hãa ? Australopithecus
ng−êi ? afarensis
(Australopithecus afarensis). Ng−êi Tinh tinh
v−în ¤xtral«pitÕc cã chiÒu cao Ardipithecus
4 ramidus
kho¶ng 1 – 1,5m, ®i b»ng hai ch©n
? Dßng
(Ýt nhÊt mét ®o¹n ng¾n). 5 tiÕn hãa
C¸c loµi ®Çu tiªn ®−îc xÕp v−în ng−êi
cïng chi Homo víi ng−êi hiÖn ®¹i
(H. sapiens) cã hãa th¹ch h×nh
thµnh c¸ch ®©y kho¶ng 2 – 2,5 Tæ tiªn chung
cña ng−êi, ng−êi
triÖu n¨m, ®−îc ®Æt tªn lµ H. v−în vµ tinh tinh
rudolfensis (gäi lµ ng−êi rudolfen)
vµ H. habilis (gäi lµ ng−êi H×nh 10.14. C©y ph¸t sinh loµi ng−êi trªn c¬ së b»ng chøng
habilis). C¶ hai loµi ng−êi v−în hãa th¹ch. Tæ tiªn chung cña ng−êi, c¸c d¹ng ng−êi v−în vµ tinh tinh
“xuÊt hiÖn sím” nµy cã nhiÒu ®Æc ®· tiÕn hãa theo hai dßng ®éc lËp h×nh thµnh nªn ng−êi hiÖn ®¹i -
Homo sapiens ( dßng tiÕn hãa ng−êi) vµ tinh tinh (dßng tiÕn hãa v−în
®iÓm h×nh th¸i gièng v−în ng−êi. ng−êi). DÊu hái ph¶n ¸nh "b−íc" tiÕn hãa ch−a ®−îc kh¼ng ®Þnh.
Tuy vËy, so víi ng−êi v−în
¤xtral«pitÕc, hai d¹ng ng−êi v−în nµy cã ®iÓm tiÕp xóc gi÷a n·o bé vµ tñy sèng ë gÇn
gi÷a hép sä h¬n; ngoµi ra, hép sä gi¶m chiÒu dµi vµ t¨ng chiÒu réng (gièng ng−êi h¬n).
MÆc dï vËy, còng cã nhiÒu nhµ cæ sinh vËt häc kh«ng nhÊt trÝ xÕp hai loµi nµy vµo chi
Homo, mµ thay vµo ®ã lµ chi Australopithecus. Loµi cã b»ng chøng hãa th¹ch ®−îc kh¼ng
®Þnh ch¾c ch¾n thuéc chi Homo lµ Homo ergaster, gäi lµ ng−êi Egaxt¬, cã mÉu hãa th¹ch
h×nh thµnh c¸ch ®©y 1,5 – 1,9 triÖu n¨m. Ng−êi Egaxt¬ cã nhiÒu ®Æc ®iÓm h×nh th¸i
gièng víi ng−êi h¬n, bao gåm h×nh d¸ng c¬ thÓ, tØ lÖ kÝch th−íc ch©n-th©n, ®Æc ®iÓm cÊu
tróc hµm vµ kÝch th−íc r¨ng.
TÊt c¶ c¸c mÉu hãa th¹ch trªn ®©y ®Òu ®−îc t×m thÊy ë Ch©u Phi. MÉu hãa th¹ch
hominid ®Çu tiªn ®−îc t×m thÊy ë ngoµi Ch©u Phi thuéc vÒ ng−êi Homo erectus, gäi lµ
ng−êi £rec hay ng−êi ®øng th¼ng. Hãa th¹ch ng−êi £rec, cã tuæi kho¶ng 1 triÖu n¨m,
®−îc t×m thÊy ë nhiÒu vïng thuéc khu vùc §«ng-Nam Ch©u ¸, trong ®ã cã Ên §é,
In®«nªsia, Trung Quèc, ViÖt Nam... §iÒu nµy cho thÊy H. erectus ®· cã ph¹m vi ph©n bè
réng vµ cã thÓ lµ nguån gèc h×nh thµnh nªn c¸c quÇn thÓ ng−êi “cæ x−a” ë Ch©u ¢u, Ch©u
¸ vµ Ch©u Phi. Ng−êi cæ x−a ®−îc biÕt ®Õn nhiÒu nhÊt lµ ng−êi Nªan®ectan (H.
neanderthalensis) ph¸t triÓn kh¸ h−ng thÞnh ë Ch©u ¢u vµ vïng CËn §«ng c¸ch ®©y vµi
tr¨m ngh×n n¨m. Dùa vµo ®Æc ®iÓm h×nh th¸i vµ tæ chøc x· héi gÇn gièng víi ng−êi, tr−íc
®©y ng−êi ta tõng cho r»ng ng−êi Nªan®ectan cã kh¶ n¨ng lµ tæ tiªn cña ng−êi hiÖn ®¹i.
Nh−ng, nh÷ng b»ng chøng ph©n tö (so s¸nh ADN hÖ gen ti thÓ gi÷a hai loµi) gÇn ®©y cho
thÊy ng−êi Nªan®ectan kh«ng hÒ ®ãng gãp vËt chÊt di truyÒn vµo vèn gen ng−êi hiÖn ®¹i.
ThÕ nªn, nhiÒu kh¶ n¨ng, ng−êi Nªan®ectan chÝnh lµ “®èi thñ” c¹nh tranh víi ng−êi cæ
x−a vèn lµ tæ tiªn cña ng−êi hiÖn ®¹i. Trong cuéc c¹nh tranh ®ã, ng−êi Nªan®ectan tá ra
kÐm thÝch nghi h¬n vµ bÞ tuyÖt chñng.
Ng−êi hiÖn ®¹i cã thÓ ®· tiÕn hãa ®ång thêi tõ c¸c quÇn thÓ ng−êi cæ x−a vèn ®·
h×nh thµnh tõ tr−íc ë Ch©u ¢u, Ch©u ¸ vµ Ch©u Phi; hoÆc còng cã thÓ chØ tõ mét ch©u
315
§inh §oµn Long
lôc (nhiÒu kh¶ n¨ng lµ Ch©u Phi), sau ®ã ph¸t t¸n ra c¸c vïng kh¸c trªn Tr¸i ®Êt qua sù
di c−. Gi¶ thiÕt thø nhÊt ®−îc gäi lµ “gi¶ thiÕt ®a vïng”, cßn gi¶ thiÕt thø hai ®−îc gäi lµ
“gi¶ thiÕt ngoµi Ch©u Phi”. TiÕc r»ng, c¸c b»ng chøng hãa th¹ch thu ®−îc ®Òu kh«ng
kh¼ng ®Þnh ®−îc gi¶ thiÕt nµo phï hîp h¬n. Nh−ng gÇn ®©y, viÖc ph©n tÝch vµ so s¸nh
c¸c tr×nh tù ADN ë ng−êi ®−¬ng thêi ®· phÇn nµo tr¶ lêi ®−îc c©u hái nµy.
10.5.5. Nguån gèc loµi ng−êi theo b»ng chøng ph©n tö
Trong vßng 20 n¨m qua, c¸c b»ng chøng ph©n tö (ADN, protein) ®· cung cÊp nhiÒu
th«ng tin bæ sung quan träng vÒ qu¸ tr×nh h×nh thµnh ng−êi hiÖn ®¹i. NhiÒu dÊu hiÖu
ph©n tö kh¸c nhau ®· ®−îc sö dông, nh− c¸c dÊu hiÖu ®a h×nh nhãm m¸u vµ isozyme, ®a
h×nh c¸c ®o¹n giíi h¹n (RFLP), ®a h×nh chiÒu dµi c¸c ®o¹n lÆp l¹i kÕ tiÕp (SSR, VNTR),
v.v... C¶ hai hÖ gen nh©n vµ ti thÓ ®Òu ®−îc “huy ®éng” trong nh÷ng nghiªn cøu nµy. HÖ
gen nh©n cã “−u thÕ” khi ®¸nh gi¸ tÝnh ®a d¹ng di truyÒn chung cña vèn gen loµi ng−êi;
nh−ng hÖ gen ti thÓ cã “−u thÕ” trong viÖc ph©n tÝch di truyÒn theo dßng mÑ, vµ x¸c ®Þnh
thêi ®iÓm ph©n li tiÕn hãa cña c¸c chñng téc.
So víi phÇn lín c¸c ®éng vËt kh¸c, hÖ gen ng−êi cã tÝnh ®ång nhÊt kh¸ cao. Khi so
s¸nh c¸c tr×nh tù ADN, sù thay thÕ c¸c nucleotide ë hÖ gen ng−êi thÊp h¬n 4 lÇn so víi
tinh tinh vµ b»ng 1/10 so víi ruåi giÊm. PhÇn lín (85 – 95%) c¸c d¹ng biÕn dÞ di truyÒn
(c¸c alen) ë ng−êi biÓu hiÖn ngay trong mçi quÇn thÓ, chø kh«ng ph¶i gi÷a c¸c quÇn thÓ
kh¸c nhau. TÇn sè biÕn dÞ t−¬ng ®èi thÊp gi÷a c¸c quÇn thÓ ng−êi cho thÊy: trong qu¸
tr×nh tiÕn hãa cña ng−êi hiÖn ®¹i, kÝch th−íc c¸c quÇn thÓ “tiÒn th©n” ®−îc duy tr× vÒ sau
®· rÊt nhá, −íc tÝnh chØ cã tõ 10.000 ®Õn 100.000 c¸ thÓ. Cã thÓ kÝch th−íc thùc cña c¸c
quÇn thÓ “tiÒn th©n” nµy lµ lín h¬n, nh−ng do mét sè yÕu tè nh− tËp tÝnh kÕt cÆp giao
phèi (®Æc ®iÓm tæ chøc x·
héi), ¸p lùc cña chän läc tù Vèn gen
hiÖn t¹i
nhiªn lªn qu¸ tr×nh sinh
s¶n, “hiÖu øng th¾t cæ chai”
g©y ra bëi hµng lo¹t dÞch
bÖnh, n¹n ®ãi, thiªn tai...
dÉn ®Õn kÝch th−íc quÇn
thÓ di truyÒn hiÖu qu¶
(®ãng gãp vµo vèn gen
ng−êi ®−¬ng thêi) ®· lu«n
nhá h¬n 100.000 c¸ thÓ.
Trong nh÷ng quÇn thÓ nhá Thêi
nh− vËy, hiÖn t−îng “l¹c gian
dßng di truyÒn” ®· −u thÕ
h¬n so víi ®ét biÕn trong
viÖc quy ®Þnh sù c©n b»ng
gi÷a møc ®é biÕn dÞ vµ tØ lÖ
c¸c alen trung tÝnh ®−îc
chän läc duy tr×.
Khi ph©n tÝch c¸c Tæ tiªn
quÇn thÓ ng−êi kh¸c nhau, chung cña
biÕn dÞ di truyÒn ë c¸c c¸c c¸ thÓ
chñng téc ng−êi Ch©u Phi ®ang sèng
cao h¬n h¼n c¸c ch©u lôc
kh¸c. §iÒu nµy ñng hé gi¶ H×nh 10.15. Qu¸ tr×nh “dÝnh chËp”. NÕu c¸c dßng tr×nh tù ADN ®−îc t×m
thiÕt “ngoµi Ch©u Phi”. thÊy trong c¸c c¸ thÓ ®ang sèng (vèn gen hiÖn t¹i) ®−îc truy nguyªn vÒ qu¸
Ngoµi ra, c¸c kÕt qu¶ so khø, th× sÏ thÊy tÊt c¶ c¸c c¸ thÓ hiÖn ®ang tån t¹i ®Òu cã mét tæ tiªn chung.
C¸c tr×nh tù ADN kh¸c ®· tõng cã trong qu¸ khø nh−ng hiÖn nay kh«ng
cßn tån t¹i lµ do sù tuyÖt chñng ®−îc kÝ hiÖu b»ng vßng trßn ®en (•).
316
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
s¸nh hÖ gen ti thÓ gi÷a c¸c quÇn thÓ ng−êi kh¸c nhau còng ®· ñng hé gi¶ thiÕt nµy,
nghÜa lµ ban ®Çu chØ cã mét quÇn thÓ ng−êi hiÖn ®¹i ë Ch©u Phi råi di c− tíi c¸c ch©u lôc
kh¸c vµ h×nh thµnh nªn c¸c quÇn thÓ míi (h×nh 10.15).
B»ng viÖc ph©n tÝch hÖ gen ti thÓ gi÷a c¸c chñng téc ng−êi, mét sè nhµ tiÕn hãa −íc
tÝnh tæ tiªn chung cña toµn bé ng−êi ®−¬ng thêi (gäi lµ “£va”, do di truyÒn theo dßng mÑ)
sèng c¸ch ®©y tõ 100.000 ®Õn 200.000 n¨m. §iÒu ®¸ng chó ý lµ sau ®ã viÖc so s¸nh vïng
kh«ng t−¬ng ®ång trªn NST Y (di truyÒn theo dßng bè) ë ®µn «ng tõ c¸c quÇn thÓ kh¸c
nhau còng cho kÕt qu¶ t−¬ng tù (“Adam” sèng c¸ch ®©y kho¶ng 150.000 n¨m). KÕt hîp
c¸c sè liÖu nµy, cã thÓ nhËn ®Þnh r»ng mäi ng−êi sèng trªn Tr¸i ®Êt hiÖn nay ®Òu lµ hËu
duÖ cña mét cÆp “£va - Adam” sèng ë Ch©u Phi c¸ch ®©y kho¶ng 150.000 ®Õn 200.000
n¨m. Nãi nh− vËy, kh«ng cã nghÜa lµ vµo thêi ®iÓm ®ã, chØ cã hai c¸ thÓ nµy tån t¹i; mµ
cßn nhiÒu c¸ thÓ kh¸c. Nh−ng, c¸c dßng di truyÒn kh¸c kh«ng ®−îc duy tr× ®Õn ngµy nay.
NÕu tÊt c¶ nh÷ng gi¶ thiÕt vµ kÕt qu¶ ph©n tÝch trªn ®©y lµ ®óng (bëi còng cßn mét
sè yÕu tè ch−a ch¾c ch¾n vÒ gi¶ thiÕt “®ång hå ph©n tö” vµ ®é chÝnh x¸c cña ph−¬ng ph¸p
ph©n tÝch), th× qu¶ thËt loµi ng−êi cßn rÊt trÎ. Cã lÏ, b¾t nguån tõ mét quÇn thÓ “tiÒn
th©n” nhá ë Ch©u Phi; råi tõ Ch©u Phi, loµi ng−êi di c− tíi Ch©u ¸ vµ Ch©u ¢u, sau ®ã
tíi Ch©u óc vµ Ch©u Mü; cuèi cïng, trë thµnh loµi “thèng trÞ” Tr¸i ®Êt nh− hiÖn nay.
10.6. Sù tiÕn hãa lêi nãi (ng«n ng÷) ë ng−êi
10.6.1. TÝnh tr¹ng “lêi nãi” ë ng−êi vµ gen FOX2P
NÕu nh− cÊu tróc di truyÒn hÖ gen ng−êi vµ c¸c loµi ®éng vËt cã vó kh¸c (nh−
chuét, tinh tinh) lµ gièng nhau, th× mét c©u hái ®Æt ra lµ: sù s¸ng t¹o tiÕn hãa “xuÊt
chóng” nµo ®· lµm cho loµi ng−êi rÊt kh¸c biÖt víi nh÷ng loµi cßn l¹i? Chóng ta h·y dù
®o¸n vÒ nguån gèc mét tÝnh (a) Chuét
tr¹ng ph¶n ¸nh sù kh¸c biÖt
cña loµi ng−êi, ®ã lµ “lêi nãi” Tæ tiªn §−êi −¬i
hay “ng«n ng÷”. §Õn nay, chung KhØ Gorilla
loµi ng−êi lµ loµi duy nhÊt cã
thÓ giao tiÕp b»ng c¶ hÖ Tinh tinh lïn 3
thèng ng«n ng÷ nãi vµ viÕt. Tinh tinh 2
Loµi ®éng vËt gÇn ng−êi
nhÊt lµ tinh tinh còng cã kh¶ Ng−êi
n¨ng giao tiÕp qua mét d¹ng
ng«n ng÷ ®¬n gi¶n, nh−ng s¬ (b) 80 303 325
khai h¬n rÊt nhiÒu so víi loµi N D NS C
ng−êi. VËy, ng«n ng÷ ®·
h×nh thµnh nh− thÕ nµo Ng−êi
trong qu¸ tr×nh ph¸t sinh
loµi ng−êi? ND TN C
Kh¶ n¨ng nãi phô Tinh tinh
thuéc vµo sù ®iÒu phèi ho¹t
®éng chÝnh x¸c cña c¸c c¬ N E TA C
trong thanh qu¶n vµ miÖng.
Sù biÓu hiÖn gi¶m ®i cña mét Chuét
protein ®iÒu hßa cã tªn lµ
H×nh 10.16. Sù tiÕn hãa cña protein FOX2P. (a) Mèi quan hÖ gi÷a
c¸c loµi ®−îc x¸c ®Þnh dùa trªn sù sai kh¸c vÒ tr×nh tù axit amin trong
protein FOX2P ë chuét vµ c¸c loµi linh tr−ëng; c¸c chØ sè (2, 3) lµ sè
axit amin ®−îc thay thÕ. (b) C¸c axit amin ®−îc thay thÕ trong protein
FOX2P ë chuét, tinh tinh vµ ng−êi.
317
§inh §oµn Long
FOXP2 ®−îc t×m thÊy lµ nguyªn nh©n dÉn ®Õn nhiÒu d¹ng sai háng kh¸c nhau vÒ kh¶
n¨ng nãi. Nh÷ng c¸ thÓ thiÕu hôt protein nµy gÆp khã kh¨n trong viÖc ph¸t ©m vµ diÔn
®¹t ng«n ng÷. Gen FOXP2 còng ®−îc t×m thÊy vµ ph©n lËp tõ c¸c ®éng vËt kh¸c nh−
chuét, tinh tinh vµ ®−êi −¬i (h×nh 10.16a). Nh−ng d¹ng protein FOXP2 cña ng−êi kh¸c
biÖt ®«i chót so víi c¸c d¹ng t×m thÊy ë c¸c loµi linh tr−ëng vµ ®éng vËt cã vó kh¸c. §Æc
biÖt, cã hai sù thay thÕ axit amin chØ cã ë protein FOX2P cña ng−êi, ®ã lµ: Thr → Asn t¹i
vÞ trÝ 303, vµ Asn → Ser t¹i vÞ trÝ 325 (h×nh 10.16b). Cã lÏ, nh÷ng ®ét biÕn nµy ®· lµm
thay ®æi chøc n¨ng protein FOX2P cña ng−êi. Mét sè b»ng chøng cho thÊy vïng ®iÒu hßa
øc chÕ cña protein nµy mÊt kh¶
n¨ng ®iÒu khiÓn mét sè gen ®Ých
vèn bÞ øc chÕ ë tinh tinh vµ
chuét. HiÖn t−îng nµy d−êng Vá n·o míi
ë c¸c loµi
nh− gièng víi sù xuÊt hiÖn ®o¹n
linh tr−ëng
peptide “ph¶n øc chÕ” cña
protein Ubx t×m thÊy ë gi¸p x¸c
(xem môc 10.2). Ngoµi ra,
nh÷ng thay ®æi trong kiÓu biÓu
hiÖn cña gen FOX2P hoÆc trong N
chÝnh tr×nh tù c¸c gen ®Ých còng MiÒn
cã thÓ lµ nguyªn nh©n dÉn ®Õn Protein ho¹t hãa
sù ph¸t triÓn kh¶ n¨ng nãi ë FOX2P
ng−êi. MiÒn liªn kÕt
C ADN sîi kÐp
10.6.2. Gen FOX2P thóc ®Èy Ng−êi Tinh tinh
sù ph¸t triÓn ng«n ng÷
ë ng−êi nh− thÕ nµo?
ë ®©y, chóng ta còng ®Ò Gen A Gen A
cËp ®Õn 3 c¬ chÕ lµm thay ®æi “BËt” “T¾t”
chøc n¨ng protein ®iÒu hßa vèn
®· ®−îc nªu trong tr−êng hîp +1 +1
gen Ubx. Nh÷ng nguyªn lý nµy
còng ®−îc ¸p dông ®èi víi gen Gen B Gen B
FOX2P. Cã lÏ ®· cã mét sù kÕt “BËt” “T¾t”
hîp ®ång thêi 3 c¬ chÕ (thay ®æi
kiÓu biÓu hiÖn cña gen ®iÒu hßa, +1 +1
thay ®æi tr×nh tù axit amin cña
protein ®iÒu hßa do gen ®iÒu Gen C Gen C
hßa m· hãa vµ nh÷ng thay ®æi + 1 “BËt” “BËt”
ngay trong tr×nh tù c¸c gen
®Ých) dÉn ®Õn viÖc protein +1
FOX2P “®ét xuÊt” trë thµnh mét
chÊt “m«i giíi” quan träng cho H×nh 10.17. FOX2P vµ thuyÕt tiÕn hãa "ng«n ng÷" ë ng−êi.
sù h×nh thµnh ng«n ng÷ ë ng−êi. Protein ®iÒu hßa FOX2P ®−îc biÓu hiÖn trong vá n·o ë ng−êi còng
Cô thÓ, mét ®ét biÕn trong tr×nh nh− ë tinh tinh. Tuy nhiªn, ho¹t tÝnh cña protein nµy ë hai loµi cã ®iÓm
tù ®iÒu hßa cña gen FOX2P ®· kh¸c nhau. Gen ë ng−êi ®−îc biÓu hiÖn m¹nh vµo ®óng thêi ®iÓm cña
®−îc ph¸t hiÖn lµ nguyªn nh©n qu¸ tr×nh ph¸t triÓn trung khu “nãi”, trong ®ã cã sù ho¹t hãa 3 gen
lµm thay ®æi kiÓu biÓu hiÖn cña ®Ých (gi¶ ®Þnh lµ A, B vµ C) trong vïng vá n·o. Nh÷ng gen ®Ých nµy
m· hãa c¸c chÊt dÉn truyÒn thÇn kinh quan träng quyÕt ®Þnh sù h×nh
gen FOX2P trong n·o ng−êi. ë thµnh trung khu “nãi”. Ng−îc l¹i, ë tinh tinh, gen FOX2P kh«ng ®−îc
tinh tinh, gen nµy kh«ng ®−îc biÓu hiÖn vµo ®óng thêi ®iÓm tèi −u nhÊt cña qu¸ tr×nh ph¸t triÓn trung
biÓu hiÖn t¹i vÞ trÝ thÝch hîp khu “nãi”; ngoµi ra, ngay c¶ khi ®−îc biÓu hiÖn ®óng thêi ®iÓm, sù
kh¸c biÖt vÒ mét sè axit amin trong protein FOX2P cña tinh tinh lµm
gi¶m ho¹t tÝnh ho¹t hãa c¸c gen ®Ých. KÕt qu¶ lµ, tinh tinh chØ cã kh¶
n¨ng giao tiÕp b»ng ng«n ng÷ “cæ x−a”.
318
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
trong n·o vµ vµo mét thêi ®iÓm phï hîp cña qu¸ tr×nh ph¸t triÓn. Ng−îc l¹i, ë ng−êi gen
nµy ®−îc biÓu hiÖn ë vÞ trÝ vµ thêi ®iÓm rÊt phï hîp cho sù ph¸t triÓn kh¶ n¨ng nãi ë trÎ
em. Ngoµi ra, ë phÇn sau, chóng ta sÏ thÊy protein FOX2P ë ng−êi vµ tinh tinh cã c¸c
nhãm gen ®Ých kh¸c nhau. Gi¶ thiÕt nµy mÆc dï chØ lµ suy ®o¸n, nh−ng nã gióp gi¶i
thÝch t¹i sao chØ mét sè thay ®æi nhá trong c¸c gen ®iÒu hßa vµ gen ®Ých cña chóng l¹i cã
thÓ t¹o nªn ®−îc mét tÝnh tr¹ng “®éc ®¸o” nh− ng«n ng÷ ë ng−êi.
Trong sè c¸c gen ®Ých ®−îc gen FOX2P ®iÒu khiÓn cã c¸c gen m· hãa c¸c chÊt dÉn
truyÒn thÇn kinh vµ c¸c protein tÝn hiÖu quan träng cho sù ph¸t triÓn thanh qu¶n.
Nh÷ng biÕn ®æi ë nh÷ng gen nµy cã thÓ lµm thay ®æi thêi ®iÓm biÓu hiÖn vµ t¨ng møc
biÓu hiÖn cña c¸c gen, sao cho c¸c tÝn hiÖu thiÕt yÕu ®−îc h×nh thµnh ë thanh qu¶n vµo
®óng thêi ®iÓm trÎ ®ang ph¸t triÓn kh¶ n¨ng nãi trë nªn nh¹y c¶m nhÊt víi kh¶ n¨ng
tiÕp thu ng«n ng÷. C¸c gen t−¬ng øng ë tinh tinh chØ biÓu hiÖn ë møc thÊp, sai vÞ trÝ vµ ë
thêi ®iÓm muén h¬n trong qu¸ tr×nh ph¸t triÓn thanh qu¶n (h×nh 10.17).
FOX2P chØ lµ mét vÝ dô vÒ gen ®iÒu hßa tham gia vµo sù ph¸t triÓn “kh¶ n¨ng nãi”
ë ng−êi. ThËt khã ®Ó −íc l−îng cã bao nhiªu “gen ®iÒu hßa ng«n ng÷” kÓ tõ khi cã sù
ph©n li tiÕn hãa gi÷a ng−êi vµ tinh tinh. Tuy vËy, ë ®Çu ch−¬ng nµy chóng ta ®· thÊy chØ
cÇn Ýt h¬n 100 “gen ®iÒu hßa quy ®Þnh kiÓu biÓu hiÖn gen” còng ®ñ ®Ó t¹o nªn mét sù ®a
d¹ng h×nh th¸i rÊt lín ë c¸c loµi ®éng vËt ch©n ®èt. V× vËy, cã lÏ chØ cÇn mét sè gen ®iÒu
hßa lµ ®ñ ®Ó dÉn ®Õn sù ph¸t triÓn ng«n ng÷ ë ng−êi.
10.7. Sù tiÕn hãa c¸c gen c¶m nhËn mµu s¾c vµ bÖnh di truyÒn liªn quan
10.7.1. C¬ së tÕ bµo cña sù c¶m nhËn mµu s¾c ë m¾t
Chóng ta c¶m nhËn ®−îc h×nh ¶nh qua c¸c n¬ron thÇn kinh vâng m¹c ë phÝa sau
nh·n cÇu (h×nh 10.18). Nh÷ng n¬ron nµy cã hai lo¹i: tÕ bµo h×nh nãn vµ tÕ bµo h×nh que.
C¸c tÕ bµo h×nh que chiÕm 95% sè l−îng c¸c tÕ bµo c¶m nhËn ¸nh s¸ng vµ ®−îc kÝch
thÝch bëi c¸c ¸nh s¸ng yÕu. ë c−êng ®é s¸ng m¹nh h¬n, c¸c tÕ bµo h×nh que bÞ b·o hßa vµ
kh«ng cßn chøc n¨ng göi c¸c tÝn hiÖu bæ sung thªm vÒ n·o bé. Lóc nµy, c¸c tÕ bµo h×nh
nãn sÏ tiÕp qu¶n chøc n¨ng nµy, xö lý c¸c b−íc sãng cña ¸nh s¸ng m¹nh, göi tÝn hiÖu vÒ
n·o bé vµ gióp chóng ta ph©n biÖt ®−îc mµu s¾c. C¸c tÕ bµo h×nh nãn cã ba lo¹i. Lo¹i thø
nhÊt chuyªn hãa ®Ó c¶m nhËn ¸nh s¸ng ®á, lo¹i thø hai c¶m nhËn ¸nh s¸ng xanh lôc vµ
lo¹i thø ba c¶m nhËn ¸nh s¸ng xanh lam. §èi víi mçi tÕ bµo thô quan ¸nh s¸ng nh− vËy,
ho¹t ®éng c¶m nhËn ¸nh s¸ng bao gåm sù hÊp thô c¸c photon tõ ¸nh s¸ng ë mét d¶i b−íc
sãng nhÊt ®Þnh, chuyÓn th«ng tin vÒ sè l−îng vµ n¨ng l−îng cña c¸c photon thµnh c¸c tÝn
hiÖu ®iÖn tö vµ chuyÓn c¸c tÝn hiÖu ®ã qua tÕ bµo thÇn kinh thÞ gi¸c tíi bé n·o.
10.7.2. HÖ gen ng−êi cã bèn gen m· hãa bèn protein c¶m nhËn mµu s¾c
C¸c protein c¶m nhËn photon vµ khëi ®Çu sù truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh nãn
lµ rhodopsin. Protein nµy cã mét chuçi polypeptide duy nhÊt gåm 348 axit amin gÊp nÕp
thµnh chuçi zigzag xuyªn mµng tÕ bµo (h×nh 10.18). Mét axit amin Lys n»m trong chuçi
liªn kÕt víi mét ph©n tö carotenoid s¾c tè trªn vâng m¹c cã kh¶ n¨ng hÊp thô photon.
C¸c axit amin gÇn vïng liªn kÕt vâng m¹c t¹o nªn miÒn ho¹t ®éng cña rhodopsin. Nhê
viÖc thay ®æi vÞ trÝ vâng m¹c qua mét c¬ chÕ ®Æc biÖt, rhodopsin quy ®Þnh kiÓu ®¸p øng
¸nh s¸ng cña tÕ bµo vâng m¹c. Mçi tÕ bµo h×nh que chøa kho¶ng 100 triÖu ph©n tö
rhodopsin. Gen m· hãa rhodopsin ë ng−êi n»m trªn NST sè 3.
Protein cã vai trß c¶m nhËn vµ khëi ®Çu qu¸ tr×nh truyÒn tÝn hiÖu ë c¸c tÕ bµo h×nh
nãn ®èi víi photon mµu xanh lam cã quan hÖ tiÕn hãa víi rhodopsin. Protein nµy còng chØ
319
§inh §oµn Long
cã mét chuçi polypeptide duy a) C¸c tÕ bµo h×nh BiÓu m«
nhÊt gåm 348 axit amin vµ bao
quanh mét ph©n tö s¾c tè ë nãn vµ h×nh que s¾c tè
vâng m¹c. GÇn 50% tr×nh tù
axit amin trªn ph©n tö protein
c¶m nhËn ¸nh s¸ng xanh lam Vâng m¹c
gièng rhodopsin; phÇn cßn l¹i
kh¸c víi rhodopsin lµ phÇn ¸nh s¸ng TÕ bµo thô
chuyªn hãa cho sù c¶m nhËn c¶m ¸nh s¸ng
¸nh s¸ng xanh lam (h×nh
H×nh que
10.18b). Gen m· hãa protein
nµy n»m trªn NST sè 7.
H×nh nãn
Còng cã quan hÖ tiÕn hãa
víi protein rhodopsin lµ c¸c
protein c¶m nhËn ¸nh s¸ng ®á
vµ xanh lôc n»m trong c¸c tÕ ¸nh s¸ng Vâng
m¹c
bµo h×nh nãn mµu ®á vµ xanh Rhodopsin
lôc. Hai protein nµy còng chØ cã
mét chuçi polypeptide duy b) 1- Protein Rhodopsin 2- Protein c¶m nhËn mµu xanh lam
nhÊt, nh−ng chiÒu dµi lµ 364
axit amin. Chóng còng liªn kÕt
víi vâng m¹c vµ n»m xuyªn
mµng tÕ bµo (h×nh 10.18b). 3-Protein c¶m nhËn mµu lôc 4-Protein c¶m nhËn mµu ®á
Còng gièng nh− protein c¶m
nhËn mµu xanh lam, c¸c
protein c¶m nhËn mµu ®á vµ
xanh lôc cã gÇn 50% tr×nh tù
axit amin gièng rhodopsin; c¸c
protein nµy chØ kh¸c nhau d) Sù tiÕn hãa cña c¸c gen
trung b×nh 4 / 100 axit amin. c) C¸c gen m· hãa protein c¶m nhËn mµu ®á c¶m nhËn mµu s¾c
(1) vµ lôc (2) trªn NST X Gen tiÒn th©n
MÆc dï chØ kh¸c biÖt nhá nh−
vËy nh−ng c¸c protein nµy ®·
biÖt hãa c¸c tÕ bµo h×nh nãn
thµnh hai lo¹i c¶m øng víi c¸c 1 2 2 2 §á Lôc Lam Rhodopsin
photon ¸nh s¸ng cã b−íc sãng H×nh 10.18. C¬ së ph©n tö cña sù c¶m nhËn mµu s¾c. (a) c¸c tÕ
kh¸c nhau, gäi lµ c¸c tÕ bµo bµo h×nh nãn vµ h×nh que ë vâng m¹c chøa hµng triÖu protein thô
h×nh nãn mµu ®á vµ xanh lôc. thÓ liªn kÕt mµng tÕ bµo cã vai trß c¶m nhËn ¸nh s¸ng. (b) c¸c thô
C¶ hai gen m· hãa cho c¸c thÓ c¶m nhËn ¸nh s¸ng ë tÕ bµo h×nh que lµ rhodopsin. C¸c protein
protein c¶m nhËn mµu ®á vµ thô thÓ c¶m nhËn mµu ®á, xanh lam vµ lôc cã ë c¸c tÕ bµo h×nh nãn
xanh lôc ®Òu n»m trªn NST X, gièng víi rhodopsin ë phÇn lín tr×nh tù, nh−ng vÉn ®ñ kh¸c biÖt dÉn
vµ xÕp thµnh mét chuçi kÕ tiÕp ®Õn kh¶ n¨ng thô c¶m mµu s¾c kh¸c nhau. (c) c¸c gen m· hãa
nhau. Mçi NST X ë ng−êi protein c¶m nhËn mµu ®á (1) vµ lôc (2) n»m thµnh chuçi trªn NST
X. Ng−êi b×nh th−êng cã 1 b¶n sao gen m· hãa protein c¶m nhËn
th−êng mang 1 gen m· hãa mµu ®á vµ tõ 1 ®Õn 5 b¶n sao gen m· hãa protein c¶m nhËn mµu
protein c¶m nhËn ¸nh s¸ng ®á lôc. (d) sù tiÕn hãa cña c¸c protein c¶m nhËn mµu s¾c cho thÊy
duy nhÊt, nh−ng cã 1 - 5 b¶n chóng cïng xuÊt ph¸t tõ mét gen tiÒn th©n, tr¶i qua ba ®ét biÕn lÆp
sao gen m· hãa protein c¶m ®o¹n gen ®éc lËp, sau ®ã lµ sù ph©n ly vÒ chøc n¨ng cña c¸c gen.
nhËn ¸nh s¸ng xanh lôc n»m liÒn kÒ nhau (h×nh 10.18c).
10.7.3. Hä gen rhodopsin tiÕn hãa do hiÖn t−îng lÆp ®o¹n vµ ph©n li chøc n¨ng
Sù gièng nhau vÒ cÊu tróc vµ chøc n¨ng gi÷a bèn lo¹i protein rhodopsin cho thÊy
c¸c gen m· hãa c¸c protein nµy xuÊt hiÖn do hiÖn t−îng lÆp ®o¹n cña mét gen thô thÓ
320
Ch−¬ng 10. Di truyÒn häc ph©n tö vµ tiÕn ho¸
c¶m nhËn ¸nh s¸ng tiÒn th©n, råi tiÕp tôc ph©n li do sù tÝch lòy ®ét biÕn. C¸c ®ét biÕn t¹o
nªn kh¶ n¨ng c¶m nhËn mµu s¾c ®−îc −u tiªn chän läc qua hµng triÖu n¨m tiÕn hãa. C¸c
protein c¶m nhËn ¸nh s¸ng ®á vµ xanh lôc gièng nhau h¬n c¶ (chØ kh¸c nhau 15 axit
amin), cho thÊy chóng ®−îc ph©n li gÇn ®©y. Cßn sù gièng nhau vµ kh¸c nhau gi÷a hai
lo¹i protein c¶m nhËn mµu xanh lam vµ rhodopsin, còng nh− so s¸nh víi hai lo¹i protein
cßn l¹i, cho thÊy hai lo¹i protein ®−îc nh¾c ®Õn tr−íc xuÊt hiÖn vµ ph©n li sím h¬n trong
qu¸ tr×nh tiÕn hãa (h×nh 10.18d).
10.7.4. §ét biÕn ë hä gen rhodopsin ¶nh h−ëng ®Õn thÞ lùc vµ kh¶ n¨ng nhËn
biÕt mµu
10.7.4.1. NhiÒu ®ét biÕn thay thÕ axit amin ë rhodopsin g©y mï toµn phÇn hay mét phÇn
Ng−êi ta ®· ph¸t hiÖn ®−îc Ýt nhÊt 29 d¹ng ®ét biÕn thay thÕ axit amin trong
protein rhodopsin g©y nªn mét nhãm bÖnh di truyÒn tréi n»m trªn NST th−êng (gäi
chung lµ c¸c bÖnh lo¹n s¾c tè vâng m¹c, retinitis pigmentosa) víi biÓu hiÖn lµ: ban ®Çu
c¸c tÕ bµo h×nh que mÊt chøc n¨ng, råi dÇn dÇn c¸c tÕ bµo vâng m¹c ngo¹i vi bÞ tho¸i hãa.
Nh÷ng ®ét biÕn nµy g©y nªn sù gÊp nÕp sai cña rhodopsin, hoÆc lµm protein nµy trë nªn
kÐm bÒn. B×nh th−êng, protein rhodopsin ph¶i g¾n vµo mµng tÕ bµo h×nh que, nh−ng khi
bÞ ®ét biÕn chóng kh«ng g¾n ®−îc vµo mµng tÕ bµo vµ kh«ng biÓu hiÖn ®−îc chøc n¨ng
b×nh th−êng. Khi kh«ng cã ®ñ rhodopsin trªn mµng tÕ bµo, tÕ bµo h×nh que th−êng bÞ
chÕt. Tïy theo sè tÕ bµo h×nh que chÕt, ng−êi bÖnh cã thÓ bÞ mï hoµn toµn hay mét phÇn.
C¸c ®ét biÕn kh¸c ë gen m· hãa rhodopsin cßn g©y nªn mét d¹ng bÖnh lý Ýt nghiªm
träng h¬n lµ bÖnh mï ban ®ªm. C¸c ®ét biÕn nµy lµm thay ®æi tr×nh tù cña c¸c axit amin
trong ph©n tö protein theo h−íng lµm t¨ng ng−ìng ¸nh s¸ng kÝch thÝch cÇn thiÕt ®Ó khëi
®Çu chuçi truyÒn tÝn hiÖu c¶m nhËn ¸nh s¸ng. Víi nh÷ng thay ®æi nµy, khi c−êng ®é ¸nh
s¸ng yÕu, m¾t kh«ng c¶m nhËn ®−îc mµu s¾c.
10.7.4.2. C¸c ®ét biÕn gen ë tÕ bµo h×nh nãn lµm gi¶m thÞ lùc theo kiÓu dù ®o¸n ®−îc
C¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn liªn quan ®Õn c¸c gen s¾c tè thuéc tÕ bµo
h×nh nãn Ýt nghiªm träng h¬n so víi c¸c rèi lo¹n thÞ lùc g©y ra bëi c¸c ®ét biÕn t−¬ng tù
x¶y ra víi c¸c gen rhodopsin trong c¸c tÕ bµo h×nh que. Nguyªn nh©n chñ yÕu cã lÏ bëi v×
c¸c tÕ bµo h×nh que chiÕm ®Õn 95% sè n¬ron thÇn kinh c¶m nhËn mµu s¾c ë ng−êi, trong
khi c¸c tÕ bµo h×nh nãn chØ chiÕm 5%. Mét sè ®ét biÕn liªn quan ®Õn gen m· hãa protein
c¶m nhËn mµu xanh lam n»m trªn NST sè 7 g©y nªn héi chøng rèi lo¹n thÞ lùc s¾c tè
xanh (tritanopia). C¸c ®ét biÕn ë gen m· hãa protein c¶m nhËn s¾c tè ®á trªn NST X cã
thÓ lµm mÊt chøc n¨ng c¶m nhËn mµu ®á cña c¸c tÕ bµo h×nh nãn vµ g©y bÖnh mï mµu
®á. Mét sè ®ét biÕn nhá kh¸c liªn quan ®Õn gen quy ®Þnh protein c¶m nhËn mµu ®á cã thÓ
g©y nªn bÖnh mï mµu ®á mét phÇn hoÆc hoµn toµn tïy vµo vÞ trÝ ®ét biÕn.
10.7.4.3. Trao ®æi chÐo kh«ng c©n gi÷a c¸c gen m· hãa protein c¶m nhËn mµu xanh lôc
vµ ®á trªn NST X g©y ra phÇn lín c¸c rèi lo¹n thÞ lùc vÒ c¶m nhËn mµu
Mét ng−êi b×nh th−êng chØ cã mét gen duy nhÊt m· hãa protein c¶m nhËn mµu ®á
n»m trªn NST X; nh−ng n»m kÒ gen nµy cã tõ mét ®Õn n¨m b¶n sao gen m· hãa protein
c¶m nhËn mµu xanh lôc. C¸c gen ®á vµ xanh lôc cã tr×nh tù ADN gièng nhau 96%. C¸c
b¶n sao kh¸c nhau cña gen xanh lôc gièng nhau ®Õn 99,9%. Sù gièng nhau vµ n»m gÇn
nhau cña nh÷ng gen nµy lµm hiÖn t−îng trao ®æi chÐo kh«ng c©n rÊt dÔ x¶y ra. Cã lÏ v×
vËy, nhiÒu ®ét biÕn mÊt gen mµu ®á ®· ®−îc t×m thÊy lµ do sù trao ®æi chÐo kh«ng c©n ë
vïng gen nµy. KÕt qu¶ cña nh÷ng trao ®æi chÐo nµy lµ sù tæ hîp l¹i cña c¸c gen xanh lôc,
hoÆc t¹o ra c¸c gen lai míi “xanh lôc - ®á”. Do kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc
phô thuéc vµo tØ lÖ ¸nh s¸ng ®á vµ xanh lôc ®−îc ph¶n chiÕu tõ h×nh ¶nh, nh÷ng ng−êi
thiÕu c¸c gen nµy sÏ c¶m nhËn hai mµu ®á vµ xanh lôc nh− mét mµu gièng nhau.
321
§inh §oµn Long
10.7.4.4. Mét sè ®ét biÕn cã thÓ lµm mÊt kh¶ n¨ng c¶m nhËn mµu ®á vµ xanh lôc
§Õn nay, ®· ph¸t hiÖn cã b¶y d¹ng ®ét biÕn mÊt ®o¹n NST g©y bÖnh mï mµu ®á vµ
xanh lôc liªn kÕt víi NST giíi tÝnh X. BÖnh lý nµy ®−îc gäi lµ héi chøng tÕ bµo h×nh nãn
®¬n s¾c xanh lam (blue cone monochromacy). Nh÷ng ng−êi m¾c héi chøng nµy chØ c¶m
nhËn ®−îc mµu liªn quan ®Õn mµu xanh lam. Nghiªn cøu ph©n tö cho thÊy: c¶ b¶y ®ét
biÕn mÊt ®o¹n nµy ®Òu liªn quan ®Õn mét tr×nh tù gåm 600 bp n»m ngoµi vïng m· hãa
cña c¸c gen ®á vµ xanh lôc. §iÒu nµy cho thÊy ®©y cã thÓ lµ ®o¹n tr×nh tù ®iÒu hßa dµi
cÇn cho sù biÓu hiÖn cña chuçi c¸c gen c¶m nhËn mµu ®á vµ xanh lôc.
Nh− vËy, chóng ta nh×n vµ c¶m nhËn ®−îc c¸c mµu s¾c ®a d¹ng, phong phó cña
v¹n vËt mét phÇn lµ nhê bèn gen trùc tiÕp m· hãa bèn lo¹i protein trong c¸c tÕ bµo
h×nh que vµ h×nh nãn ë vâng m¹c m¾t. C¸c ®ét biÕn lµm thay ®æi nh÷ng gen nµy hoÆc
sè l−îng cña chóng cã thÓ lµm gi¶m thÞ lùc, thËm chÝ lµm háng kh¶ n¨ng c¶m nhËn
mµu s¾c cña m¾t.
322
Ch−¬ng 11
Ph©n tÝch gen vµ s¶n phÈm cña gen
11.1. Giíi thiÖu chung
ë c¸c ch−¬ng tr−íc, chóng ta ®· ®Ò cËp ®Õn c¸c c¬ chÕ cña c¸c hiÖn t−îng di truyÒn
ë cÊp ph©n tö vµ tÕ bµo, trong ®ã cã sù ®iÒu hßa biÓu hiÖn cña c¸c gen, phÇn nµo gi¶i
thÝch ®−îc sù tiÕn hãa cña sinh vËt trªn c¬ së c¸c quy luËt biÕn ®æi cña vËt chÊt di truyÒn
(ADN vµ NST). Ch−¬ng nµy ®Ò cËp ®Õn mét sè ph−¬ng ph¸p c¬ b¶n cña sinh häc ph©n tö
vµ hãa sinh häc ®−îc dïng trong viÖc ph©n tÝch gen (ADN) vµ s¶n phÈm cña gen (ARN vµ
protein).
Trong bèi c¶nh c«ng nghÖ sinh häc vµ sinh häc ph©n tö ph¸t triÓn hÕt søc m¹nh mÏ
trong nh÷ng n¨m qua, ch¾c ch¾n gi¸o tr×nh nµy kh«ng thÓ ph¶n ¸nh ®Çy ®ñ c¸c ph−¬ng
ph¸p ®· ®−îc sö dông trong c¸c nghiªn cøu vÒ gen vµ s¶n phÈm cña gen, mµ chØ cã thÓ ®Ò
cËp ®Õn nguyªn lý cña mét sè ph−¬ng ph¸p c¬ b¶n ®−îc dïng phæ biÕn hiÖn nay trong c¸c
nghiªn cøu di truyÒn häc ë cÊp ®é ph©n tö. PhÇn ®Çu cña ch−¬ng m« t¶ c¸c ph−¬ng ph¸p
®−îc dïng trong ph©n tÝch c¸c axit nucleic, bao gåm tõ t¸ch chiÕt ADN, ph©n lËp gen ®Õn
gi¶i tr×nh tù vµ so s¸nh c¸c hÖ gen (genomics). PhÇn sau cña ch−¬ng ®Ò cËp ®Õn c¸c kü
thuËt t¸ch chiÕt vµ ph©n tÝch protein lµ s¶n phÈm cña hÇu hÕt c¸c gen, bao gåm tõ viÖc
tinh s¹ch protein ®Õn c¸c kü thuËt ph©n tÝch ho¹t tÝnh protein ë c¸c tÕ bµo vµ m«
(proteomics). Tuy ®−îc ®Ò cËp ë c¸c phÇn t¸ch biÖt, nh−ng thùc tÕ c¸c kü thuËt ph©n tÝch
ADN vµ protein ®Òu dùa trªn mét sè nguyªn lý chung vµ th−êng ®−îc sö dông phèi hîp
trong c¸c nghiªn cøu.
11.2. C¸c kü thuËt ph©n tÝch axit nucleic
11.2.1. T¸ch chiÕt vµ tinh s¹ch ADN
HÇu hÕt c¸c nghiªn cøu ph©n tÝch gen ®Òu b¾t ®Çu b»ng viÖc ph¶i t¸ch chiÕt vµ tinh
s¹ch ADN tõ c¸c ®èi t−îng nghiªn cøu. Dï lµ t¸ch chiÕt ADN tõ vi khuÈn, ®éng vËt hay
thùc vËt th× mét sè b−íc ®Çu tiªn cña qui tr×nh ®Òu cÇn “gi¶i phãng” c¸c thµnh phÇn cña
tÕ bµo vµo dung dÞch. Do vi khuÈn th−êng tån t¹i ë d¹ng c¸c tÕ bµo ®¬n, kh«ng cã cÊu
tróc x−¬ng, kh«ng tÝch lòy chÊt bÐo, Ýt hîp chÊt sinh häc thø cÊp ... nªn viÖc t¸ch chiÕt
ADN th−êng t−¬ng ®èi ®¬n gi¶n. Ng−îc l¹i, phÇn lín c¸c m« thùc vËt vµ ®éng vËt th−êng
cÇn ph¶i nghiÒn nhá trong nit¬ láng thµnh nh÷ng h¹t mÞn tr−íc khi cã thÓ t¸ch ADN.
ViÖc t¸ch chiÕt ADN tõ tÕ bµo ®éng vËt (vÝ dô: tõ ®u«i chuét) ®«i khi cÇn c¸c enzym ph©n
hñy c¸c m« liªn kÕt gióp t¨ng hiÖu qu¶ gi¶i phãng c¸c tÕ bµo vµ thµnh phÇn cña chóng
vµo dÞch chiÕt. §Æc biÖt, c¸c tÕ bµo thùc vËt cã thµnh cøng, nªn th−êng ph¶i sö dông c¸c
biÖn ph¸p c¬ häc (vÝ dô: sö dông m¸y xay, nghiÒn b»ng cèi) hoÆc sö dông mét sè enzym
®Æc hiÖu ph©n hñy thµnh tÕ bµo tr−íc khi cã thÓ t¸ch ADN. C¸c tÕ bµo thùc vËt cßn cã
®Æc ®iÓm phæ biÕn lµ tÝch lòy c¸c hîp chÊt sinh häc thø cÊp ë hµm l−îng cao, nªn ®Ó lo¹i
bá c¸c hîp chÊt nµy th−êng ph¶i bæ sung vµo dung dÞch chiÕt mét sè hîp chÊt, vÝ dô nh−
CTAB (cetyltrimethylammonium bromide) gióp t¨ng hiÖu qu¶ lo¹i bá c¸c hîp chÊt
polysaccharide vµ polyphenol. C¸c qui tr×nh t¸ch chiÕt ADN ®¬n gi¶n nhÊt lµ ë vi khuÈn.
§Çu tiªn c¸c tÕ bµo vi khuÈn cã thÓ ®−îc xö lý víi enzym lysozyme gióp ph©n hñy líp
petidoglycan trªn thµnh tÕ bµo. Sau ®ã, mÉu ®−îc xö lý tiÕp víi c¸c hîp chÊt tÈy lµm
323
§inh §oµn Long
ph©n r· c¸c cÊu tróc lipid trªn ADN vµ ARN
trong n−íc
mµng tÕ bµo. C¸c hîp chÊt t¹o
phøc kiÓu EDTA (ethylene
diamine tetraacetate) còng Bæ sung L¾c Ly t©m
th−êng ®−îc dïng ®Ó lo¹i bá Phenol m¹nh
c¸c ion kim lo¹i. Trong c¸c
b−íc nh− vËy, ADN ®−îc gi¶i Phenol Protein
ADN, ARN vµ trong
phãng vµo dÞch chiÕt vµ sau ®ã protein trong
®−îc tinh s¹ch.
Cã hai ph−¬ng ph¸p phæ pha n−íc phenol
biÕn ®−îc dïng phèi hîp ®Ó H×nh 11.1. Dïng phenol lo¹i protein khái dÞch chiÕt ADN vµ ARN.
tinh s¹ch ADN lµ ly t©m vµ
chiÕt xuÊt bëi dung m«i. Nguyªn lý cña ph−¬ng ph¸p ly t©m lµ khi dÞch chiÕt tÕ bµo
®−îc “quay” ë tèc ®é cao th× lùc ly t©m lµm l¾ng ®äng c¸c thµnh phÇn tÕ bµo cã khèi
l−îng vµ kÝch th−íc lín. Ch¼ng h¹n, khi thµnh tÕ bµo cña vi khuÈn ®· bÞ ph©n gi¶i th×
hÇu hÕt c¸c thµnh phÇn tÕ bµo cña nã ë d¹ng hßa tan trong dÞch chiÕt bëi chóng cã kÝch
th−íc nhá, cßn ADN vµ mét sè chÊt cã khèi l−îng ph©n tö lín sÏ l¾ng xuèng ®¸y èng ly
t©m. Lóc nµy, dÞch chiÕt mang c¸c thµnh phÇn tÕ bµo bÞ ph©n hñy dÔ dµng ®−îc hót ra
vµ lo¹i bá.
H¹t kÕt tña mang ADN sau ®ã ®−îc hßa tan trë l¹i trong dung dÞch ®Öm phï hîp.
Tuy nhiªn, nã th−êng cßn lÉn ARN vµ protein. C¸c hîp chÊt nµy sau ®ã cã thÓ ®−îc lo¹i
bá nhê sö dông c¸c dung m«i thÝch hîp. Trong b−íc tinh s¹ch ADN, phenol lµ mét dung
m«i cã hiÖu qu¶ cao vµ ®−îc dïng réng r·i, tuy nã kh¸ ®éc bëi kh¶ n¨ng hßa tan vµ g©y
biÕn tÝnh m¹nh protein. ViÖc sö dông phenol gióp hßa tan vµ t¸ch bá protein khái ADN.
Khi bæ sung phenol vµo n−íc, hai chÊt láng nµy kh«ng thÓ trén víi nhau thµnh dung dÞch
®ång nhÊt, mµ thay vµo ®ã phenol sÏ t¸ch ra thµnh líp riªng ë d−íi líp n−íc (h×nh 11.1).
Tuy vËy, khi l¾c m¹nh, hai líp dÞch nµy cã thÓ hßa vµo nhau thµnh hçn hîp “t¹m thêi”;
lóc ®ã, protein sÏ hßa tan vµo phenol. Sau ®ã, khi ®−a dung dÞch hçn hîp vÒ tr¹ng th¸i
tÜnh, hai pha phenol vµ n−íc l¹i t¸ch nhau ra. Lóc nµy, pha phenol mang nhiÒu ph©n tö
protein ë d¹ng hßa tan, cßn hÇu hÕt ADN vµ ARN chØ cã ë pha n−íc. ViÖc hót n−íc (líp ë
trªn) ra khái hçn hîp sÏ gióp t¸ch axit nucleic khái protein. §Ó gi¶m tèi ®a l−îng protein
cßn sãt l¹i, b−íc chiÕt xuÊt b»ng phenol cã thÓ ®−îc thùc hiÖn lÆp l¹i nhiÒu lÇn. Mét sè
quy tr×nh t¸ch chiÕt ADN gÇn ®©y nh»m tr¸nh phenol (v× tÝnh ®éc cña nã) ®· cã mét sè
c¶i tiÕn. Phæ biÕn nhÊt lµ viÖc sö dông c¸c cét chøa chÊt nÒn liªn kÕt ®Æc hiÖu ADN.
Trong ®ã, hai nhãm chÊt nÒn th«ng dông nhÊt lµ silic dioxide vµ c¸c hîp chÊt trao ®æi
anion. C¸c chÊt nÒn dùa trªn silic dioxide cã kh¶ n¨ng liªn kÕt ®Æc hiÖu víi ADN ë nång
®é muèi thÊp vµ pH cao. Trong khi ®ã, c¸c chÊt nÒn trao ®æi anion, nh−
diethylaminoethyl-cellulose, tÝch ®iÖn d−¬ng liªn kÕt m¹nh víi khung ®−êng-phosphate
cña ph©n tö ADN. Khi sö dông c¸c chÊt nÒn trao ®æi anion ë nång ®é muèi thÊp, ADN
®−îc “b¾t gi÷” trong cét; nh−ng khi nång ®é muèi t¨ng, ADN sÏ ®−îc röa tr«i khái cét bëi
nång ®é muèi cao lµm ph¸ vì c¸c liªn kÕt ion gi÷a ADN vµ chÊt nÒn.
B−íc tiÕp theo cña viÖc tinh s¹ch ADN lµ cÇn lo¹i bá ARN. ViÖc nµy th−êng ®−îc
thùc hiÖn nhê c¸c enzym ribonuclease (vÝ dô: RNase A). Nhãm enzym nµy cã kh¶ n¨ng
nhËn biÕt ®Æc hiÖu ARN (qua nhãm C2’-OH) vµ ph©n gi¶i chóng thµnh nh÷ng ®o¹n nhá,
mµ hÇu nh− kh«ng t¸c ®éng ®Õn c¸c ph©n tö ADN. Trong b−íc xö lý ribonuclease, hçn
hîp ADN vµ ARN ®−îc ñ ë nhiÖt ®é tèi −u cña enzym. Sau ®ã, dÞch chiÕt ®−îc bæ sung
mét thÓ tÝch t−¬ng ®−¬ng cña alcohol (etanol hay isoamylalcohol). C¸c hîp chÊt alcohol
lµm kÕt tña c¸c ph©n tö kÝch th−íc lín mµ lóc nµy trong dÞch chiÕt chØ cßn chñ yÕu lµ
ADN. C¸c ®o¹n ARN nhá ë d¹ng hßa tan nªn cã thÓ dÔ dµng hót ra vµ lo¹i bá. §iÓm ®¸ng
l−u ý lµ c¸c alcohol lµm kÕt tña c¸c ®¹i ph©n tö mét c¸ch kh«ng ®Æc hiÖu, nªn c¸c hîp
324
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
chÊt nh− hydrat carbon vµ protein cã thÓ cïng kÕt tña víi ADN vµ ARN. ThÕ nªn, b−íc
kÕt tña b»ng alcohol th−êng chØ ®−îc thùc hiÖn sau khi c¸c thµnh phÇn kh¸c cña tÕ bµo
®· ®−îc lo¹i bá khái dÞch chiÕt nhê ly t©m vµ/hoÆc chiÕt xuÊt bëi phenol.
Hçn hîp ADN vµ ARN sau khi ®−îc xö lý b»ng ribonuclease råi bæ sung etanol ®−îc
ly t©m ®Ó thu kÕt tña ADN, cßn ARN ë d¹ng hßa tan trong dÞch chiÕt ®−îc hót ra vµ lo¹i
bá. H¹t ADN kÕt tña ë ®¸y èng ly t©m ®«i khi rÊt nhá (thËm chÝ kh«ng nh×n thÊy b»ng
m¾t th−êng), nh−ng ®· chøa hµng triÖu ph©n tö ADN vµ th−êng lµ ®ñ cho c¸c nghiªn
cøu tiÕp theo. ADN lóc nµy cã møc ®é tinh s¹ch cao, ®−îc hßa tan trë l¹i trong dung dÞch
®Öm n−íc vµ cã thÓ sö dông cho c¸c thÝ nghiÖm ph©n tÝch ADN sau ®ã.
11.2.2. Sö dông quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ ARN
C¸c cÊu tróc vßng th¬m (purine vµ pyrimidine) cña c¸c nucleotide cÊu t¹o nªn ADN
vµ ARN t¹o cho c¸c ph©n tö nµy cã c−êng ®é hÊp thô tia tö ngo¹i cùc ®¹i ë vïng b−íc
sãng 260 nm (t−¬ng øng víi tia UV). Khi tia UV ®−îc chiÕu qua dung dÞch axit nucleic,
møc hÊp thô tia UV (A260 hay OD260) phô thuéc vµo nång ®é cña c¸c axit nucleic. TÝnh
chÊt nµy lµ nguyªn lý c¬ b¶n cña viÖc dïng m¸y quang phæ ®Ó x¸c ®Þnh nång ®é ADN vµ
ARN trong dung dÞch. Theo ®ã, dùa trªn nång ®é ADN hoÆc ARN cña c¸c dung dÞch
chuÈn biÕt tr−íc, c¸c gi¸ trÞ A260 t−¬ng øng ®−îc dïng ®Ó vÏ ®−êng tuyÕn tÝnh chuÈn
t−¬ng quan gi÷a nång ®é axit nucleic víi chØ sè A260. Dùa trªn ®−êng chuÈn nµy, cã thÓ
x¸c ®Þnh ®−îc nång ®é ADN hoÆc ARN cã trong dung dÞch mÉu sau khi ®o ®−îc chØ sè A260
cña nã.
Kh¸c víi ADN vµ ARN, protein hÊp thô tia tö ngo¹i cùc ®¹i ë b−íc sãng 280nm
(®iÒu nµy chñ yÕu lµ do cÊu tróc vßng th¬m cña axit amin tryptophan). §é tinh s¹ch cña
dÞch chiÕt ADN cã thÓ x¸c ®Þnh qua tØ sè A260/A280. DÞch chiÕt chØ chøa ADN tinh s¹ch cã tØ
sè A260/A280 xÊp xØ 1,8. NÕu cã protein, tØ sè nµy th−êng thÊp h¬n 1,8. Cßn nÕu cã ARN, tØ
sè nµy lín h¬n 1,8. DÞch chiÕt chØ chøa ARN tinh s¹ch cã tØ sè A260/A280 xÊp xØ 2,0.
Trong dung dÞch chØ chøa c¸c nucleotide ®¬n lÎ, v× c¸c nucleotide hßa tan kh¾p
dung dÞch, nªn c−êng ®é hÊp thô cña chóng lín h¬n khi chóng ë trong c¸c ph©n tö ADN
vµ ARN. Së dÜ nh− vËy lµ do c−êng ®é hÊp thô tia UV chñ yÕu do c¸c vßng purine vµ
pyrimidine chø kh«ng ph¶i do phÇn ®−êng vµ phosphate. Trong ph©n tö ADN sîi kÐp,
c¸c vßng purine vµ pyrimidine bÞ “ch¾n” bëi khung ®−êng-phosphate, nªn c−êng ®é hÊp
thô tia UV gi¶m. C¸c ph©n tö ARN vµ ADN cã cÊu tróc d¹ng m¹ch ®¬n víi mét sè vïng
cã thÓ cã cÊu tróc sîi kÐp nªn cã møc hÊp thô trung b×nh. Hµm l−îng ADN vµ ARN trong
dung dÞch th−êng ®−îc qui ®æi trªn c¬ së chØ sè A260 theo c«ng thøc:
1 A260 cña dung dÞch ADN sîi kÐp (dsADN) = 50 µg
1 A260 cña dung dÞch ADN m¹ch ®¬n (ssADN)/ARN = 40 µg
1 A260 cña dung dÞch dNTP/oligonucleotide = 33 µg
11.2.3. §iÖn di ph©n tÝch axit nucleic
Cã nhiÒu ph−¬ng ph¸p kh¸c nhau cã thÓ dïng ®Ó ph©n tÝch ADN, nh−ng ®Õn nay
®iÖn di trªn gel lµ ph−¬ng ph¸p ®−îc dïng phæ biÕn nhÊt nhê −u ®iÓm nhanh vµ ®¬n
gi¶n. Nguyªn t¾c cña ph−¬ng ph¸p lµ: d−íi t¸c ®éng cña ®iÖn tr−êng, c¸c ph©n tö axit
nucleic (tÝch ®iÖn ©m) kh¸c nhau vÒ kÝch th−íc, ®iÖn tÝch, møc ®é cuén xo¾n vµ d¹ng
ph©n tö (m¹ch th¼ng hay vßng) sÏ di chuyÓn qua hÖ m¹ng cña gel tõ cùc ©m (cathode)
sang cùc d−¬ng (anode) víi tèc ®é di chuyÓn kh¸c nhau. V× vËy, chóng dÇn dÇn t¸ch nhau
ra trªn tr−êng ®iÖn di; qua ®ã, ng−êi ta cã thÓ thu thËp vµ ph©n tÝch ®−îc tõng ph©n
®o¹n ADN hoÆc gen riªng rÏ. Trªn tr−êng ®iÖn di, c¸c ph©n ®o¹n ADN cã kÝch th−íc cµng
nhá cµng di chuyÓn nhanh. Sau khi ®iÖn di kÕt thóc, c¸c ph©n tö ADN cã thÓ quan s¸t
325
§inh §oµn Long
®−îc nhê sö dông thuèc nhuém ph¸t huúnh quang, nh− ethidium bromide (EtBr, xem c¬
chÕ ë ch−¬ng 3). Mçi b¨ng ®iÖn di th−êng ph¶n ¸nh mét tËp hîp c¸c ph©n tö ADN cã
cïng kÝch th−íc.
Cã hai lo¹i gel ®iÖn di ®−îc dïng phæ biÕn lµ agarose vµ polyacrylamide. Trong
®ã, gel polyacrylamide cã ®é ph©n gi¶i cao, nh−ng vïng kÝch th−íc ADN cã thÓ ph©n tÝch
hÑp. Cô thÓ, ph−¬ng ph¸p nµy cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau thËm chÝ chØ
mét cÆp nucleotide (1 bp), nh−ng th−êng chØ dïng ®Ó ph©n tÝch c¸c ®o¹n ADN kÝch th−íc
nhá (tõ 5 ®Õn 1000 bp). Trong khi ®ã, gel agarose cã ®é ph©n gi¶i thÊp ®èi víi c¸c ®o¹n
ADN kÝch th−íc nhá, nh−ng rÊt hiÖu qu¶ khi ph©n t¸ch c¸c ®o¹n ADN kÝch th−íc lín
(kho¶ng tõ 200 bp ®Õn 20 kb; 1 kb = 1000 bp).
C¸c ®o¹n ADN kÝch th−íc lín kh«ng thÓ “lät” qua c¸c lç nhá trªn c¸c b¶n gel, kÓ c¶
gel agarose. Thay vµo ®ã, chóng (th−êng ë d¹ng m¹ch th¼ng) “tr−ên” qua m¹ng l−íi gel
b»ng c¸ch ®Çu nµy cña ph©n tö ®i tr−íc, cßn ®Çu kia theo sau. HËu qu¶ lµ c¸c ®o¹n ADN
lín (tõ 10 kb ®Õn 10 Mb; 1 Mb = 1000 kb) cã tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di gÇn
t−¬ng ®−¬ng vµ khã ph©n t¸ch nhê ®iÖn di th«ng th−êng. §èi víi c¸c ®o¹n ADN lín nh−
vËy, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di xung tr−êng (PFGE, pulsed-field gel
electrophoresis). Trong ph−¬ng ph¸p nµy, 2 cÆp ®iÖn cùc ®−îc ®Æt chÐo gãc trªn b¶n ®iÖn
di (h×nh 11.2). ViÖc “bËt” vµ “t¾t” lu©n phiªn 2 cÆp ®iÖn cùc lµm c¸c ®o¹n ADN lín thay
®æi chiÒu dÞch chuyÓn nh− m×nh häa trªn h×nh. C¸c ®o¹n ADN cã kÝch th−íc cµng lín
cµng chËm h¬n trong qu¸ tr×nh ®æi chiÒu dÞch chuyÓn. Nhê vËy, c¸c ®o¹n kÝch th−íc kh¸c
nhau sÏ t¸ch khái nhau. Kü thuËt PFGE trong thùc tÕ cã thÓ dïng ®Ó x¸c ®Þnh trùc tiÕp
kÝch th−íc cña nhiÔm s¾c thÓ (NST) vi khuÈn, hoÆc NST sinh vËt nh©n thËt bËc thÊp,
nh− nÊm men hoÆc mét sè nguyªn sinh ®éng vËt. KÝch th−íc hÖ gen cña nh÷ng loµi nµy
kho¶ng vµi Mb.
§èi víi c¸c ®o¹n ADN kÝch th−íc nhá chØ kh¸c nhau mét vµi bp, vÝ dô nh− c¸c s¶n
phÈm PCR cña c¸c alen thuéc cïng locut, ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®iÖn di
biÕn tÝnh gradient (DGGE). Trong kü thuËt DGGE, c¸c ph©n tö ADN sîi kÐp ®−îc g©y
biÕn tÝnh bëi nhiÖt hoÆc hãa chÊt, nh− urª hay formamide (®«i khi phèi hîp c¶ hai
ph−¬ng ph¸p) ®ång thêi víi qu¸ tr×nh diÖn di. NhiÖt ®é th−êng ®−îc duy tr× cao (50 –
§iÖn cùc 0% Gradient biÕn tÝnh 70% C¸c giÕng tra mÉu
ChiÒu dÞch chuyÓn cña ADN ThÓ ®ét biÕn 1 Gradient biÕn tÝnh 40%
dÔ biÕn tÝnh h¬n
ADN
kiÓu d¹i
ThÓ ®ét biÕn 2 70%
khã biÕn tÝnh h¬n
DGGE vu«ng gãc DGGE song song
H×nh 11.2. Kü thuËt ®iÖn di xung tr−êng. H×nh 11.3 C¸c kü thuËt ®iÖn di biÕn tÝnh gradient DGGE
A vµ B lµ hai bé ®iÖn cùc. Chóng ®−îc bËt vµ t¾t (Denaturing gradient gel electrophoresis). Trong DGGE vu«ng gãc,
lu©n phiªn. Khi bËt A, ph©n tö ADN di chuyÓn vÒ hçn hîp 3 ®o¹n ADN (kiÓu d¹i, ®ét biÕn 1 vµ 2) ®−îc tra vµo mét
gãc ph¶i phÝa d−íi. Khi A t¾t vµ B bËt, ph©n tö giÕng dµi n»m ngang b¶n gel. Do t¸c ®éng cña chÊt g©y biÕn tÝnh ë
ADN di chuyÓn vÒ gãc tr¸i phÝa d−íi. Mòi tªn m« nång ®é kh¸c nhau, sù ®Þnh vÞ cña c¸c ®o¹n ADN t¹o nªn d¹ng
t¶ h−íng di chuyÓn cña ph©n tö ADN trong ®iÖn ®−êng cong sigma. §iÖn di DGGE song song t¹o nªn phæ ®iÖn di
di xung tr−êng. gièng ®iÖn di trªn gel th«ng th−êng.
326
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
65oC) vµ æn ®Þnh, trong khi nång ®é urª vµ formamide ®−îc t¨ng dÇn theo chiÒu song
song (DGGE song song) hoÆc vu«ng gãc (DGGE vu«ng gãc) víi chiÒu ®iÖn di. Trong
DGGE song song, kÕt qu¶ ®iÖn di h×nh thµnh c¸c b¨ng t¸ch biÖt gièng ®iÖn di trªn gel
agarose. Trong DGGE vu«ng gãc, hçn hîp c¸c ph©n tö ADN chØ kh¸c biÖt nhau mét hoÆc
mét vµi bp ph©n t¸n kh¾p b¶n gel vµ t¹o nªn mét chuçi b¨ng d¹ng ®−êng cong sigma
(h×nh 11.3).
§iÖn di kh«ng nh÷ng cã thÓ ph©n t¸ch c¸c ®o¹n ADN kh¸c nhau vÒ kÝch th−íc mµ
c¶ vÒ h×nh d¹ng vµ cÊu h×nh cña chóng. C¸c ph©n tö ADN ë d¹ng m¹ch vßng duçi xo¾n
hoÆc bÞ “®øt g·y” ë mét sè nucleotide di chuyÓn chËm h¬n trªn tr−êng ®iÖn di so víi c¸c
ph©n tö ADN ë d¹ng m¹ch th¼ng cã cïng khèi l−îng. Trong khi ®ã, c¸c ph©n tö ADN ë
d¹ng siªu xo¾n (kÝch th−íc thu nhá) th−êng di chuyÓn nhanh h¬n trªn tr−êng ®iÖn di so
víi c¸c ph©n tö ADN d¹ng m¹ch vßng duçi xo¾n hoÆc cã møc ®é cuén xo¾n thÊp h¬n cã
cïng khèi l−îng.
Kü thuËt ®iÖn di còng ®−îc dïng ®Ó ph©n t¸ch ARN. Gièng ADN, c¸c ph©n tö ARN
còng tÝch ®iÖn ©m. Tuy nhiªn, nÕu nh− c¸c ®o¹n ADN sîi kÐp th¼ng th−êng cã cÊu tróc
bËc hai ®ång nhÊt (nªn tèc ®é dÞch chuyÓn trªn tr−êng ®iÖn di t−¬ng quan víi khèi l−îng
cña chóng), th× ARN ngoµi cÊu tróc m¹ch ®¬n, cßn cã c¸c cÊu tróc bËc 2 vµ 3 ¶nh h−ëng
®Õn tèc ®é dÞch chuyÓn cña chóng trªn tr−êng ®iÖn di. §Ó h¹n chÕ ®iÒu nµy, ng−êi ta
th−êng xö lý ARN víi mét sè hãa chÊt ph¸ vì liªn kÕt côc bé trong ph©n tö, nh− glyoxal.
Hîp chÊt nµy liªn kÕt vµo nhãm -NH2 cña c¸c baz¬ nit¬ vµ ng¨n c¶n sù kÕt cÆp gi÷a
chóng. C¸c ARN ®−îc xö lý glyoxal kh«ng h×nh thµnh c¸c cÊu tróc bËc cao, nªn tèc ®é di
chuyÓn trªn tr−êng ®iÖn di phô thuéc chñ yÕu vµo khèi l−îng ph©n tö cña chóng. ë phÇn
sau cña ch−¬ng nµy, chóng ta sÏ thÊy kü thuËt ®iÖn di còng ®−îc dïng phæ biÕn trong
ph©n tÝch protein.
11.2.4. Sö dông enzym giíi h¹n trong ph©n tÝch ADN
HÇu hÕt c¸c ph©n tö ADN trong tù nhiªn ®Òu lín h¬n nhiÒu so víi kÝch th−íc cã
thÓ thao t¸c thuËn lîi trong phßng thÝ nghiÖm. Trong tÕ bµo, phÇn lín NST lµ mét ph©n
tö ADN chøa hµng tr¨m, thËm chÝ hµng ngh×n gen kh¸c nhau. V× vËy, ®Ó ph©n lËp vµ
ph©n tÝch tõng gen, ng−êi ta th−êng ph¶i c¾t c¸c ph©n tö ADN kÝch th−íc lín thµnh c¸c
®o¹n nhá. C«ng viÖc nµy ®−îc thùc hiÖn bëi mét nhãm enzym ®Æc biÖt gäi lµ c¸c enzym
giíi h¹n.
TÊt c¶ c¸c enzym giíi h¹n ®Òu cã hai ®Æc tÝnh: 1) nhËn biÕt mét tr×nh tù ®Æc hiÖu
trªn ADN (gäi lµ vÞ trÝ giíi h¹n); vµ 2) c¾t trong ph©n tö ADN t¹i vÞ trÝ ®Æc hiÖu (hoÆc
ngay t¹i vÞ trÝ giíi h¹n nh− c¸c enzym giíi h¹n lo¹i II, hoÆc c¸ch vÞ trÝ giíi h¹n mét sè
nucleotide nhÊt ®Þnh nh− c¸c enzym giíi h¹n lo¹i I, III vµ IV). Trong kü thuËt di truyÒn,
c¸c enzym giíi h¹n lo¹i II (chiÕm kho¶ng 40%) ®−îc dïng phæ biÕn h¬n c¶ v× tr×nh tù
ADN t¹i vÞ trÝ c¾t cña chóng lµ x¸c ®Þnh. C¸c vÞ trÝ giíi h¹n cña nhãm enzym nµy th−êng
gåm 4 - 8 bp, th−êng cã tÝnh ®èi xøng vµ ®iÓm c¾t trong tr×nh tù giíi h¹n. VÝ dô nh−
EcoRI t×m thÊy ë E. coli cã tr×nh tù giíi h¹n lµ 5’-G↓AATTC-3’ víi vÞ trÝ c¾t ë gi÷a G vµ
A. Tªn enzym gåm 3 ký tù ®Çu chØ tªn loµi vi khuÈn tõ ®ã enzym ®−îc t×m ra (Eco =
Escherichia coli), c¸c ký tù sau chØ chñng vi khuÈn (vÝ dô: R) vµ sè thø tù enzym ®−îc
thÊy ë vi khuÈn ®ã (EcoRI lµ enzym giíi h¹n ®Çu tiªn ph¸t hiÖn ®−îc ë E. coli).
Mét enzym giíi h¹n cã tr×nh tù giíi h¹n gåm 6 bp gièng nh− EcoRI th−êng ®−îc
tr«ng ®îi cã trung b×nh mét vÞ trÝ c¾t trong mçi ®o¹n ADN cã kÝch th−íc kho¶ng 4 kb (bëi
theo x¸c suÊt, t¹i mét vÞ trÝ nhÊt ®Þnh trªn ADN, x¸c suÊt ®Ó cã mét lo¹i nucleotide nhÊt
327
§inh §oµn Long
®Þnh lµ 1/4, v× vËy x¸c suÊt ®Ó cã mét tr×nh tù nhÊt ®Þnh gåm 6 bp sÏ lµ 1/46 = 1/4096).
Nãi c¸ch kh¸c, kÝch th−íc trung b×nh cña c¸c ®o¹n ADN ®−îc c¾t bëi EcoRI lµ 4096 bp.
Gi¶ sö mét ph©n tö ADN m¹ch th¼ng cã 6 vÞ trÝ c¾t cña EcoRI, th× ph©n tö nµy sau khi
®−îc xö lý víi enzym sÏ cho 7 ph©n ®o¹n ADN kh¸c nhau. Trªn tr−êng ®iÖn di, s¶n phÈm
c¾t gåm 7 ph©n ®o¹n ADN nµy sÏ ph©n t¸ch nhau ra do kh¸c nhau vÒ khèi l−îng.
ViÖc sö dông mét enzym giíi h¹n kh¸c, ch¼ng h¹n HindIII còng cã tr×nh tù giíi h¹n
gåm 6 bp, nh−ng cã tr×nh tù giíi h¹n thay ®æi (5’-A↓AGCTT-3’) sÏ cho ra c¸c s¶n phÈm
c¾t kh¸c víi khi sö dông EcoRI. Víi mét sè enzym giíi h¹n kh¸c, ch¼ng h¹n nh− Sau3AI
(t×m thÊy ë vi khuÈn Staphylococcus aureus) cã tr×nh tù giíi h¹n ng¾n h¬n (5’-GA↓TC-
3’), nªn tÇn sè c¾t cña chóng th−êng cao h¬n c¸c enzym cã tr×nh tù giíi h¹n dµi. Theo x¸c
suÊt, c¸c ®o¹n ADN sîi kÐp ®−îc Sau3AI c¾t cã kÝch th−íc trung b×nh kho¶ng 250 bp
(1/44 = 1/256). Ng−îc l¹i, enzym NotI cã tr×nh tù giíi h¹n dµi (5’-GC↓GGCCGC-3’) t¹o ra
c¸c ®o¹n c¾t trung b×nh dµi 65 kb (1/48 = 1/65.536). Nh− vËy, viÖc sö dông ®ång thêi
nhiÒu enzym giíi h¹n sÏ t¹o ra mét phæ c¸c kiÓu h×nh ®iÖn di ®Æc thï ®èi víi mçi gen
®−îc ph©n tÝch.
C¸c enzym giíi h¹n kh«ng chØ kh¸c nhau vÒ tr×nh tù giíi h¹n vµ ®é dµi ®o¹n tr×nh
tù giíi h¹n ®Æc tr−ng cña chóng, mµ cßn kh¸c nhau vÒ c¸ch “c¾t” ph©n tö ADN. Ch¼ng
h¹n nh− Sau3AI nªu trªn t¹o ra c¸c ph©n tö ADN d¹ng ®Çu b»ng (®Çu tï), cßn c¸c
enzym EcoRI, HindIII vµ NotI c¾t ph©n tö ADN t¹o ra c¸c ph©n ®o¹n cã ®Çu dÝnh. Së dÜ
gäi lµ “®Çu dÝnh” v× hai ®Çu ph©n tö ADN sau khi ®−îc enzym c¾t cã tr×nh tù bæ sung víi
nhau theo nguyªn t¾c Chargaff; v× vËy, chóng cã xu h−íng “dÝnh” l¹i víi nhau, hoÆc
“dÝnh” víi c¸c ph©n tö ADN kh¸c ®−îc c¾t bëi cïng enzym giíi h¹n. TÝnh chÊt nµy ®−îc
dïng trong nh©n dßng ph©n tö vµ ADN t¸i tæ hîp. Mét sè enzym giíi h¹n kh¸c c¾t ®Æc
hiÖu ADN m¹ch ®¬n.
11.2.5. C¸c ph−¬ng ph¸p lai axit nucleic vµ mÉu dß
Nh− ®· nªu ë ch−¬ng 2 (môc 2.1.4.3), c¸c ph©n tö ADN sîi kÐp cã tÝnh chÊt ®Æc biÖt
lµ kh¶ n¨ng biÕn tÝnh (t¸ch thµnh hai m¹ch ®¬n) vµ håi tÝnh (hai m¹ch ®¬n cã tr×nh tù bæ
sung liªn kÕt trë l¹i khi lo¹i bá c¸c yÕu tè g©y biÕn tÝnh). Kh¶ n¨ng liªn kÕt bæ sung gi÷a
c¸c baz¬ nit¬ cho phÐp hai m¹ch ADN cã nguån gèc kh¸c nhau nh−ng cã tr×nh tù bæ trî
liªn kÕt víi nhau trong ®iÒu kiÖn phï hîp (vÒ nhiÖt ®é, ®é pH, …) ®Ó t¹o nªn mét ph©n tö
ADN míi. HiÖn t−îng liªn kÕt nh− vËy cã thÓ x¶y ra gi÷a hai m¹ch ADN víi nhau, hoÆc
gi÷a hai m¹ch ARN hoÆc gi÷a ADN vµ ARN. Ph©n tö axit nucleic sîi kÐp míi h×nh thµnh
®−îc gäi lµ ph©n tö lai vµ qu¸ tr×nh kÕt cÆp gi÷a c¸c baz¬ thuéc hai m¹ch ®¬n axit
nucleic cã nguån gèc kh¸c nhau theo nguyªn t¾c bæ sung nh− vËy ®−îc gäi lµ qu¸ tr×nh
lai ph©n tö.
NhiÒu nghiªn cøu di truyÒn ph©n tö hiÖn nay dùa trªn ph−¬ng ph¸p lai ph©n tö. VÝ
dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ dïng mét ®o¹n ADN cã tr×nh tù biÕt tr−íc, gäi
lµ mÉu dß, ®Ó x¸c ®Þnh mét tr×nh tù bæ sung t−¬ng øng cã trong hÖ gen ®−îc quan t©m
nghiªn cøu. C¸c mÉu dß cã thÓ cã nguån gèc tù nhiªn hoÆc ®−îc tæng hîp hãa häc; ®Ó dÔ
ph¸t hiÖn, c¸c mÉu dß th−êng ®−îc ®¸nh dÊu bëi chÊt phãng x¹ hoÆc chÊt ph¸t quang.
Cã hai ph−¬ng ph¸p ®¸nh dÊu mÉu dß ADN. Ph−¬ng ph¸p thø nhÊt dùa trªn
nguyªn t¾c tæng hîp hãa häc ADN sö dông tiÒn chÊt lµ c¸c ph©n tö ®−îc ®¸nh dÊu phãng
x¹ hoÆc ph¸t quang. Ph−¬ng ph¸p thø hai dùa trªn nguyªn t¾c g¾n mét ph©n tö ®¸nh
dÊu vµo ®u«i cña mét tr×nh tù ADN cã s½n. VÝ dô, nhê sö dông enzym polynucleotide
kinase, ng−êi ta cã thÓ g¾n nhãm γ cña ATP vµo nhãm 5’-OH cña ®o¹n ADN lµm mÉu
dß. NÕu nhãm γ nµy ®−îc ®¸nh dÊu b»ng ®ång vÞ 32P th× ADN mÉu dß sÏ ph¸t phãng x¹.
Trong ph−¬ng ph¸p cßn l¹i (sö dông c¸c tiÒn chÊt ®¸nh dÊu), ng−êi ta cã thÓ thùc hiÖn
ph¶n øng PCR víi mét trong 4 tiÒn chÊt dNTP ®−îc ®¸nh dÊu víi chÊt ph¸t quang hoÆc
328
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
phãng x¹. Trong ph−¬ng ph¸p nµy, chØ cÇn 25% nucleotide cña mÉu dß ADN ®−îc ®¸nh
dÊu lµ ®ñ ®Ó ph©n tÝch.
C¸c mÉu dß ADN ®−îc ®¸nh dÊu b»ng chÊt ph¸t quang cã thÓ ph¸t hiÖn d−íi nguån
s¸ng UV, cßn c¸c mÉu dß ®¸nh dÊu phãng x¹ ®−îc ph¸t hiÖn b»ng ph−¬ng ph¸p phãng x¹
tù chôp nhê phim tia X, hoÆc ®o b»ng m¸y khuÕch ®¹i tÝn hiÖu h¹t β víi hai ®ång vÞ
phãng x¹ ®−îc dïng phæ biÕn lµ 32P vµ 35S. Cã nhiÒu c¸ch ®Ó x¸c ®Þnh c¸c ph©n ®o¹n ADN
vµ ARN ®Æc hiÖu dùa trªn lai ph©n tö. D−íi ®©y, chóng ta chØ ®Ò cËp ®Õn hai ph−¬ng
ph¸p phæ biÕn.
11.2.5.1. X¸c ®Þnh c¸c ®o¹n ADN b»ng ®iÖn di vµ mÉu dß - lai Southern
Sö dông mÉu dß kÕt hîp víi ®iÖn di lµ ph−¬ng ph¸p c¬ b¶n ®ång thêi cã thÓ gióp
x¸c ®Þnh møc ®é phæ biÕn vµ kÝch th−íc cña mét ®o¹n ADN hoÆc ARN ®−îc quan t©m
nghiªn cøu. VÝ dô: b»ng ph−¬ng ph¸p nµy, ng−êi ta cã thÓ x¸c ®Þnh vµ so s¸nh ®−îc møc
biÓu hiÖn cña mét gen ë c¸c lo¹i m« vµ tÕ bµo qua viÖc x¸c ®Þnh sè l−îng b¶n phiªn m·
mARN t−¬ng øng cña gen cã t¹i mçi lo¹i m« vµ tÕ bµo t−¬ng øng.
Gi¶ sö chóng ta c¾t hÖ gen cña nÊm men b»ng EcoRI vµ cÇn x¸c ®Þnh kÝch th−íc
cña ®o¹n ADN mang tr×nh tù gen A. ADN tæng sè sau khi ®−îc c¾t b»ng EcoRI sÏ t¹o nªn
mét hçn hîp c¸c ph©n ®o¹n cã kÝch th−íc trung b×nh 4 kb (v× 46 = 4.096 bp). V× vËy, nÕu
®em s¶n phÈm c¾t giíi h¹n nhuém víi EtBr, th× s¶n phÈm ®iÖn di sÏ lµ mét d¶i c¸c ®o¹n
liªn tôc cã kÝch th−íc quanh vïng 4 kb vµ kh«ng thÓ x¸c ®Þnh ®−îc chÝnh x¸c ph©n ®o¹n
nµo mang gen A. Trong tr−êng hîp nµy, kü thuËt lai Southern (cßn gäi lµ thÈm t¸ch
Southern) cã thÓ ®−îc dïng ®Ó x¸c ®Þnh ®o¹n ADN mang gen ®ã (h×nh 11.4). Ng−êi ta
mang gel ®iÖn di chøa c¸c s¶n phÈm c¾t ng©m vµo dung dÞch kiÒm nhÑ ®Ó lµm biÕn tÝnh
ADN. Råi c¸c ®o¹n ADN ®−îc chuyÓn sang mét mµng tÝch ®iÖn d−¬ng gäi lµ mµng lai
theo kiÓu “®ãng dÊu”. NghÜa lµ c¸c ®o¹n ADN ®Þnh vÞ trªn mµng lai sÏ t−¬ng øng víi c¸c
®o¹n ADN trªn gel ®iÖn di. Mµng lai sau ®ã ®−îc ñ víi mÉu dß cã tr×nh tù ADN bæ sung
víi tr×nh tù cña gen A. Qu¸ tr×nh ñ ®−îc tiÕn hµnh trong ®iÒu kiÖn nhiÖt ®é vµ nång ®é
muèi phï hîp cho sù håi tÝnh cña axit nucleic. Trong ®iÒu kiÖn ®ã, c¸c mÉu dß sÏ chØ t¹o
liªn kÕt ®Æc hiÖu víi ph©n ®o¹n ADN mang gen A. Do c¸c ®o¹n gen th−êng cã kÝch th−íc
lín h¬n nhiÒu so víi mÉu dß, nªn kh¶ n¨ng håi tÝnh cña c¸c ®o¹n gen sÏ khã x¶y ra h¬n
so víi “ph¶n øng” a) C¸c b−íc trong ph−¬ng ph¸p lai Southern VÞ trÝ ®o¹n ADN
lai gi÷a mÉu dß víi C¸c mÉu dß ADN ®−îc ®¸nh lai víi mÉu dß
gen. C¸c ®o¹n ADN dÊu phãng x¹ hoÆc ph¸t quang
mang tr×nh tù gen
cÇn nghiªn cøu sau ADN C¸c ®o¹n ADN
®ã ®−îc ph¸t hiÖn
vµ ph©n lËp nhê c¸c C¾t b»ng §iÖn di
ph−¬ng ph¸p ph¸t enzym giíi h¹n
hiÖn mÉu dß ®· nªu Lai vµ röa
mÉu dß
ë trªn.
thõa
Mét ph−¬ng BiÕn tÝnh ADN vµ
ph¸p c¶i tiÕn cña lai chuyÓn lªn mµng lai
Southern ®−îc dïng
®Ó x¸c ®Þnh vïng b) B−íc chuyÓn ADN tõ gel ®iÖn di sang mµng lai
m· hãa (exon) cña Qu¶ nÆng
gen ®−îc gäi lµ
ph−¬ng ph¸p lai Dung dÞch ®Öm Mµng lai GiÊy läc
Zoo. Ph−¬ng ph¸p Gel
H×nh 11.4. Ph−¬ng ph¸p
lai nµy dùa trªn lai (thÈm t¸ch) Southern.
hiÖn t−îng lµ trong
329
§inh §oµn Long
qu¸ tr×nh tiÕn hãa, c¸c tr×nh tù nucleotide trong c¸c vïng kh«ng m· hãa th−êng biÕn ®æi
nhanh h¬n so víi c¸c vïng m· hãa ë cïng mét gen, khi so s¸nh gi÷a c¸c loµi cã quan hÖ
gÇn gòi. Ch¼ng h¹n, ë mét nghiªn cøu, ng−êi ta t¸ch chiÕt ADN tõ mét nhãm c¸c loµi
kh¸c nhau gåm ng−êi, v−în, khØ, chuét, bß, v.v... ADN cña mçi loµi sau ®ã ®−îc c¾t bëi
cïng enzym giíi h¹n phï hîp; råi c¸c ®o¹n c¾t ®−îc ph©n t¸ch trªn ®iÖn di vµ chuyÓn lªn
mµng lai. C¸c ®o¹n ADN nµy sau ®ã ®−îc lai víi mÉu dß cã nguån gèc ng−êi ®−îc “gi¶
thiÕt” lµ tr×nh tù m· hãa. NÕu ®ã thùc sù lµ tr×nh tù m· hãa th× ph¶n øng lai sÏ x¶y ra
víi tÊt c¶ hoÆc hÇu hÕt c¸c mÉu ADN; nÕu kh«ng, nhiÒu kh¶ n¨ng tr×nh tù t−¬ng øng víi
mÉu dß kh«ng ph¶i lµ tr×nh tù m· hãa.
11.2.5.2. X¸c ®Þnh c¸c ®o¹n ARN b»ng ®iÖn di vµ mÉu dß - lai Northern
Víi cïng nguyªn t¾c, mét ph−¬ng ph¸p lai ®−îc dïng ®Ó ph©n tÝch s¶n phÈm phiªn
m· mARN ®−îc gäi lµ ph−¬ng ph¸p lai Northern (hay thÈm t¸ch Northern). Tuy
nhiªn, v× mARN th−êng ng¾n h¬n nhiÒu so víi ADN, nªn trong lai Northern, kh«ng cÇn
c¾t mARN. Hçn hîp mARN sau khi ph©n t¸ch b»ng ®iÖn di ®−îc chuyÓn lªn mµng lai víi
mÉu dß ADN t−¬ng øng víi ®o¹n mARN ®−îc t×m kiÕm. S¶n phÈm lai ë ®©y lµ
ARN/ADN.
Trong thùc tiÔn, lai Northern th−êng ®−îc dïng ®Ó ®Þnh l−îng mét lo¹i ph©n tö
mARN nµo ®ã cã trong mÉu ph©n tÝch h¬n lµ ®Ó x¸c ®Þnh kÝch th−íc cña nã. §Ó ®Þnh
l−îng mARN, mÉu dß th−êng ®−îc ®−a vµo ph¶n øng lai víi mét l−îng d− võa ®ñ nh»m
®¶m b¶o l−îng ph©n tö lai t¹o thµnh tØ lÖ thuËn víi l−îng mARN. L−îng mARN cã trong
m« ®−îc coi lµ th«ng sè ph¶n ¸nh møc ®é biÓu hiÖn cña gen t−¬ng øng. Ch¼ng h¹n, b»ng
lai Northern, c¸c nhµ nghiªn cøu cã thÓ ®¸nh gi¸ ®−îc ¶nh h−ëng cña mét yÕu tè phiªn
m· tíi sù biÓu hiÖn cña gen nhÊt ®Þnh khi so s¸nh l−îng mARN do gen ®ã m· hãa cã
trong c¸c m« ®−îc xö lý vµ kh«ng ®−îc xö lý víi yÕu tè phiªn m·. T−¬ng tù nh− vËy, kü
thuËt nµy cho phÐp so s¸nh møc ®é biÓu hiÖn cña gen ë c¸c giai ®o¹n ph¸t triÓn kh¸c
nhau cña c¬ thÓ.
11.2.5.3. Ph−¬ng ph¸p lai vi d·y (microarray)
Nguyªn lý cña c¸c ph−¬ng ph¸p lai Southern còng chÝnh lµ c¬ së cña kü thuËt
ph©n tÝch ADN b»ng vi d·y (DNA microarray) ®−îc ph¸t triÓn vµ ngµy cµng ®−îc
dïng réng r·i trong c¸c nghiªn cøu di truyÒn ë cÊp ph©n tö. Trong ph−¬ng ph¸p lai vi
d·y, c¸c mÉu dß th−êng lµ c¸c ®o¹n cADN ®−îc t¹o ra tõ phiªn m· ng−îc c¸c mARN
t−¬ng øng ®−îc t¸ch chiÕt tõ c¸c m« hoÆc tÕ bµo. C¸c mÉu dß nµy sau ®ã ®−îc dïng ®Ó lai
víi mét d·y “giÕng thö” chøa c¸c ph©n tö ADN ®−îc t¸ch chiÕt tõ c¸c mÉu sinh vËt kh¸c
nhau, trong ®ã mçi d·y th−êng ®−îc bæ sung mÉu dß liªn quan ®Õn mét hoÆc mét sè gen
nhÊt ®Þnh. C−êng ®é biÓu hiÖu cña s¶n phÈm lai (®o ®−îc qua mÉu dß) ë mçi d·y vµ ®èi
chiÕu gi÷a c¸c d·y gióp ph¶n ¸nh møc ®é biÓu hiÖn cña gen trong c¸c ®iÒu kiÖn hoÆc ë
c¸c mÉu sinh vËt kh¸c nhau.
11.2.5.4. Lai huúnh quang t¹i chç - FISH
NÕu nh− c¸c ph−¬ng ph¸p lai ®−îc nªu ë trªn ®Òu cÇn t¸ch chiÕt ADN vµ ARN tõ tÕ
bµo, th× ph−¬ng ph¸p lai huúnh quang t¹i chç, ®−îc gäi t¾t lµ lai FISH (fluorescence in
situ hybridization), sö dông mÉu dß ®Ó ph¸t hiÖn trùc tiÕp sù cã mÆt cña mét gen hay
b¶n phiªn m· mARN cña nã trong tÕ bµo mµ kh«ng cÇn qua b−íc t¸ch chiÕt axit nucleic
(h×nh 11.5). Trong b−íc ®Çu tiªn, mÉu dß cã tr×nh tù t−¬ng øng víi gen quan t©m ®−îc
t¹o ra hoÆc b»ng kü thuËt nh©n dßng ph©n tö hoÆc b»ng PCR. Th−êng th× chØ mét phÇn
tr×nh tù ADN cña gen lµ ®ñ ®Ó lµm mÉu dß. Trong ph−¬ng ph¸p nµy, c¸c mÉu dß lu«n
®−îc ®¸nh dÊu b»ng chÊt ph¸t quang ®Ó sau qu¸ tr×nh lai chóng dÔ dµng ®−îc ph¸t hiÖn
b»ng kÝnh hiÓn vi huúnh quang. Gièng c¸c ph−¬ng ph¸p lai kh¸c, trong lai FISH, ADN
330
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
vµ ARN còng cÇn ®−îc g©y biÕn MÉu dß ADN ChÊt ph¸t quang
tÝnh; nh−ng, viÖc g©y biÕn tÝnh
®−îc thùc hiÖn ngay trªn c¸c BiÕn tÝnh Quan s¸t b»ng kÝnh
mÉu m« vµ tÕ bµo nªn ADN vµ trén hiÓn vi huúnh quang
®−îc duy tr× t¹i chç (in situ)
trong nh©n tÕ bµo. §Ó thùc hiÖn H×nh 11.5. Ph−¬ng ph¸p lai huúnh quang t¹i chç (FISH).
"ph¶n øng" lai, c¸c mÉu m« ®−îc
c¾t thµnh c¸c l¸t máng nhê dao
c¾t chuyªn dông (microtome)
tr−íc khi ®−îc chuyÓn vµo dung
dÞch biÕn tÝnh vµ lai víi mÉu dß.
Mét sè øng dông c¬ b¶n cña ph−¬ng ph¸p lai FISH cã thÓ kÓ ®Õn nh− sau:
1) Cã thÓ sö dông mét sè tr×nh tù gen cña virut lµm mÉu dß ®Ó x¸c ®Þnh xem tÕ
bµo cã mang c¸c gen cña virut hay kh«ng, còng nh− ®Ó x¸c ®Þnh gen cña mét
virut nµo ®ã chØ giíi h¹n trong tÕ bµo chÊt hay th©m nhËp ®−îc vµo trong nh©n
tÕ bµo chñ.
2) Bªn c¹nh ADN trong nh©n tÕ bµo, lai FISH cã thÓ dïng ®Ó x¸c ®Þnh vÞ trÝ cña mét
gen trªn NST th«ng qua viÖc lai mÉu dß víi tÕ bµo ë kú gi÷a cña nguyªn ph©n.
3) MÉu dß ADN cã thÓ dïng ®Ó ph¸t hiÖn mét lo¹i mARN cã trong mét m« nhÊt
®Þnh. Do mARN th−êng ë d¹ng m¹ch ®¬n nªn mÉu m« kh«ng cÇn ph¶i g©y biÕn
tÝnh bëi nhiÖt ®é cao hay hãa chÊt. C¸c tÕ bµo ®ang phiªn m· vµ tæng hîp m¹nh
lo¹i mARN ®−îc quan t©m nghiªn cøu sÏ cã mËt ®é liªn kÕt mÉu dß cao vµ ph¸t
quang m¹nh. Gen biÓu hiÖn cµng m¹nh, th× tÕ bµo ph¸t quang cµng s¸ng. ViÖc so
s¸nh c¸c mÉu nh− vËy tõ c¸c m« kh¸c nhau cã thÓ gióp x¸c ®Þnh chøc n¨ng cña
mét gen nhÊt ®Þnh. Tuy vËy, trong mét sè tr−êng hîp gen nghiªn cøu thuéc
nhãm lu«n biÓu hiÖn yÕu (chØ cã vµi b¶n sao mARN trong mçi tÕ bµo), th× tÝn
hiÖu FISH th−êng yÕu vµ kh«ng ®ñ ®Ó ph©n tÝch. Lóc nµy, viÖc ph¸t hiÖn mARN
®−îc thùc hiÖn bëi mét sè ph−¬ng ph¸p nh¹y h¬n,nh− ph−¬ng ph¸p PCR ®Þnh
l−îng (RT-PCR) hoÆc microarray.
Nh»m t¨ng c−êng hiÖu qu¶ cña ph−¬ng ph¸p lai FISH, mét sè mÉu dß cã thiÕt kÕt
®Æc biÖt ®−îc gäi lµ nhÊp nh¸y ph©n tö (molecular beacon). §©y lµ lo¹i mÉu dß chØ ph¸t
quang sau khi ®· liªn kÕt vµo tr×nh tù ADN ®Ých. MÉu dß nhÊp nh¸y ph©n tö th−êng
mang hai “gèc”: mét “gèc” ph¸t quang, gäi lµ nh©n ph¸t quang (fluorophore), ë mét ®Çu
ph©n tö; cßn ®Çu kia mang “gèc” øc chÕ sù ph¸t quang,
gäi lµ nh©n t¾t quang (quenching group). Mçi mÉu ADN
dß nhÊp nh¸y ph©n tö cã tr×nh tù trung t©m dµi MÉu dß nhÊp
kho¶ng 20 – 30 nucleotide bæ sung víi tr×nh tù gen cÇn nh¸y ph©n tö
ph©n tÝch. Ngoµi ra, ë hai ®Çu nã cã hai tr×nh tù gåm
kho¶ng 6 baz¬ nit¬ bæ sung víi nhau. Khi mÉu dß ë PT
d¹ng tù do (kh«ng liªn kÕt víi tr×nh tù gen ®Ých), hai
®Çu mÉu dß t¹o liªn kÕt Chargaff víi nhau, dÉn ®Õn Lai víi mÉu dß
viÖc nh©n t¾t quang tiÕp xóc ®−îc víi nh©n ph¸t
quang vµ øc chÕ sù ph¸t quang cña mÉu dß (h×nh Nh©n ph¸t Nh©n t¾t quang (T)
11.6). Khi mÉu dß ®· liªn kÕt vµo tr×nh tù ADN ®Ých, P quang (P) tù do
T
tr×nh tù mÉu dß ®−îc duçi th¼ng, nªn nh©n t¾t quang
kh«ng tiÕp xóc vµ øc chÕ ®−îc sù ph¸t quang cña nh©n Ph©n tö lai ADN – mÉu dß
ph¸t quang. V× vËy, mÉu dß sÏ ph¸t quang m¹nh. Tuy
nhiªn, ®iÒu cÇn l−u ý khi sö dông mÉu dß nhÊp nh¸y H×nh 11.6. Nguyªn t¾c lai ADN
ph©n tö lµ cÇn duy tr× tÝnh æn ®Þnh cña c¸c ®o¹n bæ dïng mÉu dß nhÊp nh¸y ph©n tö.
331
§inh §oµn Long
sung ng¾n ë hai ®Çu, v× nhiÖt ®é cao cã thÓ g©y biÕn tÝnh ®o¹n nµy vµ dÉn ®Õn hiÖn t−îng
"d−¬ng tÝnh gi¶".
11.2.6. Nh©n dßng ph©n tö vµ x©y dùng ng©n hµng gen
11.2.6.1. Mét sè kh¸i niÖm chung
Nh©n dßng ph©n tö (molecular cloning) chØ mét nhãm c¸c ph−¬ng ph¸p nh»m: (1)
ph©n lËp mét ®o¹n gen (ADN) ®Æc hiÖu tõ hçn hîp c¸c ph©n tö ADN ban ®Çu ®−îc t¸ch
chiÕt tõ c¸c mÉu sinh häc cã thµnh phÇn phøc t¹p; vµ (2) nh©n b¶n ®o¹n tr×nh tù ADN
®−îc quan t©m lªn mét l−îng ®ñ lín ®Ó cã thÓ tiÕn hµnh ph©n tÝch vÒ cÊu tróc vµ chøc
n¨ng gen t−¬ng øng.
ViÖc tinh s¹ch c¸c ®o¹n ADN ®Æc hiÖu ®¹t l−îng ®ñ lín lµ cÇn thiÕt ®Ó thùc hiÖn c¸c
b−íc nghiªn cøu tiÕp theo. Ch¼ng h¹n, tõ ®o¹n ADN ®−îc tinh s¹ch, ng−êi ta cã thÓ t¹o
nªn c¸c ph©n tö ADN t¸i tæ hîp. C¸c ph©n tö ADN t¸i tæ hîp míi cã thÓ lµm thay ®æi
møc biÓu hiÖn cña mét gen (ch¼ng h¹n, khi mét tr×nh tù m· hãa cña loµi nµy ®−îc “ghÐp”
víi promoter cña loµi kh¸c) hoÆc thËm chÝ tæng hîp nªn mét protein “dung hîp” míi
(protein lai) chøa tr×nh tù axit amin cã nguån gèc tõ c¸c loµi kh¸c nhau. Qu¸ tr×nh nh©n
dßng ph©n tö vµ t¹o ra ph©n tö ADN hoÆc protein t¸i tæ hîp th−êng liªn quan ®Õn c¸c
vect¬ nh©n dßng hoÆc c¸c vect¬ biÓu hiÖn. “C«ng cô” chÝnh ®Ó t¹o ADN t¸i tæ hîp lµ
c¸c enzym giíi h¹n gióp c¾t ADN t¹i c¸c vÞ trÝ x¸c ®Þnh vµ ghÐp nèi c¸c ®o¹n ADN cã
nguån gèc kh¸c nhau t¹i c¸c vÞ trÝ mong muèn. B»ng viÖc t¹o nªn c¸c ph©n tö ADN t¸i tæ
hîp cã kh¶ n¨ng tù sao chÐp trong tÕ bµo chñ, ®o¹n ADN cµi dÔ dµng ®−îc nh©n lªn
thµnh mét l−îng lín b¶n sao.
D−íi ®©y, chóng ta sÏ m« t¶ b»ng c¸ch nµo c¸c ph©n tö ADN ®−îc c¾t, t¸i tæ hîp vµ
nh©n lªn, ®ång thêi còng ®Ò cËp ®Õn viÖc x©y dùng th− viÖn hÖ gen gåm tËp hîp c¸c
dßng tÕ bµo mang c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen gióp ph©n tÝch chøc n¨ng
cña mçi gen, còng nh− ®Ó sö dông chóng trong c¸c øng dông cña di truyÒn häc.
11.2.6.2. Nh©n dßng ADN nhê vect¬ plasmid
Sau khi mét ®o¹n ADN ®−îc c¾t khái mét ph©n tö ADN cã kÝch th−íc lín h¬n b»ng
enzym giíi h¹n, ®o¹n ADN ®ã cÇn ®−îc “cµi” vµo mét vect¬ ®Ó cã thÓ nh©n lªn. §Õn nay,
tÕ bµo chñ ®−îc dïng réng r·i nhÊt trong c«ng nghÖ ADN t¸i tæ hîp lµ vi khuÈn E. coli.
C¸c vect¬ nh©n dßng ADN ®iÓn h×nh th−êng cã 3 ®Æc tÝnh:
1) Chóng ph¶i cã mét tr×nh tù khëi ®Çu sao chÐp (vÝ trÝ t¸i b¶n), gióp ph©n tö ADN
t¸i tæ hîp cã thÓ tù sao chÐp ®éc lËp víi NST cña tÕ bµo chñ.
2) Chóng ph¶i mang mét dÊu chuÈn chän läc cho phÐp ph©n biÖt ®−îc c¸c tÕ bµo
mang vect¬ t¸i tæ hîp vµ c¸c tÕ bµo kh«ng mang vect¬ t¸i tæ hîp.
3) Chóng th−êng cã vÞ trÝ c¾t cña mét hay nhiÒu enzym giíi h¹n kh¸c nhau. §©y
chÝnh lµ vÞ trÝ cµi cña ph©n ®o¹n ADN cÇn nh©n dßng vµo vect¬.
Vect¬ nh©n dßng phæ biÕn nhÊt lµ c¸c ph©n tö ADN sîi kÐp, m¹ch vßng, kÝch th−íc
nhá (kho¶ng 3 Kb) cã nguån gèc tõ c¸c plasmid vi khuÈn, mét sè tõ nÊm men. Trong
nhiÒu tr−êng hîp, c¸c ph©n tö ADN nµy vèn cã s½n hai thuéc tÝnh tù nhiªn, ®ã lµ: (1) kh¶
n¨ng tù sao chÐp trong tÕ bµo chñ, vµ (2) mang gen kh¸ng kh¸ng sinh; gen nµy ®−îc
dïng lµm dÊu hiÖu chän läc. Ngoµi ra, c¸c vect¬ plasmid cßn mét −u ®iÓm n÷a lµ chóng
cã thÓ nh©n lªn vµ tån t¹i thµnh nhiÒu b¶n sao trong mçi tÕ bµo. §iÒu nµy gióp dÔ dµng
nh©n b¶n vµ ph©n lËp ®−îc mét l−îng lín ®o¹n ADN cµi mµ chØ cÇn nu«i mét sè Ýt tÕ bµo
vi khuÈn.
332
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
C¸c vect¬ plasmid ®Çu tiªn chØ cã mét vÞ trÝ giíi h¹n duy nhÊt. Nh−ng cïng víi thêi
gian, cÊu tróc cña c¸c vect¬ plasmid ®−îc c¶i tiÕn theo h−íng bá bít c¸c tr×nh tù kh«ng
cÇn thiÕt vµ g¾n thªm ®o¹n tr×nh tù cã thÓ ®−îc c¾t b»ng nhiÒu enzym giíi h¹n kh¸c
nhau. Tr×nh tù mang nhiÒu vÞ trÝ giíi h¹n nh− vËy ®−îc gäi lµ tr×nh tù ®a nh©n dßng
(polycloning site). Cã nh÷ng tr×nh tù ®a nh©n dßng ®−îc thiÕt kÕ chØ dµi vµi tr¨m bp,
nh−ng cã trªn 20 vÞ trÝ giíi h¹n kh¸c nhau. Nhê ®Æc ®iÓm nµy, mét vect¬ cã thÓ ®−îc
dïng ®Ó nh©n dßng nhiÒu ®o¹n ADN kh¸c nhau. Dùa trªn nguyªn t¾c t−¬ng tù, ngoµi
vect¬ plasmid, ng−êi ta ®· ph¸t triÓn ®−îc c¸c lo¹i vect¬ kh¸c cã nguån gèc tõ phag¬,
hoÆc lµ ph©n tö lai gi÷a vi khuÈn vµ phag¬ (nh− phagemid, cosmid …), hoÆc cã nguån gèc
tõ nÊm men (vÝ dô: YAC).
ViÖc cµi mét ®o¹n ADN vµo vect¬ th−êng lµ c«ng viÖc t−¬ng ®èi ®¬n gi¶n. Ng−êi ta
sö dông cïng mét enzym giíi h¹n ®Ó c¾t vect¬ vµ ®o¹n ADN cµi. Ch¼ng h¹n, khi xö lý
vect¬ plasmid b»ng enzym EcoRI, vect¬ sÏ tõ d¹ng “vßng” chuyÓn sang d¹ng “th¼ng” víi
hai ®Çu dÝnh. Do ®−îc c¾t bëi cïng enzym, ®o¹n ADN cµi còng cã hai ®Çu dÝnh víi tr×nh
tù bæ sung víi tr×nh tù ®Çu dÝnh cña vect¬. C¸c ®Çu dÝnh cña vect¬ vµ ®o¹n ADN cµi
trªn c¬ së nguyªn t¾c Chargaff sÏ ®Ýnh kÕt víi nhau ®Ó t¹o nªn ph©n tö ADN t¸i tæ hîp
d¹ng vßng chØ cßn thiÕu mét liªn kÕt phosphodiester duy nhÊt ë mçi m¹ch. Liªn kÕt
cuèi cïng nµy ®−îc h×nh thµnh bëi enzym ADN ligase xóc t¸c. §Ó h¹n chÕ kh¶ n¨ng
“tù ®éng” g¾n kÕt trë l¹i gi÷a hai ®Çu dÝnh cña chÝnh vect¬, trong hçn hîp vect¬ vµ
®o¹n cµi, ng−êi ta th−êng cho d− thõa l−îng ADN cµi ®Ó t¨ng kh¶ n¨ng t¸i tæ hîp gi÷a
vect¬ vµ ®o¹n ADN cµi.
Mét sè lo¹i vect¬ kh«ng chØ cho phÐp nh©n dßng mét ®o¹n ADN cµi nµo ®ã, mµ cßn
cã thÓ ®iÒu khiÓn sù biÓu hiÖn cña gen trong ®o¹n ADN cµi. Nh÷ng vect¬ nh− vËy ®−îc
gäi lµ c¸c vect¬ biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ph¶i cã promoter n»m ng−îc
dßng so víi vÞ trÝ cµi gen. Vïng m· hãa cña gen cÇn ®−îc g¾n vµo vect¬ theo ®óng khung
®äc th× gen míi ®−îc biÓu hiÖn. C¸c vect¬ biÓu hiÖn th−êng ®−îc dïng ®Ó biÓu hiÖn c¸c
gen ®ét biÕn hoÆc c¸c gen lai nh»m ph©n tÝch chøc n¨ng cña chóng, hoÆc còng cã thÓ
®−îc dïng ®Ó s¶n xuÊt tËp trung mét lo¹i protein nµo ®ã vèn kh«ng thu ®−îc víi hiÖu
suÊt t−¬ng tù trong tù nhiªn. Ngoµi ra, promoter trong c¸c vect¬ biÓu hiÖn cã thÓ ®−îc
lùa chän sao cho sù biÓu hiÖn cña gen cµi cã thÓ ®−îc ®iÒu khiÓn b»ng viÖc bæ sung mét
chÊt ®¬n gi¶n vµo m«i tr−êng (ch¼ng h¹n nh− mét lo¹i ®−êng hay axit amin). ViÖc cã thÓ
®iÒu khiÓn chñ ®éng sù biÓu hiÖn cña mét gen nµo ®ã cã ý nghÜa quan träng trong nghiªn
cøu chøc n¨ng gen, nhÊt lµ víi c¸c gen g©y ®éc.
11.2.6.3. BiÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ
BiÕn n¹p lµ qu¸ tr×nh tÕ bµo chñ cã thÓ tiÕp nhËn ph©n tö ADN ngo¹i lai hoÆc theo
c¬ chÕ tù nhiªn hoÆc nhê c¸c kü thuËt “chuyÓn gen”. Trong tù nhiªn, mét sè vi khuÈn,
bao gåm Streptoccocus pneumoniae, Bacillus subtilis, Haemophilus influenzae vµ Neisseria
gonorrhoeae, cã c¸c c¬ chÕ tiÕp nhËn ADN tõ m«i tr−êng ngoµi. Chóng ®−îc gäi lµ c¸c vi
khuÈn kh¶ biÕn tù nhiªn. MÆc dï trong tù nhiªn, E. coli th−êng kh«ng cã tÝnh kh¶
biÕn, nh−ng khi ®−îc xö lý víi ion Ca2+, vi khuÈn nµy cã thÓ tiÕp nhËn ADN tõ m«i
tr−êng ngo¹i bµo. Cã thÓ ion Ca2+ víi kh¶ n¨ng “bao bäc” ph©n tö ADN tÝch ®iÖn ©m ®·
t¨ng c−êng kh¶ n¨ng “x©m nhËp” qua mµng tÕ bµo cña ADN. C¸c tÕ bµo E. coli sau khi
®−îc xö lý víi Ca2+ nh− vËy còng ®−îc gäi lµ c¸c tÕ bµo kh¶ biÕn. §Ó t×m ra vµ ph©n lËp
c¸c tÕ bµo kh¶ biÕn mang vect¬ t¸i tæ hîp, ng−êi ta th−êng nu«i cÊy c¸c vi khuÈn trªn
m«i tr−êng chän läc chøa c¸c chÊt kh¸ng sinh t−¬ng øng víi gen ®¸nh dÊu cã mÆt trong
vect¬.
Nh×n chung, hiÖu suÊt cña qu¸ tr×nh biÕn n¹p th−êng kh«ng cao. ChØ mét tØ lÖ nhá
c¸c tÕ bµo ®−îc xö lý biÕn n¹p cã thÓ tiÕp nhËn plasmid t¸i tæ hîp. Nh−ng, chÝnh hiÖu
qu¶ biÕn n¹p thÊp nh− vËy gióp cho hÇu hÕt c¸c tÕ bµo mang vect¬ t¸i tæ hîp th−êng chØ
333