The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Cơ sở di truyền phân tử và tế bào

Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by Doubletet Jame, 2021-10-05 03:11:21

Cơ sở di truyền phân tử và tế bào

Cơ sở di truyền phân tử và tế bào

Keywords: HSGQG

§inh §oµn Long

sao c¸c alen ®ét biÕn th−êng lµ lÆn. NÕu mét tÕ bµo cã c¶ hai d¹ng enzym cã ho¹t tÝnh vµ
mÊt ho¹t tÝnh, th× d¹ng cã ho¹t tÝnh vÉn cã thÓ xóc t¸c c¸c ph¶n øng diÔn ra b×nh th−êng.

Ngoµi ra, do tÝnh tho¸i hãa cña m· bé ba (nhiÒu m· bé ba cïng m· hãa mét axit
amin), nªn nhiÒu ®ét biÕn cã thÓ kh«ng t¹o nªn hiÖu qu¶ kiÓu h×nh. Nh÷ng ®ét biÕn nµy
®−îc gäi lµ ®ét biÕn c©m (lµ mét d¹ng cña ®ét biÕn trung tÝnh). Mét c©u hái ®Æt ra lµ
t¹i sao phÇn lín ®ét biÕn quan s¸t ®−îc th−êng t¹o ra s¶n phÈm mÊt hoÆc gi¶m ho¹t
tÝnh? Cã lÏ tr¶i qua hµng triÖu n¨m tiÕn hãa, c¸c alen kiÓu d¹i ®· ®−îc chän läc vÒ hiÖu
qu¶ thÝch nghi nªn chóng ®· cã ho¹t tÝnh tèi −u. V× vËy, c¸c ®ét biÕn ngÉu nhiªn sinh ra
th−êng dÉn ®Õn sù thay ®æi cña tr×nh tù axit amin cã hÖ sè thÝch nghi cao nhÊt. Ta cã thÓ
vÝ ®iÒu nµy víi mét cç m¸y phøc t¹p. NÕu c¸c m«®un cÊu t¹o m¸y ®· ®−îc tèi −u, mäi sù
thay ®æi ®Òu cã xu h−íng lµm gi¶m hiÖu qu¶ cña hÖ thèng. Quan ®iÓm nh− vËy gióp gi¶i
thÝch t¹i sao phÇn lín ®ét biÕn quan s¸t ®−îc th−êng lµ c¸c alen lÆn vµ cã h¹i.

TiÒn chÊt ChÊt trung gian 1 ChÊt trung gian 2 S¶n phÈm

Enzym A Enzym B Enzym C

Gen A Gen B Gen C
alen kiÓu d¹i A alen kiÓu d¹i B alen kiÓu d¹i C

§ét biÕn §ét biÕn §ét biÕn

Alen ®ét biÕn a Alen ®ét biÕn b Alen ®ét biÕn c

Enzym a mÊt ho¹t tÝnh Enzym b mÊt ho¹t tÝnh Enzym c mÊt ho¹t tÝnh
ë c¬ thÓ ®ång hîp tö ë c¬ thÓ ®ång hîp tö ë c¬ thÓ ®ång hîp tö

aa bb cc

TiÒn chÊt ChÊt trung gian 1 ChÊt trung gian 2 S¶n phÈm

H×nh 6.3. C¸c alen lÆn ®ét biÕn th−êng g©y c¶n trë c¸c con ®−êng trao ®æi chÊt. C¸c con ®−êng nµy cã
thÓ gåm mét sè b−íc ph¶n øng (nh− minh häa trªn h×nh), hoÆc gåm nhiÒu chuçi ph¶n øng dµi h¬n. C¸c alen
kiÓu d¹i ë mçi gen m· hãa cho mét enzym b×nh th−êng xóc t¸c mét ph¶n øng hãa häc nhÊt ®Þnh trong qu¸
tr×nh trao ®æi chÊt. PhÇn lín c¸c ®ét biÕn x¶y ra ë c¸c alen kiÓu d¹i dÉn ®Õn sù h×nh thµnh c¸c d¹ng enzym bÞ

biÕn ®æi gi¶m ho¹t tÝnh hoÆc kh«ng cßn ho¹t tÝnh. ë tr¹ng th¸i ®ång hîp tö, c¸c alen ®ét biÕn s¶n sinh ra c¸c
enzym mÊt chøc n¨ng, g©y c¶n trë ( ) qu¸ tr×nh trao ®æi chÊt do thiÕu ho¹t tÝnh enzym cÇn thiÕt.

6.3.2. HiÖu qu¶ kiÓu h×nh c¸c gen m· hãa globin ë ng−êi

C¸c ®ét biÕn gen m· hãa hemoglobin ë ng−êi lµ mét vÝ dô cho thÊy phÇn lín ®ét
biÕn lµ cã h¹i. ë ng−êi tr−ëng thµnh, hemoglobin chñ yÕu ë d¹ng A gåm hai chuçi α vµ
hai chuçi β. Mçi chuçi α gåm 141 axit amin, cßn mçi chuçi β gåm 146 axit amin. Do
gièng nhau vÒ tr×nh tù, cã thÓ tin r»ng c¸c gen m· hãa globin (α, β, γ, ε vµ δ) cã cïng
nguån gèc.

ë c¸c quÇn thÓ ng−êi kh¸c nhau, ng−êi ta t×m thÊy nhiÒu ®ét biÕn ë gen m· hãa
globin, trong ®ã hÇu hÕt lµ cã h¹i. Ch¼ng h¹n bÖnh hång cÇu h×nh liÒm (kÝ hiÖu HbS) g©y
ra do ®ét biÕn thay thÕ axit amin sè 6 lµ Glu (®©y lµ mét axit amin tÝnh axit) trªn chuçi β
thµnh Val (®©y lµ mét axit amin trung tÝnh). Sù thay ®æi nµy dÉn ®Õn h×nh thµnh mét

184

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

liªn kÕt míi néi ph©n tö, lµm VÞ trÝ axit amin trong chuçi β - globin
cÊu h×nh cña hemoglobin thay
®æi vµ chóng cã xu h−íng kÕt C¸c d¹ng Hb
dÝnh víi nhau, lµm tÕ bµo hång
cÇu cã h×nh liÒm. C¬ së ph©n tö
dÉn ®Õn sù thay ®æi axit amin
trªn chuçi β lµ do ®ét biÕn thay
thÕ cÆp nucleotide A=T trªn alen
kiÓu d¹i (HbAβ) thµnh T=A trªn
alen ®ét biÕn (HbSβ). Sù thay thÕ
nucleotide nh− vËy ban ®Çu
®−îc dù ®o¸n tõ tr×nh tù axit
amin, sau nµy ®−îc kh¼ng ®Þnh
b»ng gi¶i tr×nh tù c¸c gen (alen)
HbAβ vµ HbSβ.

§Õn nay, ®· cã trªn 100 H×nh 6.4. Mét sè d¹ng thay thÕ axit amin trong chuçi β-globin ë
d¹ng ®ét biÕn kh¸c nhau liªn ng−êi. TÊt c¶ c¸c tr−êng hîp nªu trªn h×nh ®Òu do ®ét biÕn thay thÕ
quan ®Õn chuçi β ®−îc ph¸t hiÖn ®¬n nucleotide ë gen HbAβ. §iÒu ®¸ng chó ý lµ nhiÒu d¹ng thay thÕ
(mét sè vÝ dô ®−îc nªu trªn axit amin ë ®©y lµm thay ®æi tæng ®iÖn tÝch cña chuçi, mÆc dï chØ cã
h×nh 6.4). PhÇn lín chóng lµ c¸c 5 trong sè 20 axit amin phæ biÕn tÝch ®iÖn ë pH trung tÝnh. C¸c ®ét
®ét biÕn dÉn ®Õn thay thÕ mét biÕn thay thÕ axit amin lµm thay ®æi tæng ®iÖn tÝch dÔ dÉn ®Õn sù
axit amin. Ngoµi ra, ë ng−êi, cßn thay ®æi cÊu h×nh kh«ng gian cña protein h¬n so víi nh÷ng d¹ng thay
cã nhiÒu ®ét biÕn kh¸c liªn quan thÕ kh¸c. Nãi c¸ch kh¸c, nh÷ng thay thÕ axit amin lµm thay ®æi tæng
®Õn chuçi α. ®iÖn tÝch cña protein dÔ lµm thay ®æi chøc n¨ng cña nã.

6.3.3. PhÇn lín ®ét biÕn ë ng−êi ng¨n c¶n c¸c con ®−êng trao ®æi chÊt

H×nh 6.3 cho chóng ta thÊy, c¸c ®ét biÕn gen m· hãa enzym th−êng ng¨n c¶n c¸c
con ®−êng trao ®æi chÊt. Nh÷ng ®ét biÕn nh− vËy x¶y ra ë mäi loµi sinh vËt.

Chóng ta sÏ xem c¸c ®ét biÕn liªn quan ®Õn c¸c gen m· hãa enzym tham gia vµo
c¸c con ®−êng chuyÓn hãa phenylalanine (Phe) vµ tyrosine (Tyr) g©y ra hiÖu øng kiÓu
h×nh nh− thÕ nµo. ë ng−êi, Phe vµ Tyr lµ c¸c axit amin kh«ng thay thÕ. Nh−ng, kh¸c víi
vi khuÈn, c¬ thÓ ng−êi kh«ng tù tæng hîp ®−îc hai axit amin nµy, mµ ®−îc cung cÊp tõ
thøc ¨n.

BÖnh di truyÒn phæ biÕn nhÊt liªn quan ®Õn chuyÓn hãa Phe vµ Tyr lµ phenyl
keto niÖu. Ng−êi m¾c bÖnh nµy kh«ng cã enzym phenylalanine hydroxylase lµm nhiÖm
vô chuyÓn hãa Phe → Tyr. BÖnh nµy g©y ra do ®ét biÕn lÆn n»m trªn NST th−êng. TriÖu
chøng cña bÖnh lµ thiÓu n¨ng trÝ tuÖ nÕu ng−êi bÖnh kh«ng cã chÕ ®é dinh d−ìng (gi¶m
Phe) hîp lý. Tuy nhiªn, ngoµi phenyl keto niÖu, bÖnh di truyÒn liªn quan ®Õn chuyÓn hãa
Phe vµ Tyr ®Çu tiªn ®−îc ph¸t hiÖn l¹i lµ alkapto niÖu. Nguyªn nh©n g©y bÖnh còng do
mét ®ét biÕn lÆn n»m trªn NST th−êng, m· hãa enzym homogentisic acid oxidase.

Ngoµi c¸c bÖnh di truyÒn liªn quan ®Õn con ®−êng chuyÓn hãa Phe-Tyr nªu trªn,
cßn cã hai bÖnh di truyÒn kh¸c do ®ét biÕn lÆn trªn NST th−êng ë c¸c gen m· hãa enzym
tham gia vµo qu¸ tr×nh dÞ hãa Tyr, ®ã lµ bÖnh c−êng tyrosine (tyrosinosis) vµ tyrosine

185

§inh §oµn Long

huyÕt (tyrosinemia). TriÖu chøng cña hai bÖnh nµy lµ do sù thiÕu hôt t−¬ng øng c¸c
enzym tyrosine transaminase vµ p-hydroxyphenylpyruvic acid oxidase (h×nh 6.5). BÖnh
c−êng tyrosine rÊt hiÕm gÆp vµ ch−a ®−îc nghiªn cøu chi tiÕt. Ng−êi m¾c bÖnh nµy cã
hµm l−îng tyrosine tÝch lòy trong m¸u vµ n−íc tiÓu cao, ®ång thêi cã mét sè dÞ tËt bÈm
sinh kh¸c. Ng−êi m¾c bÖnh tyrosine huyÕt cã hµm l−îng cña c¶ tyrosine vµ axit
p-hydroxyphenylpyruvic trong m¸u vµ n−íc tiÓu cao. PhÇn lín trÎ s¬ sinh m¾c chøng
tyrosine huyÕt chÕt trong 6 th¸ng ®Çu sau khi sinh do bÞ háng gan.

BÖnh b¹ch t¹ng còng lµ bÖnh di truyÒn cã thÓ liªn quan ®Õn chuyÓn hãa tyrosine,
do thiÕu enzym chuyÓn hãa tyrosine thµnh melanine (s¾c tè mµu ®en). Mét d¹ng b¹ch
t¹ng lµ do thiÕu tyrosinase. Enzym nµy xóc t¸c ph¶n øng ®Çu tiªn trong con ®−êng tæng
hîp melanine tõ tyrosine. C¸c d¹ng b¹ch t¹ng kh¸c lµ do sù ng¨n c¶n c¸c b−íc cña con
®−êng chuyÓn hãa tyrosine → melanine. Nh×n chung, c¸c d¹ng b¹ch t¹ng kh¸c nhau ®Òu
do alen lÆn trªn NST th−êng g©y nªn. V× vËy, c¸c thÓ dÞ hîp tö th−êng cã kiÓu h×nh b×nh
th−êng. Víi c¬ chÕ trªn, ta cã thÓ thÊy, trong tr−êng hîp kÕt h«n gi÷a hai ng−êi bÞ b¹ch
t¹ng bëi ®ét biÕn ë c¸c gen kh¸c nhau, th× tÊt c¶ c¸c con cña hä vÉn cã thÓ b×nh th−êng.

Nh− vËy, c¸c nghiªn cøu liªn quan ®Õn sù trao ®æi Phe-Tyr ®· cho chóng ta thÊy cã Ýt

nhÊt n¨m bÖnh di truyÒn kh¸c nhau. ë ng−êi, cßn nhiÒu vÝ dô kh¸c n÷a cho thÊy c¬ chÕ di
truyÒn kiÓm so¸t c¸c con ®−êng trao ®æi chÊt trong c¬ thÓ t−¬ng tù nh− víi Phe-Tyr.

Protein Thyroxine
(tæng hîp hoÆc tõ thøc ¨n)

Phenylalanine Phenylalanine Tyrosine Tyrosinase DOPA
hydroxylase B¹ch t¹ng (3,4-Dihydroxy
Axit phenylalanine)
Phenylpyruvic PKU
(®éc víi hÖ thÇn B¹ch t¹ng
kinh trung −¬ng) C−êng (kiÓu ©m tÝnh víi (kiÓu d−¬ng tÝnh
tyrosine Tyrosine tyrosinase) víi tyrosinase)

transaminase

p-Hydroxyphenyl
pyruvate

Tyrosine p-Hydroxyphenyl Melanine
huyÕt pyruvate oxidase
(S¾c tè lµm tãc mµu
2,5-Dihydroxyphenyl pyruvate ®en vµ da sÉm mµu)
(axit homogentisic)

AKU Axit homogentisic
oxidase

Axit maleylacetoacetic

CO2 + H2O
H×nh 6.5. Nh÷ng bÖnh di truyÒn ë ng−êi liªn quan ®Õn chuyÓn hãa phenylalanine-tyrosine. C¸c bÖnh
nµy bao gåm: phenyl keto niÖu, c−êng tyrosine, tyrosine huyÕt, alkapt« niÖu vµ b¹ch t¹ng. C¶ 5 bÖnh nµy ®Òu
do c¸c ®ét biÕn lÆn n»m trªn NST th−êng g©y nªn. C¸c alen ®ét biÕn sinh ra c¸c enzym mÊt ho¹t tÝnh vµ ng¨n
c¶n qu¸ tr×nh chuyÓn hãa phenylalanine – tyrosine b×nh th−êng t¹i c¸c b−íc ®−îc chØ trªn h×nh.

186

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.3.4. §ét biÕn g©y chÕt cã ®iÒu kiÖn lµ c«ng cô nghiªn cøu di truyÒn häc

Trong tÊt c¶ c¸c lo¹i ®ét biÕn, kÓ c¶ c¸c ®ét biÕn trung tÝnh vµ g©y chÕt, c¸c ®ét
biÕn g©y chÕt cã ®iÒu kiÖn cã ý nghÜa nhÊt trong c¸c nghiªn cøu di truyÒn häc. ThÓ
mang ®ét biÕn g©y chÕt cã ®iÒu kiÖn cã ®Æc ®iÓm: 1) chÕt trong mét m«i tr−êng, gäi lµ
®iÒu kiÖn giíi h¹n; vµ 2) sèng ®−îc trong mét m«i tr−êng kh¸c, gäi lµ ®iÒu kiÖn chän
läc. C¸c ®ét biÕn g©y chÕt cã ®iÒu kiÖn ®−îc sö dông ®Ó x¸c ®Þnh nh÷ng gen thiÕt yÕu
qua viÖc mÊt hoµn toµn ho¹t tÝnh cña s¶n phÈm do gen m· hãa trong c¸c c¬ thÓ ®¬n béi.
C¸c thÓ ®ét biÕn cã thÓ ®−îc nh©n lªn trong ®iÒu kiÖn chän läc vµ cung cÊp th«ng tin vÒ
chøc n¨ng s¶n phÈm gen bÞ thiÕu hôt khi chóng ®−îc nu«i trong ®iÒu kiÖn giíi h¹n. §Õn
nay, nhiÒu ®ét biÕn g©y chÕt cã ®iÒu kiÖn ®· ®−îc dïng trong viÖc lµm s¸ng tá chøc n¨ng
cña c¸c gen trong c¸c qu¸ tr×nh sinh häc ë c¸c ®èi t−îng sinh vËt.

Cã ba lo¹i thÓ ®ét biÕn cã ®iÒu kiÖn c¬ b¶n lµ: 1) c¸c ®ét biÕn dinh d−ìng thô ®éng
(khuyÕt d−ìng), 2) c¸c ®ét biÕn mÉn c¶m nhiÖt ®é, vµ 3) c¸c ®ét biÕn mÉn c¶m chÊt g©y
®éc. C¸c thÓ ®ét biÕn dinh d−ìng thô ®éng thiÕu kh¶ n¨ng sinh tæng hîp mét hîp
chÊt thiÕt yÕu (nh− axit amin, purine, pyrimidine, vitamin, ...) vèn ®−îc tæng hîp b×nh
th−êng ë c¬ thÓ kiÓu d¹i, hoÆc ë d¹ng dinh d−ìng chñ ®éng trong cïng loµi. Do vËy, trong
m«i tr−êng kh«ng cã chÊt chÊt dinh d−ìng nµy, thÓ ®ét biÕn dinh d−ìng thô ®éng kh«ng
sèng ®−îc. Nh−ng, trong m«i tr−êng ®−îc bæ sung chÊt dinh d−ìng thiÕu hôt, thÓ ®ét
biÕn cã thÓ ph¸t triÓn vµ sinh s¶n b×nh th−êng. C¸c thÓ ®ét biÕn mÉn c¶m nhiÖt ®é
chØ sèng trong mét vïng nhiÖt ®é nhÊt ®Þnh, nh−ng chÕt trong mét vïng nhiÖt ®é kh¸c.
PhÇn lín c¸c thÓ ®ét biÕn thuéc nhãm nµy lµ mÉn c¶m víi nhiÖt ®é cao, nh−ng cã mét
sè ®ét biÕn mÉn c¶m víi nhiÖt ®é thÊp. Së dÜ kh¶ n¨ng sèng cña c¸c thÓ ®ét biÕn phô
thuéc nhiÖt ®é lµ do mét (hoÆc mét sè) enzym cña chóng ë tr¹ng th¸i ho¹t ®éng ë vïng
nhiÖt ®é nµy, nh−ng mÊt (hoÆc gi¶m) ho¹t tÝnh ë mét vïng nhiÖt ®é kh¸c. Ngoµi ra, cã
tr−êng hîp lµ do gen m· hãa mét sè enzym hoÆc protein thiÕt yÕu chØ biÓu hiÖn ë vïng
nhiÖt ®é nµy, mµ kh«ng biÓu hiÖn ë vïng nhiÖt ®é kh¸c. Nh−ng, mét khi ®· ®−îc biÓu
hiÖn, s¶n phÈm cña gen còng cã ho¹t tÝnh vµ æn ®Þnh nh− ë c¸ thÓ kiÓu d¹i. C¸c thÓ
®ét biÕn mÉn c¶m chÊt g©y ®éc lµ nh÷ng thÓ ®ét biÕn chÕt khi kh«ng cã protein øc
chÕ chÊt g©y ®éc, nh−ng sèng khi cã nh÷ng protein øc chÕ nµy. C¸c gen m· hãa protein
øc chÕ cã thÓ söa ch÷a nh÷ng sai háng trong kiÓu h×nh cña c¸c thÓ ®ét biÕn mÉn c¶m
víi chÊt g©y ®éc; hoÆc nã cã thÓ lµm biÕn ®æi s¶n phÈm cña gen ®ét biÕn vÒ d¹ng kh«ng
ho¹t ®éng. VËy, b»ng c¸ch nµo chóng ta cã thÓ sö dông c¸c ®ét biÕn g©y chÕt cã ®iÒu
kiÖn trong nghiªn cøu c¸c qu¸ tr×nh sinh häc. H·y b¾t ®Çu b»ng mét con ®−êng sinh
tæng hîp ®¬n gi¶n sau ®©y:

Gen A Gen B

↓↓

Enzym A Enzym B

TiÒn chÊt X ---------→ ChÊt trung gian Y ---------→ S¶n phÈm Z

ChÊt trung gian Y ®−îc t¹o ra tõ tiÒn chÊt X nhê ho¹t ®éng cña enzym A, nh−ng nã
®−îc chuyÓn hãa nhanh chãng thµnh s¶n phÈm Z do ho¹t ®éng cña enzym B. V× vËy,
trong tÕ bµo, chÊt trung gian Y chØ tån t¹i ë l−îng “vÕt” vµ rÊt khã ph©n lËp ®Ó ph©n tÝch.
Tuy vËy, ë ®ét biÕn gen B, nÕu enzym B mÊt hoÆc gi¶m ho¹t tÝnh, chÊt trung gian Y sÏ
®−îc tÝch lòy ë l−îng cao, nªn dÔ ph©n lËp vµ nghiªn cøu. T−¬ng tù nh− vËy, nÕu gen A
®ét biÕn, tiÒn chÊt X cã thÓ ®−îc tÝch lòy. Nhê vËy, qua nh÷ng ®ét biÕn nµy, ta cã thÓ x¸c
®Þnh ®−îc c¸c b−íc cña mét con ®−êng trao ®æi chÊt.

Sù ph¸t sinh h×nh th¸i vµ ph¸t triÓn cña sinh vËt mét phÇn lµ do biÓu hiÖn theo
thø tù nhÊt ®Þnh cña c¸c gen trong hÖ gen. KÕt qu¶ cña qu¸ tr×nh ®ã lµ c¸c protein lÇn
l−ît ®−îc bæ sung vµo cÊu tróc cña c¸c ®¹i ph©n tö sinh häc, lµm thay ®æi cÊu h×nh vµ

187

§inh §oµn Long

biÓu hiÖn chøc n¨ng cña chóng. Nhê sù ph©n lËp c¸c thÓ ®ét biÕn vÒ c¸c gen m· hãa c¸c
protein, chóng ta cã thÓ x¸c ®Þnh ®−îc thø tù c¸c b−íc biÓu hiÖn cña gen trong hÖ gen vµ
ph©n t¸ch c¸c qu¸ tr×nh ®ã thµnh c¸c b−íc ph¶n øng ®éc lËp.

Trªn c¬ së ph©n lËp c¸c d¹ng ®ét biÕn, Robert Edgar vµ céng sù ®· x©y dùng hoµn
chØnh c¸c b−íc cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë phag¬ T4. Qu¸ tr×nh nµy liªn quan
®Õn sù biÓu hiÖn cña tõ 50 ®Õn 200 gen ë hÖ gen T4. Mçi gen m· hãa cho mét protein cÊu
tróc, hoÆc mét enzym xóc t¸c mét ph¶n øng trong qu¸ tr×nh ph¸t sinh h×nh th¸i. B»ng
viÖc sö dông hai ph−¬ng ph¸p, gåm: 1) ph©n lËp c¸c thÓ ®ét biÕn mÉn c¶m nhiÖt ®é vµ
g©y chÕt cã ®iÒu kiÖn (kho¶ng 50 gen), vµ 2) sö dông kÝnh hiÓn vi ®iÖn tö vµ ph©n tÝch
hãa sinh ®Ó ph©n tÝch cÊu tróc c¸c protein ®−îc tÝch lòy ë mçi d¹ng ®ét biÕn (nu«i trong
®iÒu kiÖn giíi h¹n), c¸c t¸c gi¶ ®· t×m ra c¸c b−íc chi tiÕt cña qu¸ tr×nh ph¸t sinh h×nh
th¸i ë T4 nh− ®−îc minh häa trªn h×nh 6.6.

Sîi ®u«i 37, 38 36 35 34
16, 2, 4,
20, 21, 17, 50, 64, 13, 63
22, 23, 49 65 14 (Tù ph¸t)
24, 31,
40, 66
§Çu

5, 6, 7, 8, 10, 9, 54,
25, 26, 27, 28, 11, 48,
12 19 18 3, 15
§u«i 29, 51, 53

H×nh 6.6. S¬ ®å gi¶n l−îc minh häa qu¸ tr×nh ph¸t sinh h×nh th¸i cña thùc khuÈn thÓ T4. C¸c gen m·
hãa c¸c phÇn ®Çu, ®u«i vµ c¸c sîi ®u«i ®−îc biÓu hiÖn theo c¸c con ®−êng riªng; råi s¶n phÈm cña chóng
®−îc tæ hîp l¹i vµo giai ®o¹n cuèi cïng. C¸c chØ sè trªn h×nh biÓu diÔn gen cÇn ®−îc biÓu hiÖn t¹i mçi b−íc.
Mét sè b−íc cña qu¸ tr×nh ph¸t sinh h×nh th¸i ë virut nµy ®· biÕt nh−ng ®−îc gi¶n l−îc kh«ng vÏ trªn h×nh.

RÊt nhiÒu qu¸ tr×nh sinh häc kh¸c còng ®· ®−îc ph©n tÝch dùa trªn c¸c nghiªn cøu
®ét biÕn nh− vËy, bao gåm chuçi truyÒn ®iÖn tö trong quang hîp ë thùc vËt vµ c¸c qu¸
tr×nh cè ®Þnh nit¬ ë vi khuÈn. GÇn ®©y, c¸c thÓ ®ét biÕn nµy còng ®−îc sö dông trong
nhiÒu nghiªn cøu vÒ sù biÖt hãa vµ ph¸t sinh h×nh th¸i ë c¸c loµi ®éng vËt vµ thùc vËt
bËc cao. VÒ nguyªn t¾c, c¸c thÓ ®ét biÕn cã thÓ ®−îc dïng ®Ó x¸c ®Þnh c¸c b−íc cña mäi
qu¸ tr×nh sinh häc ®−îc ®iÒu khiÓn bëi c¸c c¬ chÕ di truyÒn v× mçi gen ®Òu cã thÓ ®ét biÕn
vÒ d¹ng mµ s¶n phÈm cña nã kh«ng biÓu hiÖn chøc n¨ng. §iÒu quan träng lµ viÖc x¸c
®Þnh vµ ph©n lËp ®−îc c¸c d¹ng ®ét biÕn liªn quan ®Õn c¸c tÝnh tr¹ng cÇn quan t©m.

6.4. C¬ së ph©n tö cña ®ét biÕn

6.4.1. §ét biÕn do lçi sao chÐp ADN

Nh− ®· nãi ë ch−¬ng 2, khi m« t¶ cÊu tróc chuçi xo¾n kÐp ADN, Watson vµ Crick
cho r»ng “nguyªn t¾c kÕt cÆp bæ trî cña c¸c baz¬ nit¬ chÝnh lµ nguyªn lý c¬ b¶n cña qu¸
tr×nh sao chÐp vËt chÊt di truyÒn”. §ång thêi, c¸c t¸c gi¶ ®· chØ ra mét c¬ chÕ gi¶i thÝch
sù xuÊt hiÖn ®ét biÕn tù ph¸t. Theo ®ã, Watson vµ Crick ®· nªu r»ng “cÊu tróc cña c¸c
baz¬ nit¬ trong ph©n tö ADN kh«ng ph¶i ë tr¹ng th¸i tÜnh”. C¸c nguyªn tö hydro cã thÓ
chuyÓn tõ mét vÞ trÝ nµy sang vÞ trÝ kh¸c trong purine hay pyrimidine, vÝ dô nh− tõ mét
nhãm amino sang mét nguyªn tö nit¬ vßng. Nh÷ng biÕn ®æi hãa häc nh− vËy ®−îc gäi lµ

188

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

sù hç biÕn hãa häc. MÆc dï D¹ng phæ biÕn D¹ng hiÕm gÆp
hiÖn t−îng hç biÕn hãa häc

hiÕm khi x¶y ra, nh−ng thùc tÕ O OH
chóng cã vai trß quan träng C
trong duy tr× cÊu tróc chÝnh x¸c HN C CH3 C
cña ADN, bëi v× mét sè d¹ng hç C CH N C CH3
biÕn hãa häc cã thÓ lµm thay ON C CH
ON

®æi kh¶ n¨ng kÕt cÆp gi÷a c¸c §−êng Thymine (T) §−êng
baz¬ nit¬. C¸c cÊu tróc axit D¹ng keto D¹ng enol

nucleic ®−îc chóng ta m« t¶ ë NH2 NH

ch−¬ng 2 lµ c¸c d¹ng phæ biÕn, C C
bÒn v÷ng; mµ ë nh÷ng d¹ng N CH HN CH
nµy, adenine (A) lu«n kÕt cÆp C CH
vµ thymine (T), còng nh− ON C CH
guanine (G) lu«n kÕt cÆp víi ON
cytosine (C), vµ ng−îc l¹i. C¸c §−êng
d¹ng bÒn v÷ng cña c¸c baz¬ D¹ng Amino §−êng

NH2 Cytosine (C) D¹ng Imino

NH

nit¬, lµ keto (®èi víi G vµ T) vµ C N C N
amino (®èi víi A vµ C) rÊt N C CH HN C CH
hiÕm khi bÞ hç biÕn t−¬ng øng HC C HC C
N N
thµnh d¹ng kÐm bÒn h¬n lµ N N
§−êng §−êng

enol vµ imino (h×nh 6.7). Thêi D¹ng Amino ADENine (A) D¹ng Imino
gian tån t¹i ë d¹ng kÐm bÒn
cña c¸c baz¬ nit¬ th−êng rÊt O OH
ng¾n. Tuy vËy, nÕu ®óng lóc
c¸c baz¬ nit¬ tån t¹i ë c¸c d¹ng C N C N
hç biÕn hãa häc kÐm bÒn, mµ HN C CH N C CH
chóng ®−îc huy ®éng tham gia
vµo qu¸ tr×nh sao chÐp ADN vµ CC N H2N C N C N §−êng
H2N N
§−êng

D¹ng keto Guanine (G) D¹ng enol

l¾p r¸p vµo m¹ch ADN ®ang H×nh 6.7. C¸c d¹ng hç biÕn cña bèn lo¹i nucleotide phæ biÕn. Sù
chuyÓn vÞ nguyªn tö hydro (H) gi÷a vÞ trÝ sè 3 vµ 4 cña pyrimidine vµ
®−îc tæng hîp, th× ®ét biÕn gi÷a sè 1 vµ 6 cña purine lµm thay ®æi kh¶ n¨ng kÕt cÆp cña chóng.
(thay thÕ nucleotide) sÏ x¶y ra.

Khi c¸c baz¬ nit¬ tån t¹i ë d¹ng hç biÕn hãa häc hiÕm gÆp (enol vµ imino), th× c¸c cÆp

baz¬ nit¬ ®−îc h×nh thµnh lµ A = C vµ G ≡ T (h×nh 6.8a). HËu qu¶ cña hiÖn t−îng nµy

lµ sau hai lÇn sao chÐp, sÏ x¶y ra sù thay thÕ cÆp nucleotide A = T thµnh G ≡ C, hoÆc G ≡

C thµnh A = T (h×nh 6.8b).

C¸c ®ét biÕn g©y ra bëi hiÖn t−îng hç biÕn hãa häc dÉn ®Õn sù thay thÕ cÆp purine -

pyrimindine nµy b»ng mét cÆp purine - pyrimidine kh¸c (vÝ dô A = T → G ≡ C) vµ ng−îc
l¹i. Nh÷ng ®ét biÕn thay thÕ nucleotide nh− vËy ®−îc gäi lµ ®ét biÕn ®ång ho¸n. Cßn

®ét biÕn thay thÕ c¸c baz¬ nit¬ tõ mét purine thµnh mét pyrimidine vµ ng−îc l¹i, th×
®−îc gäi lµ ®ét biÕn dÞ ho¸n. Cã 4 kiÓu ®ét biÕn ®ång ho¸n vµ 8 kiÓu ®ét biÕn dÞ ho¸n
kh¸c nhau (h×nh 6.8c). Mét d¹ng ®ét biÕn ®iÓm kh¸c lµ sù thªm vµo hoÆc mÊt ®i mét

hoÆc mét sè c¸c cÆp baz¬ nit¬. Khi sè cÆp baz¬ nit¬ ®−îc thªm vµo hoÆc mÊt ®i kh«ng
ph¶i béi sè cña ba vµ n»m trong khung ®äc cña gen, th× dÉn ®Õn ®ét biÕn dÞch khung.

Bëi v×, nh÷ng ®ét biÕn nµy lµm thay ®æi khung ®äc cña tÊt c¶ c¸c bé ba m· hãa cßn l¹i
trong gen n»m xu«i dßng kÓ tõ vÞ trÝ ®ét biÕn (h×nh 6.9).

189

§inh §oµn Long

C¶ ba d¹ng ®ét biÕn lµ ®ång ho¸n, dÞ ho¸n vµ lÖch khung ®Òu cã thÓ xuÊt hiÖn do
hËu qu¶ cña ®ét biÕn tù ph¸t. Tuy vËy, mét ®iÒu ®¸ng ng¹c nhiªn lµ phÇn lín c¸c ®ét
biÕn tù ph¸t ®· ®−îc nghiªn cøu ®Õn nay thuéc nhãm thªm hoÆc mÊt mét cÆp nucleotide
chø kh«ng ph¶i lµ c¸c ®ét biÕn thay thÕ nucleotide. HÇu nh− tÊt c¶ c¸c ®ét biÕn dÞch
khung trong thùc tÕ ®Òu dÉn ®Õn sù tæng hîp c¸c protein mÊt chøc n¨ng.

a) C¸c d¹ng kÕt cÆp hiÕm A = C vµ G ≡ T h×nh thµnh khi C vµ G ë c¸c d¹ng hç biÕn hiÕm lµ imino vµ enol

HH CH3

CN CO
HC C H
HC C HH N N O
N
N N
C H C §−êng C H C N
§−êng O N C N O N C CH
CH
HC N C N H C C N
N N
Cytosine Thymine H
D¹ng phæ biÕn keto §−êng
D¹ng hiÕm imino ADENine §−êng
GuaNine

D¹ng phæ biÕn amino D¹ng hiÕm enol

D¹ng kÕt cÆp hiÕm A = C D¹ng kÕt cÆp hiÕm G ≡ T

b) Hç biÕn g©y ®ét biÕn thay thÕ nucleotide sau 2 lÇn sao chÐp c) 12 kiÓu thay thÕ nucleotide cã
thÓ x¶y ra trong ph©n tö ADN
ADN gèc T=A G≡C A=T C≡G
Sao chÐp lÇn 1 T

T* ≡ G G* ≡ T A* = C C* = A A G

Sao chÐp lÇn 2

ADN ®ét biÕn C≡G A=T G≡C T=A C

Tr−êng hîp 1 Tr−êng hîp 2 Tr−êng hîp 3 Tr−êng hîp 4

H×nh 6.8. HiÖn t−îng hç biÕn hãa häc g©y ®ét biÕn thay thÕ nucleotide. a) HiÖn t−îng hç biÕn hãa häc g©y

nªn c¸c d¹ng kÕt cÆp hiÕm lµ A = C vµ G ≡ T (cã 4 tr−êng hîp t−¬ng øng víi 4 d¹ng hç biÕn hiÕm cña A, T, G vµ
C; ë ®©y chØ minh häa 2 tr−êng hîp cña G vµ C). b) HiÖn t−îng hç biÕn g©y ®ét biÕn thay thÕ nucleotide kiÓu
®ång ho¸n sau hai lÇn sao chÐp, nÕu nucleotide d¹ng hç biÕn hiÕm (kÝ hiÖu dÊu *) xuÊt hiÖn mét lÇn trong qu¸
tr×nh sao chÐp. c) 12 kiÓu thay thÕ nucleotide cã thÓ x¶y ra trong ph©n tö ADN, trong ®ã cã 4 kiÓu ®ét biÕn thay
thÕ ®ång ho¸n (kÝ hiÖu b»ng mòi tªn liÒn nÐt) vµ 8 kiÓu ®ét biÕn thay thÕ dÞ ho¸n (kÝ hiÖu b»ng mòi tªn ®øt nÐt).

Thªm cÆp G ≡ C

ADN A T G A A A G G G C C C T T T ... A T G A A A C G G G C C C T T T ...
T A C T T T C C C G G G A A A ... T A C T T T G C C C G G G A A A ...

M¹ch m· hãa

A U G A A A G G G C C C U U U ... AUGA A AC GGGCCCUU ...
mARN

Codon Codon Codon Codon Codon Codon Codon Codon Codon Codon
123 45 123 45

Protein Met Lys Gly Pro Phe … Met Lys Arg Ala Leu …

H×nh 6.9. §ét biÕn dÞch khung. Sù thªm vµo hay mÊt ®i mét hoÆc hai cÆp baz¬ nit¬ lµm thay ®æi khung ®äc vµ
toµn bé c¸c bé ba (codon) m· hãa cßn l¹i n»m xu«i dßng gen kÓ tõ vÞ trÝ ®ét biÕn.

190

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Mét c¬ chÕ ®ét biÕn tù a) ChiÒu tæng hîp ADN b) ChiÒu tæng hîp ADN
ph¸t kh¸c cã thÓ x¶y ra dÉn

®Õn sù thªm vµo hoÆc mÊt ®i

mét sè nucleotide liªn quan

®Õn sù sao chÐp ADN

tr−ît (cßn gäi lµ sù sao

chÐp lÖch môc tiªu, h×nh

6.10). HiÖn t−îng nµy

th−êng ®−îc cho lµ c¬ chÕ

dÉn ®Õn sù h×nh thµnh nhiÒu

locut mang c¸c tr×nh tù

nucleotide ng¾n lÆp l¹i liªn

tôc víi sè l−îng biÕn ®éng c)

STR (short tandem repeats)

vµ VNTR (variable number ChiÒu tæng hîp ADN

tandem repeats). Sù sao

chÐp lÖch môc tiªu lµ do sù

h×nh thµnh c¸c vßng ADN

m¹ch ®¬n th−êng h×nh

thµnh ë c¸c ®o¹n c¸c tr×nh tù

nucleotide ng¾n lÆp l¹i liªn

tôc. NÕu vßng nµy xuÊt ph¸t

tõ m¹ch khu«n, th× cã xu

h−íng lµm mÊt nucleotide

(lµm gi¶m sè tr×nh tù lÆp

l¹i); cßn nÕu xuÊt ph¸t tõ

m¹ch ®ang ®−îc tæng hîp th×

cã xu h−íng thªm nucleotide

(lµm t¨ng sè tr×nh tù lÆp l¹i). H×nh 6.10. Sao chÐp tr−ît (lÖch) môc tiªu cã thÓ lµ nguyªn nh©n dÉn
§o¹n tr×nh tù ng¾n lÆp l¹i ®Õn c¸c locut cã sè l−îng tr×nh tù lÆp l¹i biÕn ®éng (STR vµ VNTR).
a) NÕu baz¬ nit¬ bÞ sao chÐp tr−ît n»m trªn m¹ch ®ang tæng hîp míi, th×
liªn tiÕp ®−îc gäi lµ ®¬n vÞ dÉn ®Õn sù t¨ng sè l−îng cña ®¬n vÞ lÆp l¹i (ë vÝ dô nµy lµ [T]5 → [T]6).
lÆp l¹i. Chóng ta dÔ dµng b) NÕu baz¬ nit¬ bÞ sao chÐp tr−ît n»m trªn m¹ch lµm khu«n, th× dÉn ®Õn
nhËn thÊy nÕu ®¬n vÞ lÆp l¹i sù gi¶m sè l−îng ®¬n vÞ lÆp l¹i (ë vÝ dô nµy lµ [GA]3 → [GA]4). c) Mét sè
kh«ng ph¶i lµ béi sè cña ba, tr×nh tù lÆp l¹i cã thÓ t¹o cÊu tróc cÆp tãc, dÉn ®Õn sè l−îng ®¬n vÞ lÆp l¹i
th× ®ét biÕn do sao chÐp lÖch thay ®æi nhiÒu sau mçi lÇn sao chÐp (ë vÝ dô nµy lµ [GTC]8 → [GTC]13).
môc tiªu cã xu h−íng g©y

nªn ®ét biÕn dÞch khung. Trong c¸c locut STR (cßn gäi lµ vi vÖ tinh, microsatellite, hay

SSR), ®¬n vÞ lÆp l¹i th−êng ng¾n, gåm tõ 2 ®Õn 6 bp, ch¼ng h¹n ®¬n vÞ lÆp l¹i 2 bp [GT]n
hay lÆp l¹i 3 bp [CAG]n (trong ®ã n lµ sè lÇn lÆp l¹i). Theo mét thèng kª gÇn ®©y, hÖ gen
ng−êi cã kho¶ng 128.000 locut lÆp 2 bp, 8740 locut lÆp l¹i 3 bp, 23.680 locut lÆp l¹i 4 bp,

4300 locut lÆp l¹i 5 bp vµ 230 locut lÆp l¹i 6 bp. Trong c¸c locut lÆp l¹i 6 bp bao gåm c¸c

locut t¹i c¸c vïng ®Çu mót NST. C¸c locut VNTR (cßn gäi lµ tiÓu vÖ tinh, minisatellites)

cã ®Æc ®iÓm còng gièng víi STR vÒ sù lÆp l¹i liªn tiÕp cña c¸c tr×nh tù ®¬n, nh−ng ®¬n vÞ

lÆp l¹i th−êng lín h¬n, gåm tõ 7 ®Õn vµi chôc bp. Trong hÖ gen ng−êi, sè locut VNTR Ýt

h¬n nhiÒu so víi STR.

MÆc dï cßn nhiÒu ®iÓm ch−a hoµn toµn s¸ng tá vÒ nguyªn nh©n, c¬ chÕ ph©n tö
vµ tÇn sè cña c¸c ®ét biÕn tù ph¸t nh−ng cã thÓ kÓ ®Õn 3 yÕu tè chÝnh lµ: 1) sù chÝnh
x¸c cña bé m¸y sao chÐp ADN, 2) hiÖu qu¶ cña c¸c c¬ chÕ söa ch÷a ADN, vµ 3) møc ®é
tiÕp xóc víi c¸c t¸c nh©n g©y ®ét biÕn trong m«i tr−êng. Thùc tÕ, nh÷ng trôc trÆc trong

191

§inh §oµn Long

c¸c qu¸ tr×nh sao chÐp ADN vµ söa ch÷a ADN (vèn lµ c¸c qu¸ tr×nh ®−îc ®iÒu khiÓn bëi
c¬ chÕ di truyÒn) trong nhiÒu tr−êng hîp ®· lµm t¨ng tÇn sè ®ét biÕn lªn ®¸ng kÓ.

6.4.2. §ét biÕn do c¸c t¸c nh©n hãa häc

ViÖc ph¸t hiÖn ra ngµy cµng nhiÒu c¸c hîp chÊt g©y ®ét biÕn ®· gióp chóng ta hiÓu
biÕt ngµy cµng ®Çy ®ñ h¬n vÒ c¸c c¬ chÕ ®ét biÕn ë møc ph©n tö. MÆc dï ngµy nay ®· cã
nhiÒu hîp chÊt ®−îc xÕp vµo danh môc c¸c hîp chÊt g©y ®ét biÕn, nh−ng ë ®©y chóng ta
chØ nªu ®¹i diÖn mét sè hîp chÊt cã hiÖu lùc g©y ®ét biÕn m¹nh vµ c¬ chÕ ®Æc tr−ng.

Cã lÏ, khÝ mï t¹t lµ hîp chÊt g©y ®ét biÕn ®Çu tiªn ®−îc biÕt. Nhµ khoa häc Anh
Auerbach vµ c¸c ®ång nghiÖp ®· ph¸t hiÖn ra hiÖu lùc ®ét biÕn cña khÝ nµy trong ThÕ
chiÕn thø hai. Nh−ng do lo sî khÝ nµy ®−îc dïng lµm vò khÝ, chÝnh phñ Anh ®· kh«ng
cho phÐp c¸c nhµ khoa häc c«ng bè vÒ ph¸t hiÖn nµy cho ®Õn khi ThÕ chiÕn kÕt thóc.
Ngµy nay chóng ta biÕt, khÝ mï t¹t thuéc mét nhãm lín hîp chÊt g©y ®ét biÕn cã tªn gäi
chung lµ c¸c hîp chÊt alkyl hãa (lµ c¸c chÊt cã kh¶ n¨ng chuyÓn c¸c nhãm -CH3 hoÆc
- C2H5 ... sang c¸c baz¬ nit¬ cña ADN).

C¸c t¸c nh©n ®ét biÕn hãa häc cã thÓ ph©n thµnh hai nhãm chÝnh: 1) nhãm c¸c hîp
chÊt t¸c ®éng ®Õn ADN ®ang sao chÐp hay kh«ng sao chÐp; nhãm nµy gåm c¸c hîp chÊt
alkyl hãa vµ axit nit¬, vµ 2) nhãm c¸c hîp chÊt chØ t¸c ®éng ®Õn c¸c ph©n tö ADN ®ang
sao chÐp, bao gåm c¸c hîp chÊt cã cÊu tróc ph©n tö gÇn gièng c¸c purine vµ pyrimidine
(gäi lµ c¸c hîp chÊt thÕ baz¬ nit¬). Ngoµi ra, nhãm thø hai còng gåm c¶ c¸c thuèc nhuém
acridine, cã thÓ xen vµo gi÷a ph©n tö ADN lµm ph¸t sinh sai sãt trong sao chÐp ADN.

Së dÜ c¸c hîp chÊt thÕ baz¬ nit¬ cã thÓ g©y ®ét biÕn lµ do chóng cã cÊu tróc
gièng c¸c baz¬ nit¬ nªn cã thÓ cµi vµo chuçi polynucleotide ®ang tæng hîp. Nh−ng, ®ång
thêi chóng còng ®ñ kh¸c c¸c baz¬ nit¬ ®Ó g©y nªn sù kÕt cÆp sai trong qu¸ tr×nh sao
chÐp. Cã hai hîp chÊt g©y ®ét biÕn ®iÓn h×nh ho¹t ®éng theo c¬ chÕ thÕ baz¬ nit¬ lµ 5-BU
(5-bromouracine) vµ 2-AP (2-aminopurine). 5-BU cã cÊu tróc gièng thymine (ë vÞ trÝ C5
cña 5-BU cã nhãm bromine gièng víi nhãm methyl ë vÞ trÝ nµy cña thymine). Nh−ng do
nhãm bromine hay thay ®æi sù ph©n bè ®iÖn tÝch, nªn dÔ x¶y ra hiÖn t−îng hç biÕn hãa
häc (h×nh 6.11). ë d¹ng bÒn v÷ng keto, 5-BU liªn kÕt víi adenine. Nh−ng khi bÞ hç biÕn
(vÒ d¹ng enol), 5-BU sÏ liªn kÕt víi guanine. Nh− vËy, hËu qu¶ cña ®ét biÕn do 5-BU g©y
ra gièng víi ®ét biÕn do hç biÕn hãa häc cña c¸c baz¬ nit¬ trong ®ét biÕn tù ph¸t (h×nh
6.8b). Nãi c¸ch kh¸c, ®ét biÕn do 5-BU g©y ra th−êng lµ ®ång ho¸n (A=T → G≡C). Tuy
nhiªn, nÕu d¹ng kÐm bÒn enol cña 5-BU l¹i xuÊt hiÖn ®óng vµo lóc m¹ch ADN ®ang tæng
hîp, th× 5-BU cã thÓ kÕt cÆp víi guanine, vµ dÉn ®Õn ®ét biÕn ng−îc (G≡C → A=T). §©y lµ
mét c¬ chÕ g©y ®ét biÕn phôc håi. Nh−ng, nhí r»ng d¹ng enol lµ kÐm bÒn nªn rÊt hiÕm
gÆp. V× vËy, tÇn sè ®ét biÕn ng−îc th−êng nhá h¬n ®ét biÕn thuËn. C¬ chÕ ho¹t ®éng cña
2-AP còng gièng nh− 5-BU, nh−ng nã thay thÕ c¸c purine A vµ G.

Axit nit¬ (HNO2) lµ mét chÊt g©y ®ét biÕn m¹nh t¸c ®éng lªn ph©n tö ADN bÊt kÓ
ph©n tö nµy ®ang sao chÐp hay kh«ng. §©y lµ mét hîp chÊt oxy hãa m¹nh, lµm lo¹i
nhãm amin (NH2-) ra khái c¸c baz¬ nit¬ A, G vµ C. Ph¶n øng nµy lµm d¹ng amino
chuyÓn thµnh d¹ng keto, vµ lµm thay ®æi kh¶ n¨ng t¹o liªn kÕt hydro cña c¸c baz¬ nit¬
(h×nh 6.11d). Adenine sau khi bÞ lo¹i nhãm amin th× chuyÓn thµnh hypoxanthine cã xu
h−íng liªn kÕt víi cytosine (chø kh«ng ph¶i víi thymine nh− b×nh th−êng). Cytosine th×
chuyÓn thµnh uracil (nghÜa lµ liªn kÕt víi A chø kh«ng ph¶i víi G). Guanine th× chuyÓn
thµnh xanthine; nh−ng xanthine th× vÉn liªn kÕt víi C, nªn sù lo¹i amin hãa cña guanine
kh«ng g©y ®ét biÕn. Do sù lo¹i amin hãa cña axit nit¬ ®èi víi A dÉn ®Õn ®ét biÕn ®ång
ho¸n A=T → G≡C, vµ ®èi víi C g©y nªn ®ét biÕn ®ång hãa ng−îc lµ G≡C → A=T. Nªn cã
thÓ kh¼ng ®Þnh, axit nit¬ cã thÓ g©y ®ét biÕn hai chiÒu A=T ↔ G≡C. KÕt qu¶ lµ, t¸c nh©n
®ét biÕn nµy cã thÓ g©y ®ét biÕn thuËn vµ ®ét biÕn ng−îc phôc håi trë l¹i alen kiÓu d¹i.

192

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

C¸c thuèc nhuém acridine, nh− proflavine (h×nh 6.11c) hay c¸c dÉn xuÊt
acridine kh¸c, lµ c¸c hîp chÊt g©y ®ét biÕn m¹nh theo kiÓu ®ét biÕn dÞch khung. C¸c
thuèc nhuém acridine cã tÝnh kiÒm lu«n cã xu h−íng t¹o liªn kÕt vµ xen vµo gi÷a c¸c
cÆp baz¬ nit¬ xÕp chång lªn nhau trªn chuçi ADN. Khi ph©n tö nµy xen vµo chuçi xo¾n
kÐp, nã lµm ph©n tö ADN trë nªn cøng nh¾c vµ lµm thay ®æi cÊu h×nh xo¾n kÐp th«ng
th−êng, thËm chÝ lµm vÆn xo¾n ph©n tö ADN. Khi ®o¹n ADN ®ang sao chÐp liªn kÕt víi
acridine, nã th−êng bÞ mÊt mét hoÆc mét sè baz¬ nit¬, dÉn ®Õn ®ét biÕn dÞch khung.
Nh− ®· ®Ò cËp ë trªn, c¸c ®ét biÕn do acridine g©y ra th−êng lµm mÊt chøc n¨ng gen
hoÆc s¶n phÈm cña gen.

C¸c chÊt alkyl hãa lµ c¸c chÊt cã thÓ chuyÓn nhãm alkyl cña chóng cho c¸c hîp
chÊt kh¸c. Chóng bao gåm khÝ mï t¹t vµ c¸c hîp chÊt methyl vµ ethyl methane sulfate
(MMS vµ EMS). C¸c hîp chÊt nµy cã nhiÒu hiÖu øng kh¸c nhau lªn ph©n tö ADN. C¸c
hîp chÊt alkyl hãa cã thÓ g©y nªn c¸c lo¹i ®ét biÕn kh¸c nhau, bao gåm ®ång ho¸n, dÞ
ho¸n, dÞch khung vµ thËm chÝ biÕn d¹ng NST, tïy thuéc vµo møc ho¹t ®éng cña mçi hîp
chÊt víi ADN. Mét c¬ chÕ g©y ®ét biÕn cña c¸c hîp chÊt alkyl hãa lµ chóng chuyÓn nhãm
ethyl hoÆc methyl tíi c¸c baz¬ nit¬ vµ lµm chóng kÕt cÆp sai. VÝ dô nh−, EMS ethyl hãa
c¸c baz¬ nit¬ ë c¸c vÞ trÝ 7-N vµ 6-O. Khi G → 7-ethylguanine, nã kÕt cÆp víi thymine vµ

a) C¸c hîp chÊt akyl hãa CH3 CH2 O SO2 CH3 CH3 CH2 O SO2 CH2 CH3

Cl CH2 CH2 S CH2 CH2 Cl Ethyl methane sulfonate Ethyl ethane sulfonate
(EMS) (EES)
Di-(2-chloroethyl) sulfide
(khÝ mï t¹t)

b) C¸c hîp chÊt gièng baz¬ nit¬ c) Nhãm thuèc nhuém acridine

OH HHH

H C Br NCC N HCCCH
NC CH CCCC

CC H2N C N C N C C+C C +
ONH H H2N C N C NH3

H 2 - Amino purine HHH
(2-AP)
5-Bromouracine 2,8-Diamino acridine
(5-BU) (Proflavin)

d) C¸c hîp chÊt khö e) C¸c hîp chÊt f) Sù kÕt cÆp cña 5-BU víi A vµ G
nhãm amin hydroxyl hãa Br

HNO2 NH2OH NCO
CCHH
Axit nit¬ Hydroxylamine N
NN
C H C
§−êng N C N

H×nh 6.11. Mét sè nhãm hîp chÊt g©y ®ét biÕn O CH
m¹nh. a) C¸c hîp chÊt akyl hãa cã thÓ g©y nªn c¸c HCNC N

®ét biÕn ®ång ho¸n, dÞ ho¸n, dÞch khung hoÆc biÕn (5-BU = A) §−êng
d¹ng NST. b) C¸c hîp chÊt thÕ baz¬ nit¬ cã xu Br
h−íng g©y nªn ®ét biÕn ®ång ho¸n. c) Nhãm hîp
NCO
chÊt kiÓu acridine cã xu h−íng g©y ®ét biÕn dÞch CCH
khung. d) C¸c hîp chÊt khö nhãm amin cã thÓ g©y O
®ét biÕn ®ång ho¸n hai chiÒu. e) C¸c hîp chÊt NN
C H C
hydroxyl hãa cã hiÖu øng g©y ®ét biÕn ®Æc hiÖu §−êng N C N
(xem thªm trong bµi). f) Kh¶ n¨ng kÕt cÆp ®ång thêi
O CH
cña 5-BU víi A vµ G lµ c¬ së cña c¸c ®ét biÕn ®ång H C C
ho¸n th−êng g©y ra bëi hîp chÊt nµy. N N N

(5-BU ≡ G) H §−êng

193

§inh §oµn Long

g©y nªn ®ét biÕn ®ång ho¸n G≡C → A=T. Sù alkyl hãa c¸c baz¬ nit¬ kh¸c cã thÓ thóc ®Èy
mét sè c¬ chÕ söa ch÷a ADN cã xu h−íng sai (vÝ dô: c¬ chÕ SOS, ®−îc m« t¶ ë phÇn sau
ch−¬ng nµy), dÉn ®Õn c¸c ®ét biÕn ®ång ho¸n, dÞ ho¸n, hoÆc dÞch khung. Mét sè hîp chÊt

alkyl hãa, ®Æc biÖt lµ c¸c hîp chÊt cã hai nhãm alkyl ho¹t ®éng cã thÓ t¹o nªn sù v¾t chÐo
gi÷a hai m¹ch hoÆc gi÷a hai ph©n tö ADN, dÉn ®Õn sù ®øt g·y hoÆc mét sè biÕn d¹ng
kh¸c cña NST. Nh− vËy, so víi c¸c hîp chÊt thÕ baz¬ nit¬, axit nit¬ vµ c¸c thuèc nhuém

acridine, c¸c hîp chÊt alkyl hãa cã xu h−íng g©y hiÖu øng ®ét biÕn Ýt ®Æc hiÖu h¬n.

Kh¸c víi c¸c hîp chÊt acridine, c¸c hîp chÊt hydroxyl hãa (cho nhãm OH-), nh−

hydroxylamine NH2OH, l¹i cã hiÖu øng g©y ®ét biÕn ®Æc hiÖu. Nhãm hîp chÊt nµy g©y
nªn ®ét biÕn ®ång ho¸n G≡C → A=T. Khi ADN ®−îc xö lý víi NH2OH, cytosine bÞ chuyÓn
hãa thµnh hydroxylamincytosine. Hîp chÊt nµy kÕt cÆp víi adenin, dÉn ®Õn ®ét biÕn G≡C
→ A=T. Nhê g©y hiÖu øng ®ét biÕn ®Æc hiÖu, hydroxylamine cã mét øng dông ®Æc biÖt
quan träng trong viÖc x¸c ®Þnh ®−îc kiÓu ®ét biÕn ®ång ho¸n. Cô thÓ lµ, c¸c ®ét biÕn phôc

håi do xö lý víi axit nit¬ hay chÊt thÕ baz¬ nit¬ cã thÓ ®−îc ph©n biÖt thµnh hai nhãm

trªn c¬ së xö lý víi hydroxylamine. Nhãm thø nhÊt mang cÆp baz¬ nit¬ ®ét biÕn A=T
kh«ng ®¶o ng−îc ®−îc khi xö lý víi hydroxylamine, cßn nhãm thø hai mang cÆp baz¬ nit¬

®ét biÕn G≡C cã thÓ ®¶o ng−îc ®−îc nhê hydroxylamine. Nh− vËy, hydroxylamine cã thÓ
®−îc dïng ®Ó ph©n biÖt ®ét biÕn ®ång ho¸n lµ tõ A=T → G≡C hay tõ G≡C → A=T.

6.4.3. §ét biÕn do c¸c t¸c nh©n vËt lý

Vïng phæ ®iÖn tõ (h×nh Vïng ¸nh s¸ng nh×n thÊy
6.12) víi c¸c b−íc sãng ng¾n

h¬n vµ dµi h¬n ¸nh s¸ng nh×n 750nm
§á
thÊy ®−îc chia lµm hai vïng Vµng
Xanh lôc
bøc x¹ ion hãa (gåm tia X, Xanh lam
380 nm
tia gamma, c¸c tia vò trô

n¨ng l−îng cao) vµ bøc x¹ B−íc Vi Hång Tia
vò trô
kh«ng ion hãa (tia cùc tÝm - sãng radio sãng ngo¹i UV Tia X Tia γ
UV). C¸c tia bøc x¹ ion hãa

th−êng cã n¨ng l−îng cao vµ 103m 109nm 106nm 103nm 1nm 10-3nm 10-5nm B−íc sãng
®−îc sö dông trong chÈn ®o¸n (1m) Bøc x¹ ion hãa
y häc do chóng cã kh¶ n¨ng
xuyªn s©u qua c¸c m«. Trong ThÊp nhÊt Møc n¨ng l−îng Cao nhÊt

qu¸ tr×nh truyÒn qua c¸c m«, H×nh 6.12. Phæ ®iÖn tõ. C¸c b−íc sãng ë møc n¨ng l−îng cao cã thÓ
tÕ bµo, c¸c tia x¹ va ch¹m vµo g©y ®ét biÕn gen vµ NST (nÕu liÒu chiÕu ®ñ lín trong thêi gian dµi).

c¸c h¹t nh©n vµ lµm gi¶i

phãng ®iÖn tö, t¹o nªn c¸c gèc tù do tÝch ®iÖn d−¬ng hoÆc c¸c ion. §Õn l−ît m×nh, c¸c ion

va ch¹m víi c¸c ph©n tö kh¸c vµ lµm gi¶i phãng c¸c ®iÖn tö kh¸c tiÕp theo. KÕt qu¶ lµ

mét “h×nh nãn” cña c¸c ion h×nh thµnh däc theo ®−êng ®i cña tia x¹ khi nã xuyªn qua c¸c

m«. Qu¸ tr×nh ion hãa nµy th−êng ®−îc thùc hiÖn bëi m¸y ph¸t tia X, tia pr«t«n, tia

n¬tr«n, còng nh− c¸c tia alpha, bªta vµ gama xuÊt ph¸t tõ c¸c ®ång vÞ phãng x¹ nh− 32P,

35S vµ urani-38 ®−îc dïng trong c¸c lß ph¶n øng h¹t nh©n.

Tia cùc tÝm (UV) cã n¨ng l−îng thÊp h¬n c¸c bøc x¹ ion hãa, nªn nã chØ th©m nhËp

®−îc líp tÕ bµo bÒ mÆt vµ kh«ng t¹o nªn hiÖu øng ion hãa. Tia UV bÞ mÊt n¨ng l−îng cho

h¹t nh©n mµ nã tiÕp xóc, lµm cho ®iÖn tö ë quü ®¹o ngoµi cña h¹t nh©n t¨ng lªn vÒ møc
n¨ng l−îng, gäi lµ møc kÝch thÝch. C¸c ph©n tö mang c¸c nguyªn tö ion hãa hoÆc ë møc

kÝch thÝch cã tÝnh ph¶n øng hãa häc cao h¬n nhiÒu so víi d¹ng bÒn v÷ng th«ng th−êng

194

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

cña chóng. Kh¶ n¨ng ph¶n øng t¨ng lªn cña c¸c nguyªn tö trong ph©n tö ADN lµ nguyªn
nh©n cña phÇn lín c¸c ®ét biÕn g©y ra bëi c¸c bøc x¹ ion hãa vµ tia UV.

Tia X vµ c¸c bøc x¹ ion hãa th−êng ®−îc ®o b»ng ®¬n vÞ r¬ntghen (r), tÝnh b»ng sè
nguyªn tö ion hãa trªn mét ®¬n vÞ thÓ tÝch trong ®iÒu kiÖn tiªu chuÈn. Thùc tÕ, mét
r¬ntghen ®−îc tÝnh b»ng l−îng chiÕu x¹ ion hãa t¹o ra 2,083 x 109 cÆp ion trªn 1cm3 khÝ ë
0oC vµ ¸p suÊt lµ 760 mmHg. CÇn chó ý lµ, liÒu chiÕu x¹ cã sù tÝch lòy theo thêi gian.
NghÜa lµ, liÒu chiÕu x¹ thÊp qua thêi gian dµi cã thÓ t−¬ng ®−¬ng víi liÒu cao trong thêi
gian ng¾n. §iÒu nµy rÊt quan träng, bëi phÇn lín c¸c nghiªn cøu cho thÊy tÇn sè ®ét biÕn
®iÓm xuÊt hiÖn tØ lÖ thuËn víi liÒu chiÕu x¹. Ch¼ng h¹n nh−, tØ lÖ ®ét biÕn ®iÓm g©y chÕt
ë tinh trïng ruåi dÊm t¨ng tuyÕn tÝnh tõ 0 ®Õn 15% khi liÒu chiÕu tia X t¨ng tõ 0 ®Õn
5000 r (tøc lµ, liÒu chiÕu cø t¨ng 1000 r, tÇn sè ®ét biÕn t¨ng 3%). Mèi quan hÖ tuyÕn
tÝnh nµy cho thÊy, hiÖu øng g©y ®ét biÕn cña tia X cã ®éng häc riªng lÎ. NghÜa lµ, mçi ®ét
biÕn lµ kÕt qu¶ cña mét sù kiÖn ion hãa ®éc lËp. Nãi c¸ch kh¸c, trong ®iÒu kiÖn tiªu
chuÈn, mçi ph¶n øng ion hãa bëi chiÕu x¹ n¨ng l−îng cao cã x¸c suÊt g©y ®ét biÕn ®iÓm
gièng nhau.

VËy, c−êng ®é chiÕu x¹ lµ bao nhiªu th× an toµn? ViÖc ph¸t triÓn vµ sö dông bom
h¹t nh©n, còng nh− sù cè ë c¸c nhµ m¸y ®iÖn nguyªn tö ®· g©y nªn mèi hoµi nghi vÒ
nguy c¬ ph¬i nhiÔm phãng x¹. Mèi quan hÖ tuyÕn tÝnh gi÷a tÇn sè ®ét biÕn vµ liÒu chiÕu
x¹ cho thÊy, kh«ng cã møc chiÕu x¹ nµo lµ an toµn. LiÒu chiÕu x¹ cµng cao, th× tÇn sè ®ét
biÕn cµng cao vµ ng−îc l¹i. ThËm chÝ ngay víi mét c−êng ®é chiÕu x¹ thÊp, th× dï tÇn sè
®ét biÕn cã thÓ thÊp, nh−ng x¸c suÊt ®Ó mét ®ét biÕn cã thÓ x¶y ra lµ hiÖn h÷u.

Khi thö nghiÖm chiÕu x¹ tinh trïng cña ruåi giÊm, c¸c nhµ nghiªn cøu thÊy r»ng
liÒu chiÕu dµi víi c−êng ®é thÊp cã hiÖu qu¶ ®ét biÕn gièng víi liÒu chiÕu ng¾n víi
c−êng ®é cao. Tuy vËy, ë chuét, liÒu chiÕu dµi c−êng ®é thÊp g©y Ýt ®ét biÕn h¬n ®«i chót
liÒu chiÕu ng¾n ë c−êng ®é cao (víi tæng liÒu chiÕu nh− nhau). Ngoµi ra, trªn chuét thÝ
nghiÖm, víi tæng liÒu chiÕu nh− nhau, sù chiÕu x¹ gi¸n ®o¹n lµm gi¶m nhÑ tÇn sè ®ét
biÕn so víi chiÕu x¹ liªn tôc. Sù kh¸c biÖt nµy trong hiÖu øng g©y ®ét biÕn cña chiÕu x¹
ion hãa gi÷a ®éng vËt cã vó vµ ruåi giÊm ®−îc gi¶i thÝch bëi hiÖu qu¶ cña c¸c c¬ chÕ söa
ch÷a ADN sai háng kh¸c nhau ë c¸c ®èi t−îng sinh vËt nµy. Mét sè c¬ chÕ söa ch÷a
ADN cã thÓ xuÊt hiÖn ë c¸c tÕ bµo sinh tinh vµ sinh trøng ë ®éng vËt cã vó, nh−ng
kh«ng ho¹t ®éng ë tinh trïng ruåi giÊm. Tuy vËy, ph¶i kh¼ng ®Þnh lµ tÊt c¶ c¸c xö lý
chiÕu x¹ ®Òu cã kh¶ n¨ng g©y ®ét biÕn, dï møc ®é cã thÓ kh¸c nhau, ë ruåi giÊm còng
nh− ë ®éng vËt cã vó.

C¸c chiÕu x¹ ion hãa còng cã thÓ g©y nªn nh÷ng biÕn ®æi lín trong cÊu tróc NST,
nh− mÊt ®o¹n, ®¶o ®o¹n, lÆp ®o¹n vµ chuyÓn ®o¹n. Nh÷ng sai háng NST nµy th−êng lµ
kÕt qu¶ cña c¸c sù kiÖn ®øt g·y NST, g©y ra bëi ®éng häc cña nhiÒu sù va ch¹m khi tia
x¹ truyÒn qua (kh¸c víi ®ét biÕn ®iÓm d−êng nh− chñ yÕu g©y ra bëi nh÷ng va ch¹m
®¬n lÎ).

Tia UV kh«ng ®ñ møc n¨ng l−îng ®Ó g©y nªn hiÖn t−îng ion hãa. Nh−ng nã l¹i
®−îc hÊp thô bëi nhiÒu ph©n tö h÷u c¬, trong ®ã cã c¸c purine vµ pyrimidine cña ADN,
vµ nguyªn tö cña nh÷ng ph©n tö nµy sau ®ã chuyÓn sang tr¹ng th¸i kÝch thÝch. Do kh¶
n¨ng xuyªn thÊu kÐm, tia UV chñ yÕu t¸c ®éng lªn líp tÕ bµo bÒ mÆt cña sinh vËt ®a bµo.
Nh−ng, ®èi víi sinh vËt ®¬n bµo, nã lµ mét t¸c nh©n g©y ®ét biÕn hiÖu qu¶. B−íc sãng
hÊp thô tia UV tèi ®a cña ADN lµ 254 nm; vµ ®©y còng lµ b−íc sãng g©y tÇn sè ®ét biÕn
cao nhÊt. §iÒu nµy cho thÊy ®ét biÕn cã liªn quan trùc tiÕp ®Õn sù hÊp thô tia UV cña c¸c
purine vµ pyrimidine. Trong ®ã, ®Æc biÖt lµ c¸c pyrimidine sau khi hÊp thô tia UV ë b−íc
sãng 254nm, chóng trë nªn cã kh¶ n¨ng ph¶n øng m¹nh. HiÖu øng næi bËt cña chiÕu x¹
tia UV ®èi víi c¸c pyrimidine (C vµ T) lµ sù h×nh thµnh c¸c pyrimidine hydrate (g¾n
thªm gèc OH-) vµ h×nh thµnh phøc kÐp pyrimidine (h×nh 6.13). C¸c phøc kÐp thymine

195

§inh §oµn Long

(T :: T) cã thÓ g©y ®ét biÕn theo hai c¸ch: 1) lµm biÕn d¹ng cÊu tróc ADN, dÉn ®Õn sao
chÐp sai; vµ 2) kÝch ho¹t hÖ thèng söa ch÷a ADN theo c¬ chÕ SOS dÔ ph¸t sinh ®ét biÕn
(xem phÇn “C¸c c¬ chÕ söa ch÷a ADN” d−íi ®©y).

a) O O OO
H C CH3 CH3C H
HC CH3 HC CH3 UV
NC NC N CC N
+
CC CC CC CC
ONH ONH ON NO

HH H H
H H

Thymine (T) Thymine (T) Phøc kÐp Thymine (T :: T)

H×nh 6.13. Tia UV g©y biÕn ®æi cÊu tróc b) NH2 UV + H2O NH2
pyrimidine. a) Liªn kÕt céng hãa trÞ h×nh CH CH
thµnh gi÷a hai tiÓu phÇn thymine ®øng N C OH
c¹nh nhau trªn ph©n tö ADN t¹o nªn phøc NC
kÐp thymine. b) Sù hydrate hãa cytosine C CH
t¹o thµnh cytosine hydrate, lµ nguyªn CC O NH
nh©n g©y kÕt cÆp sai trong sao chÐp ADN. ONH
H
H
Cytosine hydrate
Cytosine

6.4.4. §ét biÕn do c¸c yÕu tè di truyÒn vËn ®éng (gen nh¶y)

C¸c c¬ thÓ sèng nãi chung chøa mét l−îng ADN cã thÓ vËn ®éng tõ vÞ trÝ nµy sang
vÞ trÝ kh¸c trong hÖ gen. Nh÷ng yÕu tè nµy ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng
(transposable genetic elements, viÕt t¾t lµ TGE hoÆc TE), hay gäi t¾t lµ gen nh¶y
(transposon). ViÖc cµi mét TE vµo gen th−êng lµm mÊt chøc n¨ng cña gen. NÕu gen m·
hãa cho mét protein quan träng, kiÓu h×nh ®ét biÕn dÔ xuÊt hiÖn. §Õn nay ®· cã nhiÒu
®ét biÕn do ho¹t ®éng cña TE ®−îc t×m thÊy ë ng«, ruåi giÊm, E. coli vµ c¸c loµi sinh vËt
kh¸c. Trong thùc tÕ, alen quy ®Þnh tÝnh tr¹ng h¹t nh¨n ë ®Ëu Hµ lan trong thÝ nghiÖm
cña Menden vµ ®ét biÕn mµu m¾t tr¾ng ë ruåi giÊm ®−îc ph¸t hiÖn lÇn ®Çu tiªn ®Òu lµ
c¸c ®ét biÕn do ho¹t ®éng cña gen nh¶y. C¬ chÕ ho¹t ®éng cña c¸c yÕu tè di truyÒn vËn
®éng vµ hiÖu øng g©y ®ét biÕn cña chóng ®−îc m« t¶ ë phÇn cuèi ch−¬ng nµy.

6.4.5. Sù lÆp l¹i c¸c bé ba nucleotide vµ c¸c bÖnh di truyÒn ë ng−êi

TÊt c¶ c¸c lo¹i ®ét biÕn ®−îc m« t¶ ë c¸c phÇn trªn cña ch−¬ng nµy ®Òu xuÊt hiÖn ë
ng−êi. Ngoµi ra, cã mét lo¹i ®ét biÕn g¾n liÒn víi nhiÒu bÖnh di truyÒn ë ng−êi, ®ã lµ c¸c
tr×nh tù lÆp l¹i víi mçi ®¬n vÞ lÆp l¹i gåm tõ 1 ®Õn 6 nucleotide ®−îc gäi lµ c¸c tr×nh tù
®¬n gi¶n lÆp l¹i liªn tiÕp (simple tandem repeats). Nh÷ng tr×nh tù lÆp l¹i kiÓu nh−
vËy ®−îc t×m thÊy ph©n bè kh¾p hÖ gen. C¸c tr×nh tù lÆp l¹i víi ®¬n vÞ lÆp l¹i gåm 3
nucleotide (gäi t¾t lµ c¸c tr×nh tù 3 nucleotide lÆp l¹i liªn tiÕp) ®−îc t×m thÊy cã liªn
quan ®Õn mét sè bÖnh di truyÒn ë ng−êi. Ch¼ng h¹n sè l−îng ®¬n vÞ lÆp l¹i cña tr×nh tù
[CGG] t¨ng lªn t¹i vÞ trÝ FRAXA thuéc NST X liªn quan ®Õn Héi chøng NST X dÔ g·y
(fragile X syndrome), lµ bÖnh thiÓu n¨ng trÝ tuÖ di truyÒn phæ biÕn nhÊt ë ng−êi. NST X
b×nh th−êng cã tõ 6 ®Õn 50 b¶n sao liªn tiÕp cña tr×nh tù [CGG], nh−ng NST ®ét biÕn
chøa tíi 1.000 b¶n sao liªn tiÕp cña ®¬n vÞ lÆp l¹i gåm 3 nucleotide nµy.

C¸c ®o¹n tr×nh tù lÆp l¹i cña [CAG] vµ [CTG] liªn quan ®Õn mét sè bÖnh thÇn kinh
di truyÒn ë ng−êi, bao gåm bÖnh móa giËt Huntingt¬n, bÖnh lo¹n d−ìng c¬, bÖnh

Kennedy, bÖnh teo c¬ delta vµng da, bÖnh mÊt ®iÒu hßa tiÓu n·o ®Ønh. ë tÊt c¶ nh÷ng
bÖnh nµy, møc ®é nghiªm träng cña bÖnh cã liªn quan trùc tiÕp ®Õn sè ®ét biÕn lÆp l¹i

196

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

cña c¸c tr×nh tù. Khi sè b¶n sao cña tr×nh tù ba nucleotide cµng cao, møc ®é nghiªm
träng cña bÖnh cµng t¨ng. Ngoµi ra sè lÇn lÆp l¹i cña c¸c tr×nh tù nucleotide liªn quan
®Õn c¸c bÖnh nµy cã thÓ kh«ng æn ®Þnh gi÷a c¸c tÕ bµo soma kh¸c nhau vµ gi÷a c¸c thÕ
hÖ. C¬ chÕ lµm t¨ng sè l−îng c¸c bé ba nucleotide g©y nªn c¸c bÖnh di truyÒn ®Õn nay
ch−a râ, nh−ng còng cã thÓ liªn quan ®Õn c¬ chÕ sao chÐp tr−ît ®−îc nªu ë môc 6.4.1
(h×nh 6.10).

6.5. C¸c c¬ chÕ söa ch÷a ADN

PhÇn lín c¸c ®ét biÕn tù ph¸t vµ g©y t¹o nh×n chung cã thÓ coi lµ c¸c sai háng cña
gen hay ADN. §Æc biÖt khi xö lý víi liÒu cao cña c¸c t¸c nh©n ®ét biÕn th× sù sai háng lµ
®¸ng kÓ. Trong thùc tÕ, ë gãc ®é nµo ®ã, chóng ta cã thÓ coi ®ét biÕn lµ nh÷ng biÕn ®æi
cña ADN mµ kh«ng ®−îc c¸c hÖ thèng söa ch÷a ADN kh¸c nhau phôc håi. Trªn c¬ së ®ã,
ta cã thÓ viÕt c«ng thøc: “®ét biÕn = sai háng ADN – söa ch÷a ADN”. C¶ sinh vËt
prokaryote vµ eukaryote ®Òu cã mét sè hÖ thèng söa ch÷a ADN víi sù huy ®éng nhiÒu
enzym kh¸c nhau. NÕu hÖ thèng söa ch÷a kh«ng kh¾c phôc ®−îc c¸c sai háng th× dÉn
®Õn sù h×nh thµnh c¸c tÕ bµo hay c¬ thÓ ®ét biÕn; hoÆc nÕu cã qu¸ nhiÒu sai háng th× c¸c
c¬ thÓ vµ tÕ bµo ®ét biÕn th−êng chÕt. Sù sèng lµ kÕt qu¶ c©n b»ng gi÷a sù chÝnh x¸c
trong sao chÐp vµ truyÒn ®¹t th«ng tin di truyÒn trong ADN tíi c¸c tÕ bµo vµ c¬ thÓ thÕ
hÖ con víi nh÷ng ®ét biÕn ®«i khi x¶y ra trong vai trß lµ nguån nguyªn liÖu s¬ cÊp cña
tiÕn hãa. C¸c hÖ thèng söa ch÷a ADN chÝnh lµ c«ng cô gióp duy tr× sù hµi hßa nµy.

Dùa trªn c¬ chÕ ho¹t ®éng, chóng ta cã thÓ chia c¸c c¬ chÕ söa ch÷a ADN thµnh ba
nhãm chÝnh: 1) c¸c c¬ chÕ phôc håi trùc tiÕp, 2) c¸c c¬ chÕ söa ch÷a b»ng c¾t bá, vµ 3) mét
sè c¬ chÕ söa ch÷a kh¸c. Sau ®©y lµ mét sè m« h×nh söa ch÷a ADN.

6.5.1. C¸c c¬ chÕ phôc håi trùc tiÕp

6.5.1.1. C¬ chÕ söa ch÷a ghÐp ®«i sai nhê chøc n¨ng ®äc söa cña ADN polymerase

TÇn sè ®ét biÕn thay thÕ nucleotide ë c¸c gen vi khuÈn vµo kho¶ng 10-11 ®Õn 10-7
mçi lÇn ph©n bµo. Tuy vËy, thùc nghiÖm cho thÊy lçi sao chÐp cña ADN polymerase cã
thÓ cao h¬n, kho¶ng 10-5. Sù kh¸c biÖt gi÷a nh÷ng con sè nµy ®−îc gi¶i thÝch lµ nhê chøc
n¨ng ®äc söa cña ho¹t tÝnh exonuclease 3’→5’ ®−îc tÝch hîp trong hÇu hÕt (nÕu kh«ng
ph¶i lµ tÊt c¶) c¸c enzym ADN polymerase ë prokaryote còng nh− eukaryote. Khi mét
nucleotide ®−îc kÕt cÆp sai trong qu¸ tr×nh sao chÐp ADN, nã cã thÓ ®−îc enzym ADN
polymerase nhËn ra. Lóc nµy, sù sao chÐp ADN t¹m dõng l¹i cho ®Õn khi nucleotide kÕt
cÆp sai ®−îc lo¹i bá vµ thay thÕ. Sau khi nucleotide sai háng ®−îc söa ch÷a, enzym ADN
polymerase tiÕp tôc tr−ît trªn m¹ch ADN lµm khu«n vµ kh«i phôc ho¹t ®éng sao chÐp.

TÇm quan träng cña ho¹t tÝnh ®äc söa ®i kÌm víi ho¹t tÝnh exonuclease 3’→5’ cña
ADN polymerase ®−îc chøng minh bëi c¸c ®ét biÕn g©y ®ét biÕn (mutator mutation)
t×m thÊy ë E. coli. C¸c chñng vi khuÈn mang c¸c ®ét biÕn nµy cã tÇn sè ®ét biÕn ë tÊt c¶
c¸c gen cao h¬n h¼n so víi c¸c chñng ®èi chøng. Nh÷ng ®ét biÕn g©y ®ét biÕn liªn quan
®Õn c¸c gen m· hãa cho c¸c protein thiÕt yÕu tham gia söa ch÷a ADN. Ch¼ng han nh−,
gen g©y ®ét biÕn mutD cña E. coli m· hãa cho tiÓu phÇn ε cña enzym ADN polymerase
III ë E. coli. §ét biÕn mutD lµm mÊt ho¹t tÝnh ®äc söa chiÒu 3’→5’ cña ADN polymerase.
Do vËy, nhiÒu nucleotide ®−îc l¾p r¸p sai mµ kh«ng ®−îc söa ch÷a, dÉn ®Õn ®ét biÕn.

197

§inh §oµn Long

6.5.1.2. Söa ch÷a phøc kÐp pyrimidine b»ng c¬ chÕ quang phôc ho¹t

Theo c¬ chÕ quang phôc ho¹t (photoreactivation repair, hay söa ch÷a ADN nhê
¸nh s¸ng), c¸c ®ét biÕn phøc kÐp pyrimidine (phæ biÕn nhÊt lµ T::T) cã thÓ ®−îc phôc håi
trùc tiÕp trë vÒ d¹ng nguyªn thñy, nÕu chóng ®−îc ®−a ®Õn gÇn vïng ¸nh s¸ng cã b−íc
sãng trong kho¶ng 320 - 370nm. Lóc nµy, c¬ chÕ quang phôc ho¹t ho¹t ®éng nÕu enzym

photolyase (do gen phr m· hãa) ®−îc ho¹t hãa bëi ph«t«n ¸nh s¸ng. Sù ho¹t ®éng cña hÖ
thèng söa ch÷a nµy lµm “ph¸ vì” liªn kÕt céng hãa trÞ gi÷a c¸c pyrimidine liÒn kÒ trªn

khung cña ph©n tö ADN. C¸c chñng vi khuÈn mang ®ét biÕn ë gen phr th−êng ®ång thêi
bÞ háng c¬ chÕ söa ch÷a quang phôc ho¹t. Enzym photolyase ®−îc t×m thÊy ë vi khuÈn vµ
mét sè eukaryote, nh−ng kh«ng thÊy cã ë ng−êi vµ c¸c ®éng vËt cã vó kh¸c.

6.5.1.3. Söa ch÷a sai háng ADN g©y ra do alkyl hãa

Nh− ®· nãi ë trªn c¸c hîp chÊt alkyl hãa, nh− MMS hay EMS, cã kh¶ n¨ng chuyÓn
nhãm alkyl vµo c¸c baz¬ nit¬ ë c¸c vÞ trÝ kh¸c nhau, vÝ nh− nguyªn tö O cña C-6 ë

guanine. ë E. coli, nh÷ng sai háng ADN g©y ra bëi sù alkyl hãa ë vÞ trÝ nµy cña guanine

®−îc söa ch÷a bëi mét enzym cã tªn gäi lµ a) C¸c vÞ trÝ c¾t baz¬ sai háng theo kiÓu BER
O6-methylguanine methyltransferase, ®−îc gen Baz¬ sai háng

ada m· hãa. Enzym nµy cã kh¶ n¨ng nhËn ra
O6-methylguanine vµ lo¹i bá nhãm methyl,
qua ®ã chuyÓn baz¬ nit¬ nµy trë vÒ d¹ng gèc VÞ trÝ c¾t 1

cña nã. Mét c¬ chÕ t−¬ng tù còng ®−îc t×m Baz¬
thÊy ®Ó söa ch÷a c¸c thymine bÞ alkyl hãa.
Nh÷ng ®ét biÕn ë nh÷ng gen m· hãa nh÷ng VÞ trÝ
enzym söa ch÷a ADN nµy th−êng lµm t¨ng c¾t 2

tÇn sè ®ét biÕn tù ph¸t.

6.5.2. C¬ chÕ söa ch÷a b»ng c¾t bá

Cã lÏ c¬ chÕ söa ch÷a lo¹i bá c¸c baz¬ b) C¸c b−íc cña qu¸ tr×nh söa ch÷a kiÓu BER
nit¬ sai háng phæ biÕn nhÊt lµ c¬ chÕ c¾t bá c¸c
baz¬ nit¬ vµ nucleotide sai háng, råi thay vµo Baz¬ sai ADN
®ã c¸c baz¬ nit¬ vµ nucleotide ®óng. Do thµnh
phÇn vµ c¸ch thøc ho¹t ®éng kh¸c nhau, ng−êi (1) ADN glycosylase c¾t
ta chia thµnh c¸c c¬ chÕ söa ch÷a b»ng c¾t bá baz¬ sai háng (c¾t 1)
baz¬ nit¬ vµ söa ch÷a b»ng c¾t bá nucleotide.
+
6.5.2.1. Söa ch÷a b»ng c¾t bá baz¬ nit¬ (BER)
VÞ trÝ thiÕu baz¬ (2) AP endonuclease c¾t khung
Trong c¬ chÕ söa ch÷a b»ng c¾t bá (kÝ hiÖu AP) ADN t¹i vÞ trÝ thiÕu baz¬ (c¾t 2)
baz¬ nit¬ - BER (base excision repair), mét
enzym (trong hä lín enzym) glycosylase nhËn (3) ADN phosphodiesterase c¾t mét
ra baz¬ sai háng vµ lo¹i nã ra khái ph©n tö ®o¹n khung t¹i vÞ trÝ sai háng
ADN b»ng viÖc c¾t bá liªn kÕt glycoside gi÷a +
baz¬ vµ ®−êng deoxyribose cña nucleotide sai
háng. C¸c enzym kh¸c sau ®ã ®−îc huy ®éng (4) ADN polymeraseI tæng hîp
®Ó c¾t bá phÇn khung ®−êng-phosphate ë tr−íc theo chiÒu 5’ → 3’
vµ sau vÞ trÝ cã cÊu tróc khung ®−êng thiÕu
baz¬ nit¬, gi¶i phãng khung ®−êng nµy vµ mét (5) ADN ligase “hµn kÝn” m¹ch
®o¹n m¹ch ADN ®¬n “rçng” (h×nh 6.14). §o¹n ADN ®−îc söa ch÷a
ADN rçng nµy sau sÏ ®−îc lÊp l¹i b»ng c¸c
nucleotide kÕt cÆp ®óng nhê ho¹t ®éng cña H×nh 6.14. S¬ ®å minh häa m« h×nh söa ch÷a
enzym ADN polymerase (dïng m¹ch ADN ®èi ADN b»ng c¾t bá baz¬ nit¬ (BER) ë E. coli.
diÖn lµm khu«n) vµ ADN ligase.

198

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.5.2.2. Söa ch÷a b»ng c¾t bá nucleotide (NER)

N¨m 1964, hai nhãm nghiªn cøu, gåm Boyce cïng Howard-Flander vµ Setlow cïng

Carrier, ®· ph©n lËp ®−îc mét sè ®ét biÕn mÉn c¶m chiÕu x¹ UV ë E. coli. C¸c d¹ng ®ét
biÕn nµy cã tÇn sè ®ét biÕn cao bÊt th−êng so víi c¸c chñng kh¸c khi xö lý chiÕu x¹ UV

trong bãng tèi. Nh÷ng ®ét biÕn nµy ®−îc gäi lµ c¸c thÓ ®ét biÕn uvrA (uvr lµ tõ viÕt t¾t

cña “UV repair”). C¸c thÓ ®ét biÕn uvrA chØ söa ch÷a ®−îc c¸c sai háng ADN kiÓu “phøc
kÐp thymine” khi ®−îc chiÕu s¸ng; ®iÒu nµy cho thÊy, c¬ chÕ söa ch÷a ho¹t ®éng ë ®©y cã
lÏ lµ quang phôc ho¹t. Tuy nhiªn, ®iÒu ®¸ng chó ý lµ c¸c chñng kiÓu d¹i cã thÓ söa ch÷a
nh÷ng sai háng nµy ngay c¶ khi ®−îc nu«i trong tèi. Qua ®ã, c¸c nhµ nghiªn cøu cho
r»ng, ®· tån t¹i mét hÖ thèng söa ch÷a ADN kh¸c kh«ng phô thuéc vµo ¸nh s¸ng. HÖ
thèng nµy lóc ®ã ®−îc gäi lµ hÖ thèng söa ch÷a trong tèi, hiÖn nay ®−îc gäi lµ hÖ
thèng söa ch÷a b»ng c¾t bá nucleotide - NER (nucleotidede excision repair).

HÖ thèng NER kh«ng chØ söa ch÷a sai háng kiÓu “phøc kÐp thymine” mµ cßn söa

ch÷a c¸c sai háng nghiªm träng kh¸c trong ph©n tö ADN sîi kÐp. H×nh 6.15 m« t¶ hÖ

thèng NER ho¹t ®éng ë E. coli. HÖ thèng nµy cã 4 protein UvrA, UvrB, UvrC vµ UvrD

®−îc m· hãa t−¬ng øng bëi c¸c gen uvrA, uvrB, uvrC vµ uvrD. Mét phøc hÖ gåm hai tiÓu

phÇn UvrA vµ mét tiÓu phÇn UvrB (Uvr2A-B) tr−ît däc ph©n tö ADN. Khi phøc hÖ nµy

nhËn ra “phøc kÐp  Phøc hÖ
pyrimidine” hay mét sai UvrAB tr−ît
háng nghiªm träng nµo kh¸c
th× c¸c tiÓu phÇn UvrA sÏ däc ph©n tö Phøc hÖ
t¸ch ra khëi phøc hÖ Uvr2A- Uvr2A-B
ADN vµ ph¸t
B, vµ thay vµo ®ã lµ sù ®Ýnh
hiÖn vÞ trÝ sai

háng

kÕt cña 1 UvrC.

Sù liªn kÕt cña UvrB-C  UvrA ®−îc
gi¶i phãng;
t¹i vÞ trÝ sai háng dÉn ®Õn UvrC thay thÕ

viÖc c¾t m¹ch ®¬n ADN UvrA t¹i vÞ tri
kho¶ng 4 nucleotide vÒ phÝa sai háng
®Çu 3’ (thùc hiÖn bëi UvrB)
VÞ trÝ c¾t ®Çu 5’ VÞ trÝ c¾t ®Çu 3’

vµ 7 nucleotide vÒ phÝa ®Çu  C¾t ®o¹n ADN
5’ (thùc hiÖn bëi UvrC). sai háng t¹i

UvrB sau ®ã rêi khái ph©n c¸c ®Çu 5’ vµ UvrD
tö ADN vµ UrvD liªn kÕt vµo 3’ t−¬ng øng
®o¹n phÝa ®Çu 5’ cã ®Çu 3’- bëi UvrB vµ ADN polymerase I
OH tù do. UvrD thùc chÊt lµ UvrC (pol I)
mét helicase, cã vai trß gi·n
UvrD gi·n xo¾n
xo¾n ADN t¹i tr×nh tù gi÷a  vïng ADN bÞ
hai vÞ trÝ c¾t vµ gi¶i phãng ra
®o¹n c¾t. Sau ®ã, ADN c¾t, gi¶i phãng
polymerase I sÏ lÊp ®Çy ®o¹n
rçng b»ng c¸c nucleotide kÕt ®o¹n sai háng.
cÆp ®óng b»ng ho¹t tÝnh
ADN pol I tæng ADN ligase
tæng hîp theo chiÒu 5’→3’;
råi ADN ligase nèi liªn kÕt hîp bï ®o¹n
phosphodieste cuèi cïng
ADN rçng

 ADN ligase nèi
®o¹n söa ®æi.

Qu¸ tr×nh söa

ADN kÕt thóc

gi÷a hai ®o¹n ADN. HÖ H×nh 6.15. S¬ ®å minh häa m« h×nh söa ch÷a ADN b»ng c¾t bá
thèng söa ch÷a b»ng c¾t bá nucleotide (NER) ë E. coli.
nucleotide ®−îc t×m thÊy ë

199

§inh §oµn Long

hÇu hÕt c¸c loµi sinh vËt ®· tõng ®−îc nghiªn cøu. ë nÊm men vµ ®éng vËt cã vó, cã
kho¶ng 12 gen m· hãa protein liªn quan ®Õn ho¹t ®éng söa ch÷a ADN b»ng c¾t bá
nucleotide.

6.5.3. C¸c c¬ chÕ söa ch÷a kh¸c

6.5.3.1. C¬ chÕ söa ch÷a kÕt cÆp sai nhê m¹ch ADN khu«n ®−îc methyl hãa (MMR)

MÆc dï c¸c enzym ADN polymerase cã ho¹t tÝnh ®äc söa, nh−ng sau qu¸ tr×nh sao
chÐp ADN, vÉn tån t¹i mét sè baz¬ nit¬ kÕt cÆp sai kh«ng söa ch÷a hÕt. Trong lÇn sao
chÐp tiÕp theo, nÕu nh÷ng sai háng nµy kh«ng ®−îc kh¾c phôc th× ®ét biÕn sÏ h×nh
thµnh.

Thùc tÕ, nhiÒu baz¬ nit¬ kÕt cÆp sai ®−îc söa ch÷a sau qu¸ tr×nh sao chÐp bëi mét
hÖ thèng söa ch÷a ADN kh¸c, gäi lµ söa ch÷a kÕt cÆp sai nhê m¹ch ADN khu«n
®−îc methyl hãa – MMR (methyl-directed mismatch repair). HÖ thèng nµy nhËn ra c¸c
baz¬ nit¬ kÕt cÆp sai, c¾t bá c¸c baz¬ nit¬ sai háng vµ tiÕn hµnh tæng hîp thay thÕ. ë E.
coli, giai ®o¹n ®Çu cña c¬ chÕ MMR liªn quan ®Õn 3 gen lµ mutS, mutL vµ mutH, m· hãa
cho 3 protein t−¬ng øng lµ MutS, MutL vµ MutH. §Çu tiªn, MutS sÏ liªn kÕt vµo baz¬
nit¬ kÕt cÆp sai. Sau ®ã hÖ thèng söa ch÷a nhËn ra baz¬ nµo ®óng vµ baz¬ nµo sai t−¬ng
øng víi m¹ch nµo lµm khu«n vµ m¹ch nµo ®−îc tæng hîp míi. ë E. coli, hai m¹ch nµy
®−îc ph©n biÖt bëi sù methyl hãa nucleotide A t¹i tr×nh tù [GATC]. Tr×nh tù nµy cã trôc
®èi xøng, nghÜa lµ tr×nh tù ®äc theo chiÒu 5’→3’ trªn c¶ hai m¹ch gièng nhau. C¶ hai
nucleotide A trªn c¶ hai m¹ch cña ph©n tö ADN lµm khu«n th«ng th−êng ®−îc methyl
hãa. Tuy vËy, khi sù sao chÐp ADN võa kÕt thóc th× chØ cã A trªn m¹ch lµm khu«n ®−îc
methyl hãa cßn A trªn m¹ch míi tæng hîp ch−a ®−îc methyl hãa (xÐt t¹i vÞ trÝ tr×nh tù
[GATC]). Lóc nµy, MutS (®· liªn kÕt vµo baz¬ nit¬ kÕt cÆp sai) sÏ t¹o phøc víi MutL vµ
MutH ®Ó mang tr×nh tù [GATC] ch−a ®−îc methyl hãa ë gÇn tíi vÞ trÝ kÕt cÆp sai. MutH
sÏ lµm ®øt m¹ch kh«ng ®−îc methyl hãa t¹i tr×nh tù [GATC]. Tõ vÞ trÝ ®ã, mét enzym
exonuclease sÏ c¾t m¹ch ADN kh«ng ®−îc methyl hãa, ®Õn hÕt vÞ trÞ nucleotide kÕt cÆp
sai. Råi c¸c enzym ADN polymerase III vµ ligase sÏ tæng hîp bï vµ lÊp ®o¹n ADN rçng.

C¬ chÕ MMR còng ho¹t ®éng ë eukaryote. Tuy vËy, c¬ chÕ ®Ó nhËn biÕt m¹ch lµm
khu«n vµ m¹ch míi ch−a s¸ng tá hoµn toµn. ë ng−êi, ®· x¸c ®Þnh ®−îc 4 gen liªn quan
®Õn ho¹t ®éng cña c¬ chÕ MMR gåm cã hMSH2, hMLH1, hPMS1 vµ hPMS2; trong ®ã
hMSH2 cã chøc n¨ng t−¬ng ®−¬ng víi mutS ë E. coli, cßn 3 gen cßn l¹i t−íng øng víi
mutL ë E. coli. C¸c gen nµy ®−îc gäi lµ c¸c gen g©y ®ét biÕn, bëi viÖc mÊt chøc n¨ng cña
chóng dÉn ®Õn sù tÝch lòy t¨ng lªn cña c¸c ®ét biÕn trong hÖ gen. C¸c ®ét biÕn x¶y ra ë
mét trong bèn gen nµy lµm t¨ng nguy c¬ m¾c mét sè bÖnh di truyÒn, trong ®ã cã bÖnh
ung th− ruét kÕt di truyÒn kh«ng polip. HiÖu øng cña c¸c gen g©y ®ét biÕn trong sù ph¸t
sinh ung th− ®−îc nªu thªm ë ch−¬ng 8.

6.5.3.2. Sù tæng hîp ADN bá qua sai háng vµ c¬ chÕ söa ch÷a SOS

Nh− chóng ta ®· biÕt, mét sè sai háng cña ADN trong qu¸ tr×nh sao chÐp cã thÓ
ng¨n c¶n viÖc tiÕp tôc chuyÓn ®éng cña bé m¸y sao chÐp trªn ph©n tö ADN khu«n. NÕu
kh«ng ®−îc kh¾c phôc, tÕ bµo sÏ bÞ chÕt. Trong tr−êng hîp nµy, cã mét ph−¬ng tiÖn söa
ch÷a “cøu c¸nh” ®−îc gäi lµ sù tæng hîp ADN bá qua sai háng, cho phÐp sù sao chÐp
cã thÓ bá qua sai háng vµ tiÕp tôc. Qu¸ tr×nh nµy liªn quan ®Õn mét nhãm ADN
polymerase ®Æc biÖt chØ ®−îc tæng hîp khi cã tÝn hiÖu ADN sai háng. ë E. coli, nh÷ng sai
háng ADN nh− vËy ho¹t hãa mét hÖ thèng phøc t¹p ®−îc gäi lµ c¬ chÕ söa ch÷a SOS (gäi
nh− vËy cã lÏ do nã lµ ph−¬ng tiÖn “cøu c¸nh” cuèi cïng vµ th−êng ®−îc huy ®éng khÈn

200

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

cÊp). HÖ thèng SOS cho phÐp tÕ bµo sèng sãt (thay cho bÞ chÕt), mÆc dï nã th−êng t¹o
nªn nh÷ng ®ét biÕn míi (nªn c¬ chÕ nµy cßn ®−îc gäi lµ c¬ chÕ söa ch÷a dÔ g©y ®ét biÕn).

ë E. coli, cã hai gen liªn quan ®Õn ho¹t ®éng cña c¬ chÕ SOS lµ lexA vµ recA, m·
hãa t−¬ng øng cho c¸c protein LexA vµ RecA. §©y lµ nh÷ng gen ho¹t ®éng theo kiÓu c¶m
øng (xem ch−¬ng 5). C¸c tÕ bµo mang c¸c gen lexA vµ recA ®ét biÕn cã hÖ thèng SOS ho¹t
®éng liªn tôc. HÖ thèng nµy ho¹t ®éng nh− sau: khi kh«ng cã ADN sai háng, LexA øc chÕ
sù phiªn m· cña kho¶ng 17 gen liªn quan ®Õn söa ch÷a c¸c d¹ng ADN sai háng kh¸c
nhau. Nh−ng khi cã sai háng ADN, RecA ®−îc ho¹t hãa. Lóc nµy RecA thóc ®Èy LexA tù
biÕn tÝnh, qua ®ã t¨ng c−êng sù phiªn m· cña c¸c gen liªn quan ®Õn söa ch÷a ADN. Sau
khi ho¹t ®éng söa ch÷a kÕt thóc, RecA trë l¹i tr¹ng th¸i bÊt ho¹t cßn LexA ®−îc tæng hîp
míi sÏ øc chÕ c¸c gen söa ch÷a ADN. Trong sè c¸c gen ®−îc phiªn m· khi kh«ng cã Lex A
cã gen m· hãa cho enzym ADN polymerase ®Æc biÖt cã thÓ bá qua vÞ trÝ sai háng ®Ó tiÕp
tôc tæng hîp m¹ch ADN míi. Enzym nµy ho¹t ®éng theo kiÓu bæ sung nucleotide kh«ng
®Æc hiÖu (ngÉu nhiªn) vµo vÞ trÝ sai háng råi tiÕp tôc ph¶n øng trïng hîp ADN. Nh÷ng
nucleotide ®−îc bæ sung ngÉu nhiªn cã thÓ kh«ng kÕt cÆp ®óng nªn dÉn ®Õn ®ét biÕn (vÒ
lý thuyÕt, x¸c suÊt kÕt cÆp sai t¹i mçi nucleotide lµ 75%). Nh−ng dï sao, víi tÕ bµo th×
nh÷ng ®ét biÕn nµy cßn Ýt nguy hiÓm h¬n so víi hiÖu øng g©y chÕt cña c¸c sai háng ADN.

6.6. C¸c bÖnh di truyÒn ë ng−êi do sai háng trong bé m¸y söa ch÷a ADN

Mét trong nh÷ng bÖnh di truyÒn ë ng−êi ®−îc ph¸t hiÖn ®Çu tiªn do sai háng trong
bé m¸y söa ch÷a ADN lµ bÖnh kh« da s¾c tè, kÝ hiÖu lµ XP (xeroderma pigmentosum. C¸c
bÖnh nh©n XP cã nguy c¬ bÞ ung th− da cao khi ph¬i n¾ng. C¸c bÖnh nh©n nµy bÞ háng c¬
chÕ söa ch÷a ADN sai háng do tia UV g©y ra (ch¼ng h¹n nh− “phøc kÐp thymine”). §Õn
nay, héi chøng XP ®−îc chØ ra lµ cã liªn quan tíi ®ét biÕn Ýt nhÊt ë 9 gen kh¸c nhau. S¶n
phÈm cña 6 trong 9 gen nµy, gåm XPA, XPB, XPC, XPD, XPF vµ XPG lµ thiÕt yÕu víi hÖ
thèng söa ch÷a ADN kiÓu NER. C¸c nghiªn cøu hãa sinh cho thÊy chóng lµ thµnh phÇn
cña phøc hÖ NER cã ho¹t tÝnh excinulase. Phøc hÖ nµy cã Ýt nhÊt 17 chuçi polypeptide,

nªn danh s¸ch c¸c gen võa nªu cã lÏ ch−a ®Çy ®ñ. ë ng−êi, cßn cã hai héi chøng n÷a liªn
quan ®Õn sai háng c¬ chÕ NER lµ héi chøng Cockayne vµ chøng lo¹n d−ìng biÓu b× l«ng.
TrÎ m¾c héi chøng Cockayne sinh tr−ëng chËm vµ thiÓu n¨ng trÝ tuÖ (nh−ng kh«ng t¨ng
nguy c¬ m¾c bÖnh ung th− da). TrÎ m¾c chøng lo¹n d−ìng biÓu b× l«ng th−êng lïn, tãc dÔ
g·y, da “®ãng v¶y” vµ trÝ tuÖ kÐm ph¸t triÓn. BÖnh nh©n cña c¶ hai bÖnh nµy ®Òu bÞ háng
c¬ chÕ söa ch÷a NER liªn quan ®Õn b−íc phiªn m· c¸c gen cã liªn quan.

Ngoµi nh÷ng bÊt th−êng liªn quan ®Õn tÕ bµo da, mét sè bÖnh nh©n XP cßn cã c¸c
rèi lo¹n vÒ thÇn kinh (do sù chÕt sím cña c¸c tÕ bµo thÇn kinh). HiÖu øng nµy ë c¸c tÕ
bµo thÇn kinh cña bÖnh XP lµ ®èi t−îng nghiªn cøu vÒ sù giµ hãa. Trong ®ã, mét gi¶
thiÕt cho r»ng sù tÝch lòy c¸c ®ét biÕn tÕ bµo soma lµ mét nguyªn nh©n dÉn ®Õn sù giµ
hãa. NÕu ®óng nh− vËy th× sù sai háng trong c¸c hÖ thèng söa ch÷a ADN sÏ trùc tiÕp
thóc ®Èy sù giµ hãa. §iÒu nµy Ýt nhÊt tá ra lµ ®óng ë bÖnh nh©n XP. Nh−ng, nh×n
chung ®Õn nay míi cã rÊt Ýt dÉn chøng vÒ sù t−¬ng quan gi÷a sù tÝch lòy ®ét biÕn soma
vµ qu¸ tr×nh giµ hãa.

Cã ba bÖnh di truyÒn kh¸c ë ng−êi còng ®· ®−îc t×m thÊy cã liªn quan ®Õn nh÷ng
sai háng trong söa ch÷a ADN, bao gåm bÖnh mÊt ®iÒu hßa gi·n m¹ch (ataxia-
telangiecsia), bÖnh thiÕu m¸u Fanconi vµ héi chøng Bloom. C¶ ba bÖnh nµy ®Òu liªn
quan ®Õn c¸c alen ®ét biÕn lÆn trªn NST th−êng, víi nguy c¬ m¾c ung th− ¸c tÝnh cao ë
ng−êi bÖnh. Trong ®ã ®Æc biÖt lµ nguy c¬ m¾c bÖnh b¹ch cÇu ¸c tÝnh ë c¸c bÖnh nh©n mÊt
®iÒu hßa gi·n m¹ch vµ thiÕu m¸u Fanconi. C¸c bÖnh nh©n mÊt ®iÒu hßa gi·n m¹ch trë
nªn mÉn c¶m cao víi c¸c tia x¹ ion hãa, do sù sai háng trong c¸c c¬ chÕ söa ch÷a ADN sai
háng g©y ra bëi c¸c bøc x¹ ion hãa. TÕ bµo bÖnh nh©n thiÕu m¸u Fanconi bÞ suy yÕu vÒ

201

§inh §oµn Long

kh¶ n¨ng lo¹i bá c¸c cÊu tróc v¾t chÐo bÊt th−êng gi÷a hai m¹ch ADN (ch¼ng h¹n, mét
sè cÊu tróc g©y ra bëi mitomycin C). C¸c tÕ bµo bÖnh nh©n m¾c héi chøng Bloom cã
nguy c¬ ®øt g·y NST cao dÉn ®Õn c¸c biÕn d¹ng NST vµ/hoÆc trao ®æi chÐo gi÷a c¸c
nhiÔm s¾c tö. VÒ c¬ chÕ, mét d¹ng bÖnh mÊt ®iÒu hßa gi·n m¹ch lµ do sai háng cña mét
enzym kinase tham gia ®iÒu khiÓn chu tr×nh tÕ bµo; héi chøng Bloom do sù sai háng
cña mét enzym ADN helicase (RecQ helicase). C¬ chÕ g©y bÖnh ung th− ruét kÕt di
truyÒn kh«ng polip (®· nªu ë môc 6.5.3.1 trªn ®©y) lµ do sai háng trong c¬ chÕ söa ch÷a
MMR. §iÒu nµy cho thÊy nh÷ng sai háng trong c¸c c¬ chÕ söa ch÷a ADN kh¸c còng cã
thÓ lµ nguyªn nh©n dÉn ®Õn c¸c d¹ng ung th− kh¸c nhau ë ng−êi (ch−¬ng 8). §Ó t×m
c¸c gen liªn quan ®Õn c¸c tÝnh tr¹ng vµ bÖnh ë ng−êi, cã thÓ tham kh¶o trang Web:
www3.ncbi.nlm.nih.gov/OMIM/.

6.7. C¸c c¬ chÕ t¸i tæ hîp ADN

Trong gi¶m ph©n, mét sù kiÖn quan träng gãp phÇn lµm t¨ng biÕn dÞ tæ hîp ë c¸c
loµi sinh s¶n h÷u tÝnh lµ hiÖn t−îng trao ®æi chÐo gi÷a c¸c NST t−¬ng ®ång. Trong thùc
tÕ, nhiÒu gen cã liªn quan ®Õn ho¹t ®éng söa ch÷a c¸c ADN ®−îc t×m thÊy ®Òu cã vai trß
thiÕt yÕu trong sù trao ®æi chÐo gi÷a c¸c NST t−¬ng ®ång trong qu¸ tr×nh nµy. Ngoµi ra,
c¸c c¬ chÕ t¸i tæ hîp cã lÏ lu«n cã liªn quan ®Õn mét sè c¬ chÕ söa ch÷a ADN, nªn ë ®©y
chóng ta ®Ò cËp mét sè ®Æc ®iÓm c¬ b¶n cña qu¸ tr×nh t¸i tæ hîp ADN.

ë eukaryote, trao ®æi chÐo liªn quan ®Õn sù h×nh thµnh phøc hÖ tiÕp hîp trong k×
®Çu cña gi¶m ph©n I. Phøc hÖ nµy cã b¶n chÊt lµ ribonucleoprotein (gåm protein vµ
ARN). V× mét nguyªn nh©n nµo ®ã, hiÖn t−îng trao ®æi chÐo hÇu nh− kh«ng x¶y ra ë ruåi
giÊm ®ùc (víi phÇn lín c¸c loµi, hiÖn t−îng nµy x¶y ra ë c¶ hai giíi). §iÒu ®¸ng chó ý lµ
trong qu¸ tr×nh ph¸t sinh giao tö ®ùc (tinh trïng) ë ruåi giÊm, phøc hÖ tiÕp hîp kh«ng
thÊy h×nh thµnh ë k× ®Çu gi¶m ph©n I. Ngoµi ra, c¸c ®ét biÕn liªn quan ®Õn gen c3G ë
ruåi giÊm c¸i dÉn ®Õn phøc hÖ tiÕp hîp kh«ng h×nh thµnh vµ kh«ng cã trao ®æi chÐo. Nh−
vËy, sù h×nh thµnh phøc hÖ tiÕp hîp cã lÏ cã liªn quan mËt thiÕt víi hiÖn t−îng trao ®æi
chÐo vµ t¸i tæ hîp ADN.

6.7.1. Trao ®æi chÐo lµ sù ®øt - nèi cña c¸c ®o¹n ADN t−¬ng ®ång

PhÇn lín c¸c hiÓu biÕt vÒ trao ®æi chÐo gi÷a c¸c ph©n tö ADN ®Õn nay chñ yÕu dùa
trªn c¸c nghiªn cøu ë E. coli vµ S. cerevisiae. C¸c nghiªn cøu hãa sinh vÒ c¸c dßng ®ét
biÕn nµy cho thÊy chóng thiÕu mét sè protein vµ enzym cÇn cho sù t¸i tæ hîp ADN.

NhiÒu m« h×nh nghiªn cøu vÒ t¸i tæ hîp ADN ®−îc sö dông réng r·i hiÖn nay dùa
trªn m« h×nh ®−îc Holliday c«ng bè n¨m 1964. Cã lÏ, Holliday lµ mét trong nh÷ng ng−êi
®Çu tiªn gi¶i thÝch ®−îc hiÖn t−îng ®øt ra, nèi l¹i vµ söa ch÷a ADN. H×nh 6.16 minh
häa m« h×nh ®−îc Holliday ®−a ra cïng víi nh÷ng söa ®æi nhê nh÷ng hiÓu biÕt gÇn ®©y.
Sù trao ®æi chÐo gi÷a hai ph©n tö ADN b¾t ®Çu b»ng viÖc mét enzym endonuclease lµm
®øt mét m¹ch ®¬n trªn c¶ hai ph©n tö ADN mang ®o¹n t−¬ng ®ång. C¸c ph©n ®o¹n m¹ch
®¬n ADN ë hai phÝa cña vÞ trÝ c¾t chuyÓn chç cho nhau nhê c¸c protein liªn kÕt m¹ch ®¬n
(SSB) vµ enzym helicase. Enym helicase lµm gi·n xo¾n ph©n tö ADN sîi kÐp ë vÞ trÝ gÇn
víi ®iÓm c¾t m¹ch ®¬n. ë E. coli, mét phøc hÖ gäi lµ RecBCD ®ång thêi cã hai ho¹t tÝnh
cña endonuclease (lµm ®øt m¹ch ®¬n ADN) vµ helicase (gi·n xo¾n ADN t¹i vÞ trÝ ®øt).

C¸c m¹ch ®¬n ®æi chç cho nhau sau ®ã sÏ trao ®æi thµnh phÇn kÕt cÆp bæ sung cña
chóng t−¬ng øng trªn hai m¹ch bæ sung nguyªn vÑn (h×nh 6.16c/d). Qu¸ tr×nh nµy ®−îc
xóc t¸c bëi c¸c protein kiÓu RecA ë E. coli. C¸c protein kiÓu RecA ®−îc t×m thÊy ë nhiÒu
sinh vËt kh¸c nhau, ë c¶ prokaryote vµ eukaryote. C¸c protein kiÓu RecA thóc ®Èy sù t¸i
tæ hîp m¹ch ®¬n, nghÜa lµ mét m¹ch ®¬n cña ph©n tö ADN sîi kÐp nµy ®æi chç cho mét
®o¹n t−¬ng ®ång víi nã trªn ph©n tö ADN sîi kÐp kh¸c. Trong thùc tÕ, c¸c protein kiÓu

202

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

RecA thóc ®Èy sù NST t−¬ng aB
trao ®æi t−¬ng ®ång A ®ång 1 B
gi÷a c¸c m¹ch ®¬n A (j) NST t¸i tæ hîp b
cña hai ph©n tö a NST t−¬ng b
ADN sîi kÐp t−¬ng ®ång 2 ADN ligase (cã thÓ cã
®ång qua hai b−íc. exonuclease vµ ADN
Trong b−íc thø (a) KÕt cÆp NST t−¬ng ®ång
nhÊt, mét m¹ch ®¬n Endonuclease polymerase ho¹t
cña chuçi xo¾n kÐp ®éng tr−íc ®ã)
®øt ra råi ®æi chç AB aB
víi m¹ch t−¬ng
®ång hoµn toµn ab Ab
(hoÆc mét phÇn lín) (b) H×nh thµnh “vÕt ®øt" trªn mçi (i) H×nh ¶nh 2-D
víi nã, råi kÕt cÆp
bæ sung víi m¹ch m¹ch ®¬n B
nguyªn vÑn cßn l¹i. Helicase vµ protein A
liªn kÕt m¹ch ®¬n
ë b−íc thø hai, x¶y (h) §øt cÇu m¹ch ®¬n
ra mét sù ®æi chç AB
t−¬ng tù trªn m¹ch b a Endonuclease
®¬n ë vÞ trÝ ®æi chç ab A B
thø nhÊt. Protein (c) C¸c m¹ch ®¬n ®æi chç sau
RecA ®iÒu hßa sù b (g) CÊu h×nh kh«ng
trao ®æi chÐo b»ng khi ®øt A gian t−¬ng øng
c¸ch liªn kÕt vµo Protein kiÓu RecA
m¹ch ADN kh«ng a
kÕt cÆp, thóc ®Èy AB PhÇn ®Çu d−íi quay
m¹ch nµy t×m tr×nh 180o
tù t−¬ng ®ång víi ab
nã; vµ mét khi tr×nh (d) C¸c m¹ch ®¬n trao ®æi chÐo B
tù t−¬ng ®ång ®−îc
t×m thÊy, nã thóc ADN ligase (cã thÓ cã (f) CÊu h×nh kh«ng
®Èy sù ®æi chç cña exonuclease vµ ADN gian 3-D sau khi
mét m¹ch ®¬n polymerase ho¹t h×nh thµnh “cÇu”
thuéc tr×nh tù võa ®éng tr−íc ®ã) liªn kÕt
t×m thÊy víi m¹ch AB
kh«ng kÕt cÆp. NÕu a
tr×nh tù t−¬ng ®ång ab b
t×m thÊy s½n cã ë (e) H×nh thµnh “cÇu” liªn kÕt
d¹ng m¹ch ®¬n th×
hiÖu lùc t¹o “trao céng hãa trÞ m¹ch ®¬n
®æi chÐo” cña RecA
t¨ng trªn 50 lÇn. H×nh 6.16. C¬ chÕ t¸i tæ hîp gi÷a c¸c nhiÔm s¾c thÓ t−¬ng ®ång trªn c¬ së m«
h×nh cña Robin Holliday (1964) ®−îc bæ sung b»ng nh÷ng hiÓu biÕt gÇn ®©y.

C¸c m¹ch ®¬n bÞ ®øt th−êng ®−îc nèi l¹i (qua liªn kÕt phosphodiester) nhê ADN

ligase. NÕu nh− c¸c vÞ trÝ ®øt trªn c¸c m¹ch ®¬n cña hai ph©n tö ADN kh«ng t−¬ng ®ång

(kh«ng trïng vÞ trÝ), th× cÇn cã mét sè biÕn ®æi bæ sung kh¸c tr−íc khi ADN ligase cã thÓ
xóc t¸c ph¶n øng nèi. Nh÷ng biÕn ®æi nµy bao gåm viÖc c¾t bá mét sè nucleotide bëi mét

enzym exonuclease vµ ho¹t ®éng tæng hîp söa ch÷a cña ADN polymerase. C¸c sù kiÖn
nµy ®−îc m« t¶ th«ng qua c¸c d¹ng t¸i tæ hîp trung gian ®−îc gäi lµ c¸c d¹ng χ (®äc lµ
“khi”, h×nh 6.16g) t×m thÊy ë nhiÒu sinh vËt kh¸c nhau khi ph©n tÝch NST cña chóng

b»ng kÝnh hiÓn vi ®iÖn tö. C¸c d¹ng χ nµy sau ®ã ®−îc gi¶i phãng bëi ph¶n øng ®øt-nèi

203

§inh §oµn Long

c¸c m¹ch ADN kÕt cÆp bæ sung míi nhê ho¹t ®éng cña c¸c enzym ®Ó h×nh thµnh nªn hai

ph©n tö ADN t¸i tæ hîp (h×nh 6.16j). ë E. coli, sù gi¶i phãng d¹ng χ nh− vËy lµ nhê biÓu
hiÖn cña gen recG hoÆc cña gen ruvC (söa ch÷a sai háng ADN do tia UV). Mçi gen m·
hãa mét endonuclease xóc t¸c ph¶n øng c¾t m¹ch ®¬n t¹i vÞ trÝ ®øt-nèi.

Mét sè b»ng chøng cho thÊy cã thÓ cã nhiÒu c¬ chÕ t¸i tæ hîp t−¬ng ®ång kh¸c n÷a.
Ch¼ng h¹n, theo Jack Szostak, Frlanklin Stahl vµ ®ång nghiÖp (1983), ë S. cerevisiae cã
m« h×nh ®øt-nèi m¹ch kÐp. Theo m« h×nh nµy, sù ®øt-nèi x¶y ra trªn mét trong hai
ph©n tö ADN t−¬ng ®ång (nh−ng trªn c¶ hai m¹ch, chø kh«ng ph¶i trªn mét m¹ch nh−
m« h×nh Holliday). Tõ vÞ trÝ ®øt nèi cã sù më réng ®Ó h×nh thµnh mét ®o¹n ADN “rçng”
(gièng nh− minh häa trªn h×nh 6.15) trªn c¶ hai m¹ch. Mçi ®Çu cña mét m¹ch ®¬n t¹i vÞ
trÝ ®øt “x©m lÊn” sang chuçi kÐp nguyªn vÑn vµ thay thÕ c¸c m¹ch t−¬ng ®ång trong
vïng nµy. C¸c tr×nh tù m¹ch ®¬n “rçng” sau ®ã ®−îc lÊp ®Çy bëi ho¹t ®éng tæng hîp cña
hÖ thèng söa ch÷a ADN. Sù kh¸c biÖt cña m« h×nh nµy lµ cã sù h×nh thµnh ®ång thêi hai
“cÇu” trao ®æi chÐo trªn hai m¹ch ®¬n cña c¸c ®o¹n NST t−¬ng ®ång. C¸c “cÇu” trao ®æi
chÐo nµy sau ®ã bÞ ®øt bëi ho¹t ®éng cña enzym endonuclease gièng nh− m« h×nh
Holliday. C¶ hai m« h×nh Holliday vµ ®øt-nèi m¹ch kÐp ®Òu gióp gi¶i thÝch ®−îc sù xuÊt
hiÖn c¸c d¹ng t¸i tæ hîp cña c¸c dÊu chuÈn di truyÒn bªn c¹nh c¸c vÞ trÝ trao ®æi chÐo.

6.7.2. Trao ®æi chÐo trong c¬ chÕ söa ch÷a ADN

§Õn ®©y, chóng ta míi chØ nãi ®Õn sù t¸i tæ hîp di truyÒn do sù ®øt-nèi cña c¸c

nhiÔm s¾c tö vµ sù trao ®æi t−¬ng hç gi÷a c¸c phÇn t−¬ng ®ång cña chóng. Tuy vËy, c¸c

ph©n tÝch bé bèn ë Ascomycetes cho thÊy sù trao ®æi nh− vËy kh«ng ph¶i lóc nµo còng

t−¬ng hç. §iÒu nµy ®−îc ph¸t hiÖn thÊy trong phÐp lai gi÷a hai d¹ng ®ét biÕn liªn kÕt

gÇn ë Neurospora. Cô thÓ lµ, khi ng−êi ta tiÕn hµnh lai hai d¹ng ®ét biÕn liªn kÕt gÇn m1

vµ m2 lµ m1m2+ víi m1+m2 (alen cã dÊu “ + ” lµ kiÓu a) a+ m+ b+
d¹i), ng−êi ta thu ®−îc 4 cÆp nang cã kiÓu h×nh

sau: 1) cÆp sè 1 lµ m1+m2; 2) cÆp sè 2 lµ m1+m2+; 3) m+ kÕt cÆp sai

cÆp sè 3 lµ m1m2+ vµ 4) cÆp sè 4 lµ m1m2+ (gièng cÆp C¸c chuçi dÞ a+ m b+
sè 3). Nh− vËy, xuÊt hiÖn kiÓu h×nh kiÓu d¹i xo¾n kÐp a m+ b

m1+m2+, nh−ng ®¸ng l−u ý nhÊt lµ kh«ng xuÊt hiÖn

kiÓu h×nh ®ét biÕn kÐp m1m2. NÕu sù t¸i tæ hîp m kÕt cÆp sai

t−¬ng ®ång x¶y ra, th× bÊt cø khi nµo thu ®−îc kiÓu amb

h×nh kiÓu d¹i m1+m2+ th× còng ph¶i thu ®−îc kiÓu

h×nh ®ét biÕn kÐp m1m2. ë ®©y, ®iÒu nµy kh«ng x¶y b) a+ m+ b+
ra; ®ång thêi, tØ lÖ kiÓu h×nh m2+ : m2 ®−îc mong

®îi lµ 2 : 2, mµ trong thùc tÕ l¹i lµ 3 : 1. C¸c nghiªn mm++
cøu ph©n tö sau nµy cho thÊy, ®· cã hiÖn t−îng

“chuyÓn ®æi” mét alen m2 thµnh m2+, vµ sù t¸i tæ a+ m+ b+
hîp kh«ng t−¬ng ®ång nµy ®−îc gäi lµ sù ®æi gen.
Sù ®æi gen ë ®©y kh«ng ph¶i do ®ét biÕn ng−îc (do a m+ b C¾t bá vµ tæng
kh«ng xuÊt hiÖn alen míi); ®ång thêi tÇn sè t¸i tæ m+ hîp söa sai
m

hîp cña mét sè dÊu chuÈn gÇn vÞ trÝ trao ®æi chÐo am b

lµ 50%. Trong thùc tÕ, ®· diÔn ra hiÖn t−îng söa H×nh 6.17. Söa ch÷a ADN kiÓu “®æi gen”
ch÷a ADN ®ång thêi víi trao ®æi chÐo (h×nh 6.17). ®ång thêi víi trao ®æi chÐo t−¬ng ®ång.

204

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Víi c¸c dÊu chuÈn liªn kÕt gÇn, b+
ng−êi ta thÊy viÖc ®æi gen cßn x¶y ra

th−êng xuyªn h¬n t¸i tæ hîp t−¬ng a+ m+ Söa ch÷a ADN
®ång. Trong mét nghiªn cøu ph©n tÝch m+ Söa ch÷a ADN

®ét biÕn his1 ë nÊm men, 980 trong sè m+ m+ a
1081 nang ph©n tÝch cã kiÓu h×nh kiÓu
d¹i his1+ lµ do ®æi gen, trong khi chØ cã
101 nang lµ kÕt qu¶ cña t¸i tæ hîp

t−¬ng ®ång. b

§Æc ®iÓm næi bËt nhÊt cña viÖc Endonuclease
“®æi gen” lµ tØ lÖ alen ban ®Çu cña b+ b+

phÐp lai (1 : 1) kh«ng ®−îc duy tr× ë a+ m+ a+ m+
thÕ hÖ con. §iÒu nµy ®−îc gi¶i thÝch m+ m+
bëi c¸c ph©n ®o¹n ng¾n ADN mang

alen ®ét biÕn cña bè/mÑ bÞ ph©n gi¶i

sau ®ã ®−îc tæng hîp l¹i dùa trªn m+ a m+ a
m¹ch khu«n lµ ®o¹n ADN mang alen m+ m+

kiÓu d¹i cña mÑ/bè t−¬ng øng. Trªn b b
h×nh 6.16d-i, cã mét ph©n ®o¹n ADN

gi÷a c¸c locut A vµ B (n¬i cã c¸c ®o¹n

ADN m¹ch ®¬n cña hai NST t−¬ng a m+ b+ a+ m+ b+
®ång) kÕt cÆp bæ sung víi nhau. NÕu

mét cÆp alen thø 3 n»m trong ph©n vµ m+ vµ m+
®o¹n nµy ph©n li trong trao ®æi chÐo a+ m+ a m+
th× sù kÕt cÆp sai cã thÓ x¶y ra ë hai
chuçi xo¾n kÐp (t−¬ng øng víi 2 nhiÔm m+ b m+ b

s¾c tö, h×nh 6.17a). Ph©n tö ADN a ADN ligase a+ ADN ligase
vµ m+ b+ vµ m+ b+
chøa c¸c alen kh¸c nhau trªn hai
m¹ch ®¬n cña chóng ®−îc gäi lµ chuçi m+ m+
dÞ xo¾n kÐp. Khi sù kÕt cÆp sai cña m+ m+

ADN ®−îc söa ch÷a b»ng c¬ chÕ c¾t bá

(xem môc 6.5.2 ë trªn), trong ®ã m¹ch a+ m+ b a m+ b

m ®−îc c¾t bá vµ tæng hîp l¹i thµnh C¸c dÊu chuÈn bªn C¸c dÊu chuÈn bªn
m¹ch m+, th× thÓ tø trÞ thu ®−îc sÏ ngoµi t¸i tæ hîp ngoµi gièng bè, mÑ
gièng víi h×nh 6.17b. Trªn c¬ së ®ã,

trong lÇn ph©n bµo tiÕp theo, sù sao H×nh 6.18. Söa ch÷a ADN kiÓu “®æi gen” liªn kÕt víi c¸c
chÐp ADN theo c¬ chÕ b¸n b¶o toµn sÏ dÊu chuÈn (gen) bªn ngoµi theo kiÓu gièng bè, mÑ hoÆc
dÉn ®Õn h×nh thµnh 6 nang mang alen theo kiÓu t¸i tæ hîp.

m+ vµ chØ cã 2 nang mang alen m (v×

vËy, tØ lÖ ph©n li kiÓu h×nh lµ 3 : 1).

NÕu chØ cã 1 trong 2 vÞ trÝ kÕt cÆp sai trong thÓ tø trÞ ®−îc söa ch÷a tr−íc lÇn ph©n
bµo nguyªn nhiÔm, th× sù sao chÐp b¸n b¶o toµn cña chuçi dÞ xo¾n kÐp kh«ng ®−îc söa
ch÷a sÏ thu ®−îc mét chuçi nguyªn xo¾n kÐp mang alen m+ vµ mét mang alen m. Lóc

nµy tØ lÖ ph©n li sÏ lµ 5 m+ : 3 m.

HiÖn t−îng “®æi gen” còng liªn quan ®Õn sù t¸i tæ hîp t−¬ng ®ång cña c¸c dÊu
chuÈn ë c¹nh vÞ trÝ trao ®æi chÐo víi tØ lÖ xÊp xØ 50%. Mèi quan hÖ nµy ®−îc gi¶i thÝch bëi
m« h×nh t¸i tæ hîp cña Holliday (h×nh 6.16). Bëi v×, nÕu c¶ hai nhiÔm s¾c tö thuéc cïng

mét thÓ tø trÞ ë d¹ng gièng nh− trªn h×nh th× sù “®æi gen” ®ång thêi ®i kÌm víi sù t¸i tæ
hîp t−¬ng ®ång cña c¸c dÊu chuÈn ë gÇn vÞ trÝ trao ®æi chÐo lµ dÔ x¶y ra (h×nh 6.18). CÇu

liªn kÕt m¹ch ®¬n gi÷a hai nhiÔm s¾c tö ®−îc ph©n gi¶i bëi enzym endonuclease hoÆc

205

§inh §oµn Long

theo chiÒu däc, hoÆc theo chiÒu ngang (theo chiÒu h×nh vÏ). NÕu vÕt c¾t theo chiÒu däc,
th× c¸c nang sÏ mang c¶ 2 alen bÞ ®æi vµ sù t¸i tæ hîp t−¬ng ®ång c¸c gen ë gÇn vÞ trÝ ®øt-
nèi. Nh−ng nÕu vÕt c¾t theo chiÒu ngang th× mét nang mang gen bÞ ®æi vµ sù tæ hîp c¸c
dÊu chuÈn ë gÇn vÞ trÝ ®øt-nèi theo kiÓu gen cña bè/mÑ. V× vËy, nÕu tÇn sè c¾t däc vµ c¾t
ngang lµ t−¬ng ®−¬ng (50% mçi lo¹i) th× sù ®æi gen ®i kÌm víi t¸i tæ hîp t−¬ng ®ång cña
c¸c dÊu chuÈn gÇn vÞ trÝ ®øt-nèi lµ xÊp xØ 50%, phï hîp víi kÕt qu¶ thùc nghiÖm.

6.8. C¸c yÕu tè di truyÒn vËn ®éng (TE)

6.8.1. C©y ng« vµ hiÖn t−îng “gen nh¶y”

Ng« lµ mét trong nh÷ng c©y l−¬ng thùc quan träng hµng ®Çu ë n−íc ta vµ nhiÒu
n−íc trªn thÕ giíi. LÞch sö trång ng« b¾t ®Çu kho¶ng 5000 n¨m tr−íc ë Trung Mü, sau ®ã
ph¸t triÓn ra c¸c vïng kh¸c trªn thÕ giíi. Khi Columbus ph¸t hiÖn ra Ch©u Mü, ng−êi
d©n b¶n ®Þa ë ®©y ®· cã nhiÒu gièng ng« kh¸c nhau. Trong sè ®ã, nhiÒu gièng víi kiÓu
mµu h¹t kh¸c nhau nh− ®á, xanh lam, vµng, tr¾ng, tÝm, säc, ®èm... N¨m 1948, nhµ khoa
häc n÷ ng−êi Mü lµ Barbara McClintock ®· c«ng bè nghiªn cøu nhËn ®Þnh r»ng c¸c gièng
ng« “säc” vµ “®èm” lµ kÕt qu¶ ®ét biÕn do ho¹t ®éng cña yÕu tè di truyÒn vËn ®éng. §Õn
n¨m 1983, bµ ®−îc trao gi¶i th−ëng Nobel nhê c«ng bè nµy. Sau c©y ng«, ng−êi ta ®· t×m
thÊy c¸c tr×nh tù ADN cã thÓ vËn ®éng trong hÖ gen ë hÇu hÕt c¸c loµi sinh vËt kh¸c.
Trong hÖ gen cña nhiÒu loµi, chóng chiÕm mét tØ lÖ ®¸ng kÓ. Ch¼ng h¹n ë ng«, h¬n mét

nöa hÖ gen liªn quan ®Õn ho¹t ®éng cña c¸c TE. ë ng−êi, kho¶ng 40% tr×nh tù hÖ gen cã
liªn quan ®Õn c¸c yÕu tè TE.

6.8.2. C¸c lo¹i yÕu tè di truyÒn vËn ®éng

Cã nhiÒu lo¹i TE víi cÊu B¶ng 6.1. Ph©n lo¹i c¸c yÕu tè di truyÒn vËn ®éng (TE)
tróc vµ ®Æc ®iÓm ho¹t ®éng theo c¬ chÕ vËn ®éng
kh¸c nhau ®−îc t×m thÊy ë vi
khuÈn, nÊm, sinh vËt ®¬n bµo, KiÓu vÝ dô Sinh vËt chñ

thùc vËt còng nh− ®éng vËt. I. C¸c TE kiÓu c¾t - d¸n
Khi c¸c TE vËn ®éng, chóng
cã thÓ lµm ®øt ®o¹n NST vµ C¸c lo¹i yÕu tè IS (vÝ dô: IS50) Vi khuÈn
g©y ®ét biÕn. Dï mçi lo¹i TE
cã nh÷ng ®Æc tÝnh riªng, C¸c yÕu tè composite (vi dô: Tn5) Vi khuÈn
nh−ng dùa vµo c¸ch thøc vËn
®éng trong hÖ gen cña chóng, C¸c yÕu tè Ac/Ds Ng«

ng−êi ta chia lµm ba nhãm C¸c yÕu tè P Ruåi giÊm
chÝnh (b¶ng 6.1). Nhãm 1
gåm c¸c TE kiÓu c¾t-d¸n. C¸c yÕu tè mariner Ruåi giÊm
Gäi nh− vËy, bëi sù vËn ®éng
cña chóng ®i liÒn víi sù “®øt” C¸c yÕu tè hobo Ruåi giÊm
ra cña tr×nh tù gèc vµ “g¾n”
vµo mét vÞ trÝ kh¸c trong hÖ C¸c yÕu tè Tc1 Giun trßn
II. C¸c TE kiÓu sao chÐp
gen. Sù c¾t-d¸n cña c¸c TE cã
thÓ diÔn ra trªn cïng mét C¸c yÕu tè Tn3 Vi khuÈn
NST hoÆc gi÷a c¸c NST kh¸c III. C¸c TE kiÓu phiªn m ng−îc
nhau, nh−ng lu«n ®−îc xóc
t¸c bëi enzym ®Æc biÖt lµ A. C¸c TE kiÓu phiªn m· ng−îc

transposase. Nhãm thø hai (cßn gäi lµ retrotransposon, hay LTR = long tandem repeats)

gåm c¸c yÕu tè TE khi vËn Ty1 NÊm men
®éng chóng ®ång thêi sao
copia Ruåi giÊm

gypsy Ruåi giÊm

B. C¸c retrosposon

C¸c yÕu tè F, G vµ I Ruåi giÊm

C¸c retrosposon kÐo dµi ®Çu mót Ruåi giÊm

nhiÔm s¾c thÓ (vÝ dô: HeT-A, TART)

LINE (vÝ dô: L1) Ng−êi

SINE (vÝ dô: Alu) Ng−êi

206

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

chÐp (t¸i b¶n) tr×nh tù gèc. Gièng nhãm thø nhÊt, nhãm TE thø hai nµy còng th−êng m·
hãa cho enzym transposase cã vai trß ®iÒu khiÓn sù t−¬ng t¸c cña nã víi vÞ trÝ “®Ých” mµ nã
vËn ®éng tíi. Trong qu¸ tr×nh t−¬ng t¸c, TE ®−îc sao chÐp vµ mét b¶n sao cña nã ®−îc “g¾n”
vµo vÞ trÝ míi; cßn b¶n “gèc” vÉn duy tr× ë vÞ trÝ cò. Nhãm nµy ®−îc gäi lµ c¸c TE kiÓu sao
chÐp. Trong nhãm thø ba, qu¸ tr×nh vËn ®éng cña TE ®−îc thùc hiÖn th«ng qua viÖc “g¾n”
mét b¶n sao cña mét tr×nh tù TE ®−îc phiªn m· ng−îc tõ ph©n tö ARN t−¬ng øng cña nã
vµo vÞ trÝ míi trong hÖ gen. Trong qu¸ tr×nh nµy, cã sù tham gia cña enzym phiªn m· ng−îc
reverse transcriptase, nªn c¸c yÕu tè TE nµy ®−îc gäi lµ c¸c TE phiªn m· ng−îc hay
retrotransposon. NhiÒu TE thuéc nhãm nµy liªn quan ®Õn c¸c retrovirut, v× vËy còng cßn
®−îc gäi lµ c¸c TE kiÓu retrovirut. Mét sè lo¹i TE kh¸c cã cÊu tróc “gi¶n l−îc” ®−îc gäi lµ
retroposon. §Õn nay, nÕu nh− c¸c TE kiÓu c¾t-d¸n ®−îc t×m thÊy ë c¶ prokaryote vµ
eukaryote, th× c¸c TE kiÓu sao chÐp míi chØ thÊy ë prokaryote, cßn c¸c TE kiÓu phiªn m·
ng−îc chØ thÊy ë eukaryote.

6.8.3. C¸c yÕu tè di truyÒn vËn ®éng ë prokaryote

MÆc dï c¸c TE ®Çu tiªn ®−îc t×m thÊy ë c¸c loµi eukaryote, nh−ng nh÷ng TE ®−îc

hiÓu râ ë møc ®é ph©n tö ®Çu tiªn l¹i lµ c¸c TE ë vi khuÈn. ë vi khuÈn, cã ba lo¹i TE
chÝnh: (1) c¸c tr×nh tù cµi, cßn gäi lµ c¸c yÕu tè IS (insertion sequence); (2) c¸c yÕu tè
composite, cßn gäi lµ d¹ng tÝch hîp vµ (3) c¸c yÕu tè Tn3. C¸c yÕu tè IS cã cÊu tróc ®¬n
gi¶n nhÊt, chØ chøa gen m· hãa cho c¸c protein tham gia vµo qu¸ tr×nh vËn ®éng cña TE.
C¸c yÕu tè composite vµ Tn3 cã cÊu t¹o phøc t¹p h¬n, chøa mét sè gen m· hãa cho c¸c
s¶n phÈm kh«ng liªn quan ®Õn ho¹t ®éng vËn ®éng cña TE.

6.8.3.1. C¸c yÕu tè cµi IS

§©y lµ c¸c TE cã cÊu t¹o ®¬n gi¶n nhÊt. Chóng ®−îc gäi lµ c¸c yÕu tè cµi v× chóng cã
thÓ g¾n vµo nhiÒu vÞ trÝ kh¸c nhau trªn NST hoÆc trªn plasmid cña vi khuÈn. C¸c yÕu tè
IS ®Çu tiªn ®−îc t×m thÊy ë E. coli (dßng ®ét biÕn lac-). C¸c dßng vi khuÈn nµy cã kh¶
n¨ng ®ét biÕn phôc håi cao. C¸c nghiªn cøu ë møc ®é ph©n tö cho thÊy, c¸c ®ét biÕn “kÐm
bÒn” nµy lµ do cã c¸c ®o¹n tr×nh tù ADN “bæ sung” vµo mét sè vÞ trÝ c¹nh gen lac. Sau ®ã,
sù phôc håi ®ét biÕn x¶y ra do chÝnh sù rêi khái vÞ trÝ ®· g¾n vµo cña c¸c ®o¹n tr×nh tù bæ
sung nµy. KiÓu vËn ®éng nh− vËy cña c¸c yÕu tè IS sau nµy ®−îc t×m thÊy ë nhiÒu vi
khuÈn kh¸c.

C¸c yÕu tè IS cã cÊu t¹o gän, phÇn lín cã kÝch th−íc nhá h¬n 2500 bp vµ chØ chøa
c¸c gen liªn quan trùc tiÕp tíi sù vËn ®éng cña chóng. §Õn nay, ®· ph¸t hiÖn ®−îc nhiÒu
lo¹i yÕu tè IS kh¸c nhau. Lo¹i nhá nhÊt, IS1, cã kÝch th−íc 768 bp, ®−îc x¸c ®Þnh ranh
giíi bëi hai tr×nh tù ng¾n lÆp l¹i ng−îc chiÒu ë hai ®Çu, kÝ hiÖu lµ ITR (inverted
terminal repeat). Mçi yÕu tè IS th−êng cã tr×nh tù ITR ®Æc thï (nh−ng kh«ng nhÊt thiÕt),
víi chiÒu dµi tõ 9 ®Õn 40 bp. Khi tr×nh tù ITR bÞ ®ét biÕn, yÕu tè IS th−êng mÊt kh¶ n¨ng
vËn ®éng. §iÒu nµy cho thÊy, c¸c tr×nh tù ITR cã vai trß quyÕt ®Þnh trong sù vËn ®éng
cña c¸c yÕu tè IS.

Ýt nhÊt mét sè yÕu tè IS ®−îc t×m thÊy mang gen m· hãa cho mét enzym ®Æc biÖt cã
vai trß quan träng trong sù vËn ®éng cña b¶n th©n chóng lµ transposase. Trong qu¸
tr×nh vËn ®éng cña IS, transposase d−êng nh− g¾n vµo vÞ trÞ ë phÝa ®Çu hoÆc gÇn ®Çu cña
tr×nh tù vËn ®éng, ®ång thêi c¾t m¹ch ADN sîi kÐp t¹i vÞ trÝ gèc. ViÖc c¾t ph©n tö ADN
sîi kÐp ë vÞ trÝ nµy lµm t¸ch tr×nh tù vËn ®éng khái NST hoÆc plasmid, nhê vËy chóng cã
thÓ “vËn ®éng” tíi mét vÞ trÝ kh¸c trong hÖ gen. Khi c¸c IS g¾n vµo mét vÞ trÝ míi trªn
NST hoÆc plasmid, nã sÏ g©y ra sù nh©n ®«i mét tr×nh tù ng¾n ë hai ®Çu t¹i vÞ trÝ nã g¾n
vµo (do t¹i vÞ trÝ nµy, ph©n tö ADN sîi kÐp th−êng bÞ c¾t theo kiÓu ch÷ chi). Trong ®ã mçi
b¶n sao cña tr×nh tù ®−îc nh©n ®«i n»m vÒ mét phÝa cña yÕu tè di truyÒn vËn ®éng.

207

§inh §oµn Long

Nh÷ng tr×nh tù nµy (th−êng gåm  Hai m¹ch ®¬n cña tr×nh tù ADN ®Ých

tõ 2 ®Õn 13 cÆp nucleotide) ®−îc ®−îc c¾t t¹i c¸c vÞ trÝ kh¸c nhau (mòi tªn)

gäi lµ c¸c tr×nh tù nh©n ®«i t¹i vÞ
trÝ ®Ých (h×nh 6.19).

NST vi khuÈn cã thÓ cã  YÕu tè IS cµi vµo ®o¹n rçng ADN ®−îc
nhiÒu b¶n sao kh¸c nhau cña t¹o ra do enzym c¾t kiÓu ch÷ chi

cïng mét lo¹i yÕu tè IS. Ch¼ng

h¹n, mçi tÕ bµo E. coli th−êng cã  Sù tæng hîp ADN lÊp ®Çy c¸c vÞ trÝ rçng
tõ 6 tíi 10 b¶n sao yÕu tè IS1.
Plasmid còng cã thÓ mang yÕu tè b»ng c¸c nucleotide cßn thiÕu (mµu ghi) ë
hai ®Çu cña yÕu tè IS. §iÒu nµy dÉn ®Õn

IS. Ch¼ng h¹n, plasmid F ®iÓn sù hai tr×nh tù ng¾n lÆp l¹i cïng chiÒu ë
h×nh th−êng chøa Ýt nhÊt hai yÕu hai vïng biªn cña tr×nh tù ®Ých

tè IS kh¸c nhau lµ IS2 vµ IS3.

Khi mét lo¹i yÕu tè IS cã mÆt H×nh 6.19. Sù nh©n ®«i tr×nh tù ë hai vïng biªn c¹nh vÞ trÝ cµi
trªn c¶ NST vµ plasmid, chóng cña c¸c yÕu tè di truyÒn vËn ®éng kiÓu c¾t – d¸n (IS).

g©y nªn hiÖn t−îng “t¸i tæ hîp

t−¬ng ®ång” gi÷a c¸c ph©n tö ADN kh¸c nhau. Sù t¸i tæ hîp nh− vËy ®ãng vai trß trong

sù kÕt hîp plasmid F vµo NST ë E. coli. §Õn ®©y, chóng ta nhí r»ng, c¶ NST vµ plasmid

F ë E. coli ®Òu cã cÊu tróc ph©n tö ADN sîi kÐp, m¹ch vßng. Khi NST vµ plasmid t¸i tæ

hîp ë vïng t−¬ng ®ång (t¹i vÞ trÝ IS cã mÆt trªn c¶ hai ph©n tö ADN), th× plasmid cã kÝch

th−íc nhá sÏ kÕt hîp vµo NST, t¹o nªn mét ph©n tö ADN sîi kÐp vßng trßn duy nhÊt

trong tÕ bµo. Sù kÕt hîp nµy t¹o nªn c¸c dßng Hfr cã kh¶ n¨ng chuyÓn NST cña chóng

sang tÕ bµo kh¸c qua tiÕp hîp. C¸c dßng Hfr kh¸c nhau cã thÓ kh¸c nhau vÒ vÞ trÝ g¾n

kÕt cña plasmid F trªn NST, bëi v× c¸c yÕu tè IS ®iÒu hßa ho¹t ®éng g¾n kÕt cã thÓ n»m ë

c¸c vÞ trÝ kh¸c nhau trªn NST cña c¸c dßng vi khuÈn kh¸c nhau. V× cã vai trß trong viÖc

h×nh thµnh c¸c dßng Hfr nh− vËy, c¸c yÕu tè IS lµm t¨ng kh¶ n¨ng trao ®æi gen gi÷a c¸c

chñng vi khuÈn vµ t¹o ra nhiÒu biÕn dÞ tæ hîp. V× vËy, cïng c¸c ®ét biÕn, ®©y chÝnh lµ

mét c¬ chÕ c¬ b¶n t¹o nguyªn liÖu phong phó cho sù tiÕn hãa ë vi khuÈn.

6.8.3.2. C¸c TE kiÓu composite

C¸c TE kiÓu composite (cßn gäi lµ gen nh¶y tÝch hîp) lµ c¸c tr×nh tù vËn ®éng kiÓu
c¾t – d¸n cã ë vi khuÈn, ký hiÖu Tn, ®−îc h×nh thµnh do sù cã mÆt cña hai tr×nh tù IS
n»m gÇn nhau. C¸c vïng tr×nh tù n»m gi÷a hai yÕu tè IS còng sÏ ®−îc “vËn ®éng” cïng
víi chóng khi c¸c tr×nh tù nµy vËn ®éng trong hÖ gen. Nh− vËy, hËu qu¶ lµ hai yÕu tè IS
cã kh¶ n¨ng “b¾t gi÷” mét ®o¹n tr×nh tù ADN n»m gi÷a vèn b×nh th−êng kh«ng cã kh¶
n¨ng vËn ®éng, vµ “truyÒn” kh¶ n¨ng vËn ®éng cho ®o¹n tr×nh tù nµy. H×nh 6.20 minh
häa 3 vÝ dô. Víi Tn9, hai yÕu tè IS vïng biªn (768 bp) n»m cïng chiÒu víi nhau. Trong
khi ®ã, ë Tn5, hai yÕu tè IS (1533 bp) vïng biªn n»m ng−îc chiÒu. §o¹n tr×nh tù n»m
gi÷a hai yÕu tè IS cã thÓ chøa c¸c gen kh«ng liªn quan ®Õn sù vËn ®éng cña gen. Trong
thùc tÕ, ®o¹n tr×nh tù gi÷a hai yÕu tè IS ë c¶ ba lo¹i yÕu tè Tn ë h×nh 6.20 ®Òu mang c¸c
gen kh¸ng chÊt kh¸ng sinh.

Trong mét sè tr−êng hîp, c¸c yÕu tè IS ë hai ®Çu vïng biªn cña tr×nh tù vËn ®éng
kiÓu composite kh«ng gièng nhau. Ch¼ng h¹n nh− ë yÕu tè Tn5, tr×nh tù IS vïng biªn
ph¶i lµ IS50R cã tr×nh tù m· hãa cho transposase thóc ®Èy sù vËn ®éng cña gen, trong
khi ®ã tr×nh tù IS vïng biªn tr¸i (IS50L) kh«ng cã ®Æc tÝnh nµy. Sù kh¸c biÖt lµ ë mét cÆp
nucleotide duy nhÊt cã vai trß x¸c ®Þnh ho¹t tÝnh cña transposase.

208

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

YÕu tè Tn5 a) ~ 2500 bp b) ~ 5700 bp
còng minh häa cho

mét ®Æc tÝnh kh¸c Gen camr Gen kanr Gen bler Gen strr
cña c¸c gen nh¶y
kiÓu composite, ®ã lµ 768 bp 768 bp 1533 bp 1533 bp
qu¸ tr×nh vËn ®éng IS1 IS1
cña chóng ®−îc ®iÒu IS50L IS50R

khiÓn bëi mét sù ®iÒu §o¹n tr×nh tù hai §o¹n tr×nh tù hai
hßa (h×nh 6.21). Khi ®Çu lÆp l¹i ng−îc ®Çu lÆp l¹i ng−îc

mét thùc khuÈn thÓ chiÒu 23 bp chiÒu 23 bp

mang yÕu tè Tn5 l©y c) ~ 9300 bp

nhiÔm tÕ bµo vi 1329 bp Gen tetr
khuÈn (vµ kh«ng g©y IS10L 1329 bp
tan), th× tÇn sè vËn
IS10R
®éng cña yÕu tè Tn5

sÏ gi¶m ®i râ rÖt §o¹n tr×nh tù hai ®Çu lÆp l¹i ng−îc chiÒu 23 bp
trong tr−êng hîp

NST vi khuÈn còng H×nh 6.20. CÊu tróc cña mét sè yÕu tè di truyÒn vËn ®éng kiÓu tÝch hîp
mang mét b¶n sao (composite transposon). KÝch th−íc vµ h−íng cña c¸c tr×nh tù thµnh phÇn ®−îc
biÓu diÔn b»ng c¸c chØ sè (cÆp baz¬ nit¬, bp) vµ mòi tªn. a) YÕu tè Tn9 mang hai
cña Tn5. HiÖn t−îng
nµy cho thÊy, viÖc cã yÕu tè cµi IS1 cã tr×nh tù cïng chiÒu n»m ë hai ®Çu cña gen kh¸ng

s½n mét b¶n sao cña chloramphenicol; b) YÕu tè Tn5 mang hai yÕu tè IS50 cã tr×nh tù ng−îc chiÒu n»m

TE trong tÕ bµo chñ ë hai ®Çu côm gen gåm c¸c gen kh¸ng kanamycin, bleomycin vµ streptomycin (L =
cã t¸c dông øc chÕ sù bªn tr¸i, R = bªn ph¶i); c) YÕu tè Tn10 chøa gåm hai yÕu tè IS10 n»m ë hai ®Çu
vËn ®éng trong hÖ mét ®o¹n ADN mang gen kh¸ng tetracyclin (theo Snudtard, 2004).

gen cña nã. HiÖn

t−îng nµy cã thÓ do sù tæng hîp mét chÊt øc chÕ nµo ®ã g©y ra. Gi¶ thiÕt nµy sau ®ã ®−îc

chøng minh bëi c¸c nghiªn cøu cña Michael Syvaen, William Reznikoff vµ c¸c céng sù.

YÕu tè IS50R cña Tn5 trong thùc tÕ ®· m· hãa cho hai protein. Mét lo¹i lµ transposase

xóc t¸c qu¸ tr×nh vËn ®éng cña gen. Lo¹i thø hai lµ protein transposase bÞ c¾t mét phÇn

do ®−îc phiªn m· tõ mét tr×nh tù khëi ®éng n»m bªn trong tr×nh tù m· hãa transposase

®Çy ®ñ, lµm øc chÕ sù vËn ®éng cña gen. Do protein thø hai nµy ng¾n h¬n vµ phæ biÕn

h¬n, nªn sù vËn ®éng cña Tn5 bÞ øc chÕ.

a) b)

IS10L IS10R

Transposase

YÕu tè Tn5 YÕu tè Tn5 ChÊt øc chÕ YÕu tè
thØnh tho¶ng hiÕm khi IS50R ®ång
vËn ®éng thêi s¶n sinh
vËn ®éng hai lo¹i protein
kh¸c nhau do sù dÞch
m· b¾t ®Çu tõ hai bé
ba më ®Çu kh¸c nhau

H×nh 6.21. Sù ®iÒu hßa ho¹t ®éng cña yÕu tè Tn5. a) TÕ bµo E. coli bÞ g©y nhiÔm bëi virut mang yÕu tè
Tn5. C¸c tÕ bµo ®· s½n cã Tn5 trªn nhiÔm s¾c thÓ h¹n chÕ sù vËn ®éng cña c¸c yÕu tè nµy. b) C¬ së di
truyÒn ®iÒu hßa ho¹t ®éng cña Tn5: Mét lo¹i protein do Tn5 m· hãa lµ transposase xóc t¸c (thóc ®Èy) sù
vËn ®éng cña cña chÝnh nã, nh−ng mét protein kh¸c (chÊt øc chÕ) l¹i øc chÕ qu¸ tr×nh nµy. Protein øc chÕ
cã kÝch th−íc nhá h¬n, phæ biÕn h¬n, nªn chiÕm −u thÕ ®Æc biÖt khi cã nhiÒu b¶n sao Tn5 trong tÕ bµo.

209

§inh §oµn Long

6.8.3.3. C¸c TE kiÓu Tn3 a) CÊu tróc cña yÕu tè Tn3.

C¸c TE thuéc nhãm nµy th−êng 4957 bp
cã kÝch th−íc lín h¬n c¸c yÕu tè IS vµ

chøa c¸c gen kh«ng liªn quan ®Õn tnpA tnpR bla
qu¸ tr×nh vËn ®éng cña chóng. §Æc
®iÓm nµy gièng víi c¸c yÕu tè kiÓu VÞ trÝ res
composite. Tuy vËy, kh«ng gièng nh−
Transposase Resolvase β-lactamase
c¸c yÕu tè composite, c¸c yÕu tè Tn3 (chÊt øc chÕ)

kh«ng cã c¸c tr×nh tù IS ë c¸c ®Çu §o¹n tr×nh tù hai ®Çu lÆp
tËn cïng cña chóng. Thay vµo ®ã, c¸c l¹i ng−îc chiÒu 38 bp
yÕu tè nµy cã c¸c tr×nh tù lÆp l¹i
b) Sù vËn ®éng cña Tn3 qua sù h×nh thµnh ADN tÝch hîp

ng−îc chiÒu ë hai ®Çu víi chiÒu dµi Plasmid thÓ cho Plasmid thÓ nhËn

kho¶ng tõ 38 ®Õn 40 nucleotide. Khi Tn3
vËn ®éng vµo vÞ trÝ ®Ých, c¸c yÕu tè

Tn3 còng t¹o ra sù nh©n ®«i tr×nh tù

ng¾n t¹i vïng biªn t¹i vÞ trÝ chóng

xen vµo. H×nh 6.22a minh häa cÊu Transposase  Transposase do Tn3 m· hãa xóc t¸c
tróc cña mét yÕu tè Tn3 ®iÓn h×nh.
sù h×nh thµnh ph©n tö ADN tÝch hîp

YÕu tè nµy gåm cã ba gen tnpA, tnpR gi÷a plasmid thÓ cho vµ plasmid thÓ
nhËn. Trong qu¸ tr×nh nµy, yÕu tè Tn3
vµ bla m· hãa t−¬ng øng cho c¸c ®ång thêi sao chÐp, dÉn ®Õn ë mçi
protein lµ transposase, protein øc ®Çu nèi gi÷a plasmid thÓ cho vµ thÓ
chÕ gäi lµ resolvase, vµ mét enzym nhËn cã mét b¶n sao cña yÕu tè Tn3.

gäi lµ β-lactamase. β-lactamase t¹o

nªn tÝnh kh¸ng kh¸ng sinh Ph©n tö
ampicillin cña vi khuÈn, cßn hai ADN
protein kia cã vai trß trong ®iÒu hßa
sù vËn ®éng cña gen. tÝch hîp

Sù vËn ®éng cña yÕu tè Tn3

diÔn ra qua hai giai ®o¹n (h×nh Resolvase  Resolvase do gen tnpR m· hãa ph©n
6.22b). Trong giai ®o¹n ®Çu,
t¸ch ph©n tö tÝch hîp qua ®iÒu tiÕt sù

transposase ®iÒu hßa sù dung hîp t¸i tæ hîp gi÷a hai yÕu tè Tn3.

cña hai ph©n tö ADN cã cÊu tróc

vßng, mét lo¹i mang yÕu tè Tn3, cßn

lo¹i kia th× kh«ng. KÕt qu¶ cña qu¸

tr×nh ®ã lµ sù h×nh thµnh ph©n tö

ADN tÝch hîp. Trong khi qu¸ tr×nh

nµy diÔn ra, b¶n th©n tr×nh tù Tn3

®−îc sao chÐp vµ mçi b¶n sao cña

chóng ®−îc g¾n vµo mét ®Çu t¹i chç  Plasmid thÓ cho vµ thÓ
nèi cña hai ph©n tö ADN ban ®Çu.
Hai b¶n sao tr×nh tù Tn3 n»m trong nhËn t¸ch nhau ra, mçi
ph©n tö ADN tÝch hîp cã chiÒu gièng plasmid cã mét b¶n
sao cña Tn3

nhau. Trong giai ®o¹n sau, protein

resolvase ®−îc m· hãa bëi gen tnpR

cã t¸c dông ®iÒu hßa sù t¸i tæ hîp t¹i H×nh 6.22. CÊu tróc vµ sù vËn ®éng cña c¸c yÕu tè kiÓu Tn3.

mét vÞ trÝ ®Æc hiÖu n»m gi÷a hai b¶n

sao cña tr×nh tù Tn3, gäi lµ vÞ trÝ t¸i tæ hîp res (recombination site), ®Ó t¹o thµnh hai

ph©n tö ADN míi. Mçi ph©n tö mang mét b¶n sao cña Tn3. Nh− vËy, sù vËn ®éng cña

210

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

c¸c yÕu tè Tn3 diÔn ra theo kiÓu sao chÐp liªn quan ®Õn sù h×nh thµnh cña mét ph©n tö
ADN tÝch hîp trung gian.

S¶n phÈm cña gen tnpR trong yÕu tè Tn3 cßn cã mét chøc n¨ng n÷a, ®ã lµ nã øc chÕ
sù tæng hîp cña c¶ hai protein transposase vµ resolvase. Ho¹t ®éng øc chÕ x¶y ra do vÞ trÝ
res n»m ë gi÷a hai gen tnpA vµ tnpR. Khi liªn kÕt vµo vÞ trÝ res, protein tnpR ng¨n c¶n sù
phiªn m· cña hai gen tnpA vµ tnpR. Lóc nµy, yÕu tè Tn3 trë vÒ tr¹ng th¸i tÜnh (kh«ng
vËn ®éng).

6.8.3.4. ý nghÜa y häc cña c¸c yÕu tè di truyÒn vËn ®éng ë vi khuÈn

NhiÒu lo¹i TE ë vi khuÈn mang c¸c gen kh¸ng kh¸ng sinh. HËu qu¶ lµ, viÖc vËn
®éng cña c¸c yÕu tè nµy dÔ dµng chuyÓn c¸c gen kh¸ng kh¸ng sinh tõ ph©n tö ADN nµy
sang ph©n tö ADN kh¸c (vÝ dô nh− gi÷a NST vµ plasmid). Dßng vËn ®éng cña th«ng tin
di truyÒn nh− vËy cã ý nghÜa y häc hÕt søc quan träng do nhiÒu ph©n tö ADN sau khi
®−îc bæ sung c¸c gen kh¸ng kh¸ng sinh cã thÓ ®−îc chuyÓn sang c¸c tÕ bµo kh¸c. Kh¶
n¨ng kh¸ng kh¸ng sinh cã thÓ ®−îc lan truyÒn gi÷a c¸c quÇn thÓ hoÆc gi÷a c¸c thÕ hÖ tÕ
bµo kh¸c nhau cña vi khuÈn. KÕt qu¶ cuèi cïng cña qu¸ tr×nh nµy lµ tÊt c¶ (hoÆc hÇu
hÕt) c¸c tÕ bµo vi khuÈn trong quÇn thÓ ®Òu cã kh¶ n¨ng kh¸ng kh¸ng sinh.

HiÖn t−îng kh¸ng kh¸ng sinh do ho¹t ®éng cña TE ®−îc t×m thÊy mét sè vi khuÈn
g©y bÖnh ë ng−êi, bao gåm c¸c chñng cña Staphylococcus, Enterococcus, Neisseria,

YÕu tè x¸c ®Þnh tÝnh kh¸ng (R) Plasmid mang gen kh¸ng chÊt
kh¸ng sinh streptomycin

 Sù t¸i tæ hîp gi÷a c¸c yÕu tè Thµnh phÇn yÕu tè truyÒn RTF
IS1 n»m trong mét plasmid tÝnh kh¸ng (RTF) Plasmid tiÕp hîp
kh«ng cã kh¶ n¨ng t¹o cÇu
tiÕp hîp nh−ng mang gen Plasmid tiÕp hîp R Plasmid mang gen kh¸ng chÊt
kh¸ng streptomycin (strr) víi kh¸ng sinh tetracyclin
mét plasmid cã kh¶ n¨ng tiÕp
hîp t¹o nªn mét yÕu tè cã kh¶
n¨ng tiÕp hîp mang gen kh¸ng
chÊt kh¸ng sinh (yÕu tè truyÒn
tÝnh kh¸ng – RTF).

 Sù t¸i tæ hîp th«ng qua sù ®iÒu
tiÕt cña yÕu tè IS1 gi÷a plasmid
tiÕp hîp R kh¸ng streptomycin
vµ mét plasmid mang gen
kh¸ng tetracyclin (tetr) t¹o nªn
mét plasmid R tÝch hîp míi
mang c¶ hai gen kh¸ng c¸c
chÊt kh¸ng sinh lµ streptomycin
vµ tetracyclin

H×nh 6.23. Sù tiÕn hãa cña c¸c RTF RTF
plasmid tiÕp hîp mang c¸c gen Plasmid tiÕp hîp R mang gen kh¸ng
kh¸ng kh¸ng sinh. Plasmid tiÕp hîp R mang
gen kh¸ng streptomycin streptomycin vµ tetracyclin

211

§inh §oµn Long

Shigella vµ Salmonella. HiÖn nay, mét sè bÖnh do vi khuÈn g©y nªn, bao gåm kiÕt lþ, lao
vµ lËu, trë nªn khã ®iÒu trÞ do hiÖn t−îng kh¸ng kh¸ng sinh cña vi khuÈn. Trong mét sè
tr−êng hîp, c¸c vi khuÈn g©y bÖnh cã thÓ cïng lóc kh¸ng l¹i nhiÒu chÊt kh¸ng sinh kh¸c
nhau vµ trë thµnh c¸c t¸c nh©n g©y bÖnh cùc kú nguy hiÓm. H×nh 6.23 minh häa c¬ chÕ
truyÒn tÝnh kh¸ng kh¸ng sinh phæ biÕn ë vi khuÈn qua c¸c TE n»m trong plasmid.

Sù ph¸t triÓn vµ lan trµn kh¶ n¨ng kh¸ng nhiÒu chÊt kh¸ng sinh trong c¸c quÇn thÓ
vi khuÈn cµng ®−îc thóc ®Èy do sù cã mÆt cña plasmid tiÕp hîp R th−êng mang c¸c gen
kh¸ng kh¸ng sinh. C¸c plasmid lo¹i nµy cã hai thµnh phÇn. Mét thµnh phÇn gäi lµ yÕu tè
truyÒn tÝnh kh¸ng RTF (resistance transfer factor) chøa c¸c gen cÇn thiÕt cho qu¸ tr×nh
tiÕp hîp gi÷a c¸c tÕ bµo vi khuÈn. Thµnh phÇn thø hai lµ yÕu tè x¸c ®Þnh tÝnh kh¸ng R
chøa c¸c gen kh¸ng kh¸ng sinh. Trong quÇn thÓ vi khuÈn, sù ph¸t t¸n c¸c plasmid R diÔn
ra víi tèc ®é nhanh, thËm chÝ chóng ®−îc truyÒn tõ loµi nµy sang loµi kh¸c, nh− gi÷a vi
khuÈn coccus vµ vi khuÈn bacillus. V× vËy, nÕu nh− tÝnh kh¸ng kh¸ng sinh ®· xuÊt hiÖn ë
mét vi khuÈn nµo ®ã, th× nã cã thÓ lan trµn ra toµn giíi vi khuÈn.

6.8.4. C¸c yÕu tè di truyÒn vËn ®éng ë ThÓ giao tö ♀ ThÓ giao tö ♂
eukaryote C CI Ds

RÊt nhiÒu lo¹i TE còng ®· ®−îc t×m C  C¸c nhiÔm s¾c thÓ cña
thÊy ë sinh vËt nh©n thËt. Nh÷ng yÕu tè bè (h¹t phÊn) vµ mÑ
nµy kh¸c nhau vÒ kÝch th−íc, cÊu tróc vµ Thô phÊn
®Æc tÝnh vËn ®éng. Mét sè lo¹i phæ biÕn C (nh©n sinh d−ìng 2n
kh¾p hÖ gen, mét sè chØ hiÕm gÆp. Trong C
phÇn nµy, chóng ta sÏ t×m hiÓu mét sè CI Ds cña no·n) kÕt hîp trong
lo¹i TE kiÓu c¾t - d¸n. C¸c yÕu tè TE nµy
cã tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu VÞ trÝ nhiÔm qu¸ tr×nh thô phÊn h×nh
vµ mçi lÇn xen vµo mét ph©n tö ADN, s¾c thÓ bÞ ®øt
chóng t¹o ra c¸c tr×nh tù nh©n ®«i t¹i vÞ thµnh nªn tÕ bµo néi
trÝ ®Ých. C¸c TE kiÓu c¾t-d¸n th−êng m·
hãa cho enzym transposase xóc t¸c sù nhò tam béi.
vËn ®éng cña chóng trong hÖ gen.
 Sù “®øt g·y” nhiÔm s¾c
6.8.4.1. C¸c yÕu tè Ac vµ Ds ë c©y ng« thÓ x¶y ra ë vÞ trÝ cña

C¸c yÕu tè Ac vµ Ds ®−îc ph¸t hiÖn yÕu tè (tr×nh tù) Ds.
®Çu tiªn n¨m 1948 bëi Barbara
McClintock. Qua ph©n tÝch di truyÒn, C
McClintock chøng minh ®−îc ho¹t ®éng
cña c¸c yÕu tè nµy lµ nguyªn nh©n g©y C
nªn c¸c tÝnh tr¹ng h¹t “säc” vµ “®èm” ë
ng«. Nh−ng ph¶i nhiÒu n¨m sau ®ã, c¸c CI Ds
nghiªn cøu cña Nina Federoff, Joachim
Messing, Peter Starlinger, Heinz §o¹n nhiÔm Nguyªn  §o¹n nhiÔm s¾c thÓ
Saedler, Susan Wessler vµ céng sù míi s¾c thÓ kh«ng ph©n mang gen øc chÕ h×nh
lµm s¸ng tá cÊu tróc vµ c¬ chÕ ho¹t ®éng t©m bÞ mÊt
ë møc ph©n tö cña chóng. thµnh s¾c tè bÞ mÊt, nªn

McClintock ®· ph¸t hiÖn ra c¸c yÕu h×nh thµnh dßng tÕ bµo
tè Ac vµ Ds nhê nghiªn cøu sù “®øt ®o¹n”
NST. Bµ ®· dïng c¸c dÊu chuÈn di chøa s¾c tè (cã mµu).
truyÒn liªn quan ®Õn mµu s¾c h¹t ng« ®Ó
ph¸t hiÖn hiÖn t−îng ®øt ®o¹n nµy. Khi Dßng c¸c tÕ bµo cã mµu
mét dÊu chuÈn nµo ®ã mÊt ®i, (kiÓu gen –CC)

H×nh 6.24. Sù “®øt g y” nhiÔm s¾c thÓ g©y ra do sù
ho¹t ®éng cña gen nh¶y Ds ë ng«. Alen C trªn vai ng¾n
cña NST sè 9 t¹o ra mµu s¾c b×nh th−êng ë protein h¹t
(al¬ron), nh−ng alen CI øc chÕ qu¸ tr×nh h×nh thµnh c¸c

s¾c tè nh− vËy, nªn chóng trë nªn kh«ng mµu.

212

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

McClintock cho r»ng ®o¹n NST mang gen t−¬ng øng bÞ mÊt, vµ cã hiÖn t−îng “®øt ®o¹n”
x¶y ra. DÊu chuÈn bÞ mÊt mµ McClintock quan s¸t ®−îc khi ph©n tÝch lµ mµu cña líp vá
h¹t thuéc phÇn néi nhò tam béi cña ng«.

Trong mét d·y c¸c thÝ nghiÖm, dÊu chuÈn di truyÒn mµ McClintock ®· theo dâi lµ
mét alen thuéc locus C n»m trªn vai ng¾n cña NST sè 9. Do alen CI nµy lµ mét alen tréi
øc chÕ sù t¹o s¾c tè h¹t ng«, nªn mäi h¹t ng« mang alen nµy ®Òu kh«ng cã mµu.
McClintock ®· tiÕn hµnh thô phÊn hoa c¸i c©y ng« cã kiÓu gen CC víi h¹t phÊn cña c©y
cã kiÓu gen CI CI, ®Ó t¹o ra h¹t ng« cã phÇn néi nhò mang kiÓu gen CICC (tÕ bµo néi nhò
nhËn hai alen tõ mÑ, vµ mét alen tõ bè). MÆc dï, McClintock ph¸t hiÖn thÊy phÇn lín c¸c
h¹t ng« kh«ng mµu nh− mong ®îi, nh−ng mét sè h¹t cã c¸c vïng mang s¾c tè tÝm - n©u.
McClinctock cho r»ng hiÖn t−îng kh¶m mµu nh− vËy lµ do alen CI bÞ mÊt ®i trong qu¸
tr×nh ph¸t triÓn néi nhò, dÉn ®Õn sù h×nh thµnh mét sè m« cã kh¶ n¨ng tæng hîp s¾c tè.
KiÓu gen cña kiÓu m« nµy sÏ lµ -CC (trong ®ã dÊu “-”biÓu diÔn cho alen CI bÞ mÊt).

C¬ chÕ mµ McClintock ®· dïng ®Ó gi¶i thÝch cho hiÖn t−îng mÊt ®i cña alen CI ®−îc
m« t¶ trªn h×nh 6.24. Mét “vÕt ®øt” x¶y ra ë vÞ trÝ mòi tªn lµm rêi mét ®o¹n NST khái
t©m ®éng cña nã vµ h×nh thµnh nªn ®o¹n NST kh«ng t©m. §o¹n NST nµy cã xu h−íng
mÊt ®i trong qu¸ tr×nh ph©n bµo. V× vËy, tÊt c¶ c¸c tÕ bµo con sinh ra tõ tÕ bµo nµy sÏ
mÊt ®i mét phÇn NST ban ®Çu. Do ®o¹n bÞ mÊt mang alen CI nªn kh«ng mét tÕ bµo nµo
trong dßng tÕ bµo con nµy bÞ øc chÕ qu¸ tr×nh h×nh thµnh s¾c tè, v× vËy t¹o nªn hiÖn
t−îng h¹t cã mµu kh¶m nh− quan s¸t thÊy trong tù nhiªn.

McClintock ®ång thêi ph¸t hiÖn ra r»ng sù ®øt ®o¹n g©y nªn hiÖn t−îng h¹t cã mµu
kh¶m xuÊt hiÖn ë mét vÞ trÝ nhÊt ®Þnh trªn NST sè 9. Bµ ®Æt tªn cho yÕu tè t¹o ra hiÖn
t−îng ®øt ®o¹n nµy lµ Ds (viÕt t¾t cña tõ Dissociation). Tuy vËy, b¶n th©n yÕu tè Ds
kh«ng thÓ g©y nªn hiÖn t−îng “®øt ®o¹n” NST, mµ nã cÇn ®−îc ho¹t hãa bëi mét yÕu tè
kh¸c gäi lµ Ac (viÕt t¾t cña tõ Activator). YÕu tè Ac cã mÆt trong mét sè gièng ng«. Khi
tiÕn hµnh lai gi÷a c¸c gièng nµy víi nhau, yÕu tè Ac kÕt hîp víi Ds ®Ó t¹o ®iÒu kiÖn cho
sù “®øt ®o¹n” x¶y ra.

HÖ thèng hai yÕu tè Ac/Ds gióp gi¶i thÝch cho hiÖn t−îng “di truyÒn kh«ng æn ®Þnh”
mµ McClintock quan s¸t thÊy ë NST sè 9. C¸c thÝ nghiÖm bæ sung sau ®ã ®· chøng minh
®©y chØ lµ mét trong rÊt nhiÒu hiÖn t−îng “di truyÒn kh«ng æn ®Þnh” cã mÆt trong hÖ gen
ë c©y ng«. Ngoµi ra, sau ®ã McClintock ph¸t hiÖn thÊy hiÖn t−îng “®øt ®o¹n” cßn x¶y ra ë
c¸c NST kh¸c, ngoµi NST sè 9. Do nh÷ng “®øt ®o¹n” nµy còng phô thuéc vµo yÕu tè Ac,
nªn bµ ®· kÕt luËn r»ng cã sù tån t¹i cña yÕu tè Ds ë c¸c vÞ trÝ kh¸c nhau trong hÖ gen.
§Ó cã thÓ gi¶i thÝch cho tÊt c¶ c¸c hiÖn t−îng nµy, McClintock cho r»ng Ds cã mÆt ë nhiÒu
vÞ trÝ kh¸c nhau trong hÖ gen vµ cã thÓ vËn ®éng tõ vÞ trÝ nµy s¸ng vÞ trÝ kh¸c. C¸c
nghiªn cøu sau nµy ®· chøng minh gi¶ thiÕt cña McClintock lµ ®óng. C¸c yÕu tè Ac vµ
Ds cïng thuéc mét hä c¸c yÕu tè di truyÒn vËn ®éng. C¸c yÕu tè nµy vÒ mÆt cÊu tróc cã
liªn quan víi nhau vµ cã thÓ xen vµo nhiÒu vÞ trÝ kh¸c nhau trªn NST. Trong hÖ gen ng«,
cã nhiÒu b¶n sao kh¸c nhau cña c¸c yÕu tè Ac vµ Ds. Qua ph©n tÝch di truyÒn,
McClintock chøng minh nh÷ng yÕu tè nµy cã thÓ vËn ®éng trong hÖ gen. Bµ còng ph¸t
hiÖn ra r»ng: khi mét yÕu tè nµy g¾n vµo trong hoÆc gÇn mét gen nµo ®ã, th× chøc n¨ng
cña gen ®ã thay ®æi, thËm chÝ ®«i khi mÊt chøc n¨ng. Nãi c¸ch kh¸c, c¸c yÕu tè Ac vµ Ds
cã kh¶ n¨ng g©y ra c¸c ®ét biÕn khi xen vµo mét gen nµo ®ã. §Ó nhÊn m¹nh vai trß cña
c¸c yÕu tè Ac vµ Ds trong ®iÒu hßa sù biÓu hiÖn cña gen, McClintock gäi c¸c yÕu tè Ac vµ
Ds lµ c¸c yÕu tè ®iÒu hßa.

C¸c nghiªn cøu gi¶i tr×nh tù ADN sau nµy cho thÊy tr×nh tù yÕu tè Ac gåm 4563 bp
cã hai ®Çu tr×nh tù lÆp l¹i ng−îc chiÒu gåm 11 bp (h×nh 6.25a). C¸c tr×nh tù lÆp l¹i ë hai
®Çu lµ cÇn thiÕt ®Ó qu¸ tr×nh vËn ®éng cña yÕu tè Ac cã thÓ diÔn ra. Mçi mét yÕu tè Ac cã
hai vïng biªn ë hai ®Çu lµ c¸c tr×nh tù lÆp l¹i cïng chiÒu gåm 8 bp. Bëi v× c¸c tr×nh tù lÆp

213

§inh §oµn Long

l¹i nµy ®−îc t¹o ra khi yÕu tè Ac xen vµo ph©n a) YÕu tè Ac - cã tr×nh tù ®Çy ®ñ
4563 bp
tö ADN, nªn b¶n th©n chóng lµ s¶n phÈm
nh©n ®«i tr×nh tù t¹i vÞ trÝ ®Ých, chø kh«ng
ph¶i tr×nh tù lÆp l¹i cã trong hÖ gen.

Kh«ng gièng Ac, c¸c yÕu tè Ds cã tÝnh ®a §o¹n tr×nh tù hai ®Çu lÆp l¹i

d¹ng vÒ mÆt cÊu tróc. Chóng còng mang c¸c ng−îc chiÒu 11 bp

tr×nh tù lÆp l¹i ng−îc chiÒu ë hai ®Çu gièng b) YÕu tè Ds - mÊt mét phÇn tr×nh tù bªn trong

hÖt nh− c¸c yÕu tè Ac, chøng tá hai yÕu tè di

truyÒn vËn ®éng nµy thuéc vÒ cïng mét hä,

nh−ng tr×nh tù bªn trong cña chóng th× kh¸c

nhau. Mét sè yÕu tè Ds d−êng nh− cã nguån

gèc tõ c¸c yÕu tè Ac, ®−îc h×nh thµnh do sù c) YÕu tè Ds dÞ biÖt - cã tr×nh tù bªn trong kh«ng
liªn quan ®Õn yÕu tè Ac
mÊt ®i mét phÇn tr×nh tù bªn trong (h×nh
6.25b). Sù mÊt ®i mét phÇn nh÷ng tr×nh tù

nµy cã thÓ lµ do sù sao chÐp ADN kh«ng toµn

vÑn hoÆc do chÝnh qu¸ tr×nh vËn ®éng trong §o¹n tr×nh tù kh«ng t−¬ng ®ång
hÖ gen cña chóng g©y ra. Tuy vËy, mét sè lo¹i
d) YÕu tè Ds kÐp - Mét yÕu tè Ds nµy lång vµo
yÕu tè Ds kh¸c kh«ng thÊy cã tr×nh tù Ac bªn gi÷a mét yÕu tè Ds kh¸c
trong chuçi (h×nh 6.25c). Nh÷ng thµnh viªn

kh¸c th−êng nh− vËy cña hä Ac/Ds ®−îc gäi §o¹n Ds cµi

lµ c¸c yÕu tè Ds dÞ biÖt. Mét nhãm yÕu tè Ds
thø ba cã ®Æc ®iÓm ®Æc tr−ng lµ gåm c¸c tr×nh H×nh 6.25. S¬ ®å cÊu tróc hä c¸c yÕu tè di
tù cña c¸c yÕu tè Ds kh¸c nhau n»m gèi lªn truyÒn vËn ®éng Ac/Ds ë ng«.

nhau (h×nh 6.25d), trong ®ã mét yÕu tè Ds n»m xen vµo gi÷a mét yÕu tè Ds kh¸c víi

chiÒu tr×nh tù ®¶o ng−îc. Nh÷ng yÕu tè Ds lo¹i nµy cßn ®−îc gäi lµ nh÷ng yÕu tè Ds kÐp,

lµ nh÷ng yÕu tè lµm “®øt ®o¹n” NST mµ McClintock ®· quan s¸t thÊy trong c¸c thÝ

nghiÖm cña bµ.

C¸c ho¹t ®éng cña c¸c yÕu tè Ac/Ds (gåm c¸c ho¹t ®éng ®øt khái NST vµ vËn ®éng
trong hÖ gen; còng nh− c¸c hËu qu¶ di truyÒn cã liªn quan gåm sù ®øt ®o¹n NST vµ ®ét
biÕn) ®−îc xóc t¸c bëi transposase do tr×nh tù gen trong yÕu tè Ac m· hãa. Protein
transposase sau khi ®−îc h×nh thµnh cã sù t−¬ng t¸c râ rÖt víi c¸c tr×nh tù ë hai ®Çu
hoÆc gÇn hai ®Çu cña c¸c yÕu tè Ac vµ Ds, thóc ®Èy qu¸ tr×nh vËn ®éng cña c¸c yÕu tè
nµy. Sù ®ét biÕn hoÆc mÊt nucleotide trong tr×nh tù m· hãa transposase lµm mÊt chøc
n¨ng xóc t¸c cña enzym nµy. NÕu c¸c yÕu tè Ds còng cã nh÷ng th−¬ng tæn t−¬ng tù th×
chóng kh«ng thÓ tù ho¹t hãa. Nh−ng, nÕu trong hÖ gen tån t¹i tr×nh tù m· hãa
transposase cña yÕu tè Ac, th× chóng l¹i ®−îc ho¹t hãa. Enzym transposase cã thÓ x©m
nhËp vµo nh©n tÕ bµo, g¾n vµo yÕu tè Ds vµ ho¹t hãa sù vËn ®éng cña yÕu tè nµy. V× vËy
transposase do yÕu tè Ac m· hãa ®−îc gäi lµ protein t¸c ®éng xa (trans-acting protein).

§Õn nay, c¸c TE cã liªn quan ®Õn Ac/Ds ®· ®−îc t×m thÊy ë nhiÒu loµi kh¸c, kÓ c¶ ë
®éng vËt. Trong ®ã, TE ë ®éng vËt nh− vËy ®−îc nghiªn cøu kü nhÊt lµ hä hobo ë ruåi
Drosophila.

6.8.4.2. YÕu tè P vµ hiÖn t−îng con lai v« sinh ë c¸c loµi ruåi Drosophila

Mét sè nghiªn cøu tËp trung ®· ®−îc tiÕn hµnh trªn c¸c yÕu tè di truyÒn vËn ®éng
P t×m thÊy ë c¸c loµi ruåi Drosophila. N¨m 1977, Margaret, James Kidwell vµ John Sved
ph¸t hiÖn thÊy viÖc lai gi÷a c¸c dßng ruåi giÊm t¹o ra mét nhãm c¸c con lai cã c¸c tÝnh
tr¹ng dÞ biÖt, nh− tÇn sè ®ét biÕn cao, cã hiÖn t−îng ®øt ®o¹n NST, vµ ®Æc tÝnh v« sinh.

214

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Kidwell vµ céng sù sau ®ã nhËn thÊy cã thÓ ph©n Con c¸i (♀, mÑ)

lo¹i c¸c dßng nµy thµnh hai nhãm dùa trªn kh¶

n¨ng t¹o ra con lai v« sinh cña chóng. Hai nhãm MP
nµy ®−îc ký hiÖu lµ M vµ P. ChØ cã phÐp lai gi÷a

con ®ùc dßng P víi con c¸i dßng M míi t¹o ra c¸c Con M Sinh s¶n Sinh s¶n
con lai v« sinh. ViÖc tiÕn hµnh lai gi÷a c¸c c¸ thÓ P b×nh b×nh th−êng
trong cïng nhãm (hoÆc M hoÆc P) ®Òu t¹o ra con ®ùc
lai h÷u thô b×nh th−êng. KiÓu h×nh con lai tõ c¸c (♂,bè) th−êng Sinh s¶n
phÐp lai gi÷a hai nhãm M vµ P ®−îc nªu trªn b×nh th−êng
h×nh 6.26. V« sinh

Kidwell vµ céng sù cho r»ng, NST cña

dßng P ®· mang c¸c yÕu tè di truyÒn ®−îc ho¹t

hãa khi tinh trïng cña nã x©m nhËp vµo trøng H×nh 6.26. KiÓu h×nh cña c¸c con lai tõ phÐp
cña dßng M; sau ®ã, nh÷ng yÕu tè ®−îc ho¹t hãa lai gi÷a c¸c dßng P vµ M ë ruåi Drosophila.

g©y nªn ®ét biÕn vµ ®øt ®o¹n NST. TiÕp nèi

nghiªn cøu cña Kidwell, n¨m 1979 Engels (mét a) YÕu tè P cã tr×nh tù ®Çy ®ñ

nghiªn cøu sinh t¹i §¹i häc Winconsin) ®· ph¸t 2907 bp
hiÖn thÊy mét ®ét biÕn ®Æc biÖt cã kh¶ n¨ng ®ét

biÕn phôc håi cao. HiÖn t−îng thiÕu æn ®Þnh di Gen m· hãa transposase

truyÒn nµy gîi ý Engels vÒ nh÷ng ®ét biÕn g©y ra

bëi yÕu tè IS ë E. coli, ®ång thêi cho thÊy nh÷ng

®ét biÕn nµy nhiÒu kh¶ n¨ng liªn quan ®Õn mét §o¹n tr×nh tù hai ®Çu lÆp l¹i
yÕu tè di truyÒn vËn ®éng nµo ®ã. Nh÷ng nghiªn ng−îc chiÒu 31 bp
cøu sau nµy (vµo nh÷ng n¨m 1980) ®· chøng
minh ®óng lµ cã sù tån t¹i cña nhiÒu b¶n sao c¸c b) C¸c yÕu tè P mÊt mét phÇn tr×nh tù

yÕu tè TE trong hÖ gen c¸c dßng P; nh−ng, kh«ng

cã ë c¸c dßng M. V× vËy, c¸c TE nµy ®−îc gäi lµ

c¸c yÕu tè P.

ViÖc ph©n tÝch tr×nh tù ADN cho thÊy c¸c H×nh 6.27. CÊu tróc vÒ h−íng vµ kÝch th−íc
yÕu tè P rÊt kh¸c nhau vÒ kÝch th−íc. C¸c yÕu tè tr×nh tù ADN cña c¸c yÕu tè P ë ruåi giÊm.
P cã kÝch th−íc lín nhÊt dµi 2907 bp, gåm c¸c tr×nh tù lÆp l¹i ë hai ®Çu dµi 31 bp. C¸c
yÕu tè P hoµn chØnh mang mét gen m· hãa cho transposase. Khi transposase cña yÕu tè P
g¾n vµo ®o¹n ®u«i cña mét yÕu tè P hoµn chØnh (cã tr×nh tù ®Çy ®ñ), nã cã kh¶ n¨ng “vËn
chuyÓn” yÕu tè P nµy ®Õn mét vÞ trÝ kh¸c trong hÖ gen. C¸c yÕu tè P kh«ng hoµn chØnh
(h×nh 6.27) thiÕu kh¶ n¨ng tæng hîp transposase do mÊt ®i mét sè tr×nh tù bªn trong
vïng m· hãa enzym nµy, nh−ng chóng vÉn cã c¸c vïng tËn cïng vµ gÇn tËn cïng lµ vÞ trÝ
g¾n cña transposase. KÕt qu¶ lµ, nh÷ng yÕu tè P kh«ng hoµn chØnh nµy vÉn cã kh¶ n¨ng
vËn ®éng trong hÖ gen, nÕu nh− ë ®©u ®ã trong hÖ gen cã tr×nh tù m· hãa cho
transposase.

C¸c nghiªn cøu ë c¸c quÇn thÓ ruåi Drosophila kh¸c trong tù nhiªn sau nµy ®· chøng
minh cã nhiÒu yÕu tè P kh¸c nhau tån t¹i trong hÖ gen víi sè l−îng biÕn ®éng. Mét sè loµi
ruåi cã sè b¶n sao cña yÕu tè P lªn ®Õn 50, trong khi ®ã mét sè loµi kh¸c chØ cã mét vµi b¶n
sao. Tuy vËy, mét ®Æc ®iÓm ®¸ng ng¹c nhiªn lµ tÊt c¶ c¸c dßng thu ®−îc tr−íc n¨m 1950
kh«ng cã bÊt cø mét yÕu tè P nµo. Trªn c¬ së ®ã, Marganet Kidwell ®· ®−a ra gi¶ thiÕt lµ c¸c
yÕu tè P ®· “x©m nhËp” vµo c¸c loµi ruåi Drosophila chØ trong thêi gian gÇn ®©y. §¸ng chó ý
h¬n n÷a lµ hÖ gen cña c¸c loµi ruåi cã quan hÖ gÇn gòi nhÊt víi ruåi dÊm l¹i kh«ng cã yÕu tè
P, trong khi nh÷ng loµi cã kho¶ng c¸ch xa h¬n l¹i cã yÕu tè nµy. §Õn nay chóng ta ch−a biÕt
râ b»ng c¬ chÕ nµo yÕu tè P ®· x©m nhËp vµo c¸c loµi Drosophila, nh−ng cã mét gi¶ thiÕt cho

215

§inh §oµn Long

r»ng nh÷ng yÕu tè nµy ®−îc virut vËn chuyÓn vµo hÖ gen cña c¸c loµi ruåi Drosophila. Qu¸
tr×nh nµy cã thÓ gièng víi viÖc phag¬ “t¶i n¹p” c¸c yÕu tè IS vµo hÖ gen E. coli.

C¸c quÇn thÓ Drosophila chøa yÕu tè P ®· cã sù ph¸t triÓn c¬ chÕ ®iÒu hßa vËn ®éng

cña nh÷ng yÕu tè nµy. ë mét sè dßng, sù ®iÒu hßa nµy phô thuéc vµo kiÓu tÕ bµo
(cytotype), tøc lµ ®Æc ®iÓm tÕ bµo ®−îc truyÒn tõ tÕ bµo mÑ sang tÕ bµo con th«ng qua tÕ bµo
chÊt cña trøng. KiÓu tÕ bµo häc P øc chÕ sù vËn ®éng cña yÕu tè P, cßn kiÓu tÕ bµo M t¹o
®iÒu kiÖn cho yÕu tè P vËn ®éng. KiÓu tÕ bµo P lµ ®Æc tÝnh cña tÕ bµo mang gen m· hãa yÕu
tè P trªn NST, trong khi ®ã kiÓu tÕ bµo M lµ ®Æc tÝnh cña tÕ bµo kh«ng mang gen m· hãa
yÕu tè P. Khi yÕu tè P ®−îc kÕt hîp víi kiÓu tÕ bµo M th«ng qua mét phÐp lai phï hîp th×
sù vËn ®éng cña yÕu tè P ®−îc thóc ®Èy. MÆc dï c¬ chÕ ®iÒu hßa sù vËn ®éng cña yÕu tè P bëi
kiÓu tÕ bµo ®· ®−îc mét sè nhãm quan t©m nghiªn cøu, nh−ng ®Õn nay vÉn ch−a s¸ng tá.

Ph−¬ng thøc di truyÒn theo dßng mÑ cña kiÓu tÕ bµo ®−îc nhËn thÊy trong c¸c phÐp
lai thuËn nghÞch gi÷a c¸c dßng P vµ M (h×nh 6.28). Cã hai phÐp lai: 1) [KiÓu tÕ bµo P , ♀] x
[KiÓu tÕ bµo M, ♂], vµ 2) [KiÓu tÕ bµo P , ♂] x [KiÓu tÕ bµo M, ♀]. ThÕ hÖ con sinh ra tõ hai

phÐp lai ®Òu mang gen m· hãa yÕu tè P vµ gièng nhau vÒ hÖ gen nh©n. Nh−ng, chØ c¸c con
lai tõ phÐp lai 2 míi x¶y ra hiÖn t−îng “gen nh¶y”. §iÒu ®ã cho thÊy, ®Æc tÝnh cho phÐp yÕu
tè P vËn ®éng hay kh«ng lµ ®Æc tÝnh ®−îc di truyÒn theo dßng mÑ (do tÕ bµo chÊt quy ®Þnh).
Trong phÐp lai 1, tÕ bµo mÑ truyÒn kiÓu tÕ bµo P cho con vµ sù vËn ®éng cña yÕu tè P bÞ øc
chÕ. Trong phÐp lai 2, tÕ bµo mÑ truyÒn kiÓu tÕ bµo M cho con, cho phÐp yÕu tè P vËn ®éng.

Cã mét ®iÒu ng¹c nhiªn lµ kÓ c¶ khi hÖ gen bÞ biÕn ®æi ®¸ng kÓ do sù vËn ®éng ë møc

®é lín cña c¸c yÕu tè P, th× phÐp lai [KiÓu tÕ bµo P , ♂] x [KiÓu tÕ bµo M, ♀] vÉn cã thÓ t¹o

ra c¸c c¸ thÓ con sèng b×nh C¸c phÐp lai thuËn, nghÞch gi÷a c¸c dßng P vµ M
th−êng. C¸c nghiªn cøu cña
Donald Rio, Frank Laski vµ PhÐp lai 1 PhÐp lai 2

Gerald Rubin cho thÊy C¸i §ùc C¸i §ùc

nh÷ng c¸c c¸ thÓ con nµy

kháe m¹nh bëi c¸c yÕu tè P Trøng Tinh trïng Trøng Tinh trïng
chØ vËn ®éng trong c¸c dßng

tÕ bµo sinh dôc (qu¸ tr×nh

ph¸t sinh giao tö). Cßn ë c¸c

tÕ bµo soma, sù vËn ®éng C¸c giao tö mang

cña yÕu tè P vèn cã kh¶ nhiÔm s¾c thÓ cã hoÆc
n¨ng g©y ra nh÷ng rèi lo¹n kh«ng cã c¸c yÕu tè P

lín chØ hiÕm x¶y ra, do

transposase P kh«ng ®−îc

tæng hîp trong nh÷ng tÕ bµo YÕu tè P bÞ øc chÕ YÕu tè P ®−îc ho¹t hãa
nµy. Sù tæng hîp protein trong kiÓu tÕ bµo P trong kiÓu tÕ bµo M
nµy bÞ øc chÕ ë b−íc hoµn

thiÖn mARN. Cô thÓ, mét

®o¹n intron ®−îc gi÷ l¹i HiÖn t−îng v« sinh

trong ph©n tö mARN m· xuÊt hiÖn ë con lai
hãa transposase, t¹o nªn sinh ra tõ phÐp lai 2
mét bé ba m· kÕt thóc sím.
HËu qu¶ lµ tÕ bµo soma Con lai sinh s¶n Con lai v« sinh
kh«ng tæng hîp ®−îc b×nh th−êng
transposase, mµ thay vµo
®ã lµ mét ph©n tö protein H×nh 6.28. HiÖn t−îng con lai v« sinh do ho¹t ®éng cña yÕu tè P ë
Drosophila. KiÓu tÕ bµo ®−îc di truyÒn theo dßng mÑ. Theo ®ã, kiÓu tÕ
bµo P øc chÕ ho¹t ®éng cña c¸c yÕu tè P, trong khi kiÓu tÕ bµo M ho¹t

hãa chóng. HiÖn t−îng v« sinh chØ xuÊt hiÖn ë con lai cã kiÓu tÕ bµo M.

216

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

ng¾n kh«ng cã ho¹t tÝnh xóc t¸c yÕu tè P vËn ®éng. KÕt qu¶ lµ, yÕu tè P kh«ng vËn ®éng vµ
c¸c tÕ bµo soma tr¸nh ®−îc nh÷ng sai háng di truyÒn do sù vËn ®éng cña yÕu tè P.

6.8.4.3. YÕu tè di truyÒn vËn ®éng cã tÝnh cæ x−a vµ phæ biÕn mariner

Hai loµi ruåi cã quan hÖ gÇn gòi nhÊt víi ruåi giÊm (Drosophila melanogaster) lµ
D. simulans vµ D. mauritiana, cã mét TE kÝch th−íc nhá lµ mariner (dµi 1286 bp víi tr×nh
tù lÆp l¹i ng−îc chiÒu ë hai ®Çu gåm 28 bp). MÆc dï yÕu tè mariner kh«ng thÊy cã ë
D. melanogaster, nh−ng nh÷ng yÕu tè t−¬ng tù l¹i thÊy cã ë nhiÒu loµi, nh− giun trßn, nÊm,
thËm trÝ c¶ ë ng−êi. Hugh Robertson còng ph¸t hiÖn thÊy nhiÒu TE kiÓu mariner cã mÆt ë
c¸c bé c«n trïng kh¸c nhau. Mét ®iÓm ®¸ng l−u ý lµ ®«i khi c¸c yÕu tè mariner ë c¸c loµi
c¸ch xa nhau l¹i gièng nhau h¬n gi÷a c¸c loµi cã quan hÖ gÇn gòi. VÝ dô nh− yÕu tè mariner
ë loµi ruåi qu¶ §Þa trung h¶i rÊt gièng víi ë loµi ong mËt, dï hai loµi nµy ®· t¸ch ly tiÕn hãa
khái nhau tõ hµng tr¨m triÖu n¨m tr−íc. ChØ cã mét gi¶ thiÕt hîp lý lµ c¸c yÕu tè mariner
®· x©m nhËp vµo hai loµi c«n trïng nµy trong thêi gian gÇn ®©y h¬n tõ mét vÐct¬ nµo ®ã, cã
thÓ tõ mét loµi c«n trïng kh¸c hoÆc qua sù l©y nhiÔm cña c¸c virut c«n trïng cã phæ vËt
chñ réng. Trong qu¸ tr×nh l©y nhiÔm, hÖ gen virut cã thÓ tiÕp nhËn vµ truyÒn yÕu tè TE.

§Õn nay, b»ng kü thuËt gi¶i tr×nh tù ADN ng−êi ta ®· x¸c ®Þnh ®−îc c¸c yÕu tè
mariner th−êng cã kÝch th−íc kh¸ lín (kho¶ng 1,6 - 1,7 kb) víi hai tr×nh tù lÆp l¹i ng−îc
chiÒu ë hai ®Çu. Tr×nh tù lÆp l¹i ë hai ®Çu ®iÓn h×nh cña chóng cã chiÒu dµi tõ 54 ®Õn 234
bp. YÕu tè mariner ®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Tc1, t×m thÊy ë giun trßn
(Caenorhabditis elegans). C¸c TE gièng Tc1 cßn thÊy cã ë ®éng vËt cã x−¬ng sèng. Nh− vËy
cã thÓ nãi c¸c TE lo¹i Tc1 vµ mariner thuéc mét hä TE cã tÝnh cæ x−a vµ phæ biÕn cao.

6.8.5. C¸c yÕu tè di truyÒn vËn ®éng kiÓu phiªn m· ng−îc

Ngoµi c¸c yÕu tè TE nh− Ac, P vµ mariner, hÖ gen sinh vËt nh©n thËt cßn cã c¸c yÕu
tè TE mµ sù vËn ®éng cña chóng trong hÖ gen phô thuéc vµo sù phiªn m· ng−îc ARN →
ADN. V× vËy, c¸c yÕu tè TE nµy ®−îc gäi lµ c¸c TE kiÓu phiªn m· ng−îc. Cã hai nhãm
retrotransposon chñ yÕu: c¸c TE kiÓu retrovirut vµ retrosposon. C¸c TE thuéc nhãm thø
nhÊt gièng víi NST cña mét nhãm retrovirut, cßn c¸c TE thuéc nhãm thø hai cã cÊu tróc
gièng víi ph©n tö mARN cã ®Çu 3’-poly(A).

6.8.5.1. YÕu tè TE kiÓu retrovirut

C¸c yÕu tè di truyÒn vËn ®éng (TE) kiÓu retrovirut ®−îc t×m thÊy ë nhiÒu sinh
vËt kh¸c nhau, gåm c¶ ®éng vËt, thùc vËt vµ nÊm men. MÆc dï, chóng cã kÝch th−íc vµ tr×nh
tù c¸c nucleotide kh¸c nhau, nh−ng tÊt c¶ nh÷ng TE nµy ®Òu cã ®Æc ®iÓm chung lµ: cã mét
vïng m· hãa trung t©m ®−îc giíi h¹n bëi hai vïng biªn gäi lµ c¸c tr×nh tù lÆp l¹i dµi ë
®Çu tËn cïng - LTR (long terminal repeats), cã tr×nh tù gièng nhau cïng chiÒu. C¸c LTR
®iÓn h×nh th−êng gåm vµi tr¨m bp. Víi mçi lo¹i LTR, nã l¹i ®−îc giíi h¹n bëi c¸c tr×nh tù ë
hai ®Çu lÆp l¹i ng−îc chiÒu (gièng nh− c¸c transposon kiÓu IS). Do cã cÊu t¹o ®Æc tr−ng víi
cÊu tróc LTR, nh÷ng TE kiÓu retrovirut ®−îc gäi lµ c¸c yÕu tè di truyÒn vËn ®éng LTR.

Vïng m· hãa trung t©m cña TE kiÓu retrovirut chøa mét sè Ýt gen, th−êng lµ hai gen.
Nh÷ng gen nµy gièng víi gen gag vµ pol t×m thÊy ë retrovirut (xem thªm ch−¬ng 3); trong
®ã, gen gag m· hãa cho protein vá virut, cßn gen pol m· hãa cho enzym reverse
transcriptase (cã thÓ c¶ integrase). C¸c retrovirut th−êng cã mét gen thø ba lµ env m· hãa
cho mét protein còng lµ thµnh phÇn bao ngoµi virut. §èi víi c¸c TE kiÓu retrovirut, c¸c s¶n
phÈm cña gen gag vµ pol gi÷ vai trß quan träng trong qu¸ tr×nh vËn ®éng cña chóng trong
hÖ gen.

217

§inh §oµn Long

Mét trong nh÷ng TE kiÓu retrovirut a) ~ 5900 bp δ
®−îc nghiªn cøu kü nhÊt ®Õn nay lµ Ty1 ë δ TyB = pol ~340
nÊm men S. cerevisae (h×nh 6.29a). YÕu tè ~340 TyA = gag bp
bp
nµy cã chiÒu dµi 5,9 kbp; cÊu tróc LTR cña LTR
chóng cã chiÒu dµi kho¶ng 340 bp. Mçi lÇn LTR
yÕu tè nµy xen vµo tr×nh tù ®Ých, nã t¹o ra
hai vïng biªn lËp l¹i cïng chiÒu gåm 5 bp. b)
PhÇn lín c¸c chñng nÊm men chøa kho¶ng

35 b¶n sao cña yÕu tè Ty1; ®«i khi, chóng

chøa c¸c cÊu tróc LTR n»m t¸ch khái c¸c

yÕu tè Ty1. C¸c cÊu tróc LTR riªng lÎ nh−

vËy (®«i khi cßn gäi lµ c¸c tr×nh tù delta - δ)

râ rµng ®−îc h×nh thµnh do qu¸ tr×nh t¸i tæ δ δ

hîp gi÷a c¸c LTR cña c¸c yÕu tè Ty1 hoµn
chØnh (h×nh 6.29b). Qu¸ tr×nh t¸i tæ hîp

lµm cho vïng m· hãa vµ mét phÇn cña cÊu

tróc LTR h×nh thµnh ph©n tö vßng khÐp δ δ ®¬n lÎ
kÝn. Khi ph©n tö ADN vßng nµy t¸ch khái

NST, phÇn cßn l¹i cña LTR sÏ hßa hîp víi c) Protein Reverse
cÊu tróc transcriptase
phÇn NST cßn l¹i, t¹o nªn cÊu tróc δ riªng
lÎ. PhÇn tö ADN vßng bÞ mÊt ®i sau khi tÕ
bµo ph©n chia.

C¸c yÕu tè Ty1 chØ cã hai gen, TyA vµ

TyB, lµ c¸c gen t−¬ng øng gièng víi c¸c gen Gen TyA Gen TyB
δδ
gag vµ pol ë retrovirut. C¸c nghiªn cøu hãa
sinh cho thÊy s¶n phÈm cña hai gen nµy  Ty1 ®−îc phiªn m·
còng cã thÓ gióp h×nh thµnh h¹t virut trong
tÕ bµo chÊt cña nÊm men. Sù vËn ®éng cña thµnh ARN.

yÕu tè Ty1 liªn quan ®Õn qu¸ tr×nh phiªn Ty1 ARN
m· ng−îc ARN (h×nh 6.29c). Sau khi ARN

®−îc tæng hîp tõ gen Ty1, enzym reverse

transcriptase do gen TyB m· hãa sÏ sö  ARN ®−îc phiªn m·
ng−îc thµnh cADN bëi
dông ph©n tö ARN lµm sîi khu«n ®Ó tæng
hîp nªn ph©n tö ADN sîi kÐp bæ trî t−¬ng enzym do TyB m· hãa.

øng (cã thÓ tån t¹i trong d¹ng mét h¹t Ty1 cADN
virut). Sau ®ã ph©n tö ADN sîi kÐp võa
tæng hîp ®−îc vËn chuyÓn vµo trong nh©n  Ty1 cADN ®−îc cµi vµo
vµ xen vµo mét vÞ trÝ nµo ®ã trong hÖ gen,
nhiÔm s¾c thÓ, t¹o nªn
mét b¶n sao míi cña Ty1.

t¹o nªn mét yÕu tè Ty1 míi.

C¸c TE kiÓu retrovirut còng ®−îc t×m H×nh 6.29. CÊu tróc di truyÒn vµ c¬ chÕ ho¹t ®éng
thÊy ë ruåi giÊm. Mét trong nh÷ng yÕu tè cña yÕu tè Ty1 ë nÊm men (xem m« t¶ trong tµi liÖu).

nh− vËy ®−îc ph¸t hiÖn ®Çu tiÒn lµ copia.

Së dÜ gäi tªn nh− vËy, bëi yÕu tè nµy cã kh¶ n¨ng t¹o ra mét sè lín b¶n sao (copy) cña

ph©n tö ARN. C¸c yÕu tè copia cã cÊu t¹o gièng víi c¸c yÕu tè Ty1 ë nÊm men. ë ruåi

giÊm, cßn cã mét TE kiÓu retrovirut kh¸c gäi lµ yÕu tè gypsy cã kÝch th−íc lín h¬n copia

do chóng chøa thªm gen gièng víi env ë retrovirut (gäi lµ gen gypsy-env). C¶ hai yÕu tè

copia vµ gypsy ®Òu cã kh¶ n¨ng h×nh thµnh h¹t virut trong c¸c tÕ bµo ruåi giÊm; tuy vËy,

chØ cã c¸c h¹t virut h×nh thµnh tõ ARN gypsy míi cã kh¶ n¨ng v−ît qua mµng tÕ bµo chñ

(cã thÓ lµ do chóng cã chøa s¶n phÈm cña gen gypsy-env). YÕu tè gypsy v× vËy lµ mét virut

thùc sù. Cßn cã nhiÒu hä TE kiÓu retrovirut kh¸c ®−îc t×m thÊy ë ruåi giÊm, nh−ng c¬ chÕ
vËn ®éng cña chóng ®Õn nay ch−a biÕt ®Çy ®ñ.

218

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

6.8.5.2. C¸c retrosposon

C¸c retrosposon lµ c¸c TE kiÓu retrovirut ph©n bè réng r·i vµ ®a d¹ng, nh−ng
kh«ng cã cÊu tróc LTR. Mét sè vÝ dô thuéc nhãm nµy cã thÓ kÓ ®Õn lµ c¸c yÕu tè F, G vµ I
t×m thÊy ë ruåi giÊm vµ mét sè yÕu tè kh¸c t×m thÊy ë ®éng vËt cã vó. Nh÷ng yÕu tè nµy vËn
®éng trong hÖ gen qua mét ph©n tö ARN ®−îc phiªn m· ng−îc thµnh ADN, cã thÓ do ho¹t
®éng cña c¸c protein do chÝnh TE m· hãa. MÆc dï c¸c retrosposon còng t¹o ra tr×nh tù lÆp
l¹i t¹i vÞ trÝ trªn ph©n tö ADN mµ nã xen vµo, nh−ng b¶n th©n chóng kh«ng cã c¸c tr×nh tù
lÆp l¹i ng−îc chiÒu hoÆc cïng chiÒu ë hai ®Çu tr×nh tù cña b¶n th©n chóng. Thay vµo ®ã,
chóng cã ®Æc ®iÓm ®Æc tr−ng lµ cã tr×nh tù poly(A = T) ë mét ®Çu. Tr×nh tù nµy lµ dÊu hiÖu
cho thÊy, cã lÏ chóng lµ kÕt qu¶ cña s¶n phÈm phiªn m· ng−îc ph©n tö ARN cã ®Çu 3’-
Poly(A). V× vËy, c¸c retrosposon ph¶n ¸nh nguån gèc cña chóng vèn lµ c¸c tr×nh tù phiªn
m· ng−îc cña c¸c ph©n tö mARN ®· tr¶i qua giai ®o¹n hoµn thiÖn (xem ch−¬ng 3).

ë ruåi giÊm, ng−êi ta cßn t×m thÊy mét nhãm retrosposon ®Æc biÖt t¹i c¸c ®Çu mót
NST cã kh¶ n¨ng kÐo dµi phÇn ®Çu mót nµy sau mçi lÇn nã bÞ ng¾n do sù sao chÐp ADN.
Nhí r»ng, víi ph©n tö ADN sîi kÐp m¹ch th¼ng, sau mçi lÇn sao chÐp, ph©n tö ADN l¹i
ng¾n ®i mét sè cÆp nucleotide. HiÖn t−îng ph©n tö ADN bÞ ng¾n l¹i lµ do enzym ADN
polymerase lu«n ®ßi hái cã s½n mét ®o¹n måi cã ®Çu 3’-OH tù do. Th«ng th−êng ®o¹n måi
nµy cã b¶n chÊt lµ ARN vµ bÞ lo¹i bá sau qu¸ tr×nh sao chÐp ADN (®Ó l¹i mét vïng ®Çu NST
lµ m¹ch ®¬n). Trong lÇn sao chÐp ADN tiÕp theo, khi sîi ng¾n h¬n (míi ®−îc tæng hîp)
®−îc sö dông lµm khu«n, nã sÏ t¹o nªn mét ph©n tö ADN míi ng¾n h¬n ph©n tö ADN gèc.
Nh− vËy, sau mçi lÇn sao chÐp ADN, ph©n tö ADN (NST) ngµy cµng trë nªn ng¾n h¬n ë
hai phÇn ®Çu mót.

§Ó kh¾c phôc hiÖn t−îng mÊt ®o¹n ®Çu mót NST nh− vËy, ë ruåi dÊm cã m«t c¬ chÕ
®Æc biÖt liªn quan ®Õn Ýt nhÊt hai lo¹i retrosposon kh¸c nhau, ®−îc gäi lµ HeT-A vµ TART
(viÕt t¾t cña telomere associated retrosposon). C¸c yÕu tè nµy cã xu h−íng vËn ®éng vÒ
phÝa ®Çu mót NST vµ kÐo dµi tr×nh tù ®Çu mót kho¶ng vµi kb. Cuèi cïng th× c¸c tr×nh tù do
c¸c yÕu tè TE xen vµo còng sÏ bÞ mÊt ®i do sù sao chÐp ADN vèn kh«ng hoµn chØnh ë ®Çu
mót. Nh−ng, mét sù vËn ®éng kh¸c cña nh÷ng yÕu tè nµy l¹i bï ®¾p phÇn tr×nh tù bÞ mÊt ®i.
Nh− vËy, ë ®©y c¸c yÕu tè HeT-A vµ TART cã chøc n¨ng quan träng lµ t¸i t¹o ®Çu mót NST.

6.8.6. C¸c yÕu tè di truyÒn vËn ®éng ë ng−êi

Tõ kÕt qu¶ dù ¸n gi¶i tr×nh tù hÖ gen ng−êi, −íc tÝnh cã Ýt nhÊt 44% sè tr×nh tù hÖ
gen ng−êi cã xuÊt xø hoÆc cã liªn quan víi c¸c yÕu tè di truyÒn vËn ®éng, bao gåm c¸c TE
kiÓu retrovirut (∼ 8%), retrosposon (∼ 33%) vµ mét sè hä TE kiÓu c¾t-d¸n (∼3%).

YÕu tè di truyÒn vËn ®éng phæ biÕn nhÊt lµ L1. YÕu tè nµy thuéc mét líp c¸c tr×nh tù
gäi lµ c¸c yÕu tè tr×nh tù dµi n»m d¶i r¸c trong nh©n LINE (long interspersed nuclear
element). C¸c yÕu tè LINE hoµn chØnh cã kÝch th−íc kho¶ng 6 kb, chóng chøa mét
promoter ®−îc nhËn biÕt bëi enzym ARN polymerase II, vµ cã hai khung ®äc më (ORF).
Trong ®ã ORF1 m· hãa cho mét protein liªn kÕt víi c¸c axit nucleic, cßn ORF2 m· hãa cho
mét protein cã ho¹t tÝnh endonuclease vµ reverse transcriptase. HÖ gen ng−êi chøa
kho¶ng 3000 ®Õn 5000 b¶n sao yÕu tè L1 hoµn chØnh. Ngoµi ra, nã cßn chøa kho¶ng
500.000 b¶n sao c¸c yÕu tè L1 bÞ c¾t xÐn mét phÇn ë ®Çu 5’; nh÷ng yÕu tè L1 kh«ng hoµn
chØnh nµy kh«ng cßn kh¶ n¨ng vËn ®éng. C¸c yÕu tè L1 trong hÖ gen, kÓ c¶ lo¹i hoµn chØnh
vµ kh«ng hoµn chØnh, th−êng cã hai vïng biªn lµ c¸c tr×nh tù lÆp l¹i cïng chiÒu.

C¸c yÕu tè L1 lµ c¸c yÕu tè retrosposon thùc sù. Sù vËn ®éng cña chóng trong hÖ gen
liªn quan ®Õn sù phiªn m· L1 thµnh ph©n tö ARN vµ phiªn m· ng−îc ph©n tö nµy thµnh
tr×nh tù ADN (h×nh 6.30). C¶ hai qu¸ tr×nh ®ã ®Òu diÔn ra trong nh©n. Tuy vËy, tr−íc khi
ph©n tö ARN L1 ®−îc phiªn m· ng−îc, ph©n tö nµy ®−îc vËn chuyÓn ra tÕ bµo chÊt ®Ó tiÕn
hµnh dÞch m· tæng hîp c¸c chuçi polypeptide mµ nã m· hãa vµ ph©n tö protein nµy liªn kÕt

219

§inh §oµn Long

víi nã khi ®−îc vËn chuyÓn trë l¹i nh©n. C¸c chuçi polypeptide ®−îc m· hãa bëi ORF2
mang mét enzym endonuclease xóc t¸c viÖc c¾t mét m¹ch ®¬n cña sîi kÐp ADN t¹i vÞ trÝ
®Ých cã thÓ g¾n vµo cña TE trªn NST. §Çu 3’ tù do cña m¹ch ADN võa bÞ c¾t ®−îc dïng lµm
måi ®Ó tiÕn hµnh tæng hîp m¹ch ADN míi sö dông ph©n tö ARN lµm khu«n, vµ chuçi
polypeptide ®−îc tæng hîp b»ng ORF2 cung cÊp ho¹t tÝnh reverse transcriptase cho ho¹t
®éng nµy. B»ng c¸ch ®ã, mét tr×nh tù ADN L1 ®−îc tæng hîp t¹i ®iÓm trªn NST n¬i chuçi
polypeptide ORF2 ®· t¹o ra vÕt ®øt trªn sîi ®¬n. Ph©n tö ADN L1 míi ®−îc tæng hîp m¹ch
®¬n sau ®ã ®−îc “chuyÓn sang” d¹ng sîi kÐp nhê c¬ chÕ tæng hîp ADN th«ng th−êng. Ph©n
®o¹n ADN sîi kÐp míi sÏ kÕt hîp vµo NST vµ t¹o ra mét b¶n sao míi cña yÕu tè L1 trong
hÖ gen. §«i khi vïng ®Çu 5’ cña ARN L1 kh«ng ®−îc phiªn m· thµnh ADN. Khi ®ã, ®o¹n cµi
L1 thiÕu c¸c tr×nh tù ë ®Çu 5’, ®−îc gäi lµ yÕu tè L1 kh«ng hoµn chØnh.

TÕ bµo chÊt Nh©n tÕ bµo
YÕu tè L1

ADN nhiÔm s¾c thÓ

YÕu tè L1 míi cµi vµo NST

Ribosom

Protein cña ORF1 ADN nhiÔm s¾c thÓ
Protein cña ORF2

H×nh 6.30. Gi¶ thiÕt vÒ c¬ chÕ vËn ®éng cña c¸c yÕu tè L1 trong hÖ gen ng−êi. YÕu tè L1 cã kÝch th−íc kho¶ng
6 kb chøa 2 khung ®äc më (ORF1 vµ ORF2) ®−îc phiªn m· tõ cïng mét promoter (P). Chuçi polypeptide do ORF1
m· hãa liªn kÕt ngay víi L1 ARN vµ cã thÓ cã vai trß vËn chuyÓn ARN vµo nh©n tÕ bµo. Chuçi polypeptide do ORF2
m· hãa cã Ýt nhÊt hai chøc n¨ng. §ã lµ 1) ho¹t tÝnh endonuclease c¾t ADN vµ 2) ho¹t tÝnh cña enzym phiªn m·
ng−îc (tæng hîp ADN tõ m¹ch khu«n ARN). KÝch th−íc cña yÕu tè L1 míi phô thuéc vµo ph¶n øng phiªn m· ng−îc
kÐo dµi bao l©u däc theo m¹ch khu«n L1 mARN. NÕu sù phiªn m· ng−îc kh«ng kÐo dµi hÕt ®Çu 5’ cña ph©n tö L1
mARN th× sÏ t¹o ra c¸c ®o¹n cµi L1 cã tr×nh tù kh«ng ®Çy ®ñ. C¸c ®o¹n cµi L1 kh«ng ®Çy ®ñ th−êng kh«ng mang
promoter (®o¹n P) nªn kh«ng tæng hîp ®−îc ph©n tö L1 ARN vµ mÊt kh¶ n¨ng vËn ®éng.

220

Ch−¬ng 6. §ét biÕn vµ söa ch÷a Adn

Trong hÖ gen ng−êi, chØ cã mét sè Ýt yÕu tè L1 hoµn chØnh cßn vËn ®éng. Sù vËn ®éng
cña chóng ®−îc t×m thÊy khi ph©n tÝch bÖnh di truyÒn ë mét sè c¸ thÓ. §Õn nay, ®· ph¸t
hiÖn ®−îc 14 bÖnh di truyÒn do ®ét biÕn gen liªn quan ®Õn ho¹t ®éng vËn ®éng cña yÕu tè
L1, nh− c¸c ®ét biÕn ë gen m· hãa yÕu tè VIII (g©y bÖnh m¸u lo·ng). Nh×n chung, sù vËn
®éng cña yÕu tè L1 hiÕm gÆp. Ngoµi L1, hÖ gen ng−êi cßn hai tr×nh tù LINE kh¸c n÷a lµ
L2 (315.000 b¶n sao) vµ L3 (37.000 b¶n sao). Tuy vËy, kh«ng cã lo¹i nµo vËn ®éng tÝch cùc.

C¸c yÕu tè tr×nh tù ng¾n n»m r¶i r¸c trong nh©n SINE lµ nhãm yÕu tè di truyÒn
vËn ®éng phæ biÕn thø hai ë ng−êi. Nh÷ng yÕu tè nµy th−êng cã tr×nh tù ng¾n h¬n 400 bp
vµ kh«ng m· hãa cho protein. Gièng nh− c¸c retrosposon kh¸c, chóng cã mét tr×nh tù
poly(A=T) ë mét ®Çu. C¸c yÕu tè SINE vËn ®éng qua mét sù phiªn m· ng−îc mét ph©n tö
ARN b¾t ®Çu tõ mét promoter n»m bªn trong tr×nh tù cña chóng. MÆc dï chi tiÕt qu¸ tr×nh
vËn ®éng cña c¸c yÕu tè SINE ®Õn nay ch−a râ, nh−ng d−êng nh− enzym reverse
transcriptase lµ thiÕt yÕu cho sù tæng hîp ADN tõ ARN SINE. Do vËy, c¸c yÕu tè SINE
chØ vËn ®éng khi cã mÆt cña c¸c yÕu tè LINE. Víi ý nghÜa ®ã, SINE ®−îc xem lµ c¸c yÕu tè
retrosposon “ký sinh” trªn c¸c yÕu tè retrosposon kh¸c. HÖ gen ng−êi chøa ba hä c¸c yÕu tè
SINE, lµ hä Alu, MIR vµ Ther2/MIR3. Tuy vËy, chØ c¸c yÕu tè Alu (gäi nh− vËy, v× tÊt c¶
c¸c TE thuéc hä nµy ®Òu cã vÞ trÝ c¾t cña enzym giíi h¹n AluI) cßn ho¹t ®éng.

HÖ gen ng−êi chøa h¬n 400.000 ph©n ®o¹n xuÊt ph¸t tõ c¸c yÕu tè gièng virut. PhÇn
lín c¸c tr×nh tù nµy lµ c¸c tr×nh tù LTR ®éc nhÊt. MÆc dï cã h¬n 100 hä c¸c yÕu tè TE kh¸c
nhau gièng virut ®· ®−îc t×m thÊy trong hÖ gen ng−êi, nh−ng chØ cã mét sè Ýt vËn tÝch cùc
trong tiÕn hãa cËn ®¹i. Gièng víi c¸c yÕu tè SINE vµ LINE bÊt ho¹t, hÇu hÕt c¸c tr×nh tù
nµy chØ lµ c¸c “dÊu vÕt cßn l¹i” cña c¸c yÕu tè TE vËn ®éng tÝch cùc tr−íc ®©y trong tiÕn hãa.

C¸c yÕu tè TE ho¹t ®éng m¹nh kiÓu c¾t - d¸n (gièng Ac/Ds ë ng«) ®−îc xóc t¸c bëi
enzym transposase do chÝnh yÕu tè ®ã m· hãa, còng cã mét tØ lÖ nhá trong hÖ gen ng−êi.
Trong ®ã, cã hai yÕu tè cã quan hÖ xa víi Ac/Ds vµ mét sè yÕu tè thuéc hä Tc1/mariner
®−îc t×m thÊy. TÊt c¶ c¸c b»ng chøng thùc nghiÖm cho thÊy nh÷ng yÕu tè TE nµy ®· trë nªn
“bÊt ho¹t” tõ hµng triÖu n¨m tr−íc trong qu¸ tr×nh tiÕn hãa h×nh thµnh loµi ng−êi.

221

Ch−¬ng 7

C¥ Së DI TRUYÒN HäC NHIÔM S¾C THÓ

Trong tÕ bµo, mçi ph©n tö ADN th−êng liªn kÕt víi c¸c protein t¹o thµnh cÊu tróc
®−îc gäi lµ nhiÔm s¾c thÓ (viÕt t¾t lµ NST). Tæ chøc NST nh− vËy kh«ng chØ cã ë c¸c tÕ
bµo eukaryote vµ prokaryote mµ thËm chÝ ë c¶ virut. ViÖc ®ãng gãi trong c¸c NST lµ ®iÒu
kiÖn ®Ó ADN thùc hiÖn ®−îc c¸c chøc n¨ng quan träng cña nã. Thø nhÊt, NST chøa ADN
®−îc ®ãng gãi chÆt míi cã thÓ n»m gän ®−îc trong nh©n tÕ bµo. Thø hai, sù ®ãng gãi ADN
trong NST nh»m b¶o vÖ ADN khái bÞ tæn th−¬ng. C¸c ph©n tö ADN trÇn trong tÕ bµo
th−êng kÐm bÒn; trong khi ADN n»m trong cÊu tróc NST rÊt bÒn v÷ng, cho phÐp th«ng tin
mµ nã m· hãa ®−îc truyÒn l¹i chÝnh x¸c. Thø ba, chØ ADN ®−îc ®ãng gãi trong NST míi cã
thÓ ®−îc di truyÒn mét c¸ch hiÖu qu¶ cho c¸c tÕ bµo con sau mçi lÇn ph©n chia tÕ bµo. Cuèi
cïng, NST lµ sù kh¼ng ®Þnh tæ chøc nhÊt qu¸n ®Æc thï víi mçi ph©n tö ADN. Tæ chøc ®ã
lµm cho sù biÓu hiÖn cña c¸c gen còng nh− sù t¸i tæ hîp gi÷a c¸c NST bè, mÑ (t¹o nªn sù ®a
d¹ng di truyÒn) cã thÓ diÔn ra thuËn lîi vµ cã tÝnh ®Æc tr−ng.

Kho¶ng mét nöa khèi l−îng NST ë tÕ bµo eukaryote lµ protein. Trong c¸c tÕ bµo
eukaryote, vïng ADN liªn kÕt víi c¸c protein ®−îc gäi lµ chÊt nhiÔm s¾c. C¸c protein liªn
kÕt víi ADN trong chÊt nhiÔm s¾c chñ yÕu lµ c¸c protein kiÒm, kÝch th−íc nhá, gäi lµ c¸c
histon. Ngoµi ra, trong chÊt nhiÔm s¾c cßn cã c¸c protein phi histon cã vai trß trong c¸c
qu¸ tr×nh ph©n chia tÕ bµo, phiªn m·, sao chÐp, söa ch÷a vµ t¸i tæ hîp ADN.

Trong chÊt nhiÔm s¾c, c¸c protein cã mét chøc n¨ng quan träng lµ nÐn chÆt ph©n tö
ADN. TÝnh to¸n sau ®©y cho thÊy tÇm quan träng cña chøc n¨ng nµy. Bé NST ®¬n béi cña
tÕ bµo ng−êi chøa trªn 3 tû cÆp baz¬ nit¬ (nucleotide). Mçi cÆp baz¬ nit¬ cã kÝch th−íc
kho¶ng 3,4 Ao. NÕu nèi c¸c ph©n tö ADN cña bé NST ®¬n béi cña ng−êi l¹i víi nhau th×
chóng cã ®é dµi trªn 1 m. Víi c¸c tÕ bµo l−ìng béi, chiÒu dµi ®ã lµ trªn 2 m. V× ®−êng kÝnh
cña nh©n tÕ bµo ng−êi ®iÓn h×nh chØ kho¶ng 10 µm; nªn râ rµng, ADN ph¶i ®−îc nÐn chÆt
theo nhiÒu møc ®é kh¸c nhau míi cã thÓ n»m gän trong kho¶ng kh«ng gian nhá bÐ ®ã. Møc
®é nÐn ADN ®Çu tiªn ë c¸c tÕ bµo ng−êi (còng nh− ë c¸c tÕ bµo eukaryote kh¸c) lµ ADN liªn
kÕt víi histon t¹o nªn cÊu tróc gäi lµ nucleosome (thÓ nh©n). Nucleosome lµ b−íc ®ãng
xo¾n ADN ®Çu tiªn gióp gi¶m chiÒu dµi cña nã xuèng kho¶ng 10.000 lÇn. Sù nÐn kÝch
th−íc ADN trong nucleosome ph¶i “tr¶ mét chi phÝ” lµ lµm gi¶m kh¶ n¨ng tiÕp cËn ADN
cña c¸c protein ®iÒu hßa c¸c qu¸ tr×nh sao chÐp, söa ch÷a, t¸i tæ hîp ADN, vµ ®Æc biÖt
quan träng lµ c¸c protein ®iÒu hßa qu¸ tr×nh phiªn m·. MÆc dï so víi eukaryote, c¸c tÕ bµo
prokaryote th−êng cã hÖ gen nhá h¬n, nh−ng ADN cña chóng còng cÇn ®−îc nÐn chÆt. Vi
khuÈn E. coli ph¶i bao gãi ADN cña nã dµi kho¶ng 1 mm vµo trong tÕ bµo cã kÝch th−íc chØ
1 µm. C¸c møc cÊu tróc NST ë prokaryote ®Õn nay ch−a ®−îc biÕt ®Çy ®ñ. MÆc dï kh«ng
cã histon, nh−ng c¸c tÕ bµo vi khuÈn còng cã c¸c protein liªn kÕt ADN cã tÝnh kiÒm, khèi
l−îng nhá, cã lÏ ®Ó ®¶m nhËn chøc n¨ng t−¬ng tù.

Sù ®èi nghÞch vÒ nhu cÇu “nÐn vËt chÊt di truyÒn” vµ nhu cÇu “tiÕp cËn ADN” cña
c¸c bé m¸y sao chÐp, phiªn m·, söa ch÷a vµ t¸i tæ hîp ADN dÉn ®Õn viÖc cÇn t×m hiÓu cÊu
tróc vµ ho¹t ®éng cña chÊt nhiÔm s¾c. Thùc tÕ cho thÊy, sù thay ®æi lu©n phiªn cÊu tróc
nucleosome cho phÐp nh÷ng vïng riªng biÖt cña NST t−¬ng t¸c ®−îc víi c¸c protein. Sù
thay ®æi lu©n phiªn ®ã ®−îc xóc t¸c bëi c¸c enzym c¶i biÕn vµ t¸i cÊu tróc nucleosome. Qu¸
tr×nh ®ã cã tÝnh côc bé, cho phÐp c¸c enzym vµ c¸c protein ®iÒu hßa tiÕp cËn ®−îc nh÷ng

222

Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

vïng kh¸c nhau cña NST vµo c¸c thêi ®iÓm kh¸c nhau. §©y lµ ®iÓm “cèt yÕu” gióp gi¶i
thÝch nhiÒu sù kiÖn diÔn ra trong ho¹t ®éng ®iÒu hßa gen ë eukaryote.

Trong ch−¬ng nµy, chóng ta sÏ ®Ò cËp ®Õn cÊu tróc NST vµ mét sè c¬ chÕ chung gióp
gi¶i thÝch b»ng c¸ch nµo c¸c NST ®−îc di truyÒn trän vÑn tíi c¸c tÕ bµo con sau mçi lÇn
ph©n chia tÕ bµo. §ång thêi, chóng ta còng sÏ ®Ò cËp ®Õn cÊu tróc vµ sù ®iÒu hßa ho¹t ®éng
cña chÊt nhiÔm s¾c qua sù c¶i biÕn vµ t¸i cÊu tróc nucleosome vèn ®−îc xem lµ ®¬n vÞ cÊu
tróc c¬ b¶n vµ quan träng nhÊt cña chÊt nhiÔm s¾c ë tÕ bµo eukaryote.

7.1. Sù ®a d¹ng vÒ cÊu tróc cña nhiÔm s¾c thÓ (NST)

7.1.1. C¸c nhiÔm s¾c thÓ cã thÓ ë d¹ng m¹ch th¼ng hoÆc vßng

Tr−íc ®©y, ng−êi ta tõng cho r»ng c¸c tÕ bµo prokaryote chØ cã mét NST m¹ch vßng,
trong khi c¸c tÕ bµo eukaryote cã nhiÒu NST m¹ch th¼ng. Nh−ng, khi cµng cã nhiÒu loµi
prokaryote ®−îc nghiªn cøu th× quan ®iÓm nµy kh«ng cßn chÝnh x¸c n÷a. Tuy hÇu hÕt c¸c
prokaryote ®−îc nghiªn cøu (nh− E. coli vµ B. subtilis) thùc sù chØ cã mét NST m¹ch vßng,
nh−ng còng cã nhiÒu tÕ bµo prokaryote chøa nhiÒu NST m¹ch th¼ng, hoÆc thËm chÝ ®ång
thêi mang c¶ hai lo¹i. Sè l−îng NST ë c¸c sinh vËt prokaryote cã thÓ dao ®éng tõ 2 ®Õn

d−íi 50. ë mét sè eukaryote, sè l−îng NST trong mçi tÕ bµo cã thÓ ®Õn hµng ngh×n (vÝ dô:
®éng vËt nguyªn sinh Tetrahynema, xem B¶ng 7.1).

B¶ng 7.1. Sè l−îng nhiÔm s¾c thÓ (NST) ë c¸c sinh vËt kh¸c nhau

Loµi Sè l−îng Sè b¶n sao D¹ng KÝch th−íc
NST mçi NST NST hÖ gen (Mb)

Mycoplasma genitalium Prokaryote 1 vßng 0,58
Escherichia coli K12 1 1 vßng 4,6
1 3 vßng
Agrobacterium tumefaciens 1 1 th¼ng 5,67
4 vßng
Sinorhizobium meliloti 1 6,7
3

Eukaryote

Saccharomyces cerevisiae 16 1 hoÆc 2 th¼ng 12,1
Schizosaccharomyces pombe th¼ng 12,5
Caenorhabditis elegans (giun trßn) 3 1 hoÆc 2 th¼ng 97
Arabidopsis thaliana (c¶i d¹i) th¼ng 125
Drosophila melanogaster (ruåi giÊm) 62 th¼ng 180

Tetrahynema thermophilus 52 th¼ng 220
(nh©n nhá)
Fugu rubripes (c¸ xem sao) 42 th¼ng
Mus musculus (chuét) th¼ng 365
Homo sapiens (ng−êi) Nh©n nhá: 5 Nh©n nhá: 2 th¼ng 2500
Nh©n lín: 225 Nh©n lín: 10 - 2900

10.000

22 2

19 + X vµ Y 2

22 + X vµ Y 2

Dï ë d¹ng m¹ch th¼ng hay vßng, NST ®Òu gÆp nh÷ng “trë ng¹i” riªng trong qu¸
tr×nh sao chÐp vµ duy tr× th«ng tin di truyÒn. NST m¹ch vßng cÇn enzym topoisomerase
®Ó t¸ch c¸c ph©n tö ADN con sau khi kÕt thóc qu¸ tr×nh sao chÐp. NÕu kh«ng cã c¸c

223

§ç Lª Th¨ng - §inh §oµn Long

enzym nµy, c¸c ph©n tö ADN con cã thÓ lång vµo nhau hoÆc “®Ýnh” víi nhau thµnh
chuçi. Ng−îc l¹i, c¸c ph©n tö ADN cña c¸c NST m¹ch th¼ng trong qu¸ tr×nh sao chÐp cÇn
®−îc b¶o vÖ khái c¸c enzym ph©n gi¶i (nuclease) vèn cã s½n trong tÕ bµo.

7.1.2. §Æc tr−ng sè l−îng nhiÔm s¾c thÓ cña tÕ bµo

C¸c tÕ bµo prokaryote th−êng chØ cã mét b¶n sao NST hoµn chØnh n»m trong cÊu tróc

®−îc gäi lµ vïng nh©n (nucleoid, xem h×nh 7.1b). Tuy nhiªn, khi c¸c tÕ bµo prokaryote
ph©n chia nhanh th× nhiÒu phÇn cña NST ®ang sao chÐp sÏ tån t¹i ë d¹ng hai hay thËm chÝ
bèn b¶n sao. C¸c tÕ bµo prokaryote còng th−êng cã mét hoÆc mét sè ph©n tö ADN d¹ng

vßng kÝch th−íc nhá, tån t¹i ®éc lËp, gäi lµ c¸c plasmid. Plasmid th−êng kh«ng mang c¸c
gen thiÕt yÕu ®èi víi sù sinh tr−ëng cña vi khuÈn, nh−ng chóng mang c¸c gen cÇn cho mét
sè ho¹t ®éng kh¸c cña vi khuÈn, nh− kh¶ n¨ng kh¸ng kh¸ng sinh. Trong mét tÕ bµo vi
khuÈn cã thÓ cã nhiÒu b¶n sao hoµn chØnh cña c¸c plasmid.

PhÇn lín c¸c tÕ bµo eukaryote lµ l−ìng béi, nghÜa lµ chóng chøa hai b¶n sao cña mçi

NST (h×nh 7.1c). Hai b¶n sao cña mçi NST ®−îc gäi lµ hai NST t−¬ng ®ång; mét chiÕc cã

nguån gèc tõ bè, mét chiÕc cã nguån gèc tõ mÑ. Tuy nhiªn, kh«ng ph¶i mäi tÕ bµo

eukaryote ®Òu lµ l−ìng béi; mét sè cã (b)
thÓ lµ ®¬n béi hoÆc ®a béi. C¸c tÕ bµo Vi khuÈn ®¬n béi
®¬n béi (nh− tinh trïng vµ trøng) chØ cã

mét b¶n sao duy nhÊt cña mçi NST vµ

tham gia vµo qu¸ tr×nh sinh s¶n h÷u

tÝnh. C¸c tÕ bµo ®a béi cã nhiÒu h¬n

hai b¶n sao cña mçi NST. Trong thùc Roi b¬i Vá

tÕ, mét sè sinh vËt duy tr× phÇn lín c¸c

tÕ bµo tr−ëng thµnh cña chóng ë d¹ng (a) Vïng nh©n NhiÔm s¾c thÓ
®a béi. Cã nh÷ng tr−êng hîp sè b¶n Prokaryote
(c)
sao cña mçi NST trong tÕ bµo lªn ®Õn 1 µm TÕ bµo l−ìng béi
hµng tr¨m, thËm chÝ hµng ngh×n. KiÓu Eukaryote Bé m¸y Golgi
t¨ng theo béi sè cña hÖ gen nh− vËy
cho phÐp tÕ bµo s¶n sinh nhanh mét Nh©n
l−îng lín ARN vµ protein. VÝ dô, tÕ bµo
nh©n khæng lå (megakaryocyte) cã NhiÔm
s¾c thÓ

trong tñy x−¬ng ë ng−êi lµ c¸c tÕ bµo M¹ng l−íi

®a béi chuyªn hãa (chøa kho¶ng 128 10 µm néi chÊt
b¶n sao cña mçi NST). Mçi tÕ bµo Ti thÓ

nh©n khæng lå cã thÓ s¶n sinh hµng TÕ bµo ®¬n béi

ngh×n tiÓu cÇu kh«ng cã NST nh−ng lµ

thµnh phÇn quan träng trong m¸u (cã

kho¶ng 200.000 tiÓu cÇu/ml m¸u). ë H×nh 7.1. So s¸nh tÕ bµo prokaryote (nh©n s¬) vµ
eukaryote (nh©n thËt) ®iÓn h×nh. (a) §−êng kÝnh tÕ bµo
d¹ng ®a béi, c¸c tÕ bµo nh©n khæng lå
lu«n duy tr× ®−îc møc ®é trao ®æi chÊt eukaryote kho¶ng 10 µm vµ tÕ bµo prokaryote kho¶ng 1µm.
cao ®Ó cã thÓ s¶n sinh nhanh mét (b) NST eukaryote n»m ë vïng nh©n vµ chiÕm phÇn ®¸ng kÓ
l−îng lín c¸c tiÓu cÇu. Sù ph©n ly sè trong tÕ bµo. Vïng nh©n kh«ng cã mµng bao bäc. Ngoµi ra, tÕ
l−îng lín NST nh− vËy theo c¸c c¬ chÕ bµo prokaryote cßn cã plasmid. (c) C¸c NST tÕ bµo eukaryote
n»m trong nh©n tÕ bµo cã mµng bao bäc. TÕ bµo ®¬n béi cã mét
chung sÏ rÊt khã kh¨n nªn c¸c tÕ bµo ë b¶n sao cña mçi NST, cßn c¸c tÕ bµo l−ìng béi cã hai b¶n sao.
d¹ng ®a béi, nh− tÕ bµo nh©n khæng
lå, sau khi biÖt hãa sÏ ngõng ph©n
chia. Dï sè l−îng lµ bao nhiªu th× c¸c
NST ë tÕ bµo eukaryote lu«n ®−îc “bao
gãi” trong nh©n tÕ bµo.

224

Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

7.1.3. NghÞch lý gi¸ trÞ C

ADN tæng sè cña hÖ gen ®¬n béi cña mét loµi ®−îc gäi lµ gi¸ trÞ C cña loµi ®ã. B¶ng
7.2 liÖt kª gi¸ trÞ C, sè l−îng gen −íc tÝnh vµ mËt ®é gen/Mb cña mét sè loµi prokaryote vµ
eukaryote. Nh÷ng sè liÖu nµy nh×n chung ph¶n ¸nh mèi t−¬ng quan gi÷a kÝch th−íc hÖ
gen víi møc ®é tæ chøc phøc t¹p cña c¬ thÓ sinh vËt. C¸c loµi prokaryote th−êng cã hÖ gen
nhá h¬n 10 Mb. HÖ gen cña c¸c eukaryote ®¬n bµo th−êng nhá h¬n 50 Mb, trong khi nh÷ng
nguyªn sinh ®éng vËt cã cÊu tróc c¬ thÓ phøc t¹p h¬n cã thÓ cã hÖ gen lín h¬n 200 Mb. C¸c
sinh vËt ®a bµo cã hÖ gen lín h¬n nhiÒu. HÖ gen cña nh÷ng sinh vËt nµy cã thÓ ®¹t tíi
100.000 Mb.

Tuy vËy, mèi t−¬ng quan gi÷a kÝch th−íc hÖ gen víi møc ®é tæ chøc phøc t¹p cña c¬
thÓ kh«ng hoµn toµn tuyÖt ®èi. NhiÒu sinh vËt cã møc ®é tæ chøc gÇn t−¬ng ®−¬ng nhau
nh−ng cã kÝch th−íc hÖ gen rÊt kh¸c nhau. VÝ dô, ruåi giÊm cã hÖ gen nhá h¬n ch©u chÊu
25 lÇn; cßn lóa n−íc cã hÖ gen nhá h¬n lóa m× 40 lÇn. §iÒu nµy cho thÊy, cã lÏ sè l−îng
gen, chø kh«ng ph¶i kÝch th−íc hÖ gen cã quan hÖ mËt thiÕt víi møc ®é tæ chøc phøc t¹p
cña sinh vËt. Ph©n tÝch mËt ®é gen cña c¸c hÖ gen cho thÊy râ xu h−íng nµy.

B¶ng 7.2. Gi¸ trÞ C, sè gen −íc tÝnh vµ mËt ®é gen ë mét sè loµi sinh vËt

Loµi Gi¸ trÞ C Sè gen MËt ®é gen
(Mb) −íc tÝnh (sè gen / Mb)
Prokaryote (Vi khuÈn)
Mycoplasma genitalium 0,58 500 860
Streptococcus pneumonia 2,2 2.300 1.060
Escherichia coli K12 4,6 4.400
Agrobacterium tumefaciens 5,7 5.400 950
Sinorhhizobium meliloti 6,7 6.200 960
930

Eukaryote 12 5.800 480
12 4.900 410
a) NÊm
Saccharomyces cerevisiae 220 > 20.000 >90
Schizosaccharomyces pombe
97 19.000 200
b) §éng vËt nguyªn sinh 180 13.700 80
Tetrahynema thermophilus 845 ~ 22.000
5.000 Ch−a x¸c ®Þnh ~26
c) §éng vËt kh«ng x−¬ng sèng Ch−a x¸c ®Þnh
C. elegans (giun trßn) 365 > 31.000
D. melanogaster (ruåi giÊm) 2.900 25.000 >85
Strongylocentrotus purpuratus 2.500 23.000 8,6
Locusta migratoria 9,2
125 25.500
d) §éng vËt cã x−¬ng sèng 430 > 45.000 200
Fugu rubripes (c¸ xem sao) 2.200 > 45.000 >100
Homo sapiens (ng−êi) 120.000 Ch−a x¸c ®Þnh
Mus musculus (chuét) >20
Ch−a x¸c ®Þnh
e) Thùc vËt
Arabidopsis thaliana (c¶i d¹i)
Oryza saliva (lóa)
Zea mays (ng«)
Fritilaria assyriaca (tulip)

225

§ç Lª Th¨ng - §inh §oµn Long

7.1.4. C¸c gen chiÕm hÇu hÕt hÖ gen vi khuÈn

PhÇn lín nh÷ng hiÓu biÕt ®Õn nay vÒ hÖ gen vi khuÈn lµ tõ c¸c nghiªn cøu ë vi
khuÈn “m« h×nh” E. coli. C¸c gen m· ho¸ protein chiÕm phÇn lín hÖ gen cña vi khuÈn nµy.
Tr×nh tù kh«ng m· ho¸ chñ yÕu lµ c¸c tr×nh tù ®iÒu hoµ phiªn m·. V× mét vÞ trÝ khëi ®Çu
phiªn m· th−êng ®−îc E. coli sö dông ®Ó ®iÒu khiÓn sù biÓu hiÖn ®ång thêi cña mét sè gen
(cÊu tróc mARN ®a cistron) nªn sè l−îng tr×nh tù khëi ®Çu phiªn m· trong hÖ gen còng rÊt
Ýt. §iÓm khëi ®Çu sao chÐp trªn NST cña E. coli kh«ng ph¶i lµ mét ®o¹n tr×nh tù trong gen
mµ lµ mét vïng tr×nh tù ng¾n trªn NST ®−îc dïng ®Ó ®iÒu khiÓn bé m¸y sao chÐp ADN.
MÆc dï cã vai trß quan träng nh−ng vïng nµy cã kÝch th−íc kh¸ nhá, chØ chiÕm vµi tr¨m
cÆp baz¬ nit¬ trong tæng sè 4,6 Mb cña hÖ gen.

7.1.5. C¸c sinh vËt bËc cao cã mËt ®é gen trong hÖ gen gi¶m

T¹i sao mËt ®é gen trong hÖ Intron 1 2
gen sinh vËt bËc cao l¹i gi¶m? Cã ADN 3
hai yÕu tè chÝnh dÉn ®Õn hiÖn Exon 1 2

t−¬ng nµy. §ã lµ kÝch th−íc mçi 2 3
gen vµ chiÒu dµi ®o¹n tr×nh tù TiÒn-mARN 1 3’
liªn gen (gi÷a c¸c gen) cã xu 5’

h−íng t¨ng lªn. §é dµi mçi gen

t¨ng lªn v× hai lý do. Thø nhÊt, c¸c mARN hoµn thiÖn 5’ 3’
sinh vËt trë nªn ngµy cµng phøc t¹p (sau c¾t intron)

vµ c¸c gen cña nã ®−îc ®iÒu khiÓn H×nh 7.2. S¬ ®å hãa qu¸ tr×nh xÐn intron (hoµn thiÖn mARN).
biÓu hiÖn bëi nhiÒu c¬ chÕ ®iÒu hßa

nghiªm ngÆt vµ phøc t¹p h¬n nªn ®é dµi c¸c ®o¹n tr×nh tù ADN ®iÒu hoµ phiªn m· (gäi t¾t

lµ c¸c tr×nh tù ®iÒu hoµ) còng t¨ng lªn (tøc lµ tÝch lòy thªm th«ng tin). Thø hai, c¸c gen

m· ho¸ protein ë c¸c eukaryote th−êng cã tÝnh “ph©n m¶nh”, nghÜa lµ xen kÏ gi÷a c¸c
tr×nh tù m· hãa - exon - lµ c¸c tr×nh tù kh«ng m· hãa axit amin trªn ph©n tö protein -

intron. C¸c intron ®−îc c¾t bá khái ph©n tö tiÒn-mARN sau phiªn m· bëi qu¸ tr×nh xÐn

intron lµ mét b−íc cña qu¸ tr×nh hoµn thiÖn mARN (h×nh 7.2). Sù cã mÆt cña c¸c intron

lµm t¨ng ®¸ng kÓ ®é dµi cña gen (b¶ng 7.3). Ch¼ng h¹n ë ng−êi, ®o¹n tr×nh tù ®−îc phiªn

m· cña mét gen (®Ó tæng hîp tiÒn-mARN) cã kÝch th−íc trung b×nh kho¶ng 27 kb, th×

®o¹n tr×nh tù m· ho¸ (®−îc dÞch m· thµnh protein) chØ dµi kho¶ng 1,3 kb. Nãi c¸ch kh¸c,

chØ cã kho¶ng 5% sè nucleotide trong tr×nh tù c¸c gen ë ng−êi lµ c¸c tr×nh tù m· ho¸. C¸c

gen ë eukaryote bËc thÊp cã xu h−íng mang Ýt intron h¬n. VÝ dô, ë nÊm men

Saccharomyces cerevisiae, chØ cã kho¶ng 3% sè gen chøa intron vµ kh«ng cã intron nµo dµi

qu¸ 1 kb.

C¸c ®o¹n tr×nh tù liªn gen ë c¸c sinh vËt bËc cao còng lµ nguyªn nh©n quan träng lµm

gi¶m mËt ®é gen. ADN liªn gen lµ phÇn cña hÖ gen kh«ng trùc tiÕp liªn quan ®Õn sù biÓu

hiÖn cña gen (tæng hîp protein hoÆc c¸c ARN cÊu tróc). H¬n 60% hÖ gen ng−êi lµ c¸c ®o¹n

tr×nh tù liªn gen vµ phÇn lín c¸c tr×nh tù ®ã ®Õn nay ch−a biÕt râ vÒ chøc n¨ng (h×nh 7.3).

Cã hai lo¹i tr×nh tù ADN liªn gen: c¸c tr×nh tù ®¬n nhÊt vµ c¸c tr×nh tù lÆp l¹i. Kho¶ng 1/4

sè tr×nh tù ADN liªn gen lµ c¸c tr×nh tù ®¬n nhÊt. Chóng bao gåm c¶ c¸c ®o¹n tr×nh tù

ADN lµ “vÕt tÝch” cña gen kh«ng cßn ho¹t ®éng chøc n¨ng, nh− c¸c gen ®ét biÕn mÊt chøc

n¨ng, c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶. C¸c gen ®ét biÕn mÊt chøc n¨ng vµ c¸c ph©n

®o¹n cña gen xuÊt hiÖn do c¸c ®ét biÕn ngÉu nhiªn hoÆc do sai sãt trong qu¸ tr×nh t¸i tæ

hîp ADN. Mét c¬ chÕ ph¸t sinh c¸c gen gi¶ lµ do ho¹t ®éng cña c¸c enzym phiªn m·

ng−îc. ChØ mét sè virut nhÊt ®Þnh trong qu¸ tr×nh sinh s¶n sö dông lo¹i enzym nµy ®Ó sao

chÐp ARN thµnh ADN sîi kÐp (cßn gäi lµ cADN). Khi bÞ nhiÔm nh÷ng virut nµy, c¸c

mARN cña tÕ bµo chñ cã thÓ bÞ sao chÐp thµnh cADN råi ®o¹n cADN võa t¹o ra ®−îc lång

ghÐp vµo hÖ gen nh−ng kh«ng biÓu hiÖn ®−îc chøc n¨ng.

226

Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

HÖ gen ng−êi Tr×nh tù ADN C¸c tr×nh tù C¸c tr×nh tù
(3.200 Mb) liªn gen liªn gen kh¸c ®¬n nhÊt
(510 Mb)
H×nh 7.3. Tæ chøc hÖ gen ng−êi. (2.000 Mb) (600 Mb)
HÖ gen ng−êi gåm nhiÒu lo¹i tr×nh C¸c tr×nh tù lÆp l¹i C¸c tr×nh tù lÆp l¹i
tù ADN kh¸c nhau, trong ®ã phÇn Gen vµ tr×nh tù ph©n bè kh¾p hÖ sè l−îng biÕn ®éng
lín kh«ng m· hãa protein. liªn quan ®Õn gen
gen (1.400 Mb) - microsatellite
(1.200 Mb) (90 Mb)
C¸c tr×nh tù liªn
quan ®Õn gen Intron vµ c¸c tr×nh
(1.152 Mb) tù kh«ng ®−îc

phiªn m cña gen
C¸c ph©n ®o¹n

kh«ng hoµn chØnh
cña gen

GEN Gen gi¶
(48 Mb)

B¶ng 7.3. Intron vµ tr×nh tù lÆp l¹i trong hÖ gen c¸c sinh vËt kh¸c nhau

Loµi MËt ®é gen Sè intron trung Tû lÖ tr×nh tù ADN

Prokaryote (Vi khuÈn) (sè gen / Mb) b×nh ë mçi gen lÆp l¹i (%)
Escherichia coli K12
950 0 <1
Eukaryote
480 0,04 3,4
a) NÊm
Saccharomyces cerevisiae 200 5 6,3
60 3 12
b) §éng vËt kh«ng x−¬ng sèng
Caenorhabditis elegans 75 5 2,7
Drosophila melanogaster 86 46

c) §éng vËt cã x−¬ng sèng 125 3 Ch−a x¸c ®Þnh
Fugu rubripes
Homo sapiens 470 Ch−a x¸c ®Þnh 42

d) Thùc vËt
Arabidopsis thaliana
Oryza sativa

C¸c ®o¹n tr×nh tù liªn gen ë c¸c sinh vËt bËc cao còng lµ nguyªn nh©n quan träng lµm
gi¶m mËt ®é gen. ADN liªn gen lµ phÇn cña hÖ gen kh«ng trùc tiÕp liªn quan ®Õn sù biÓu
hiÖn cña gen (tæng hîp protein hoÆc c¸c ARN cÊu tróc). H¬n 60% hÖ gen ng−êi lµ c¸c ®o¹n

tr×nh tù liªn gen vµ phÇn lín c¸c tr×nh tù ®ã ®Õn nay ch−a biÕt râ vÒ chøc n¨ng (h×nh 7.3).
Cã hai lo¹i tr×nh tù ADN liªn gen: c¸c tr×nh tù ®¬n nhÊt vµ c¸c tr×nh tù lÆp l¹i. Kho¶ng 1/4
sè tr×nh tù ADN liªn gen lµ c¸c tr×nh tù ®¬n nhÊt. Chóng bao gåm c¶ c¸c ®o¹n tr×nh tù
ADN lµ “vÕt tÝch” cña gen kh«ng cßn ho¹t ®éng chøc n¨ng, nh− c¸c gen ®ét biÕn mÊt chøc
n¨ng, c¸c ph©n ®o¹n cña gen vµ c¸c gen gi¶. C¸c gen ®ét biÕn mÊt chøc n¨ng vµ c¸c ph©n
®o¹n cña gen xuÊt hiÖn do c¸c ®ét biÕn ngÉu nhiªn hoÆc do sai sãt trong qu¸ tr×nh t¸i tæ

hîp ADN. Mét c¬ chÕ ph¸t sinh c¸c gen gi¶ lµ do ho¹t ®éng cña c¸c enzym phiªn m·

ng−îc. ChØ mét sè virut nhÊt ®Þnh trong qu¸ tr×nh sinh s¶n sö dông lo¹i enzym nµy ®Ó sao
chÐp ARN thµnh ADN sîi kÐp (cßn gäi lµ cADN). Khi bÞ nhiÔm nh÷ng virut nµy, c¸c

227

§ç Lª Th¨ng - §inh §oµn Long

mARN cña tÕ bµo chñ cã thÓ bÞ sao chÐp thµnh cADN råi ®o¹n cADN võa t¹o ra ®−îc lång
ghÐp vµo hÖ gen nh−ng kh«ng biÓu hiÖn ®−îc chøc n¨ng.

7.1.6. PhÇn lín c¸c tr×nh tù liªn gen ë ng−êi lµ c¸c ®o¹n tr×nh tù lÆp l¹i

Kho¶ng mét nöa hÖ gen ng−êi lµ c¸c ®o¹n tr×nh tù ADN lÆp l¹i nhiÒu lÇn trong hÖ
gen. Cã hai lo¹i tr×nh tù lÆp l¹i chñ yÕu: c¸c ADN tiÓu vÖ tinh (microsatellite) vµ c¸c
®o¹n tr×nh tù lÆp l¹i kh¾p hÖ gen. ADN tiÓu vÖ tinh lµ c¸c ®o¹n tr×nh tù lÆp l¹i kÕ tiÕp
nhau víi ®¬n vÞ lÆp l¹i cã kÝch th−íc ng¾n (d−íi 13 bp). C¸c tr×nh tù ADN tiÓu vÖ tinh phæ
biÕn nhÊt cã ®¬n vÞ lÆp l¹i gåm hai nucleotide (vÝ dô, CACACACACACA). Nh÷ng ®o¹n lÆp
l¹i nµy xuÊt hiÖn do nh÷ng sai sãt trong qu¸ tr×nh sao chÐp ADN vµ chiÕm kho¶ng 3% hÖ
gen. Nh÷ng “®o¹n tr×nh tù lÆp l¹i kh¾p hÖ gen” cã kÝch th−íc lín h¬n nhiÒu c¸c ADN tiÓu
vÖ tinh. Mçi ®¬n vÞ lÆp l¹i cña chóng th−êng lín h¬n 100 bp, thËm chÝ h¬n 1 kb. Nh÷ng
tr×nh tù nµy cã thÓ tån t¹i ®éc lËp nh−ng ph©n t¸n kh¾p hÖ gen, hoÆc kÕt côm thµnh tõng
nhãm xen kÏ gi÷a c¸c tr×nh tù ®Öm. Cã thÓ ph©n chóng thµnh nhiÒu lo¹i tr×nh tù kh¸c
nhau, song cã ®Æc ®iÓm chung lµ chóng ®Òu cã thÓ lµ c¸c yÕu tè di truyÒn vËn ®éng (xem
ch−¬ng 6). C¸c yÕu tè di truyÒn vËn ®éng (kÝ hiÖu TE) lµ c¸c ®o¹n tr×nh tù cã thÓ vËn ®éng
tõ vÞ trÝ nµy sang vÞ trÝ kh¸c trong hÖ gen. Th−êng th× khi vËn ®éng, c¸c yÕu tè TE ®Ó l¹i
b¶n sao gèc ë vÞ trÝ cò (nhê vËy, nã ®−îc nh©n lªn vµ tÝch lòy thµnh nhiÒu b¶n sao kh¾p hÖ
gen). Sù vËn ®éng cña c¸c yÕu tè TE trong hÖ gen ng−êi lµ sù kiÖn hiÕm x¶y ra. Tuy vËy,
tr¶i qua hµng triÖu n¨m tiÕn hãa, c¸c yÕu tè nµy ®· tù nh©n lªn vµ duy tr× hiÖu qu¶ tíi møc
hiÖn nay chóng chiÕm tíi 44% hÖ gen ng−êi.

B¶n chÊt cña c¸c tr×nh tù liªn gen ë c¸c sinh vËt kh¸c còng cã c¸c ®Æc ®iÓm chung
gièng víi ng−êi. ë nh÷ng loµi thùc vËt cã hÖ gen lín (nh− ng«), tû lÖ c¸c yÕu tè TE cßn cao
h¬n. Ngay c¸c hÖ gen nhá (nh− E. coli vµ S. cerevisiae) còng cã c¸c yÕu tè TE. Sù kh¸c biÖt
chØ ë chç, nh÷ng yÕu tè nµy cã sè l−îng b¶n sao trong hÖ gen thÊp h¬n. MÆc dï cã xu
h−íng coi c¸c tr×nh tù ADN lÆp l¹i lµ c¸c tr×nh tù ADN “Ýt gi¸ trÞ”, song viÖc chóng ®−îc duy
tr× æn ®Þnh qua hµng triÖu n¨m tiÕn hãa th× cã thÓ dù ®o¸n r»ng c¸c tr×nh tù ADN liªn gen
ph¶i cã mét ý nghÜa (hoÆc −u thÕ chän läc) nµo ®ã ®èi víi sinh vËt.

7.2. Sù nh©n ®«i vµ ph©n ly cña c¸c nhiÔm s¾c thÓ

7.2.1. T©m ®éng, ®Çu mót vµ c¸c ®iÓm khëi ®Çu sao chÐp cÇn thiÕt ®Ó duy tr× c¸c
nhiÔm s¾c thÓ trong qu¸ tr×nh ph©n bµo ë eukaryote

Trªn mçi NST cña eukaryote, c¸c ®iÓm khëi ®Çu sao chÐp c¸ch nhau kho¶ng 30 - 40
kb. Th−êng th× c¸c ®iÓm khëi ®Çu sao chÐp ®−îc t×m thÊy trong c¸c vïng tr×nh tù kh«ng
m· ho¸. C¸c NST ë prokaryote th−êng chØ cã mét ®iÓm khëi ®Çu sao chÐp duy nhÊt. T©m
®éng cÇn cho sù ph©n ly chÝnh x¸c c¸c nhiÔm s¾c tö vÒ hai tÕ bµo con trong qu¸ tr×nh ph©n
bµo. T©m ®éng ®iÒu khiÓn sù h×nh thµnh phøc hÖ nucleoprotein ®−îc gäi lµ thÓ ®éng. ThÓ
®éng t−¬ng t¸c víi bé m¸y ph©n chia tÕ bµo ®Ó ®Èy c¸c nhiÔm s¾c tö t¸ch khái nhau vÒ hai tÕ
bµo con. Mçi NST b×nh th−êng chØ cã mét t©m ®éng. NÕu kh«ng cã t©m ®éng, c¸c NST
ph©n ly ngÉu nhiªn, dÉn ®Õn mÊt hoÆc lÆp ®o¹n NST. NÕu cã nhiÒu t©m ®éng, NST cã thÓ
®ång thêi bÞ kÐo vÒ hai phÝa, dÉn ®Õn ®øt g·y (h×nh 7.4). T©m ®éng cã kÝch th−íc rÊt kh¸c
nhau, tõ d−íi 200 bp nh− ë S. serevisiae, hoÆc lín h¬n (®Õn vµi Mb) ë phÇn lín c¸c
eukaryote kh¸c vµ th−êng gåm c¸c ®o¹n ADN lÆp l¹i (h×nh 7.5).

228

Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

a) NST cã mét t©m ®éng

Mçi nhiÔm s¾c tö ph©n ly vÒ mét tÕ bµo con

b) NST kh«ng cã t©m ®éng

Sù ph©n ly ngÉu nhiªn cña nhiÔm s¾c thÓ

c) NST cã hai t©m ®éng

Sù ®øt g·y NST x¶y ra do cã nhiÒu h¬n mét t©m ®éng

H×nh 7.4. Vai trß cña t©m ®éng trong sù ph©n ly nhiÔm s¾c thÓ (NST) vÒ c¸c tÕ bµo con trong qu¸
tr×nh ph©n bµo. a) Mçi NST trong cÆp t−¬ng ®ång cã mét t©m ®éng ph©n ly vÒ mét tÕ bµo con trong qu¸
tr×nh ph©n bµo; b) Sù ph©n ly ngÉu nhiªn cña NST kh«ng cã t©m ®éng dÉn ®Õn mÊt NST; c) Cã nhiÒu t©m
®éng dÉn ®Õn sù ®øt g·y cña NST sau qu¸ tr×nh ph©n bµo.

125 bp

I II III

a) S. cerevisiae

b) S. pombe cen1

40 - 100 Kb

c) D. melanogaster

~ 400 Kb

d) H. sapiens

Tõ 240 Kb ®Õn vµi Mb

H×nh 7.5. KÝch th−íc vµ cÊu tróc t©m ®éng cña mét sè loµi. T©m ®éng ë S. cerevisiae cã kÝch th−íc
nhá vµ kh«ng cã tr×nh tù lÆp l¹i. Ng−îc l¹i, t©m ®éng ë phÇn lín c¸c loµi kh¸c (nh− S. pombe,
D. melanogaster vµ ng−êi) cã kÝch th−íc lín h¬n nhiÒu vµ mang nhiÒu tr×nh tù lÆp l¹i, trõ mét ®o¹n ng¾n
(4 – 7 kb) ë gi÷a t©m ®éng – cen 1 - cña S. pombe kh«ng cã tr×nh tù lÆp l¹i.

229

§ç Lª Th¨ng - §inh §oµn Long

Gièng c¸c ®iÓm khëi ®Çu sao Vïng T - loop YÕu tè liªn kÕt tr×nh tù
chÐp vµ t©m ®éng, c¸c ®Çu mót cña a)
lÆp l¹i ®Çu mót NST
NST còng ®−îc g¾n kÕt bëi nhiÒu

protein. C¸c protein ë ®Çu mót Vïng D - loop

thùc hiÖn hai chøc n¨ng quan

träng. Thø nhÊt, c¸c protein nµy 5’
3’
ph©n biÖt c¸c ®Çu mót thùc sù cña §o¹n m¹ch Sù b¾t cÆp gi÷a 2
NST víi c¸c ®o¹n ®øt g·y kh¸c trªn Sù b¾t cÆp gi÷a 2 ®¬n ®Çu 3’ ®o¹n ADN sîi kÐp
cïng NST hoÆc tõ c¸c NST kh¸c ®o¹n ADN sîi kÐp

trong tÕ bµo. Th«ng th−êng, ADN ë b)
®Çu mót cã tÇn sè t¸i tæ hîp cao vµ 5’
dÔ bÞ ph©n gi¶i. C¸c protein g¾n 3’
kÕt víi chóng t¹o nªn cÊu tróc
chèng l¹i c¸c sù kiÖn trªn. Thø hai, H×nh 7.6. CÊu tróc ®Çu mót nhiÔm s¾c thÓ ®iÓn h×nh ë
®Çu mót ho¹t ®éng nh− ®iÓm khëi eukaryote. a) CÊu tróc “thßng läng” ë ®Çu mót NST víi ®Çu 3’
cña m¹ch ®¬n cã thÓ dµi hµng tr¨m nucleotide. b) tr×nh tù ®¬n vÞ
®Çu sao chÐp ®−îc biÖt ho¸, cho
phÐp tÕ bµo sao chÐp ®−îc phÇn lÆp l¹i ë ®Çu mót NST ë ng−êi lµ 5’- [TTAGGG]n - 3’.
®Çu mót nµy. Chóng ta ®· biÕt, bé

m¸y sao chÐp ADN th«ng th−êng kh«ng thÓ sao chÐp hoµn chØnh c¸c ®Çu mót cña NST

m¹ch th¼ng. Qu¸ tr×nh sao chÐp “bï” phÇn ®Çu mót ®−îc thùc hiÖn bëi enzym

telomerase. Kh«ng nh− c¸c phÇn kh¸c cña NST, phÇn quan träng cña ®Çu mót NST chØ ë

tr¹ng th¸i m¹ch ®¬n (h×nh 7.6). HÇu hÕt c¸c ®Çu mót cã tr×nh tù lÆp l¹i ®¬n gi¶n nh−ng

kh¸c nhau ë c¸c loµi kh¸c nhau. Tr×nh tù lÆp l¹i nµy th−êng ng¾n, giµu TC. VÝ dô, ®Çu mót

NST ë ng−êi cã ®¬n vÞ tr×nh tù lÆp l¹i lµ 5’-TTAGGG-3’.

7.2.2. Sù sao chÐp vµ ph©n ly Pha G1 Pha Pha
nhiÔm s¾c thÓ trong chu Pha S Pha M G1
tr×nh tÕ bµo G2
Pha G2
H×nh 7.7 tãm t¾t 4 pha (giai Pha M Pha S G0
®o¹n) c¬ b¶n cña chu tr×nh tÕ bµo. (sao chÐp
Trong qu¸ tr×nh ph©n bµo (pha M),
c¸c NST ph¶i ®−îc nh©n ®«i vµ ADN)

ph©n ly vÒ c¸c tÕ bµo con. ë vi H×nh 7.7. Chu tr×nh tÕ bµo ë
khuÈn, sù nh©n ®«i vµ ph©n li eukaryote. Bèn giai ®o¹n (pha) cña
NST diÔn ra ®ång thêi. Qu¸ tr×nh chu tr×nh tÕ bµo: NST ®−îc sao chÐp
nµy ®−îc ®iÒu hoµ chÆt chÏ, nh−ng ë pha S vµ ph©n ly vÒ c¸c tÕ bµo con
c¬ chÕ ®iÒu hßa chi tiÕt ch−a ®−îc ë pha M. Pha G1 vµ G2 lµ c¸c giai
®o¹n tÕ bµo chuÈn bÞ cho hai sù kiÖn
biÕt ®Çy ®ñ. ë eukaryote, hai qu¸ trªn. G0 lµ khi tÕ bµo chuyÓn sang
tr×nh nµy diÔn ra t¸ch biÖt ë c¸c tr¹ng th¸i biÖt hãa vµ kh«ng tiÕp tôc
pha kh¸c nhau cña chu tr×nh tÕ
bµo. ADN ®−îc tæng hîp ë pha S ph©n chia.
dÉn ®Õn sù nh©n ®«i NST. Mçi NST
cña cÆp NST nh©n ®«i ®−îc gäi lµ
mét nhiÔm s¾c tö vµ hai nhiÔm
s¾c tö ®ã ®−îc gäi lµ hai nhiÔm s¾c
tö chÞ em. Hai nhiÔm s¾c tö chÞ
em kÕt dÝnh víi nhau nhê mét
nhãm ph©n tö gäi lµ cohesin vµ
duy tr× sù kÕt dÝnh cho ®Õn khi
ph©n ly ë pha M.

230

Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

Qu¸ tr×nh ph©n ly a) C¸c sù kiÖn chÝnh x¶y ra trong pha S
NST diÔn ra ë pha M (hay
nguyªn ph©n) cña chu Ph©n tö Cohesin 2 m¹ch
ADN sîi kÐp ®¬n ADN

tr×nh tÕ bµo. Cã hai sù kiÖn

chÝnh liªn quan ®Õn sù

ph©n ly NST (h×nh 7.8).

Sù kiÖn thø nhÊt lµ cÆp Sù khëi ®Çu Sao chÐp kÐo dµi vµ
nhiÔm s¾c tö chÞ em g¾n víi sao chÐp ADN h×nh thµnh cohesin

thoi v« s¾c (thoi ph©n

bµo). Thoi v« s¾c ®−îc cÊu

t¹o tõ c¸c sîi protein dµi

d¹ng vi èng. Mét ®Çu cña

vi èng g¾n víi mét trong

hai trung t©m tæ chøc vi b) C¸c sù kiÖn chÝnh x¶y ra trong pha M NhiÔm s¾c tö chÞ em
èng (cßn ®−îc gäi lµ trung Cohesin
tö ë ®éng vËt hay thÓ cùc

cña thoi v« s¾c ë nÊm ThÓ ®éng

men vµ c¸c nÊm kh¸c) ë hai Thoi

cùc ®èi diÖn cña tÕ bµo. Sù ph©n bµo

g¾n kÕt c¸c nhiÔm s¾c tö víi Ph©n gi¶i

thoi v« s¾c ®−îc thùc hiÖn cohesin

nhê thÓ ®éng t¹i t©m ®éng. Trung t©m tæ
chøc vi èng
Thø hai lµ sù gi¶i kÕt dÝnh
c¸c nhiÔm s¾c tö dÉn ®Õn (trung tö)

mét sù kiÖn quan träng thø H×nh 7.8. C¸c sù kiÖn chÝnh x¶y ra trong pha S vµ pha M. a) Pha S:
ba lµ sù ph©n ly cña c¸c §Çu tiªn, ph©n tö ADN sîi kÐp nh©n ®«i; ngay sau ®ã, protein yÕu tè

nhiÔm s¾c tö. Theo ®ã, g¾n cohesin cã cÊu tróc d¹ng vßng quÊn quanh hai ph©n tö ADN võa
®−îc nh©n ®«i h×nh thµnh nªn phøc hÖ gåm hai nhiÔm s¾c tö chÞ em.
mçi nhiÔm s¾c tö chÞ em b) Pha M: §Çu tiªn, thÓ ®éng g¾n vµo thoi v« s¾c; sau ®ã lµ sù gi¶i kÕt
®−îc kÐo vÒ c¸c cùc ®èi diÖn dÝnh cña cohesin vµ sù ph©n ly c¸c nhiÔm s¾c tö vÒ hai cùc tÕ bµo.
cña thoi v« s¾c. C¸c sù kiÖn

trªn ®−îc ®iÒu hoµ chÆt chÏ ®Ó sù ph©n ly NST diÔn ra chÝnh x¸c vµ hoµn h¶o.

7.2.3. CÊu tróc nhiÔm s¾c thÓ thay ®æi khi tÕ bµo eukaryote ph©n chia

Qua c¸c pha cña chu tr×nh tÕ bµo, cÊu tróc NST thay ®æi liªn tôc. Tuy nhiªn, cã hai
tr¹ng th¸i chÝnh ®Æc tr−ng cho cÊu tróc cña NST. Khi tÕ bµo nguyªn ph©n hoÆc gi¶m ph©n,
c¸c NST tr¶i qua qu¸ tr×nh kÕt ®Æc, t¹o ra c¸c NST xo¾n chÆt ®Ó qu¸ tr×nh ph©n ly NST

trong ph©n bµo diÔn ra thuËn lîi. ë giai ®o¹n gian k× (k× trung gian) gi÷a hai chu tr×nh tÕ
bµo kÕ tiÕp (gåm 3 pha G1, S vµ G2), NST gi·n xo¾n ®Ó sao chÐp vµ phiªn m·.

7.2.4. Sù kÕt dÝnh c¸c nhiÔm s¾c tö vµ kÕt ®Æc nhiÔm s¾c thÓ do c¸c protein duy tr×
cÊu tróc nhiÔm s¾c thÓ (SMC) thùc hiÖn

C¸c phøc hÖ protein thùc hiÖn sù kÕt dÝnh nhiÔm s¾c tö vµ kÕt ®Æc NST cã quan hÖ
víi nhau, chóng ®Òu chøa c¸c protein SMC (structural maintanance of chromosome). C¸c
protein SMC ë d¹ng phøc, t−¬ng t¸c “më réng” víi nhau th«ng qua c¸c miÒn xo¾n-xo¾n
kÝch th−íc dµi (xem thªm ch−¬ng 1). C¸c protein SMC kÕt hîp víi c¸c protein kh¸c t¹o
thµnh phøc hÖ kÕt dÝnh hai chuçi ADN víi nhau. Mét phøc hÖ chøa SMC (®−îc gäi lµ
cohesin) lµ thiÕt yÕu ®Ó g¾n kÕt hai nhiÔm s¾c tö chÞ em víi nhau. VÒ cÊu tróc, ng−êi ta
cho r»ng, cohesin lµ mét vßng lín ®−îc cÊu t¹o tõ hai ph©n tö protein SMC vµ mét protein
phi-SMC. Mét sè b»ng chøng cho thÊy, sù kÕt dÝnh hai nhiÔm s¾c tö chÞ em lµ nhê hai
ph©n tö ADN nµy cïng “chui” qua trung t©m vßng cohesin (h×nh 7.9). Sù ph©n gi¶i tiÓu

231

§ç Lª Th¨ng - §inh §oµn Long

phÇn protein phi-SMC nhê enzym sÏ më vßng cohesin. Sù kÕt ®Æc NST còng cÇn phøc hÖ
chøa protein SMC ®−îc gäi lµ condensin. Dï cÊu tróc vµ chøc n¨ng cña condensin cßn
ch−a râ, nh−ng cã lÏ nã cã ®Æc ®iÓm gièng cohesin vµ còng cã d¹ng vßng. Nhê cÊu tróc d¹ng
vßng, nã cã thÓ gióp co ng¾n (gi¶m chiÒu dµi) NST b»ng c¸ch ®ång thêi liªn kÕt víi c¸c
vïng kh¸c nhau cña NST.

ChÊt nhiÔm s¾c Cohesin

Codensin

Kú ®Çu Kú gi÷a Kú sau

H×nh 7.9. M« h×nh dù ®o¸n vÒ vai trß cña cohesin vµ codensin trong qu¸ tr×nh ph©n bµo. Cohesin vµ
codensin lµ thµnh phÇn cña bé khung tÕ bµo. M« h×nh nµy cho r»ng chóng cã cÊu tróc vßng. Nhê vËy, cohesin
vµ codensin cã thÓ liªn kÕt chÆt nh−ng vÉn linh ho¹t ®ång thêi víi c¸c vïng kh¸c nhau cña nhiÔm s¾c thÓ.

7.3. CÊu tróc vµ vai trß cña nucleosome (thÓ nh©n)

7.3.1. Nucleosome lµ ®¬n vÞ cÊu tróc c¬ b¶n cña nhiÔm s¾c thÓ ë eukaryote

ADN cña c¸c eukaryote ®−îc bao B¶ng 7.4. MËt ®é nucleosome vµ chiÒu dµi trung
gãi thµnh c¸c nucleosome (cßn ®−îc gäi b×nh c¸c ®o¹n ADN nèi ë mét sè loµi sinh vËt
lµ thÓ nh©n). §©y chÝnh lµ møc cuén
xo¾n ®Çu tiªn cña ADN ®Ó t¹o thµnh Loµi MËt ®é nucleosome §é dµi trung
theo chiÒu dµi lÆp b×nh ®o¹n
NST. Nucleosome gåm phÇn lâi h×nh l¹i trªn ADN (bp) ADN nèi (bp)
thµnh nªn tõ 8 ph©n tö protein histon
vµ ADN bao quanh chóng. ë mäi loµi NÊm men 160 - 165 13 -18

eukaryote, ®o¹n ADN quÊn quanh lâi NhÝm biÓn ~ 260 ~ 110

protein (kho¶ng 1,65 vßng) ®−îc gäi lµ Ruåi giÊm ~ 180 ~ 33
ADN lâi lu«n cã chiÒu dµi æn ®Þnh gåm
147 cÆp baz¬ nit¬ (h×nh 7.10). Ng−îc l¹i, Ng−êi 185 - 200 38 - 53

®o¹n ADN nèi gi÷a c¸c nucleosome, ®−îc Nucleosome
gäi lµ ADN nèi cã chiÒu dµi bÊt ®Þnh,

th−êng dao ®éng tõ 20 - 60 cÆp baz¬ nit¬

vµ cã gi¸ trÞ trung b×nh ®Æc tr−ng cho mçi Lâi Histon ADN lâi
loµi eukaryote (b¶ng 7.4). CÊu tróc (147 bp)

nucleosome lµm cho chiÒu dµi ph©n tö

ADN gi¶m ®i kho¶ng s¸u lÇn. Tuy møc

®é “nÐn” nh− vËy ch−a thËt cao nh−ng

nucleosome cßn cã vai trß quyÕt ®Þnh ë

c¸c møc cÊu tróc tiÕp theo cña NST. ADN nèi

ë mäi tÕ bµo ®Òu cã mét phÇn ADN (20 - 60 bp)

kh«ng ®−îc bao gãi trong nucleosome. §ã lµ H×nh 7.10. S¬ ®å tæ chøc nucleosome

nh÷ng vïng ADN tham gia vµo qu¸ tr×nh (nucleosome)

biÓu hiÖn gen, sao chÐp hoÆc t¸i tæ hîp. Tuy kh«ng n»m trong cÊu tróc nucleosome nh−ng

nh÷ng vïng nµy th−êng liªn kÕt víi c¸c protein phi histon lµm nhiÖm vô ®iÒu hoµ trùc tiÕp

hoÆc tham gia vµo c¸c sù kiÖn ®ã.

232

Ch−¬ng 7. C¬ së di truyÒn häc nhiÔm s¾c thÓ

Cã thÓ nãi, ë eukaryote, histon lµ nhãm protein liªn kÕt ADN phæ biÕn nhÊt. Cã n¨m
lo¹i histon lµ H1, H2A, H2B, H3 vµ H4. Trong ®ã, bèn lo¹i H2A, H2B, H3 vµ H4 cÊu t¹o
nªn lâi nucleosome, ®−îc gäi lµ c¸c histon lâi; mçi nucleosome gåm 8 ph©n tö histon
(octamer), mçi lo¹i ®ãng gãp 2 ph©n tö. Cßn mét ph©n tö histon H1 liªn kÕt vµo vïng ADN
nèi; v× vËy nã ®−îc gäi lµ histon nèi. Víi ®Æc ®iÓm nh− vËy, trong tÕ bµo c¸c histon lâi cã
mÆt víi sè l−îng b»ng nhau, cßn H1 chØ cã víi sè l−îng b»ng mét nöa so víi c¸c lo¹i histon
kh¸c. C¸c histon chøa nhiÒu axit amin tÝch ®iÖn d−¬ng, nªn nã cã thÓ liªn kÕt æn ®Þnh víi
ph©n tö ADN tÝch ®iÖn ©m. Kho¶ng h¬n 20% sè axit amin cña c¸c histon lµ Lys vµ Arg.
C¸c protein lâi lµ nh÷ng protein nhá, khèi l−îng dao ®éng kho¶ng 11 - 15 kD trong khi
histon H1 cã khèi l−îng kho¶ng 20 kDa (b¶ng 7.5).

B¶ng 7.5. C¸c ®Æc ®iÓm c¬ b¶n cña c¸c protein histon

Lo¹i histon Histon Khèi l−îng l−îng ph©n tö (Da) TØ lÖ lysine vµ arginine
Histon lâi
H2A 14.000 20%
Histon nèi H2B 13.900 22%
H3 15.400 23%
H4 11.400 24%

H1 20.000 32%

Lâi nucleosome cã cÊu a) §u«i Histon (®Çu N) MiÒn gÊp nÕp histon
tróc h×nh ®Üa vµ chØ h×nh

thµnh khi liªn kÕt víi ADN. H2A N C
Khi kh«ng liªn kÕt víi

ADN, c¸c histon h×nh thµnh H2B N C
c¸c tËp hîp ë møc thÊp h¬n C
(nh− c¸c phøc kÐp). Mäi H3 N

histon lâi ®Òu chøa mét H4 N C
vïng cã tÝnh b¶o thñ cao

®−îc gäi lµ miÒn gÊp nÕp b) “PhøckÐp”H2A-H2B “Tø phøc” H3-H4

histon (h×nh 7.11a). MiÒn C H2A N H3 N
nµy gåm ba chuçi xo¾n α,

c¸ch nhau b»ng hai ®o¹n H2B

nèi kh«ng ®Æc tr−ng. Sù gÊp

nÕp gi÷a c¸c cÆp histon t¹o N N
nªn c¸c “dÞ phøc kÐp” NN
(heterodimer), cã phÇn ®Çu

C vµ ®u«i N kh¸c nhau. H3 H4

vµ H4 t¹o thµnh “dÞ phøc H×nh 7.11. CÊu tróc vµ sù t¹o phøc kÐp cña c¸c histon lâi. a) S¬ ®å
kÐp H3 – H4”, råi hai “dÞ duçi th¼ng cña bèn histon lâi. Vïng xo¾n α ®−îc thÓ hiÖn b»ng h×nh èng
phøc kÐp” nh− vËy kÕt hîp (®Ó ý r»ng, liÒn kÒ víi vïng cã cÊu tróc xo¾n α gièng nhau, c¸c histon cßn
víi nhau t¹o nªn “tø phøc” cã mét vïng xo¾n α bæ sung). b) C¸c d¹ng phøc kÐp cña histon lâi.
(tetramer). Trong khi ®ã,

H2A vµ H2B còng kÕt hîp víi nhau t¹o nªn “dÞ phøc kÐp H2A - H2B”, nh−ng kh«ng t¹o

thµnh “tø phøc”.

C¸c phøc kÐp nªu trªn kÕt hîp víi nhau vµ víi ADN theo mét trËt tù nhÊt ®Þnh ®Ó

t¹o thµnh nucleosome. Theo ®ã, tr−íc tiªn “tø phøc H3 - H4” g¾n kÕt vµo ADN, råi c¸c
“phøc kÐp H2A-H2B” míi kÕt hîp vµo ®Ó t¹o nªn nucleosome hoµn chØnh.

§u«i N cña histon (gäi t¾t lµ ®u«i histon) cã cÊu tróc dÔ biÕn ®æi vµ trong dung dÞch
nã lµ phÇn thuéc nucleosome dÔ tiÕp cËn nhÊt. Kh¶ n¨ng tiÕp cËn nµy cã thÓ nhËn thÊy dÔ

233


Click to View FlipBook Version