§inh §oµn Long
mang mét b¶n sao duy nhÊt. Thuéc tÝnh nµy gióp cho c¸c tÕ bµo biÕn n¹p vµ dßng tÕ bµo
do chóng sinh ra (do ph©n chia trùc ph©n) chØ mang mét vect¬ ADN t¸i tæ hîp duy nhÊt
vµ gióp c¸c nhµ nghiªn cøu cã thÓ ph©n lËp vµ tinh s¹ch ®−îc dÔ dµng c¸c gen hoÆc s¶n
phÈm cña c¸c gen mét c¸ch riªng rÏ tõ hçn hîp biÕn n¹p vèn chøa nhiÒu ®o¹n tr×nh tù
ADN kh¸c nhau.
11.2.6.4. ThiÕt lËp ng©n hµng hÖ gen vµ th− viÖn cADN
Víi c¸c hÖ gen nhá, chiÕn l−îc nh©n dßng th−êng t−¬ng ®èi ®¬n gi¶n. Ch¼ng h¹n
nh− hÖ gen virut cã kÝch th−íc kho¶ng 10 kb, ng−êi ta cã thÓ trùc tiÕp tinh s¹ch ADN, c¾t
chóng b»ng enzym giíi h¹n råi tiÕn hµnh ®iÖn di. C¸c ph©n ®o¹n ADN ph©n t¸ch trªn gel
®iÖn di ®−îc th«i khái gel, tinh s¹ch råi cµi vµo vect¬ nh©n dßng.
Tuy nhiªn, víi c¸c hÖ gen lín, nh− hÖ gen ng−êi, viÖc c¾t ADN tæng sè b»ng enzym
giíi h¹n råi ph©n t¸ch b»ng ®iÖn di chØ dÉn ®Õn sù h×nh thµnh mét d¶i b¨ng ®iÖn di dµi
liªn tôc däc b¶n gel (c¸c b¨ng kh«ng ph©n t¸ch) v× sè ®o¹n c¾t qu¸ lín vµ chóng lµ mét
chuçi c¸c ®o¹n ADN chØ kh¸c nhau vµi nucleotide. Trong chiÕn l−îc nh©n dßng nh÷ng hÖ
gen lín nh− vËy, ng−êi ta cµi toµn bé c¸c ®o¹n ADN cña hÖ gen (sau khi ®· c¾t b»ng
enzym giíi h¹n) vµo vect¬ nh©n dßng råi biÕn n¹p c¸c vect¬ t¸i tæ hîp vµo tÕ bµo chñ (ë ®ã
vect¬ cã kh¶ n¨ng tù sao chÐp) mµ kh«ng qua ®iÖn di. TËp hîp c¸c dßng tÕ bµo mang
vect¬ t¸i tæ hîp chøa c¸c ®o¹n ADN kh¸c nhau cña mét hÖ gen nh− vËy ®−îc gäi lµ ng©n
hµng hÖ gen.
§Ó thiÕt lËp ng©n hµng hÖ gen, ADN tæng sè cña tÕ bµo ®Ých (vÝ dô: tõ ng−êi) ®−îc
c¾t b»ng enzym giíi h¹n ®Ó t¹o nªn c¸c ®o¹n cã kÝch th−íc trung b×nh dao ®éng tõ 100 bp
®Õn 1 Mb. C¸c ®o¹n ADN sau ®ã ®−îc cµi vµo vect¬ phï hîp nhê ADN ligase. KÕt qu¶ cña
b−íc nµy lµ t¹o ra mét tËp hîp cña c¸c vect¬ mang c¸c ®o¹n ADN cµi kh¸c nhau.
Ng©n hµng hÖ gen ®−îc t¹o ra nhê sö dông enzym giíi h¹n vµ c¸c vect¬ nh©n dßng
cã øng dông râ rÖt nhÊt lµ nh»m gi¶i tr×nh tù c¸c hÖ gen lín. Dù ¸n gi¶i m· hÖ gen ng−êi
(hoµn thµnh vµo n¨m 2006 võa qua) còng ®−îc thùc hiÖn theo chiÕn l−îc nµy. Tuy nhiªn,
c¸c ®o¹n cµi ADN trong c¸c dßng tÕ bµo thuéc ng©n hµng hÖ gen cña eukaryote th−êng
kh«ng ph¶i lµ c¸c ®o¹n tr×nh tù m· hãa, bëi v× chóng ®−îc c¾t ngÉu nhiªn bëi c¸c enzym
giíi h¹n trong khi phÇn lín hÖ gen lµ c¸c tr×nh tù kh«ng m· hãa.
ThÕ nªn, ®Ó t¹o ra c¸c dßng tÕ bµo mang c¸c ®o¹n ADN cµi t−¬ng øng víi c¸c tr×nh
tù m· hãa protein, ng−êi ta thiÕt lËp mét d¹ng ng©n hµng hÖ gen kh¸c gäi lµ th− viÖn
cADN. §Ó thiÕt lËp th− viÖn cADN, trong b−íc ®Çu tiªn thay v× b¾t ®Çu tõ ADN, ng−êi
ta tiÕn hµnh phiªn m· ng−îc mARN thµnh cADN. §¸ng l−u ý lµ cADN t−¬ng øng ®óng
víi tr×nh tù m· hãa cña protein (ngoµi mét sè tr×nh tù xu«i dßng vµ ng−îc dßng tham gia
vµo qu¸ tr×nh dÞch m·). Ph¶n øng phiªn m· ng−îc ®−îc thùc hiÖn nhê reverse
transcriptase. Enzym nµy cã kh¶ n¨ng tæng hîp ADN dùa trªn m¹ch khu«n lµ ARN.
Khi cã mÆt reverse transcriptase, mARN ®−îc phiªn m· ng−îc thµnh c¸c ph©n tö ADN
sîi kÐp; nh÷ng ph©n tö nµy sau ®ã ®−îc g¾n vµo c¸c vect¬ råi biÕn n¹p vµo c¸c tÕ bµo chñ
lµm nhiÖm vô nh©n dßng. Víi tr×nh tù xuÊt ph¸t lµ mARN, cã thÓ nhËn thÊy, kh¸c víi
ng©n hµng hÖ gen, mét c¬ thÓ sinh vËt cã thÓ cho ra nhiÒu th− viÖn cADN kh¸c nhau, bëi
v× mçi m« trong c¬ thÓ ph¶n ¸nh mét tËp hîp c¸c gen ®−îc biÓu hiÖn kh¸c nhau nªn sÏ cã
mét tËp hîp c¸c mARN kh¸c nhau (trong khi ng©n hµng hÖ gen dï ®−îc t¹o ra tõ lo¹i m«
hoÆc tÕ bµo nµo cña cïng mét c¬ thÓ ®Òu gièng nhau). B¶ng 11.1 nªu mét sè ®Æc ®iÓm
kh¸c biÖt c¬ b¶n gi÷a “ng©n hµng hÖ gen” vµ “th− viÖn cADN”.
MÆc dï, trong gi¸o tr×nh nµy, cã sù ph©n biÖt khi dïng thuËt ng÷ “ng©n hµng” vµ
“th− viÖn”; trong ®ã “ng©n hµng” chØ tËp hîp ®Çy ®ñ tr×nh tù ADN cña mét hÖ gen, cßn
“th− viÖn” chØ ®¹i diÖn cho c¸c tr×nh tù ADN m· hãa cho c¸c protein ®−îc biÓu hiÖn t¹i
mét m« nhÊt ®Þnh. Nh−ng, trong thùc tÕ hai thuËt ng÷ nµy ®«i khi ®−îc dïng ®ång
334
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
nghÜa, thÕ nªn “ng©n hµng hÖ gen” cã khi ®−îc gäi lµ “th− viÖn hÖ gen” vµ ng−îc l¹i.
ThuËt ng÷ “ng©n hµng gen” ®−îc dïng chung ®Ó chØ c¶ hai lo¹i “ng©n hµng hÖ gen” vµ
“th− viÖn cADN”.
Còng gièng nh− c¸c tÕ bµo trong ng©n hµng hÖ gen, mçi tÕ bµo biÕn n¹p trong th−
viÖn cADN th−êng chØ mang duy nhÊt mét vect¬ chøa ®o¹n ADN cµi. V× vËy, sau khi c¸c
tÕ bµo nh©n lªn, chóng sÏ t¹o ra nhiÒu dßng tÕ bµo, mçi dßng chøa b¶n sao cña mét
cADN m· hãa t−¬ng øng cho mét protein. ViÖc cÇn lµm sau khi ®· x©y dùng ®−îc ng©n
hµng hÖ gen vµ th− viÖn cADN lµ x¸c ®Þnh dßng tÕ bµo nµo mang ®o¹n ADN ®−îc quan
t©m nghiªn cøu.
B¶ng 11.1. Mét sè ®Æc ®iÓm kh¸c biÖt gi÷a ng©n hµng hÖ gen vµ th− viÖn cADN
Ng©n hµng hÖ gen
1. Cã mÆt ®Çy ®ñ tÊt c¶ c¸c tr×nh tù ADN trong tÕ bµo.
2. C¸c ®o¹n ADN cã tr×nh tù nucleotide gièng hÖ gen cña tÕ bµo trong tù nhiªn, gåm c¶ c¸c tr×nh tù ADN
kh«ng m· hãa cña hÖ gen (vÝ dô: c¸c ®o¹n tr×nh tù liªn gen, ADN ®Öm, intron).
3. ë eukaryote, ngoµi c¸c tr×nh tù m· hãa, phÇn lín c¸c tr×nh tù ADN trong ng©n hµng lµ c¸c tr×nh tù kh«ng
m· hãa, gåm nhiÒu ®o¹n tr×nh tù lÆp l¹i, c¸c tr×nh tù liªn gen, c¸c tr×nh tù ®iÒu hßa ho¹t ®«ng gen, ...
4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi nhiÒu.
Th− viÖn cADN
1. ChØ lµ tËp hîp mét phÇn c¸c tr×nh tù ADN cña hÖ gen.
2. cADN ph¶n ¸nh tr×nh tù b¶n phiªn m· mARN hoµn thiÖn cña gen, kh«ng ph¶i lµ tr×nh tù ADN ®Çy ®ñ cña
gen trªn NST.
3. C¸c protein ®−îc m· hãa bëi cADN cã thÓ ®−îc tæng hîp (dÞch m·) trong mét tÕ bµo chñ mµ ë ®ã kh«ng
cÇn cã bé m¸y hoµn thiÖn ph©n tö mARN (bëi c¸c intron ®· ®−îc c¾t bá).
4. Sè l−îng c¸c dßng tÕ bµo mang c¸c ®o¹n cµi Ýt.
11.2.6.5. Sö dông mÉu dß ®Ó x¸c ®Þnh c¸c dßng tÕ bµo trong ng©n hµng gen
§Ó x¸c ®Þnh dßng tÕ bµo nµo trong ng©n hµng gen mang ®o¹n ADN ®−îc quan t©m
nghiªn cøu (vÝ dô ë ®©y lµ ng©n hµng sö dông vect¬ plasmid), ng−êi ta tiÕn hµnh lai mÉu
dß (nguyªn t¾c ®−îc nªu ë môc 11.2.5) víi c¸c khuÈn l¹c cña c¸c dßng vi khuÈn tõ ng©n
hµng gen. Kü thuËt nµy ®−îc gäi lµ ph−¬ng ph¸p lai khuÈn l¹c.
Mét th− viÖn cADN ®iÓn h×nh chøa Ýt nhÊt hµng ngµn dßng vi khuÈn kh¸c nhau,
mçi dßng mang mét ®o¹n cµi cADN ®Æc tr−ng. Sau khi vect¬ ®−îc biÕn n¹p vµo vi khuÈn,
c¸c tÕ bµo vi khuÈn ®−îc cÊy trªn bÒ mÆt m«i tr−êng chøa agar. Mçi tÕ bµo sau ®ã sÏ
ph¸t triÓn thµnh mét khuÈn l¹c riªng rÏ. C¸c tÕ bµo trong cïng mét khuÈn l¹c ®Òu mang
cïng lo¹i vect¬ vµ ®o¹n gen cµi gièng nhau. Trong kü thuËt lai khuÈn l¹c, ng−êi ta cã thÓ
dïng mµng lai gièng nh− trong c¸c ph−¬ng ph¸p lai Southern ®Ó thu håi mét l−îng “vÕt”
ADN trùc tiÕp tõ khuÈn l¹c, nh−ng ®ñ cho sù kÕt cÆp víi mÉu dß. Cô thÓ, ng−êi ta dïng
mµng lai Ðp lªn bÒ mÆt m«i tr−êng nu«i cÊy chøa khuÈn l¹c vµ “in h×nh” chóng lªn mµng
lai (cïng víi ADN cña chóng) theo kiÓu “®ãng dÊu”. Khi kÕt qu¶ lai mÉu dß/khuÈn l¹c
cho kÕt qu¶ “d−¬ng tÝnh”, sÏ x¸c ®Þnh ®−îc vÞ trÝ khuÈn l¹c mang dßng tÕ bµo chøa ®o¹n
ADN (gen) cµi mong muèn.
Mµng lai ®−îc ®em lai víi mÉu dß nh− sau: ng−êi ta tiÕn hµnh xö lý mµng lai sao
cho mµng tÕ bµo vì ra vµ c¸c ph©n tö ADN tho¸t ra ngoµi vµ g¾n lªn mµng lai t¹i chÝnh
vÞ trÝ tÕ bµo cña chóng. C¸c mµng lai sau ®ã ®−îc ñ víi c¸c mÉu dß ®−îc ®¸nh dÊu tõ
tr−íc trong c¸c ®iÒu kiÖn gièng nh− khi tiÕn hµnh c¸c kü thuËt lai Northern hay
Southern.
§Ó x©y dùng ng©n hµng gen, ngoµi c¸c vect¬ plasmid cã nguån gèc vi khuÈn, ng−êi
ta cßn dïng nhiÒu lo¹i vect¬ kh¸c cã nguån gèc virut (phag¬), hoÆc tõ c¸c sinh vËt bËc cao
h¬n nh− NST nh©n t¹o cña nÊm men (YAC), hoÆc c¸c d¹ng vect¬ lai nh− phagemid,
335
§inh §oµn Long
cosmid, NST nh©n t¹o vi khuÈn (BAC), v.v ... Trong c¸c vect¬ virut, c¸c vect¬ cã nguån
gèc phag¬ λ lµ phæ biÕn h¬n c¶. ADN hÖ gen cña virut nµy ®−îc lo¹i bá c¸c phÇn g©y ®éc
vµ th−êng ®−îc dïng nh− vect¬ nh©n dßng. Nguyªn t¾c sö dông vect¬ nµy ®Ó nh©n dßng
trong c¸c th− viÖn hÖ gen gièng nh− vect¬ plasmid. ChØ cã mét ®iÓm kh¸c lµ khi tiÕn
hµnh lai víi mÉu dß ®Ó x¸c ®Þnh c¸c dßng gen biÕn n¹p th× vÞ trÝ c¸c mÉu dß ®−îc x¸c
®Þnh trªn mµng lai t−¬ng øng víi vÞ trÝ c¸c vÕt tan thay cho vÞ trÝ c¸c khuÈn l¹c nh− khi
dïng vect¬ plasmid.
11.2.7. Tæng hîp hãa häc vµ sö dông c¸c ®o¹n oligonucleotide
C¸c ®o¹n ADN ng¾n cã tr×nh tù x¸c ®Þnh Nhãm khãa
®−îc dïng nhiÒu trong c¸c nghiªn cøu kh¸c ®Çu C5’-OH
nhau cña di truyÒn häc ph©n tö, ch¼ng h¹n nh− Nucleotide tiÕp Deoxyribose
dïng lµm mÉu dß trong c¸c ph−¬ng ph¸p lai, theo nèi vµo ®©y
dïng lµm måi trong c¸c ph¶n øng PCR vµ gi¶i
tr×nh tù ADN. C¸c ®o¹n tr×nh tù nµy th−êng
®−îc tæng hîp hãa häc (phæ biÕn b»ng m¸y tæng Phosphoamidite
hîp ADN tù ®éng) vµ ®−îc gäi lµ c¸c ®o¹n
oligonucleotide. TiÒn chÊt ®Ó t¹o nªn c¸c Nhãm diisopropylamino
nucleotide lÇn l−ît g¾n vµo chuçi oligonucleotide H×nh 11.7. Phosphoamidine lµ tiÒn chÊt
lµ c¸c phosphoamidine (h×nh 11.7). Ph¶n øng tæng hîp hãa häc c¸c oligonucleotide.
kÐo dµi chuçi oligonucleotide diÔn ra b»ng viÖc Nhãm DMT (dimethoxytrityl) cã vai trß khãa
g¾n thªm nucleotide míi vµo ®Çu 5’ (tøc lµ chiÒu ®Çu C5'-OH vµ chØ ph¶n øng víi nhãm
3’ → 5’) cña ®o¹n oligonucleotide cã s½n, nh− phosphoamidite theo chiÒu 3' → 5'.
vËy ng−îc chiÒu víi ph¶n øng kÐo dµi chuçi a) Tæng hîp ADN hoµn b) Tæng hîp tõng phÇn råi
ADN ®−îc thùc hiÖn bëi enzym ADN chØnh trªn c¶ 2 m¹ch tæng hîp b»ng ADN pol
polymerase.
Tæng hîp c¸c Tæng hîp c¸c
Ph−¬ng ph¸p tæng hîp hãa häc cã hiÖu oligonucleotide oligonucleotide
qu¶ vµ ®é tin cËy cao khi tæng hîp c¸c ®o¹n
ADN ng¾n, m¹ch ®¬n cã ®é dµi tíi 30 B¾t cÆp gi÷a c¸c B¾t cÆp gi÷a c¸c
nucleotide. §Ó tæng hîp c¸c ®o¹n ADN b»ng ®o¹n oligonucleotide ®o¹n oligonucleotide
m¸y tæng hîp tù ®éng, c¸c nhµ nghiªn cøu chØ
cÇn “nhËp” vµo phÇn mÒm tr×nh tù nucleotide Nèi bëi ADN ligase C¸c ®o¹n rçng ®−îc
cÇn tæng hîp vµ m¸y sÏ tù ®éng tæng hîp tõ c¸c tæng hîp bëi ADN pol
tiÒn chÊt ®−îc chuÈn bÞ s½n. Tuy nhiªn, khi
ph©n tö ADN ®−îc tæng hîp cã kÝch th−íc lín §o¹n tæng hîp bëi ADN pol
th× ®é chÝnh x¸c cña tr×nh tù vµ ®é ®ång ®Òu Nèi bëi ADN ligase
cña s¶n phÈm gi¶m ®i do c¸c h¹n chÕ mang
tÝnh kü thuËt. Thùc tÕ, c¸c ph©n tö ADN cã
tr×nh tù dµi trªn 100 nucleotide khã cã thÓ tæng H×nh 11.8. Hai ph−¬ng ph¸p tæng hîp hãa häc
c¸c ®o¹n ADN dµi (hoÆc gen ®Çy ®ñ).
hîp chÝnh x¸c b»ng m¸y tæng hîp tù ®éng.
Tuy vËy, b»ng c¸ch kÕt hîp mét sè kü thuËt, c¸c ®o¹n ADN (thËm chÝ gen ®Çy ®ñ)
cã chiÒu dµi h¬n 100 nucleotide còng cã thÓ tæng hîp b»ng ph−¬ng ph¸p hãa häc. Cô thÓ,
tr−íc tiªn ng−êi ta ph¶i tæng hîp c¸c ®o¹n ADN ng¾n, m¹ch ®¬n cã tr×nh tù gèi lªn nhau;
sau ®ã tinh s¹ch råi nèi c¸c ®o¹n ADN víi nhau (h×nh 11.8). ViÖc nèi c¸c ®o¹n ADN cã
thÓ thùc hiÖn theo hai c¸ch. Trong c¸ch thø nhÊt, c¸c ®o¹n ADN riªng rÏ chøa tr×nh tù
®Çy ®ñ cña ph©n tö ADN cÇn tæng hîp, chØ thiÕu liªn kÕt phosphodiester g¾n kÕt c¸c
®o¹n víi nhau. Lóc nµy, enzym ADN ligase ®−îc dïng ®Ó nèi c¸c ®o¹n víi nhau (h×nh
336
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
11.8a). Trong c¸ch thø hai, c¸c ®o¹n ADN ®−îc tæng hîp chØ chiÕm mét phÇn tr×nh tù cña
mçi m¹ch ADN cÇn tæng hîp. Khi c¸c ®o¹n ADN ®−îc cho b¾t cÆp víi nhau, trªn mçi
m¹ch cßn tån t¹i nhiÒu ®o¹n tr×nh tù “trèng”. Lóc nµy, ADN pol I ®−îc dïng ®Ó lÊp kÝn
c¸c ®o¹n “trèng” tr−íc khi ADN ligase nèi c¸c ®o¹n ADN víi nhau ®Ó t¹o nªn ph©n tö ADN
cã tr×nh tù ®Çy ®ñ (h×nh 11.8b). Trong qu¸ tr×nh tæng hîp ADN nh− vËy, còng cã thÓ kÕt hîp
c¸c tr×nh tù ®iÒu hßa cña gen víi c¸c tr×nh tù m· hãa. Ngoµi ra, còng cã thÓ bæ sung vÞ trÝ
c¾t cña c¸c enzym giíi h¹n ë vïng biªn cña tr×nh tù m· hãa, ®Ó sau ®ã cã thÓ cµi c¸c ®o¹n
ADN nµy vµo c¸c vect¬ nh©n dßng hay vect¬ biÓu hiÖn.
C¸c ®o¹n ADN ®−îc tæng hîp hãa häc ngoµi c¸c øng dông lµm mÉu dß hoÆc lµm måi
cho ph¶n øng PCR vµ gi¶i tr×nh tù, cßn cã thÓ ®−îc dïng cho c¸c nghiªn cøu kh¸c. Ch¼ng
h¹n, cã thÓ tæng hîp c¸c ®o¹n ADN mang mét (hoÆc mét sè) nucleotide biÕn ®æi so víi
tr×nh tù ADN cña gen ®· biÕt, vµ dïng ®o¹n ADN nµy trong ph−¬ng ph¸p g©y ®ét
biÕn ®Þnh vÞ trÝ. Trong ph−¬ng ph¸p nµy, ®o¹n ADN tæng hîp mang nucleotide biÕn ®æi
®−îc dïng lµm måi ®Ó nh©n ®o¹n gen ®Ých b»ng ph¶n øng PCR. V× trong ph©n tö ADN
sîi kÐp h×nh thµnh cã mét (hoÆc mét sè) vÞ trÝ kÕt cÆp sai, nªn s¶n phÈm PCR h×nh thµnh
lµ c¸c ®o¹n ADN cã tr×nh tù gen mang nucleotide biÕn ®æi ë vÞ trÝ x¸c ®Þnh. C¸c ®o¹n
oligonucleotide còng cã thÓ ®−îc dïng theo c¸ch t−¬ng tù ®Ó t¹o nªn mét ®iÓm giíi h¹n
míi trªn ph©n tö ADN, ®Ó råi sau ®ã ®iÓm giíi h¹n nµy ®−îc dïng ®Ó cµi gen ®Ých vµo
®óng vÞ trÝ cÇn thiÕt, vÝ dô: sau promoter hay sau vÞ trÝ g¾n cña ribosome, v.v…
11.2.8. Ph¶n øng PCR
Ngoµi kü thuËt nh©n dßng gen sö dông c¸c tÕ ADN khu«n 3’
bµo (in vivo), mét ph−¬ng ph¸p nh©n dßng gen Måi ng−îc 5’
invitro ®¬n gi¶n, hiÖu qu¶ ®−îc sö dông phæ biÕn
hiÖn nay ë hÇu hÕt c¸c phßng thÝ nghiÖm di truyÒn 5’
häc vµ sinh häc ph©n tö lµ ph¶n øng chuçi trïng 3’ §o¹n ADN
hîp - PCR (polymerase chain reaction). Kü thuËt
PCR dïng ADN polymerase ®Ó tæng hîp ph©n tö Måi xu«i
ADN míi tõ tr×nh tù cña ph©n tö ADN lµm khu«n
víi tiÒn chÊt lµ c¸c dNTP. Nh− ®· nªu ë ch−¬ng 3, Ph¶n øng PCR
c¸c ADN polymerase tæng hîp ADN theo chiÒu 5’→ 3’
vµ cã thÓ xóc t¸c g¾n nucleotide vµo ®Çu 3’ cña mét §o¹n ADN ®Ých
®o¹n oligonucleotide cã s½n. ThÕ nªn, nÕu ta ®· cã
®o¹n oligonucleotide g¾n vµo mét m¹ch ADN lµm §o¹n ADN ®Ých
khu«n, th× ADN polymerase cã thÓ dïng ®o¹n ®ã
nh− måi ®Ó xóc t¸c ph¶n øng kÐo dµi chuçi ADN vÒ §o¹n ADN ®Ých
phÝa ®Çu 3’ cho ®Õn hÕt tr×nh tù m¹ch khu«n. NhiÒu b¶n sao ®o¹n ADN ®Ých
H×nh 11.9. Nh©n dßng ADN b»ng PCR.
C©u hái ®Æt ra lµ: b»ng c¸ch nµo cã thÓ dïng ph¶n øng PCR ®Ó nh©n dßng mét
®o¹n tr×nh tù ADN ®Æc hiÖu? Lóc nµy, ng−êi ta sÏ tæng hîp vµ sö dông hai ®o¹n
oligonuleotide cã vÞ trÝ liªn kÕt chÆn ë hai ®Çu cña ®o¹n ADN cÇn nh©n dßng. §o¹n
oligonucleotide thø nhÊt cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch m· hãa, ®−îc gäi lµ måi
xu«i; ®o¹n thø hai cã tr×nh tù bæ sung víi ®Çu 5’ cña m¹ch ®èi m·, ®−îc gäi lµ måi
ng−îc (h×nh 11.9). Ph©n tö ADN lµm khu«n ®−îc g©y biÕn tÝnh bëi nhiÖt, t¹o ®iÒu kiÖn
cho c¸c måi xu«i vµ måi ng−îc ®Ýnh kÕt vµo c¸c vÞ trÝ ë hai ®Çu ®o¹n ADN cÇn nh©n dßng.
Víi sù cã mÆt cña c¸c tiÒn chÊt lµ dNTP, ADN polymerase sÏ nh©n dßng ®o¹n tr×nh tù
ADN ®−îc giíi h¹n bëi hai ®o¹n måi.
337
§inh §oµn Long
Trong ph¶n øng PCR, ph©n tö ADN ®−îc g©y biÕn tÝnh vµ sù tæng hîp ADN diÔn ra
lÆp l¹i qua nhiÒu chu kú nhê kh¶ n¨ng ®iÒu nhiÖt cña m¸y. KÕt qu¶ lµ: sau mçi chu kú
®iÒu nhiÖt, sè ph©n tö ADN l¹i t¨ng gÊp ®«i. §©y lµ mét ph¶n øng cã ®é nh¹y cao. ChØ
cÇn mét vµi b¶n sao ADN cã trong mÉu nghiªn cøu, chóng ta cã thÓ thu ®−îc hµng tØ b¶n
sao sau kho¶ng trªn d−íi 30 chu kú ph¶n øng (sè b¶n sao ADN = 2n víi n lµ sè chu kú
ph¶n øng).
11.2.9. Gi¶i tr×nh tù ADN Baz¬ Baz¬
Trong phÇn nµy chóng ta sÏ xem
b»ng c¸ch nµo cã thÓ x¸c ®Þnh ®−îc
tr×nh tù nucleotide cña c¸c ®o¹n ADN
ng¾n hoÆc toµn bé ph©n tö ADN dµi. H×nh 11.10. CÊu tróc cña dNTP (tr¸i) vµ ddNTP (ph¶i).
Nguyªn t¾c cña hÇu hÕt c¸c ph−¬ng
ph¸p gi¶i tr×nh tù ADN hiÖn nay ®Òu dùa
trªn ph−¬ng ph¸p ®−îc Sanger vµ céng sù
c«ng bè n¨m 1977, ®−îc gäi lµ ph−¬ng ph¸p
dideoxyribonucleotide (gäi t¾t lµ ph−¬ng ph¸p
dideoxy). Nguyªn t¾c cña ph−¬ng ph¸p
dideoxy dùa trªn viÖc bæ sung c¸c dÉn xuÊt
t−¬ng øng cña c¸c dNTP lµ 2’,3’-
dideoxynucleotide (viÕt t¾t lµ ddNTP, h×nh
11.10) vµo thµnh phÇn ph¶n øng tæng hîp
ADN trong èng nghiÖm. Do ddNTP thiÕu
nhãm C3’-OH, nªn mét khi nã ®−îc g¾n vµo
m¹ch ADN ®ang tæng hîp, th× qu¸ tr×nh tæng
hîp ADN sÏ dõng l¹i. Trong ph−¬ng ph¸p
Sanger, sù sao chÐp ADN ®−îc b¾t ®Çu b»ng
viÖc g¾n mét ®o¹n oligonucleotide cã tr×nh tù
bæ sung víi tr×nh tù ADN cÇn gi¶i m· råi ñ
chóng cïng víi enzym ADN pol. Ph©n tö
ADN tæng hîp míi sÏ cã tr×nh tù bæ sung víi
m¹ch ADN lµm khu«n. C¸c ph¶n øng gi¶i m·
tr×nh tù ®−îc chia lµm bèn èng nghiÖm t¸ch
biÖt. Mçi èng ®−îc bæ sung mét hçn hîp gåm ChiÒu ®iÖn di
4 lo¹i dNTP th«ng th−êng (vèn cÇn cho sù
tæng hîp m¹ch ADN míi); mét trong nh÷ng
lo¹i dNTP nµy ®−îc ®¸nh dÊu phãng x¹ ®Ó
ph¸t hiÖn m¹ch míi ®ang tæng hîp. Ngoµi ra,
tõng lo¹i trong 4 lo¹i ddNTP (ddATP, ddGTP,
ddCTP vµ ddTTP) sÏ ®−îc bæ sung lÇn l−ît
t−¬ng øng vµo mçi èng nghiÖm nªu trªn víi
nång ®é b»ng 1/10 so víi nång ®é lo¹i dNTP H×nh 11.11. Gi¶i tr×nh tù ADN nhê sö dông ddNTP.
t−¬ng øng. Víi thµnh phÇn ph¶n øng nh− Sù sao chÐp ADN sÏ kÕt thóc khi ddNTP ®−îc kÕt
vËy, trong phÇn lín tr−êng hîp, dNTP sÏ liªn hîp vµo chuçi. Tr×nh tù m¹ch ADN míi tæng hîp
kÕt vµo m¹ch ADN ®ang tæng hîp, nh−ng
®−îc ®äc theo chiÒu 5’ → 3’ t−¬ng øng tõ ®¸y lªn
®Ønh cña b¶n ®iÖn di.
338
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
ddNTP (ë nång ®é thÊp) còng sÏ liªn kÕt vµo mét sè m¹ch ADN ®ang tæng hîp vµ lµm
kÕt thóc qu¸ tr×nh sao chÐp. Do cã nhiÒu ph©n tö ADN ®−îc tæng hîp ®ång thêi nªn qu¸
tr×nh nµy dÉn ®Õn sù h×nh thµnh cña mét hçn hîp nhiÒu ph©n tö ADN ®−îc sao chÐp
kh«ng hoµn chØnh gièng nhau ë ®Çu 5’ ®−îc ®¸nh dÊu vµ kh¸c nhau ë ®Çu 3’ vÒ chiÒu
dµi vµ lo¹i nucleotide
kÕt thóc chuçi (h×nh 11.11). C¸c s¶n phÈm nµy sau ®ã ®−îc ph©n t¸ch trªn gel
polyacrylamide vµ ®äc tr×nh tù theo thø tù c¸c b¨ng xuÊt hiÖn trªn b¶n ®iÖn di theo
chiÒu tõ cùc d−¬ng sang cùc ©m.
§· cã nhiÒu c¶i tiÕn ®−îc ®−a ra nh»m n©ng cao hiÖu qu¶ cña ph−¬ng ph¸p dideoxy
kÓ tõ khi Sanger c«ng bè. Trong ph−¬ng ph¸p cña Sanger, enzym ADN pol I cña E. coli
®−îc dïng lµm enzym sao chÐp. Sau ®ã, nã ®−îc thay b»ng ADN pol cã nguån gèc tõ
phag¬ T7 cã hiÖu qu¶ sao chÐp c¸c ADN m¹ch dµi tèt h¬n. Ngµy nay, phÇn lín viÖc gi¶i
tr×nh tù ADN ®Òu dùa trªn ph−¬ng ph¸p dideoxy kÕt hîp víi ph¶n øng PCR sö dông c¸c
enzym chÞu nhiÖt, nh− Taq ADN pol, hoÆc −u viÖt h¬n lµ enzym cã tªn th−¬ng m¹i lµ
“sequenase”. §©y lµ enzym t¸i tæ hîp cã nguån gèc tõ ADN pol cña phag¬ T7. Enzym
nµy cã hiÖu qu¶ sao chÐp tèt c¸c m¹ch ADN dµi, cã tÝnh chÞu nhiÖt, cã ho¹t tÝnh ®äc söa
vµ cã thÓ l¾p r¸p c¸c lo¹i nucleotide c¶i biÕn (ngoµi 4 lo¹i nucleotide c¬ b¶n) vµo m¹ch
ADN ®ang tæng hîp. ViÖc kÕt hîp víi ph−¬ng ph¸p PCR cho phÐp gi¶i tr×nh tù ADN tõ
mét l−îng rÊt nhá ADN sîi kÐp, ®ång thêi còng cho phÐp gi¶i tr×nh tù trùc tiÕp mét sè hÖ
gen kÝch th−íc nhá, nh− virut vµ vi RE ChÊt nhËn dRhodamine
khuÈn. Trong khi ®ã, viÖc gi¶i tr×nh tù a)
hÖ gen c¸c sinh vËt bËc cao (cã kÝch
th−íc hÖ gen lín) cÇn ph¶i qua b−íc
nh©n dßng hoÆc sö dông c¸c ng©n hµng
gen. ChÊt ph¸t quang
11.2.9.1. Gi¶i tr×nh tù ADN tù ®éng §o¹n nèi
Kü thuËt gi¶i tr×nh tù ®−îc Sanger b)C−êng ®é ph¸t quang
m« t¶ cã thÓ x¸c ®Þnh chÝnh x¸c tr×nh tù
nucleotide cña mét ®o¹n ADN dµi tíi B−íc sãng (nm)
300 bp. Tuy nhiªn, ph−¬ng ph¸p nµy H×nh 11.12. Thuèc nhuém g¾n víi ddNTP ®−îc dïng
cÇn nhiÒu thao t¸c kü thuËt. Cô thÓ, cho gi¶i tr×nh tù ADN. a) CÊu tróc hãa häc cña chÊt kÕt
nhiÒu b−íc pipet chÝnh x¸c ph¶i ®−îc thóc chuçi BigDyeTM. Trong ®ã, c¸c ddNTP kÕt thóc chuçi
thùc hiÖn ®ång thêi míi cho kÕt qu¶ tèt; kh¸c nhau cã thuéc tÝnh ph¸t quang kh¸c nhau phô thuéc
mçi mÉu ph©n tÝch ph¶i ®ång thêi ch¹y vµo c¸c gèc R. b) Phæ ph¸t quang cña 4 gèc BigDyeTM
trªn 4 lµn ®iÖn di kh¸c nhau. Ngoµi ra, g¾n vµo 4 lo¹i ddNTP lµ kh¸c nhau.
viÖc ®äc kÕt qu¶ ®iÖn di b»ng m¾t ®«i
khi vÉn cã sai sãt. HiÖn nay, ®Ó cã thÓ
gi¶i tr×nh tù ADN c¸c hÖ gen lín (nh− ë
ng−êi, ~3,2x109 bp) ®Òu dùa vµo ph−¬ng
ph¸p gi¶i tr×nh tù tù ®éng.
Ph−¬ng ph¸p gi¶i tr×nh tù tù ®éng
kÕt hîp ®ång thêi 4 ph¶n øng ®éc lËp
339
§inh §oµn Long
vµo mét ph¶n øng chung. Trong ®iÒu kiÖn nh− vËy, viÖc dïng c¸c nucleotide ®−îc ®¸nh
dÊu phãng x¹ (g¾n vµo ®Çu 5’ cña m¹ch ADN tæng hîp míi) lµ kh«ng phï hîp v× c¸c ®o¹n
ADN míi tæng hîp chØ kh¸c nhau mét nucleotide nªn khã ph©n t¸ch b»ng ®iÖn di th«ng
th−êng. Tuy nhiªn, trë ng¹i nµy cã thÓ ®−îc kh¾c phôc nÕu nh− ®Çu 3’ cña c¸c ®o¹n ADN
tæng hîp míi ®−îc “®¸nh dÊu” vµ “ph¸t tÝn hiÖu”. §Ó lµm ®iÒu ®ã, ng−êi ta dïng mét bé
c¸c ddNTP ®−îc g¾n chÊt ph¸t quang (Glazer vµ Mathies, 1997). C¸c ddNTP lóc nµy vÉn
cã thÓ liªn kÕt vµo m¹ch ADN ®ang kÐo dµi vµ lµm ngõng ph¶n øng sao chÐp. CÊu tróc
phÇn ph¸t quang cña ddNTP gåm mét “gèc ph¸t quang” liªn kÕt víi mét trong bèn gèc
dichlororhodamine (viÕt t¾t lµ dRhodamine, lµ chÊt nhËn n¨ng l−îng quang) kh¸c nhau
qua mét ®o¹n nèi (h×nh 11.12). Bèn gèc dRhodamine khi bÞ “gèc ph¸t quang” kÝch thÝch
(bëi nguån s¸ng laser th−êng tõ Argon) nhËn n¨ng l−îng råi ph¸t quang ë c¸c b−íc sãng
kh¸c nhau. Nhê vËy, mçi mét lo¹i ddNTP khi ®−îc kÝch thÝch bëi nguån s¸ng Argon cña
m¸y gi¶i tr×nh tù sÏ ph¸t ra “tÝn hiÖu” kh¸c nhau. Th«ng tin nµy ®−îc mét c¶m biÕn tÝn
hiÖu kÕt hîp víi m¸y tÝnh xö lý vµ tù ®éng chuyÓn thµnh tr×nh tù ADN (h×nh 11.13). C¸c
ddNTP ®−îc g¾n chÊt ph¸t quang theo nguyªn lý nªu trªn ®−îc gäi lµ c¸c yÕu tè kÕt thóc
chuçi BigDyeTM.
Gi¶i tr×nh tù tù ®éng cã nhiÒu −u ®iÓm h¬n so víi ph−¬ng ph¸p thñ c«ng cña
Sanger. ¦u ®iÓm lín nhÊt lµ kh¶ n¨ng tù
®éng hãa phÇn lín c¸c b−íc cña qu¸ tr×nh a)
ph©n tÝch. NhiÒu b−íc cña ph¶n øng gi¶i Måi ®Ó gi¶i tr×nh tù
tr×nh tù cã thÓ thùc hiÖn b»ng r«bèt, kÓ
tõ viÖc pipet mÉu ®Õn ph¶n øng PCR.
C¸c s¶n phÈm sau ®ã ®−îc tinh s¹ch vµ Tr×nh tù thu ®−îc
cho ch¹y qua c¸c cét ®iÖn di mao qu¶n
mµ kh«ng cÇn bÊt cø mét thao t¸c trùc
tiÕp nµo cña con ng−êi. Tèc ®é ®äc vµ
møc ®é chÝnh x¸c cña ph−¬ng ph¸p tù
®éng rÊt cao, ®Æc biÖt ®èi víi c¸c ®o¹n
ADN dµi tõ 30 ®Õn d−íi 1000 bp (®é
chÝnh x¸c cao nhÊt lµ ®èi víi c¸c ®o¹n cã
tr×nh tù trªn d−íi 600 bp). Mét hÖ thèng
gi¶i tr×nh tù ADN hiÖn nay trung b×nh cã ChuyÓn thµnh tr×nh
thÓ ®äc ®−îc 1 - 2 triÖu bp trong mét tù m¹ch m· hãa
ngµy víi ®é chÝnh x¸c 99%. Ngoµi ra,
ph−¬ng ph¸p nµy cã ®é nh¹y cao mµ ViÕt l¹i theo
kh«ng cÇn ph¶i sö dông c¸c chÊt phãng chiÒu 5’ →3’
x¹. Tuy nhiªn, còng ph¶i nãi r»ng kü
thuËt gi¶i tr×nh tù ADN tù ®éng kh«ng b)
ph¶i lóc nµo còng cho kÕt qu¶ ph©n tÝch
hoµn toµn chÝnh x¸c. Mét sè h¹n chÕ cña
ph−¬ng ph¸p nµy gåm cã: nã kh«ng ®äc
®−îc c¸c tr×nh tù qu¸ ng¾n (d−íi 30 bp,
bëi v× hiÖu suÊt PCR cña c¸c ph©n ®o¹n
ADN nµy thÊp, b¶n th©n chóng kÐm bÒn
vµ ph¸t tÝn hiÖu yÕu); sai sè ®äc t¨ng lªn H×nh 11.13. Gi¶i tr×nh tù ADN tù ®éng. a) Sö dông måi
khi gi¶i tr×nh tù c¸c ®o¹n ADN trªn 1000 ®Ó tæng hîp ADN. Qu¸ tr×nh nµy kÕt thóc b»ng ddNTP ph¸t
bp; ngoµi ra, c¸c ®o¹n ADN mang nhiÒu quang. Chuçi c¸c pic t¸ch biÖt cho biÕt tr×nh tù ADN.
b) Phæ tr×nh tù ®−îc gi¶i m· b»ng m¸y ABI Prism377.
340
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
tr×nh tù lÆp kÕ tiÕp cã xu h−íng bÞ “nÐn” l¹i khi ch¹y qua cét chøa gel (l¾p trong m¸y),
dÉn ®Õn hiÖn t−îng c¸c pic ë c¸c vïng tr×nh tù lÆp l¹i cã xu h−íng lång vµo nhau (kh«ng
ph©n t¸ch) nªn khã x¸c ®Þnh tr×nh tù chÝnh x¸c. C¸c tr×nh tù nµy th−êng cÇn ®−îc kiÓm
tra l¹i b»ng c¸c ph−¬ng ph¸p thñ c«ng. Trong thùc tÕ, nh÷ng ®o¹n ADN cuèi cïng ®−îc
gi¶i tr×nh tù trong dù ¸n hÖ gen ng−êi (hoµn thµnh n¨m 2006) lµ c¸c ®o¹n ADN cã møc
®é lÆp l¹i lín thuéc NST sè 1.
11.2.9.2. Gi¶i tr×nh tù toµn hÖ gen
Nh− nªu ë trªn, viÖc gi¶i tr×nh tù c¸c ®o¹n ADN ng¾n hiÖn nay cã thÓ thùc hiÖn
®−îc t−¬ng ®èi dÔ dµng nhê m¸y gi¶i tr×nh tù tù ®éng. Tuy vËy, nh÷ng hÖ gen lín ®−îc
gi¶i tr×nh tù nh− thÕ nµo? D−íi ®©y lµ mét sè ph−¬ng ph¸p gi¶i tr×nh tù c¸c hÖ gen.
Tõ phÇn trªn, chóng ta biÕt r»ng để xây dựng ng©n hµng hÖ gen, toàn bộ ADN hệ
gen được cắt thành các đoạn ng¾n trước khi được nh©n dòng vµ duy tr× nhê c¸c vect¬. MÆc
dù về nguyên tắc, việc giải trình tự có thể thực hiện trực tiếp trên ADN hệ gen, nhưng thùc
tế kh«ng ph¶i vËy v× cần ph¶i biết tr−íc nhiều trình tự cña hÖ gen míi cã thÓ thiÕt kÕ mồi
để nhân các ®o¹n kh¸c nhau nằm dọc hệ gen. Để khắc phục khã kh¨n này, người ta nh©n
dòng các đoạn ADN b»ng các véctơ, rồi mỗi đoạn cµi sau đó được giải trình tự nhờ dïng mồi
oligonucleotide kết cặp với trình tự ®· biÕt của véctơ. Vấn đề còn lại là bằng cách nào tái tổ
chức lại các đoạn ADN riêng rẽ thành một trình tự đầy đủ và liên tục của hệ gen. Cã thÓ
thùc hiÖn ®−îc viÖc ®ã b»ng một số cách sau ®©y:
• Tách dòng các trình tự nằm gối lên nhau (contig). Cách đơn giản nhất để tạo ra các
trình tự nằm gối lên nhau là phân lập và giải trình tự một dòng từ ng©n hµng hệ
gen, rồi dïng trình tự của dòng thứ nhất ®Ó xác định dòng thứ hai có một phần
đoạn cài nằm gối lên đoạn thứ nhất (nhê lai víi mÉu dß). Dòng thứ hai lại được giải
trình tự và thông tin về trình tự của nó lại được dùng để xác định đoạn thứ ba nằm
gối lên đoạn thứ hai, v.v... Nguyên tắc này là cơ sở của phương pháp bước nối tiếp
trên nhiễm sắc thể được dïng để xây dựng các trình tự ADN nằm gối lên nhau
(contig) xuất phát từ các đoạn ADN ngắn được tách dòng nhê các véctơ. Tuy vậy,
phương pháp này tốn nhiều công sức. Một dòng phải được phân lập và giải trình tự
trước khi tìm thấy dòng tiÕp theo. Ngoài ra, các trình tự lặp lại kÕ tiếp (phæ biÕn)
trong hệ gen dễ g©y ra sự sắp xếp nhầm.
• Giải trình tự ngẫu nhiên toàn hệ gen (kü thuËt "shortgun"). Toµn bé các đoạn ADN
trong hệ gen được nh©n dòng nhê Gi¶i tr×nh tù ngÉu Gi¶i tr×nh tù ngÉu
vect¬ và giải trình tự ngẫu nhiên. nhiªn toµn hÖ gen nhiªn ph©n cÊp
Các trình tự sau đó mới được phân
tích b»ng phÇn mÒm m¸y tÝnh về ADN hÖ gen
khả năng nằm gối lên nhau của
chúng (tức là các trình tự cùng xuất
hiện ở nhiều phân đoạn khác nhau) Gi¶i tr×nh tù
và trình tự toàn hệ gen được xây ngÉu nhiªn
dựng dựa trên tổ hợp đồng thời của S¾p xÕp
các trình tự nằm gối lên nhau c¸c tr×nh tù
(hình 11.14). Phương pháp này lần Tr×nh tù hÖ
đầu tiên được dïng để giải tr×nh tù
hệ gen vi khuẩn Haemophilus gen ®−îc
x¸c ®Þnh
influenzae. Toàn bộ hệ gen của vi H×nh 11.14. Gi¶i tr×nh tù hÖ gen b»ng c¸c ph−¬ng
ph¸p gi¶i tr×nh tù ngÉu nhiªn toµn hÖ gen vµ gi¶i
khuÈn này được phân cắt ngẫu tr×nh tù ngÉu nhiªn ph©n cÊp.
nhiên thành những ®o¹n nhá b»ng
341
§inh §oµn Long
phương pháp “siêu âm”, rồi từng đoạn nhỏ (1,5 – 2 Kb) được nh©n dòng b»ng véctơ
plasmid pUC18. Tổng cộng thư viện hệ gen của loài này gồm khoảng 20.000 dòng
vi khuẩn khác nhau. Mỗi dòng (tương ứng với một đoạn ADN) sau đó được giải
trình tự để rồi tổ hợp lại và tạo nên tập hợp thông tin về trình tự ADN gồm 12
triệu bp. Độ dài của toàn bộ các trình tự ®−îc gi¶i m· gấp 6 lần độ dài hÖ gen của vi
khuẩn. Trình tự hệ gen cuối cùng thu được là nhờ sự tổ hợp các đoạn ADN ngắn
thành các đoạn contig. Các đoạn rçng gi÷a c¸c contig cuối cùng được “lấp đầy” bằng
việc xác định các dòng bổ sung từ một sè ng©n hµng hÖ gen khác (thùc tÕ, ®Ó gi¶i
tr×nh tù mét hÖ gen, ng−êi ta cÇn x©y dùng Ýt nhÊt 2 – 3 ng©n hµng gen mang
c¸c ®o¹n cµi cã kÝch th−íc trung b×nh kh¸c nhau, vÝ dô: 1, 5 vµ 10 Kb). Ưu điểm
râ nhất của phương pháp “shortgun” là không cần biết trước trình tự của hệ gen vµ
tèc ®é gi¶i tr×nh tù nhanh, ®Æc biÖt víi c¸c hÖ gen nhá (nh− vi khuÈn). Phần lớn
các hệ gen vi khuẩn có thể giải mã xong chỉ trong vài tuần bằng phương pháp giải
trình tự ngÉu nhiªn. Tuy vậy, khi gi¶i tr×nh tù nh÷ng hÖ gen lín (nh− ng−êi),
phương pháp này có nhược điểm là gÆp khã kh¨n khi xác định trËt tù c¸c ®o¹n
contig ở các vïng hÖ gen mang nhiÒu trình tự lặp lại liªn tiếp; ngoµi ra, sè l−îng
contig rÊt lín nªn cÇn c¸c phÇn mÒm vµ hÖ thèng m¸y tÝnh cã hiÖu n¨ng rÊt cao
®Ó xö lý d÷ liÖu.
• Giải trình tự ngẫu nhiên phân cấp. Để gi¶i tr×nh tù c¸c hÖ gen lín, có một cải tiến
là ADN toàn hệ gen ban đầu được cắt thành các đoạn lớn rồi tách dòng vào các NST
nhân tạo vi khuẩn (BAC). Sau đó, mçi dßng BAC ®−îc dïng ®Ó x©y dùng c¸c ng©n
hµng “con” mang c¸c ®o¹n ADN cµi kÝch th−íc ng¾n h¬n (vÝ dô: b»ng vect¬
pUC18). ViÖc giải trình tự ngẫu nhiên ®−îc tiÕn hµnh lÇn l−ît b¾t ®Çu tõ c¸c
ng©n hµng “con”. Phương pháp giải trình tự ngẫu nhiên phân cấp giúp việc sắp xếp
các contig dÔ dµng hơn.
11.2.9.3. T×m gen tõ c¸c hÖ gen ®· ®−îc gi¶i tr×nh tù
Sau khi hệ gen của một sinh vật đã được giải tr×nh tù xong, người ta có thể dùng một
số phương pháp khác nhau để tìm và xác định vị trí các gen trên NST, bao gồm:
• Duyệt trình tự. Các gen mã hóa cho protein phải chứa một khung đọc mở (ORF)
mang một chuỗi (không dấu “phảy”) các bộ ba (codon) mã hóa tương ứng cho một
trình tự axit amin của protein. Khung đọc mở sẽ bắt ®Çu bởi mã mở đầu 5’-ATG-
3’ của mạch mã hóa (tương ứng với 3’-TAC-5’ của mạch không mã hóa, tức mạch
làm khuôn; và mã 5’-AUG-3’ của mARN), đồng thời kết thúc ở một trong các mã
bộ ba (TAA, TAG hoặc TGA). Chiều dài trung bình của mỗi ORF khác nhau giữa
các loài. Ở E. coli, chiều dài trung bình của một ORF là 317 codon; trong khi ở
nấm men, chiều dài trung bình của một ORF là 483 codon. Nhưng nhìn chung,
mỗi ORF thường chứa nhiều hơn 50 codon. Vì vậy, để tìm các gen trong hệ gen, có
thể áp dụng phương pháp duyệt trình tự theo kiểu trượt dọc mỗi mạch ADN và tìm
các codon mở đầu và codon kết thúc cách nhau trên 100 codon. Phương pháp này
hiệu quả khi duyệt trình c¸c hÖ gen prokaryote v× hÖ gen cña chóng kh«ng cã
tÝnh ph©n m¶nh. Nhưng, với hệ gen eukaryote, phương pháp này gặp khó khăn vì
các ORF thường bị phân mảnh thành exon và intron. Việc duyệt trình tù hệ gen
eukaryote, kể cả ng−êi th−êng ph¶i nhê c¸c phÇn mÒm m¸y tÝnh nh− Grail,
Genemark, v.v… Nh÷ng phÇn mÒm nµy x¸c ®Þnh c¸c ORF kh«ng chØ dùa trªn
c¸c m· më ®Çu vµ kÕt thóc dÞch m·, mµ cßn dùa trªn mét sè thuËt to¸n thèng
kª x¸c ®Þnh nh÷ng ®o¹n cã tiÒm n¨ng m· hãa, còng nh− c¸c tr×nh tù vïng biªn
cña c¸c exon vµ intron, c¸c tr×nh tù ®iÒu hßa phiªn m·, nh− hộp TATA, INR,
DPE … lµ nh÷ng tr×nh tù cÇn thiÕt cho sù g¾n kÕt cña yÕu tè TFIID vµ phøc hÖ
phiªn m· cña ARN pol II (xem ch−¬ng 3). Tuy vËy, ngoµi c¸c m· më ®Çu vµ kÕt
thóc dÞch m·, c¸c tr×nh tù kh¸c cã møc ®é biÕn ®æi lín, nªn viÖc x¸c ®Þnh chÝnh
342
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
x¸c mét gen kh«ng ph¶i lóc nµo còng ®óng. §Ó h¹n chÕ nh−îc ®iÓm nµy, mét
ph−¬ng ph¸p bæ sung lµ gen ®−îc x¸c ®Þnh trªn c¬ së c¸c gen ®· biÕt ë c¸c loµi
sinh vËt kh¸c (v× chóng th−êng cã tr×nh tù t−¬ng ®ång hoÆc gièng nhau). Tuy
vËy, ph−¬ng ph¸p ®èi chiÕu nµy còng cã nguy c¬ lµ c¸c gen gi¶ (pseudogene,
th−êng kh«ng ®−îc phiªn m·) ®−îc tÝnh nhÇm lµ gen.
• So s¸nh cADN. Mét c¸ch hiÖu qu¶ ®Ó x¸c ®Þnh mét gen trong hÖ gen lµ so s¸nh
tr×nh tù cña nã víi mét b¶n sao cADN t−¬ng øng. Chóng ta biÕt r»ng, cADN
®−îc t¹o ra tõ mARN vµ chñ yÕu chøa c¸c tr×nh tù exon cña ORF. ViÖc so s¸nh
tr×nh tù cã thÓ thùc hiÖn nhê phÇn mÒm m¸y tÝnh hoÆc sö dông ph−¬ng ph¸p lai
gi÷a c¸c ®o¹n ADN hÖ gen víi mARN (ph−¬ng ph¸p lai Northern). C¸c ®o¹n
®¸nh dÊu tr×nh tù biÓu hiÖn - EST (expressed sequence tag) th−êng ®−îc sö
dông cho môc ®Ých nµy. EST thùc chÊt lµ c¸c ®o¹n tr×nh tù ng¾n (thường dài 200 –
500 bp) th−êng ®−îc t¹o ra trªn c¬ së gi¶i tr×nh tù tõ mét trong hai ®Çu cña mét
cADN. Nhê c¸c EST cã tÝnh ®¹i diÖn cho phÇn hÖ gen ®−îc biÓu hiÖn nªn chóng
rÊt hiÖu qu¶ ®Ó t×m kiÕm c¸c gen. Trong thùc nghiÖm, c¸c EST cßn nhiÒu −u ®iÓm
kh¸c n÷a, ®ã lµ: (1) c¸c ®o¹n EST ®−îc t¹o ra t−¬ng ®èi dÔ dµng vµ chi phÝ thÊp;
(2) chØ cÇn gi¶i tr×nh tù mét lÇn duy nhÊt lµ ®ñ ®Ó t¹o ra c¸c EST ®Æc thï víi mét
cADN, tøc lµ mét gen; (3) c¸c lçi g©y ra do gi¶i tr×nh tù th−êng kh«ng cÇn kiÓm tra
l¹i, bëi c¸c EST còng chØ ®−îc dïng ®Ó t×m c¸c tr×nh tù gÇn gièng. C¸c c¬ së d÷
liÖu EST hiÖn nay (vÝ dô: http://www.ncbi.nlm.nih.gov/dbEST/) cung cÊp trªn 5
triÖu tr×nh tù EST kh¸c nhau cña ng−êi. TÊt nhiªn, trong ®ã cã nhiÒu tr×nh tù
trïng nhiÒu lÇn (®Æc biÖt lµ c¸c gen cã møc ®é biÓu hiÖn cao vµ phæ biÕn); vµ cã
thÓ cßn thiÕu mét sè EST t−¬ng øng víi c¸c gen cã møc ®é biÓu hiÖn thÊp hoÆc
hiÕm gÆp (vÝ dô: chØ ë mét tÕ bµo, hoÆc
chØ biÓu hiÖn trong ®iÒu kiÖn ®Æc biÖt). a)
11.2.10. X¸c ®Þnh vai trß vµ chøc n¨ng gen
C¸c dù ¸n gi¶i tr×nh tù c¸c hÖ gen ®· dÉn Galactokinase
®Õn nhiÒu kÕt qu¶ thó vÞ vµ kh«ng Ýt bÊt ngê.
Ch¼ng h¹n nh−, c¸c nghiªn cøu ë E. coli vµ S. b)
cereviseae d−êng nh− ®· tiÕn hµnh chi tiÕt trong
hµng chôc n¨m, nh−ng khi gi¶i tr×nh tù xong hÖ H×nh 11.15. So s¸nh tr×nh tù cña
gen cña chóng, ng−êi ta míi biÕt r»ng míi chØ cã galactokinase tõ c¸c loµi kh¸c nhau.
30 - 40% sè gen cña chóng ®· tõng ®−îc nghiªn a) Ph¶n øng xóc t¸c bëi enzym galactokinase.
b) So s¸nh mét ®o¹n tr×nh tù axit amin cña
cøu. ë nh÷ng loµi kh¸c, bao gåm c¶ con ng−êi, tØ lÖ galactokinase gi÷a c¸c loµi.
c¸c gen ®· tõng ®−îc nghiªn cøu cßn thÊp h¬n
nhiÒu. Tuy vËy, sau khi hÖ gen ®· ®−îc gi¶i tr×nh Hs: Homo sapiens,
tù xong, cã mét sè ph−¬ng ph¸p kh¸c gióp nhanh Sc: Saccharomyces cerevisiae,
chãng x¸c ®Þnh ®−îc vai trß vµ chøc n¨ng cña Ec: Escherichia coli,
nhiÒu gen trong hÖ gen, bao gåm: Bs: Bacillus subtilis,
Ca: Candida albicans,
• T×m kiÕm nh÷ng tr×nh tù gièng nhau. Hi: Haemophilus influenza,
Còng gièng nh− viÖc sö dông c¸c c«ng cô St: Salmonella typhimurium,
tin häc trong viÖc t×m kiÕm c¸c tr×nh tù Kl: Kluyveromyces lactis,
m· hãa cña hÖ gen, c¸c c¬ së d÷ liÖu vÒ c¸c At: Arabidopsis thaliana.
gen ®· biÕt (ë c¸c loµi sinh vËt kh¸c nhau)
cã thÓ dïng ®Ó x¸c ®Þnh vai trß vµ chøc
n¨ng cña c¸c gen ch−a biÕt. ViÖc t×m kiÕm
c¸c tr×nh tù gièng nhau nµy th−êng dùa
trªn c¸c tr×nh tù axit amin t−¬ng øng víi
c¸c tr×nh tù gen, v× tÝnh ®a d¹ng cña tr×nh
343
§inh §oµn Long
tù ADN th−êng cao h¬n tr×nh tù polypeptide t−¬ng øng do tÝnh tho¸i hãa cña m·
bé ba. Thùc nghiÖm còng x¸c nhËn r»ng, c¸c gen cã cïng chøc n¨ng ë c¸c sinh
vËt kh¸c nhau lu«n cã ®Æc ®iÓm chung. Ch¼ng h¹n nh−, hÇu hÕt c¸c loµi ®Òu cã
kh¶ n¨ng chuyÓn hãa galactose → glucose-6-P, trong ®ã enzym tham gia b−íc
®Çu tiªn cña con ®−êng chuyÓn hãa nµy (galactose → galactose-1-P) lµ mét
galactose kinase cã tÝnh ®Æc thï ë mçi loµi, nh−ng chóng ®Òu cã mét sè ®o¹n
tr×nh tù gièng nhau (hình 11.15). Nh− trªn ®· nãi, tr−íc khi gi¶i xong tr×nh tù
hÖ gen nÊm men, chØ cã kho¶ng 30% trong tæng sè 6000 gen cña nÊm men ®·
®−îc biÕt. Nh−ng, sau khi gi¶i m· xong hÖ gen nÊm men, b»ng ph−¬ng ph¸p t×m
kiÕm c¸c tr×nh tù gièng nhau, ng−êi ta x¸c ®Þnh ®−îc thªm chøc n¨ng cña
kho¶ng 30% gen n÷a. Nh− vËy, cßn kho¶ng 40% gen ch−a râ chøc n¨ng. TÊt
nhiªn, trong sè nµy cã thÓ cã mét sè gen gi¶. ViÖc x¸c ®Þnh chøc n¨ng gen v× vËy
cßn cÇn c¸c ph−¬ng ph¸p phèi hîp kh¸c n÷a.
• X¸c ®Þnh chøc n¨ng gen b»ng thùc nghiÖm. ë c¸c loµi sinh vËt m« h×nh, nh− E.
coli hay S. cereviseae, mét trong nh÷ng ph−¬ng ph¸p c¬ b¶n ®Ó x¸c ®Þnh chøc
n¨ng cña mét gen ch−a biÕt lµ lµm bÊt ho¹t gen b»ng kü thuËt “knock-out”.
Trong kü thuËt nµy, ng−êi ta dïng nguyªn t¾c t¸i tæ hîp t−¬ng ®ång ®Ó lµm háng
c¸c b¶n sao b×nh th−êng cña gen. KiÓu h×nh cña c¸c thÓ ®ét biÕn ®−îc kiÓm tra
vµ ®èi chiÕu víi kiÓu d¹i ®Ó x¸c ®Þnh chøc n¨ng gen. Ph−¬ng ph¸p nµy cã hiÖu
qu¶ trong nghiªn cøu x¸c ®Þnh vai trß cña nhiÒu gen. Ch¼ng h¹n nh− ë nÊm
men, viÖc so s¸nh tr×nh tù kh«ng gióp x¸c ®Þnh ®−îc chøc n¨ng cña mét gen cã
tªn lµ SNU17, do tr×nh tù cña nã rÊt kh¸c víi tr×nh tù c¸c gen ®· biÕt. Nh−ng
khi gen nµy bÞ háng, tÕ bµo nÊm men chØ ph¸t triÓn chËm vµ th−êng cã nhiÒu
sai háng trong qu¸ tr×nh hoµn thiÖn mARN. Qua ®ã, chøc n¨ng cña SNU17 ®−îc
t×m thÊy lµ yÕu tè tham gia hoµn thiÖn mARN. §iÓm khã cña ph−¬ng ph¸p nµy
lµ trong nhiÒu tr−êng hîp, c¸c c¸ thÓ mang gen bÞ háng hoÆc chÕt sím hoÆc
kh«ng biÓu hiÖn kiÓu h×nh kh¸c biÖt. C¶ hai tr−êng hîp nµy ®Òu kh«ng dÉn ®Õn
kÕt luËn ch¾c ch¾n nµo. Khi gen bÞ “knock-out” g©y chÕt cã thÓ suy luËn r»ng
protein do gen m· hãa cã vai trß sèng cßn ®èi víi sinh vËt, nh−ng vai trß cô thÓ
thÕ nµo th× kh«ng râ. Mét ph−¬ng ph¸p c¶i tiÕn kh¸c ®Ó x¸c ®Þnh vai trß cña gen
lµ lµm t¨ng møc biÓu hiÖn cña nã, råi theo dâi kiÓu h×nh thÓ ®ét biÕn.
MÆc dï ®· cã c¸c ph−¬ng ph¸p ph¸t hiÖn chøc n¨ng gen nh− trªn, nh−ng nh×n chung
ë nhiÒu gen, chøc n¨ng gen ph¶i ®−îc ph©n tÝch trªn c¬ së tõng gen riªng rÏ. ThÕ nªn, khèi
l−îng c«ng viÖc cho m¶ng nghiªn cøu nµy cßn rÊt lín. Riªng nÊm men, cßn kho¶ng Ýt nhÊt
2000 gen ch−a ®−îc x¸c ®Þnh chøc n¨ng, cßn ë ng−êi vµo kho¶ng 20.000 gen.
11.3. C¸c kü thuËt ph©n tÝch protein
MÆc dï sù biÓu hiÖn cña gen th−êng ®−îc ®¸nh gi¸ ë møc ®é phiªn m· th«ng qua
viÖc ph©n tÝch s¶n phÈm phiªn m· lµ mARN (ch¼ng h¹n b»ng ph−¬ng ph¸p lai Northern
®· nªu ë trªn), nh−ng thùc tÕ l−îng mARN cã trong tÕ bµo kh«ng ph¶i lóc nµo còng
t−¬ng ®ång víi l−îng protein s¶n phÈm cuèi cïng cña gen vµ ho¹t tÝnh cña nã. Sù kh«ng
t−¬ng ®ång gi÷a l−îng s¶n phÈm phiªn m· víi l−îng vµ ho¹t tÝnh cña s¶n phÈm dÞch m·
cã thÓ do nhiÒu nguyªn nh©n, bao gåm:
a) Mét sè ARN kh«ng ®−îc dïng ®Ó dÞch m· nªn kh«ng t¹o bÊt cø protein nµo.
b) Mét sè tiÒn-ARN cã c¸ch xÐn intron biÕn ®æi nªn mét gen cã thÓ ®−îc dïng m·
hãa nhiÒu protein kh¸c nhau.
c) Tèc ®é dÞch m· vµ biÕn tÝnh c¸c mARN kh¸c nhau cã thÓ kh¸c nhau, nªn l−îng
mARN cã trong tÕ bµo ch−a ch¾c ®· t−¬ng quan víi l−îng protein.
344
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
d) Ho¹t tÝnh cña nhiÒu protein thay ®æi do nh÷ng c¶i biÕn protein sau dÞch m·,
ch¼ng h¹n nh− sù biÕn ®æi mét sè axit amin, sù bæ sung hay mÊt ®i mét sè nhãm
chøc (nh− acetyl, phosphate, AMP, ADP-ribose, v.v...).
e) NhiÒu protein ®−îc “c¾t tØa” sau dÞch m·, hoÆc ®−îc bæ sung thªm c¸c gèc ®−êng
hay lipid ®Ó t¹o thµnh c¸c glycoprotein vµ lipoprotein.
f) B¶n th©n c¸c protein cã ®é bÒn vµ tèc ®é ph©n hñy rÊt kh¸c nhau.
g) §ã lµ ch−a kÓ ®Õn nh÷ng biÕn ®æi cña protein cßn phô thuéc vµo c¸c ®iÒu kiÖn
sinh tr−ëng, ph¸t triÓn cña tÕ bµo; phô thuéc vµo c¸c ho¹t ®éng t−¬ng t¸c cña
protein víi c¸c gen vµ c¸c protein kh¸c. V× vËy, ®Ó ®¸nh gi¸ møc ®é biÓu hiÖn cña
mét gen, kh«ng thÓ chØ dõng ë møc phiªn m· vµ cßn cÇn ®¸nh gi¸ ë møc dÞch
m·. Ngoµi ra, sau giai ®o¹n nhiÒu hÖ gen sinh vËt m« h×nh vµ ng−êi ®· ®−îc gi¶i
tr×nh tù, vÊn ®Ò tån t¹i l¹i lµ phÇn lín c¸c gen cña chóng ch−a râ chøc n¨ng. VÝ
lý do nµy, nhiÒu nhµ khoa häc cho r»ng thÕ kû 21 lµ thÕ kû cña hÖ protein häc.
D−íi ®©y lµ mét sè ph−¬ng ph¸p ph©n tÝch protein c¬ b¶n.
11.3.1. ChuÈn bÞ dÞch nghiÒn tÕ bµo ®Ó tinh s¹ch protein
ViÖc ph©n lËp vµ tinh s¹ch c¸c protein riªng rÏ cã ý nghÜa quyÕt ®Þnh ®Õn kh¶ n¨ng
t×m hiÓu chøc n¨ng cña chóng. MÆc dï trong mét sè tr−êng hîp, chóng ta cã thÓ nghiªn
cøu chøc n¨ng cña protein ë d¹ng hçn hîp phøc t¹p, nh−ng phÇn lín nh÷ng nghiªn cøu
nµy th−êng dÉn ®Õn nh÷ng kÕt luËn kh«ng râ rµng. Ch¼ng h¹n nh− khi chóng ta nghiªn
cøu vÒ ho¹t tÝnh cña mét enzym ADN pol trong mét hçn hîp protein th« (ch¼ng h¹n tõ
dÞch ph©n gi¶i tÕ bµo), c¸c enzym ADN pol vµ protein thµnh phÇn kh¸c còng cã thÓ ¶nh
h−ëng ®Õn hiÖu suÊt tæng hîp ADN quan s¸t ®−îc trong thùc nghiÖm. V× vËy, viÖc tinh
s¹ch c¸c protein lµ mét b−íc quan träng trong qu¸ tr×nh t×m hiÓu chøc n¨ng cña chóng.
Mçi mét protein th−êng cã mét sè ®Æc tÝnh riªng nªn qui tr×nh tinh s¹ch chóng
th−êng cã tÝnh ®Æc thï. §iÒu nµy th× tr¸i ng−îc víi ADN, vèn nh×n chung gièng nhau vÒ
cÊu tróc vµ thµnh phÇn, chØ kh¸c nhau vÒ tr×nh tù nucleotide. C¸c b−íc tinh s¹ch protein
th−êng dùa trªn c¸c ®Æc tÝnh cña chóng vÒ kÝch th−íc, h×nh d¹ng, ®iÖn tÝch vµ nhiÒu khi
lµ chøc n¨ng.
VËt liÖu khëi ®Çu cho hÇu hÕt c¸c qu¸ tr×nh tinh s¹ch protein tõ sinh vËt lµ c¸c dÞch
nghiÒn tÕ bµo. Kh«ng gièng ADN vèn cã kh¶ n¨ng håi tÝnh kÓ c¶ khi ë ngoµi tÕ bµo,
protein rÊt dÔ bÞ biÕn tÝnh vµ bÞ ph©n hñy sau khi bÞ gi¶i phãng khái tÕ bµo. V× lý do nµy,
hÇu hÕt qu¸ tr×nh chuÈn bÞ c¸c dÞch chiÕt vµ tinh s¹ch protein cÇn ®−îc tiÕn hµnh ë nhiÖt
®é l¹nh (d−íi 4oC). Cã mét sè c¸ch chuÈn bÞ dÞch nghiÒn tÕ bµo. C¸c tÕ bµo cã thÓ ®−îc
ph©n gi¶i b»ng hãa chÊt, b»ng c¸c biÖn ph¸p c¬ häc lµm vì thµnh tÕ bµo, b»ng xö lý víi
dung dÞch nh−îc tr−¬ng (lµm tÕ bµo tr−¬ng lªn do n−íc ®i vµo vµ vì ra), v.v... §iÓm chung
cña c¸c ph−¬ng ph¸p lµ lµm thµnh tÕ bµo vì ra vµ gi¶i phãng c¸c protein. Trong nhiÒu
tr−êng hîp, c¸c tÕ bµo cÇn ®−îc chuyÓn vÒ tr¹ng th¸i ®«ng l¹nh, vÝ dô: b»ng m¸y c« l¹nh
ch©n kh«ng, sau ®ã ®−îc nghiÒn b»ng m¸y nghiÒn mÉu tr−íc khi tiÕn hµnh chiÕt xuÊt vµ
tinh s¹ch protein.
11.3.2. Sö dông s¾c ký cét ®Ó tinh s¹ch protein
C¸ch tinh s¹ch protein phæ biÕn nhÊt lµ sö dông c¸c ph−¬ng ph¸p s¾c ký cét.
Trong c¸c ph−¬ng ph¸p nµy, c¸c protein ®−îc cho ch¹y qua cét chøa hÖ thèng m¹ng l−íi
h×nh thµnh bëi c¸c h¹t agarose, polyacrylamide hoÆc dextran (Sephadex®). Tïy thuéc vµo
®Æc tÝnh cña protein, cã thÓ sö dông mét sè ph−¬ng ph¸p vµ qui tr×nh kü thuËt kh¸c
nhau. Cã ba ph−¬ng ph¸p s¾c ký cét c¬ b¶n lµ s¾c ký trao ®æi ion, s¾c ký läc gel vµ s¾c ký
¸i lùc.
345
§inh §oµn Long
11.3.2.1. S¾c ký trao ®æi ion
Trong ph−¬ng a) b)
ph¸p nµy, c¸c protein ++-
®−îc ph©n t¸ch dùa
trªn ®iÖn tÝch ion hãa - --++
bÒ mÆt cña chóng -++-
b»ng viÖc sö dông c¸c
vËt liÖu nhåi cét (cßn
®−îc gäi lµ pha tÜnh) Protein tÝch
lµ c¸c h¹t mang c¸c ®iÖn d−¬ng
nhãm tÝch ®iÖn ©m H¹t nhåi cét
hoÆc d−¬ng (h×nh tÝch ®iÖn ©m
11.16a). C¸c protein Protein tÝch
t−¬ng t¸c yÕu víi pha ®iÖn ©m
tÜnh (ch¼ng h¹n,
protein tÝch ®iÖn
d−¬ng ®−îc cho ch¹y
qua pha tÜnh mang
®iÖn ©m) ban ®Çu H×nh 11.16. S¾c ký cét ®Ó tinh s¹ch protein. a) S¾c ký trao ®æi ion, b) S¾c ký läc
®−îc gi÷ l¹i trong cét, gel (vÏ theo Watson et al., 2004)
sau ®ã sÏ ®−îc röa
chiÕt b»ng mét dung dÞch muçi lo·ng ch¶y qua cét (dung dÞch ®Öm ch¹y mÉu ®−îc gäi lµ
pha ®éng). C¸c protein t−¬ng t¸c víi pha tÜnh cµng m¹nh, cµng cÇn nång ®é muèi cao ®Ó
röa chiÕt. B»ng viÖc t¨ng gradient nång ®é muèi trong c¸c dung dÞch ®Öm röa chiÕt, c¸c
protein kh¸c nhau vÒ kÝch th−íc, khèi l−îng vµ møc ®é ion hãa bÒ mÆt sÏ ph©n t¸ch khái
nhau thµnh c¸c ph©n ®o¹n khi chóng ®i qua cét.
11.3.2.2. S¾c ký läc gel
S¾c ký läc gel (h×nh 11.16b) cho phÐp ph©n t¸ch c¸c protein chñ yÕu kh¸c nhau vÒ
h×nh d¹ng vµ kÝch th−íc. Kh¸c víi s¾c ký trao ®æi ion, vËt liÖu ®Ó nhåi cét kh«ng mang
c¸c nhãm tÝch ®iÖn mµ thay vµo ®ã chóng t¹o nªn hÖ thèng m¹ng cã kÝch th−íc lç kh¸c
nhau (gièng gel, v× vËy gäi lµ s¾c ký läc gel). C¸c ph©n tö protein cµng nhá cµng cã kh¶
n¨ng th©m nhËp vµo tÊt c¶ c¸c lç cã kÝch th−íc kh¸c nhau; v× vËy, thêi gian ch¹y qua cét
sÏ dµi h¬n vµ ®−îc röa chiÕt muén h¬n. Ng−îc l¹i, c¸c ph©n tö protein cµng lín cµng ®−îc
röa chiÕt sím.
Trong s¾c ký cét, c¸c ph©n ®o¹n thu ®−îc ë nång ®é muèi kh¸c nhau hoÆc ë thêi
gian kh¸c nhau, ®ång thêi cã ho¹t tÝnh protein mong ®îi cao nhÊt ®−îc tÝch lòy vµ tinh
s¹ch bæ sung. Møc ®é tinh s¹ch cña protein cã xu h−íng t¨ng lªn khi c¸c ph©n ®o¹n
protein ®−îc cho ch¹y qua nhiÒu lo¹i cét s¾c ký kh¸c nhau. Th−êng th× mét cét s¾c ký
®¬n lÎ kh«ng ®ñ ®Ó tinh s¹ch mét lo¹i protein mong muèn dï qui tr×nh s¾c ký ®ã ®−îc lÆp
l¹i nhiÒu lÇn. Thay vµo ®ã, ng−êi ta th−êng ¸p dông mét lo¹t c¸c kü thuËt ®Ó cã thÓ thu
håi mét ph©n ®o¹n chøa mét l−îng lín protein ®−îc quan t©m. Nãi c¸ch kh¸c, tuy cã
nhiÒu ph©n tö protein ®−îc röa chiÕt trong dung dÞch muèi ®Ëm ®Æc tõ cét tÝch ®iÖn
d−¬ng (vÝ dô tr−êng hîp protein tÝch ®−îc ©m) hoÆc ®−îc röa chiÕt trong s¾c ký läc gel
(víi protein kÝch th−íc nhá), c¸c kü thuËt ®¬n lÎ nµy th−êng kh«ng ®ñ ®Ó cã thÓ thu ®−îc
mét s¶n phÈm protein tinh s¹ch hoµn toµn.
11.3.2.3. S¾c ký ¸i lùc hç trî tinh s¹ch protein
§Æc tÝnh cña mçi lo¹i protein cã thÓ ®−îc dïng nh»m lµm tinh s¹ch lo¹i protein
t−¬ng øng. Ch¼ng h¹n, nÕu mét lo¹i protein cã tÝnh liªn kÕt ®Æc hiÖu víi ATP, th× cã thÓ
346
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
dïng cét s¾c ký mang vËt liÖu g¾n kÕt víi ATP ®Ó ph©n t¸ch protein ®ã. ChØ cã protein
liªn kÕt víi ATP míi ®−îc cét gi÷ l¹i, cßn hÇu hÕt c¸c protein kh«ng liªn kÕt víi ATP bÞ
röa tr«i khái cét. Kü thuËt tinh s¹ch nµy ®−îc gäi lµ s¾c ký ¸i lùc. Cã nhiÒu chÊt kh¸c
nhau cã thÓ ®−îc dïng ®Ó g¾n kÕt víi vËt liÖu nhåi cét vµ gióp qu¸ tr×nh tinh s¹ch
protein ®¹t hiÖu qu¶ cao h¬n. C¸c chÊt nµy bao gåm c¶ ADN (®Ó tinh s¹ch protein liªn
kÕt ADN) hay thËm chÝ lµ protein (®Ó tinh s¹ch mét lo¹i protein kh¸c t−¬ng t¸c ®Æc thï
víi nã). Nh− vËy, ®Ó tinh s¹ch mét protein nµo ®ã, cÇn ph¶i cã nh÷ng hiÓu biÕt c¬ b¶n vÒ
®Æc tÝnh lý hãa cña protein ®ã.
Mét d¹ng cña s¾c ký ¸i lùc ®−îc dïng phæ biÕn lµ s¾c ký ¸i lùc miÔn dÞch. Trong
ph−¬ng ph¸p nµy, ng−êi ta g¾n kh¸ng thÓ ®Æc hiÖu víi protein ®Ých lªn vËt liÖu lµm cét.
Trong tr−êng hîp lý t−ëng, lo¹i kh¸ng thÓ nµy chØ liªn kÕt ®óng víi protein cÇn tinh
s¹ch. Lo¹i protein liªn kÕt víi kh¸ng thÓ sau ®ã ®−îc röa chiÕt b»ng c¸ch cho ch¶y qua
cét dung dÞch muèi hoÆc chÊt tÈy nhÑ. Khã kh¨n gÆp ph¶i víi ph−¬ng ph¸p nµy lµ ®«i khi
liªn kÕt kh¸ng thÓ - protein bÒn v÷ng ®Õn møc ph¶i g©y biÕn tÝnh protein míi thu håi
®−îc s¶n phÈm. Nh−ng, kh«ng gièng ADN, protein sau khi biÕn tÝnh th−êng kh«ng håi
tÝnh trong ®iÒu kiÖn in vitro, nªn protein thu ®−îc nhiÒu khi kh«ng ë d¹ng ho¹t ®éng
chøc n¨ng.
§Ó t¨ng hiÖu suÊt tinh s¹ch, còng cã thÓ c¶i biÕn protein. Mét vÝ dô vÒ sù c¶i biÕn
nµy lµ bæ sung mét ®o¹n peptide ng¾n vµo ®Çu C hoÆc ®Çu N cña ph©n tö protein cÇn
ph©n tÝch. ViÖc bæ sung “tr×nh tù ®¸nh dÊu” nµy cã thÓ thùc hiÖn ®−îc b»ng kü thuËt di
truyÒn. C¸c tr×nh tù peptide ®¸nh dÊu lµm thay ®æi mét sè thuéc tÝnh cña protein vµ
gióp viÖc tinh chÕ dÔ dµng h¬n. VÝ dô, mét sè protein sau khi ®−îc bæ sung mét chuçi
peptide gåm 6 His trë nªn t−¬ng t¸c víi cét Ni2+ tèt h¬n vµ dÔ ph©n t¸ch h¬n (trong khi
nh÷ng protein kh¸c kh«ng cã ®Æc tÝnh nµy). Còng cã thÓ sö dông epitop ®Æc hiÖu
(th−êng lµ mét ®o¹n peptide cã 5 - 7 axit amin x¸c ®Þnh kh¸ng nguyªn) ®Ó tinh s¹ch lo¹i
protein cã ¸i lùc cao víi nã. C¸c c¶i tiÕn nµy cho phÐp tinh s¹ch c¸c protein trªn c¬ së
nguyªn t¾c miÔn dÞch. ¦u ®iÓm cña ph−¬ng ph¸p nµy lµ: c¸c epitop cã thÓ thay ®æi tÝnh
liªn kÕt kh¸ng thÓ tïy thuéc vµo ®iÒu kiÖn m«i tr−êng (ch¼ng h¹n, ¸i lùc gi¶m khi cã
Ca2+, vµ t¨ng khi kh«ng cã Ca2+). §iÒu nµy gióp h¹n chÕ viÖc sö dông c¸c yÕu tè g©y biÕn
tÝnh kh¸c.
Nguyªn t¾c s¾c ký ¸i lùc miÔn dÞch còng ®−îc dïng ®Ó g©y kÕt tña nhanh mét lo¹i
protein ®Æc hiÖu nµo ®ã tõ dÞch chiÕt th«. Trong tr−êng hîp nµy, ph¶n øng kÕt tña miÔn
dÞch x¶y ra do kh¸ng thÓ ®−îc g¾n vµo cïng lo¹i vËt liÖu lµm pha tÜnh trong s¾c ký cét.
Do c¸c h¹t nµy cã kÝch th−íc lín nªn chóng l¾ng rÊt nhanh trong èng nghiÖm chøa dung
dÞch ®Öm vµ mang theo c¸c protein liªn kÕt víi chóng (qua kh¸ng thÓ). Kü thuËt nµy
®−îc gäi lµ kÕt tña miÔn dÞch, còng ®−îc dïng ngµy cµng phæ biÕn trong c¸c thÝ nghiÖm
cÇn tinh s¹ch protein. MÆc dï nÕu chØ dïng riªng rÏ ph−¬ng ph¸p nµy, hiÕm khi thu ®−îc
s¶n phÈm protein tinh s¹ch hoµn toµn, song ph−¬ng ph¸p nµy rÊt hiÖu qu¶ ®Ó x¸c ®Þnh
c¸c lo¹i protein hoÆc hîp chÊt kh¸c (vÝ dô mét tr×nh tù ADN) cã t−¬ng t¸c víi mét lo¹i
protein ®Ých nµo ®ã.
11.3.3. Ph©n tÝch protein trªn gel polyacrylamide
11.3.3.1. Kü thuËt ®iÖn di trªn gel polyacrylamide (PAGE)
Kh«ng gièng c¸c axit nucleic, protein th−êng kh«ng mang ®iÖn tÝch ®ång ®Òu hay cã
cÊu tróc bËc hai ®ång nhÊt däc chiÒu dµi ph©n tö. Thay vµo ®ã, tõ 20 lo¹i axit amin c¬
b¶n (trong ®ã cã 15 axit amin trung tÝnh, 3 axit amin tÝch ®iÖn d−¬ng, 2 axit amin tÝch
®iÖn ©m; xem ch−¬ng 1) phÇn lín c¸c protein lµ trung tÝnh, mét sè kh¸c tÝch ®iÖn d−¬ng,
sè cßn l¹i tÝch ®iÖn ©m. Ngoµi cÊu tróc bËc 2, protein ë d¹ng ho¹t ®éng th−êng cã cÊu tróc
bËc 3 hoÆc 4 ®iÓn h×nh. Nh−ng khi ®−îc ®−îc xö lý víi c¸c chÊt tÈy (ion hãa) m¹nh nh−
347
§inh §oµn Long
SDS (sodium dodecyl sulphate, c«ng thøc lµ CH3-(CH2)11SO4-) hay c¸c chÊt khö nhãm
sulfhydryl, nh− β-mercapthoethanol (HS-CH2CH2OH) th× c¸c cÊu tróc bËc 2, 3 vµ 4
cña protein bÞ ph¸ vì. Lóc nµy, SDS t¹o thµnh líp vá ion ©m bao bäc protein lµm protein
trë nªn tÝch ®iÖn ©m ®ång ®Òu däc ph©n tö. β-mecarptoethanol lµm “®øt g·y” c¸c liªn kÕt
disulfide (S-S) gi÷a c¸c Cys. Trªn c¬ së nµy, nÕu c¸c ph©n tö protein ®−îc g©y biÕn tÝnh
bëi SDS vµ β-mercaptoethanol, th× sù ph©n t¸ch protein trong ®iÖn di chñ yÕu lµ do sù
kh¸c biÖt vÒ kÝch th−íc vµ khèi l−îng ph©n tö. Khi kh«ng cã SDS vµ β-mercaptoethanol,
c¸c protein vÉn cã thÓ ph©n t¸ch b»ng ®iÖn di, nh−ng lóc nµy sù ph©n t¸ch cña chóng cßn
phô thuéc vµo nhiÒu yÕu tè kh¸c nh− cÊu h×nh, ®iÓm ®¼ng ®iÖn, sù t−¬ng t¸c ph©n tö ...
Mét ®iÓm kh¸c biÖt n÷a so víi c¸c axit nucleic lµ protein th−êng cã kÝch th−íc trung
b×nh nhá h¬n nhiÒu so víi c¸c axit nucleic, nªn gel ®iÖn di protein th−êng ®−îc lµm tõ
polyacrylamide. HÖ thèng “m¹ng” mµ hîp chÊt polyme nh©n t¹o nµy t¹o ra nhá h¬n so
víi gel agarose. Kü thuËt ®iÖn di trªn gen polyacrylamide ®−îc viÕt t¾t lµ PAGE. Sau khi
®iÖn di, ®Ó quan s¸t c¸c protein ®−îc nhuém víi mét trong hai chÊt nhuém phæ biÕn lµ
Coomassie blue hoÆc b¹c (Ag2+). Coomassie blue liªn kÕt chÆt víi protein t¹o nªn c¸c
b¨ng ®iÖn di cã mµu xanh; c¸c nguyªn tö b¹c còng liªn kÕt m¹nh víi protein t¹o nªn
phøc hÖ cã mµu n©u – ®en. Nhuém b¹c th−êng nh¹y h¬n coomassie blue, nh−ng ®¾t h¬n.
11.3.3.2. §iÖn di protein trªn gel polyacrylamide hai chiÒu (2D-PAGE)
Do sè l−îng c¸c ph©n tö protein trong c¸c mÉu sinh häc th−êng rÊt lín nªn ph−¬ng
ph¸p ®iÖn di th«ng th−êng kh«ng ®ñ ®Ó ph©n t¸ch c¸c protein gièng nhau ra khái nhau.
V× vËy, c¸c ph©n tö protein th−êng ®−îc t¸ch tr−íc tiªn dùa trªn sù kh¸c biÖt vµ ®iÖn
tÝch bÒ mÆt cña chóng (gäi lµ chiÒu thø nhÊt); sau ®ã, dùa trªn sù kh¸c biÖt vÒ kÝch th−íc
(gäi lµ chiÒu thø hai). Ph−¬ng ph¸p ®iÖn di nµy ®−îc tiÕn hµnh trªn gel polyacrylamide
vµ ®−îc gäi t¾t lµ 2D-PAGE. Trong chiÒu thø nhÊt, mét gradient pH (tõ ~3 ®Õn 10)
®−îc t¹o ra däc b¶n gel. C¸c protein tïy theo ®iÖn tÝch bÒ mÆt cña chóng sÏ dÞch chuyÓn
trªn gel ®iÖn di vÒ vÞ trÝ cã ®é pH t−¬ng ®−¬ng víi ®iÓm ®¼ng ®iÖn (pI) cña chóng (lµ
®iÓm mµ ®iÖn tÝch cña chóng ®−îc trung hßa). C¸c protein cã cïng ®iÓm ®¼ng ®iÖn sau ®ã
®−îc ph©n t¸ch nhê sù kh¸c nhau vÒ kÝch th−íc theo ph−¬ng ph¸p ®iÖn di th«ng th−êng.
C¸c kü thuËt 2D-PAGE c¶i tiÕn gÇn ®©y cho phÐp ph©n t¸ch ®ång thêi trªn 10.000
protein kh¸c nhau. Trªn b¶n ®iÖn di 2D-PAGE, mçi lo¹i protein th−êng "héi tô" thµnh
nh÷ng "vÕt ®èm". Mçi vÕt ®èm nµy sau ®ã cã thÓ ®−îc c¾t ra khái gel, xö lý víi protease,
råi ph©n tÝch b»ng ph−¬ng ph¸p khèi phæ (xem d−íi ®©y) ®Ó x¸c ®Þnh lo¹i protein.
11.3.4. §Þnh tÝnh protein dùa trªn thÈm t¸ch miÔn dÞch – lai Western
Tuy cã b¶n chÊt kh¸c ADN vµ ARN, viÖc x¸c ®Þnh sù cã mÆt mét lo¹i protein trong
mÉu sinh häc còng ®−îc thùc hiÖn theo nguyªn t¾c lai vµ ®−îc gäi lµ lai Western. Tuy
nhiªn, kh«ng gièng c¸c ph−¬ng ph¸p lai axit nucleic dùa trªn nguyªn t¾c liªn kÕt
Chargaff (b¶ng 11.2), lai Western lµ ph−¬ng ph¸p ®Þnh tÝnh protein dùa trªn nguyªn t¾c
miÔn dÞch; v× vËy, nã
cßn ®−îc gäi lµ thÈm B¶ng 11.2. C¸c ph−¬ng ph¸p lai ®Ó ph©n tÝch ADN, ARN vµ protein
t¸ch miÔn dÞch
Ph−¬ng ph¸p lai Lo¹i ph©n tö cÇn ph©n tÝch B¶n chÊt mÉu dß
(immunoblotting).
Trong lai Western, Southern ADN ADN (m¹ch ®¬n)
c¸c ph©n tö protein
sau khi ®−îc ph©n Northern ARN ADN (m¹ch ®¬n)
t¸ch trªn ®iÖn di Western Protein Kh¸ng thÓ
®−îc chuyÓn lªn
mµng. Mµng nµy sau South-Western Protein ADN (sîi kÐp)
®ã ®−îc ñ trong mét
348
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
dung dÞch chøa kh¸ng thÓ ®Æc hiÖu víi protein ®−îc quan t©m nghiªn cøu. Kh¸ng thÓ sÏ
g¾n vµo lo¹i protein t−¬ng øng ë trªn mµng. Cuèi cïng, b»ng ph¶n øng enzym hiÖn mµu,
ng−êi ta cã thÓ quan s¸t ®−îc vÞ trÝ kh¸ng thÓ ë trªn mµng, qua ®ã cho biÕt sù cã mÆt vµ
khèi l−îng ph©n tö cña protein. Nh− vËy, ®iÓm chung cña tÊt c¶ c¸c ph−¬ng ph¸p lai
Southern, Northern vµ Western lµ sö dông c¸c hîp chÊt chän läc ®Ó ph¸t hiÖn sù cã mÆt
cña mét hoÆc mét sè lo¹i ph©n tö ®Æc thï trong c¸c hçn hîp phøc t¹p.
Mét ph−¬ng ph¸p lai c¶i tiÕn kh¸c ®−îc dïng ®Ó ph¸t hiÖn c¸c protein liªn kÕt ADN
lµ lai South-Western. Trong ph−¬ng ph¸p nµy, ng−êi ta dïng mÉu dß ADN (thay cho
kh¸ng thÓ trong lai Western) ®Ó lai víi c¸c protein. NÕu nh− trong lai Southern, mÉu dß
ADN th−êng ë d¹ng m¹ch ®¬n, th× mÉu dß trong lai South-Western th−êng ë d¹ng sîi kÐp,
v× phÇn lín protein liªn kÕt víi ADN sîi kÐp.
11.3.5. §Þnh lo¹i vµ gi¶i tr×nh tù protein
MÆc dï cã cÊu t¹o phøc t¹p h¬n so víi c¸c axit nucleic, c¸c ph©n tö protein còng cã
thÓ gi¶i tr×nh tù trùc tiÕp. Cã hai ph−¬ng ph¸p ®−îc sö dông phæ biÕn h¬n c¶ lµ: (1)
ph−¬ng ph¸p biÕn tÝnh Edman vµ (2) ph−¬ng ph¸p khèi phæ.
11.3.5.1. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p g©y biÕn tÝnh Edman
Ph−¬ng ph¸p g©y biÕn tÝnh Edman lµ ph−¬ng ph¸p gi¶i tr×nh tù axit amin cña
c¸c ®o¹n peptide ng¾n, dùa trªn viÖc ®¸nh dÊu vµ c¾t axit amin ®Çu N lÇn l−ît khái
chuçi peptide mµ kh«ng ¶nh h−ëng ®Õn c¸c liªn kÕt peptide kh¸c trong ph©n tö protein.
Ph¶n øng c¾t ®−îc thùc hiÖn bëi phenylisothyocyanate (PITC, h×nh 11.17). Trong
dung dÞch kiÒm nhÑ, PITC ph¶n øng víi axit amin ®Çu N ®Ó h×nh thµnh nªn dÉn xuÊt
phenylthiocarbamoyl. Khi chuyÓn sang m«i tr−êng axit, axit amin ®Çu N bÞ “®øt ra” ë
d¹ng dÉn xuÊt axit amin thiazolinone. Axit amin thiazolinone sau ®ã ®−îc chiÕt xuÊt
chän läc b»ng dung m«i h÷u c¬, råi xö lý víi mét lo¹i axit ®Ó h×nh thµnh nªn dÉn xuÊt
bÒn v÷ng cña axit amin lµ phenylthiohydantoin (PTH). ChÊt nµy cã thÓ x¸c ®Þnh b»ng
s¾c ký hoÆc ®iÖn di. Quy tr×nh nµy ®−îc lÇn l−ît lÆp l¹i cho ®Õn axit amin cuèi cïng trong
chuçi polypeptide ®Ó gi¶i tr×nh tù. H¹n chÕ lín nhÊt cña kü thuËt nµy lµ hiÖu qu¶ gi¶i
tr×nh tù thÊp ë c¸c ®o¹n peptide dµi trªn 30 axit amin. Së dÜ nh− vËy, v× ph¶n øng biÕn
tÝnh c¸c axit amin ë c¸c ®o¹n peptide dµi th−êng kh«ng triÖt ®Ó. Mét h¹n chÕ kh¸c lµ kü
thuËt nµy gÆp trë ng¹i khi axit amin ®Çu N bÞ c¶i biÕn hãa häc (vÝ dô ®−îc g¾n thªm
nhãm acetyl hoÆc formyl) mµ hiÖn t−îng nµy vèn cã thÓ x¶y ra tù nhiªn trong ®iÒu kiÖn
in vivo, hoÆc trong qu¸ tr×nh t¸ch chiÕt vµ tinh s¹ch protein. Tuy vËy, c¶ hai h¹n chÕ nµy
Ph¶n øng biÕn tÝnh Edman Phenylisothiocyanate Alanine
Chu kú biÕn tÝnh 2 Chu kú biÕn tÝnh 1 §¸nh dÊu axit §¸nh dÊu axit
amin ®Çu N amin ®Çu N
Gi¶i phãng axit Gi¶i phãng axit
amin ®Çu N
PITC-alanine amin ®Çu N
§¸nh dÊu axit
amin ®Çu N
Gi¶i phãng axit
amin ®Çu N
§o¹n peptide ng¾n ®i 1 axit amin
H×nh 11.17. Gi¶i tr×nh tù protein trùc tiÕp b»ng ph−¬ng ph¸p biÕn tÝnh Edman (vÏ theo Watson vµ cs, 2004)
349
§inh §oµn Long
®Òu cã thÓ ®−îc kh¾c phôc b»ng c¸ch dïng protease c¾t c¸c ®o¹n peptide lín thµnh c¸c
®o¹n peptide nhá h¬n tr−íc khi gi¶i tr×nh tù. Víi ®o¹n peptide dµi 30 axit amin, ®é chÝnh
x¸c trong gi¶i tr×nh tù cña ph−¬ng ph¸p Edman lµ 98%. Dùa trªn nguyªn lý biÕn tÝnh
Edman, m¸y gi¶i tr×nh tù protein tù ®éng còng ®· ®−îc ph¸t triÓn vµ dïng réng r·i.
11.3.5.2. Gi¶i tr×nh tù protein b»ng ph−¬ng ph¸p khèi phæ
ViÖc ph©n tÝch c¸c protein hoÆc c¸c ®o¹n peptide b»ng ph−¬ng ph¸p khèi phæ
(MS) dùa trªn c¸c kü thuËt hãa ph©n tÝch cã ®é chÝnh x¸c cao; vµ gÇn ®©y ®−îc thiÕt kÕ
thµnh c¸c hÖ thèng tù ®éng do m¸y tÝnh ®iÒu khiÓn. Trong ph−¬ng ph¸p nµy, cã hai kü
thuËt c¬ b¶n quan träng nhÊt lµ ph©n hñy laser trong chÊt mang (th−êng gäi t¾t lµ
MALDI) vµ ion hãa phun ®iÖn (gäi t¾t lµ ESI). Kü thuËt MS gióp ®o tØ sè [khèi l−îng /
®iÖn tÝch] (m/z) cña ion, tõ ®ã x¸c ®Þnh ®−îc khèi l−îng ph©n tö. Nh−ng nÕu kh«ng cã c¸c
kü thuËt MALDI vµ ESI, MS kh«ng trùc tiÕp ph©n tÝch ®−îc c¸c ph©n tö lín nh− protein.
Trong kü thuËt MALDI (h×nh 11.18a), c¸c xung laser ®−îc dïng ®Ó “b¾n ph¸” c¸c
tinh thÓ chÊt r¾n vµ truyÒn n¨ng l−îng ®Ó c¸c ion cña tinh thÓ “b¾n ra” ë d¹ng khÝ. §èi
víi protein, ®Çu tiªn c¸c mÉu ®−îc “tinh thÓ” hãa (chuyÓn sang d¹ng r¾n) b»ng viÖc sö
dông chÊt nÒn. ChÊt nÒn ®−îc dïng trong kü thuËt MALDI th−êng lµ c¸c axit th¬m nh−
4-methoxy cinnamic acid. Sau khi bÞ tia laser “b¾n ph¸”, chÊt nÒn truyÒn n¨ng l−îng cho
“tinh thÓ” protein, lµm gi¶i phãng c¸c ion mµ kÝch th−íc vµ ®iÖn tÝch cña chóng ®Æc thï
víi mçi lo¹i protein. C¸c ion (lóc nµy ë d¹ng khÝ) ®−îc gia tèc trong mét tr−êng ®iÖn tõ cã
hiÖu ®iÖn thÕ cao sÏ bay qua mét èng ch©n kh«ng tíi c¶m biÕn tÝn hiÖu. ThiÕt bÞ c¶m biÕn
nµy ®o ®−îc kho¶ng thêi gian bay cña ion tõ nguån ph¸t sinh ion (tinh thÓ protein) tíi
®iÓm c¶m biÕn. Thêi gian ion bay tØ lÖ thuËn víi c¨n bËc hai cña tØ sè m/z. ThÕ nªn, tõ
thêi gian bay cã thÓ x¸c ®Þnh ®−îc tØ sè m/z cña mçi ion; tËp hîp c¸c tÝn hiÖu cña c¸c ion
cho phÐp x¸c ®Þnh tr×nh tù axit amin cña protein. Ph−¬ng ph¸p x¸c ®Þnh tØ sè m/z qua
thêi gian bay cña c¸c ion ®−îc gäi lµ kü thuËt t¸ch thêi gian bay (gäi t¾t lµ TOF).
Ph−¬ng ph¸p MS dùa trªn hai kü thuËt MALDI vµ TOF ®−îc gäi chung lµ MALDI-TOF.
V× kü thuËt MALDI-TOF rÊt nh¹y nªn l−îng mÉu ®−a vµo ph©n tÝch hiÖn nay cÇn
nhá h¬n 10-12mole. §Ó cã ®−îc mÉu protein tinh s¹ch ë l−îng nhá, ng−êi ta th−êng tiÕn
hµnh ®iÖn di 2D-PAGE ®Ó ph©n t¸ch protein; råi mçi protein ®−îc th«i khái gel vµ c¾t
b»ng protease (vÝ dô trypsin) thµnh mét tËp hîp c¸c ®o¹n peptide (th−êng ng¾n h¬n 20
axit amin) ®Æc thï cña mçi protein. Ngoµi viÖc x¸c ®Þnh ®−îc tr×nh tù axit amin, kü thuËt
MALDI-TOF ®ång thêi cho phÐp ph¸t hiÖn ®−îc c¸c protein ®−îc biÕn ®æi sau dÞch m·,
ch¼ng h¹n x¸c ®Þnh ®−îc c¸c axit amin ®−îc g¾n thªm c¸c gèc phosphate hoÆc gèc ®−êng.
Kü thuËt MALDI-TOF hiÖn nay cho phÐp gi¶i tr×nh tù cña protein cã khèi l−îng tíi
a) b)
Ph©n tö mÉu ë
d¹ng tinh thÓ Mao qu¶n dÉn mÉu
®−îc g¾n lªn Tia laser C¶m biÕn tø cùc (bÉy ion)Vïng chuyÓn
Vïng chuyÓn C¶m biÕn TOF tr¹ng th¸i
chÊt mang
tr¹ng th¸i
Dung dÞch Giät dÞch Giät dÞch H¹t ion L−íi
chøa mÉu mang mÉu mang mÉu trÇn tÝch ®iÖn
nhá h¬n
ChÊt mang H×nh 11.18. C¸c ph−¬ng ph¸p khèi phæ. a) Ph−¬ng ph¸p khèi phæ
Ph©n tö mÉu L−íi
bÞ ion hãa tÝch ®iÖn ph©n hñy laser trong chÊt mang kÕt hîp víi thêi gian bay
(MALDI/TOF), b) Ph−¬ng ph¸p ion hãa phun ®iÖn (ESI).
350
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
100.000 Da trong mét lÇn “c«ng ph¸” mÉu. Tuy vËy, víi c¸c c¶i tiÕn kü thuËt kh«ng
ngõng, cã lÏ thêi gian tíi, giíi h¹n ph©n tÝch protein cña MALDI-TOF sÏ cßn tiÕp tôc
t¨ng lªn.
NÕu MALDI lµ kü thuËt ®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ chÊt r¾n, th× ESI
®−îc dïng ®Ó t¹o ra c¸c ion ë d¹ng khÝ tõ dÞch láng. Trong ESI, ng−êi ta dïng mét mao
qu¶n ®Ó nhá giät chÊt láng vµo tr−êng ®iÖn tõ cã hiÖu ®iÖn thÕ cao (h×nh 11.18b). Dung
m«i sÏ bay h¬i nhanh vµ giät nhá sÏ “vì ra”. Sù vì ra nh− vËy diÔn ra nhiÒu lÇn liªn tiÕp
t¹o nªn c¸c ion ®éc lËp (ion trÇn). C¸c h¹t ion ®−îc gia tèc bay trong èng ch©n kh«ng ®Õn
khi tiÕp cËn vµ ®−îc ®o khèi l−îng bëi bé c¶m biÕn tø cùc, cßn gäi lµ bÉy ion. Nh− vËy,
bÉy ion th−êng ®−îc dïng víi khèi phæ ESI. Khèi phæ ESI cã −u ®iÓm lµ nã th−êng ®−îc
nèi trùc tiÕp víi mét hÖ thèng ph©n t¸ch dÞch láng, bao gåm c¸c kü thuËt ®iÖn di mao
qu¶n (CE) hoÆc s¾c ký láng cao ¸p (HPLC). MÆc dï th«ng th−êng kh«ng ®−îc nèi trùc
tiÕp víi c¸c hÖ thèng MALDI-TOF, nh−ng c¸c kü thuËt CE vµ HPLC còng cã thÓ ®−îc
dïng ®Ó tinh s¹ch protein tr−íc khi ph©n tÝch b»ng MALDI-TOF.
Ngoµi ra, trong kü thuËt MS, do hiÖn t−îng c¸c ion “gèc” cã thÓ ph©n r· thµnh c¸c
ion “con”, nªn kü thuËt khèi phæ cã thÓ ®−îc thùc hiÖn nhiÒu lÇn kÕ tiÕp ®Ó thu ®−îc c¸c
sè liÖu ph©n tÝch chi tiÕt h¬n vÒ mçi ph©n tö protein. Kü thuËt nµy ®−îc gäi lµ khèi
phæ kÕ tiÕp (viÕt t¾t lµ MS/MS). Kü thuËt nµy cho phÐp ph©n biÖt ®−îc hai ion cã cïng
khèi l−îng (vÝ dô: ®Ó ph©n biÖt hai ®o¹n peptide ng¾n cã cïng thµnh phÇn axit amin
nh−ng kh¸c nhau vÒ tr×nh tù). Trong thùc tÕ, ®Ó gi¶i a) MiÒn ho¹t
tr×nh tù c¸c ®o¹n peptide hoÆc protein míi, ng−êi ta YÕu tè phiªn m· hãa enzym
th−êng ph¶i dïng ph−¬ng ph¸p khèi phæ kÕ tiÕp.
MiÒn liªn
11.3.6. Ph©n tÝch t−¬ng t¸c protein - protein kÕt ADN
Däc theo gi¸o tr×nh nµy, chóng ta nhËn thÊy ADN ARN pol
c¸c mèi t−¬ng t¸c gi÷a c¸c ®¹i ph©n tö (ADN, ARN Gen chØ thÞ
vµ protein) cã vai trß trung t©m ®iÒu hßa hÇu hÕt c¸c
ho¹t ®éng sèng cña tÕ bµo vµ c¬ thÓ sinh vËt. Trong VÞ trÝ Gen biÓu hiÖn
®ã, t−¬ng t¸c gi÷a c¸c protein víi nhau cã vai trß nhËn biÕt
quyÕt ®Þnh trùc tiÕp ®ång thêi cã tÝnh ®a d¹ng vµ “VËt s¨n måi”
phøc t¹p nhÊt. Cã nhiÒu ph−¬ng ph¸p kh¸c nhau b)
®−îc dïng ®Ó ®¸nh gi¸ t−¬ng t¸c gi÷a c¸c protein nh»m
MiÒn ho¹t
gãp phÇn lµm s¸ng tá chøc n¨ng cña chóng. ë ®©y, hãa enzym
chóng ta chØ ®Ò cËp ®Õn 3 ph−¬ng ph¸p lµ: (1) hÖ
thèng lai hai dßng ë nÊm men, (2) ®ång kÕt tña miÔn “Måi” “VËt s¨n måi”
dÞch vµ (3) kü thuËt vi d·y protein. kh«ng b¾t
MiÒn liªn
11.3.6.1. HÖ thèng lai hai dßng ë nÊm men kÕt ADN ARN pol ®−îc “måi”
Gen chØ thÞ
HÖ thèng lai hai dßng dùa trªn ®Æc ®iÓm cÊu
tróc ph©n tö cña phÇn lín protein ho¹t hãa phiªn m·. Gen kh«ng biÓu hiÖn
Tõ ch−¬ng 5 chóng ta biÕt r»ng, nhiÒu protein ho¹t
hãa phiªn m· cã hai miÒn ho¹t tÝnh: miÒn liªn kÕt c) “VËt s¨n måi”
ADN, viÕt t¾t lµ DBD (th−êng nhËn ra c¸c ®o¹n tr×nh “Måi”
tù ®Æc hiÖu ng−îc dßng promoter) vµ miÒn ho¹t hãa, MiÒn ho¹t
viÕt t¾t lµ AD (cã vai trß thóc ®Èy phiªn m· sau khi MiÒn liªn hãa enzym
®Ýnh kÕt víi ARN polymerase). Khi hai miÒn nµy
t−¬ng t¸c víi nhau, chóng ho¹t hãa sù phiªn m· cña kÕt ADN “VËt s¨n måi”
gen. VÒ nguyªn t¾c, hai miÒn AD vµ DBD kh«ng nhÊt
thiÕt ph¶i liªn kÕt céng hãa trÞ trªn cïng ph©n tö ARN pol b¾t ®−îc “måi”
Gen chØ thÞ
Gen biÓu hiÖn
H×nh 11.19. Nguyªn t¾c cña hÖ thèng lai
hai dßng. Xem néi dung trong phÇn diÔn
gi¶i (vÏ theo Clark, 2006).
351
§inh §oµn Long
protein. ThÕ nªn, trong hÖ thèng lai hai dßng, hai miÒn AD vµ DBD ®−îc "dung hîp" víi
hai protein kh¸c nhau, gi¶ sö ®−îc kÝ hiÖu lµ A vµ B (h×nh 11.19). Hai protein lai nµy
®−îc coi lµ "måi" (AD-A) vµ "vËt s¨n måi" (DBD-B). NÕu "vËt s¨n måi" b¾t ®−îc "måi", tøc
lµ A vµ B t−¬ng t¸c víi nhau, mét phøc hÖ sÏ h×nh thµnh vµ ho¹t hãa gen. Ng−êi ta sö
dông mét gen chØ thÞ ®Ó x¸c nhËn cã hay kh«ng sù t−¬ng t¸c gi÷a hai protein lai.
M« h×nh lai hai dßng ®−îc ph¸t triÓn ë nÊm men vµ ®−îc dïng ®Ó kiÓm tra mèi
t−¬ng t¸c gi÷a kho¶ng 6000 lo¹i protein kh¸c nhau ë sinh vËt nµy. Theo lý thuyÕt, sÏ
ph¶i kiÓm tra 6000x6000 tæ hîp protein kh¸c nhau. §Ó thùc hiÖn ®−îc ®iÒu ®ã, mçi ORF
cña hÖ gen nÊm men ®Òu ®−îc nh©n dßng vµo hai lo¹i vect¬ kh¸c nhau: mét vect¬ mang
miÒn AD, cßn mét vect¬ mang miÒn DBD. Nãi c¸ch kh¸c, mçi protein cña nÊm men ®Òu
®−îc kiÓm tra trong vai trß lµ "måi" vµ "vËt b¾t måi". C¸c vect¬ ®Òu ®−îc thiÕt kÕ sao cho
c¸c ORF t−¬ng øng víi hai miÒn AD vµ DBD ®Òu ®−îc ho¹t hãa biÓu hiÖn bëi cïng mét
yÕu tè ho¹t hãa phiªn m·, vÝ dô nh− GAL4 (h×nh 11.20). Vect¬ A cã vÞ trÝ "®a nh©n dßng"
n»m ng−îc dßng ®o¹n gen GAL4-AD gióp t¹o nªn ph©n tö lai A-GAL4-AD, cßn vect¬ B
cã vÞ trÝ n»m xu«i dßng ®o¹n gen GAL4-DBD gióp t¹o nªn ph©n tö lai GAL4-DBD-B.
Hai vect¬ plasmid lai ®−îc biÕn n¹p vµo c¸c tÕ bµo nÊm men kh¸c giíi tÝnh. KÕt qu¶
lµ h×nh thµnh hai nhãm giíi tÝnh, mçi nhãm gåm 6000 dßng tÕ bµo nÊm men mang c¸c
vect¬ biÕn n¹p kh¸c nhau. Sau ®ã, mçi dßng tÕ bµo thuéc nhãm nµy (giíi tÝnh nµy) ®−îc
®em lai víi mçi dßng thuéc §iÓm khëi ®Çu sao
nhãm kia (giíi tÝnh kia). §iÓm chÐp ë vi khuÈn
NghÜa lµ mäi kh¶ n¨ng tæ khëi ®Çu
sao chÐp
hîp gi÷a c¸c AD vµ DBD
thuéc c¸c protein kh¸c nhau ë nÊm Vect¬ Vect¬
®Òu x¶y ra. Khi c¸c dßng men “vËt b¾t måi” “måi”
nÊm men "lai" víi nhau, (B) (A)
chóng h×nh thµnh nªn d¹ng Promoter Tr×nh tù “vËt b¾t måi” Tr×nh tù “måi”
bµo tö l−ìng béi (2n) mang
c¶ hai plasmid "måi" vµ "vËt
s¨n måi". NÕu hai protein “vËt b¾t måi” “måi”
lai lµ A vµ B t−¬ng t¸c víi
nhau, gen chØ thÞ sÏ biÓu T−¬ng t¸c ¸i
hiÖn. Trong m« h×nh ë nÊm lùc cao gi÷a
men, hai gen chØ thÞ ®−îc sö c¸c protein
dông lµ HIS3 vµ URA3. NÕu
gen HIS3 vµ URA3 kh«ng
®−îc ho¹t hãa, tÕ bµo nÊm
men sÏ chÕt nÕu m«i tr−êng
kh«ng cã t−¬ng øng histidine
(His) vµ uracine (U). Nh−
vËy, nÕu tÕ bµo nÊm men lai
(2n) cã thÓ sinh tr−ëng ®−îc
trªn m«i tr−êng kh«ng cã ADN ARN ARN
His hoÆc U th× chøng tá c¸c pol ADN pol
gen chØ thÞ HIS3 vµ URA3 ®·
®−îc ho¹t hãa; tøc lµ hai
protein A vµ B ®· t−¬ng t¸c
víi nhau. Trªn m« h×nh ë Chän läc trªn m«i Chän khuÈn l¹c mµu xanh lam
h×nh 11.20, hai gen chØ thÞ tr−êng thiÕu His (His-) trªn m«i tr−êng cã X-gal
®−îc dïng lµ HIS3 vµ LacZ.
Trong ®ã, gen LacZ m· hãa H×nh 11.20. C¸c vect¬ ®−îc thiÕt kÕ cho hÖ thèng lai hai dßng.
cho β-galactosidase. Enzym Xem néi dung trong phÇn diÔn gi¶i (vÏ theo Clark, 2006).
352
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
nµy chuyÓn hãa hîp chÊt kh«ng mµu lµ X-gal (5- Ph©n tö ARN
brom-4-chlor-3-idolyl-β-D-galactoside) thµnh
hîp chÊt cã mµu xanh lam lµ 5-brom-4-chlor- MiÒn liªn MiÒn ho¹t
indigo. V× vËy, khi gen chØ thÞ lµ LacZ, nÕu cã kÕt ADN hãa enzym
t−¬ng t¸c gi÷a c¸c protein, tÕ bµo sÏ cã mµu
xanh lam khi nu«i trong m«i tr−êng cã X-gal. ADN ARN pol
Gen chØ thÞ
¦u ®iÓm næi bËt nhÊt cña hÖ thèng lai
kÐp ë nÊm men lµ cho phÐp ®¸nh gi¸ sù t−¬ng VÞ trÝ
t¸c protein – protein trong tÕ bµo. Tuy vËy, nã nhËn biÕt
còng cã mét sè h¹n chÕ. KiÓu t−¬ng t¸c protein
- protein nµy chØ giíi h¹n trong nh©n tÕ bµo. H×nh 11.21. M« h×nh lai ba dßng.
HÇu hÕt c¸c protein mµng tÕ bµo "gÊp nÕp" sai
khi ë trong nh©n; ng−îc l¹i, c¸c protein trong Gen ®ang Tr×nh tù FLAG
nh©n cã xu h−íng bÞ “biÕn ®æi” sai khi ë tÕ bµo nghiªn cøu
chÊt. §éc tÝnh t¹o ra do sù t−¬ng t¸c gi÷a c¸c
protein lín (c¸c protein lai th−êng cã kÝch ADN BiÕn n¹p vµo tÕ
th−íc lín h¬n d¹ng tù nhiªn) cã thÓ dÉn ®Õn plasmid bµo ®éng vËt
viÖc ®¸nh gi¸ sai mét sè t−¬ng t¸c quan träng. nu«i cÊy in vitro
Ngoµi ra, mét sè t−¬ng t¸c protein-protein cßn Promoter
phô thuéc vµo sù cã mÆt cña ARN hoÆc mét sè ®éng vËt cã vó Thu tÕ bµo vµ
ph©n tö nhá kh¸c kh«ng chøng minh ®−îc t¸ch tÕ bµo chÊt
b»ng m« h×nh nµy. Protein
kh¸c Kh¸ng thÓ
Mét hÖ thèng lai ®−îc c¶i tiÕn nh»m kh¾c Phøc hÖ cña FLAG
phôc h¹n chÕ trªn ®−îc gäi lµ hÖ thèng lai ba protein
dßng (h×nh 11.21). Trong hÖ thèng nµy, hai H¹t ®−îc
protein (AD-A vµ DBD-B) ®−îc ®¸nh gi¸ t−¬ng “bäc” b»ng
t¸c ®ång thêi víi ph©n tö ARN mµ c¶ hai protein A
protein cïng liªn kÕt. M« h×nh nµy cã thÓ ®−îc
dïng ®Ó sµng läc c¸c protein t−¬ng t¸c ARN. Ly t©m thu h¹t vµ ch¹y
®iÖn di trªn gel SDS-PAGE
HÖ thèng lai hai dßng ë nÊm men còng cã
thÓ ¸p dông víi c¸c gen tõ c¸c loµi kh¸c. Ngoµi 3 lo¹i protein liªn kÕt trong phøc hÖ
ra, mét sè h·ng (nh− Stratagene, Mü) ®· thiÕt Protein ®−îc ®¸nh dÊu bëi FLAG
lËp hÖ thèng lai hai dßng dïng vi khuÈn E.
coli. Trong m« h×nh ë E. coli, hai gen chØ thÞ
®−îc dïng lµ bla (kh¸ng ampicillin) vµ lacZ.
11.3.6.2. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch H×nh 11.22. Ph−¬ng ph¸p ®ång kÕt tña miÔn dÞch.
ë ®éng vËt cã vó, sù t−¬ng t¸c gi÷a c¸c protein cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng
ph¸p ®ång kÕt tña miÔn dÞch (h×nh 11.22). Gen m· hãa cho protein ®−îc biÕn n¹p vµ
biÓu hiÖn trong tÕ bµo ®éng vËt; sau ®ã, ph©n lËp lo¹i protein ®−îc quan t©m nghiªn cøu
võa tæng hîp tõ tÕ bµo chÊt nhê kh¸ng thÓ. Trong tr−êng hîp ch−a cã kh¸ng thÓ t−¬ng
øng, th× protein ®−îc “g¾n” víi mét peptide ®¸nh dÊu, gäi lµ FLAG. Sau ®ã, kh¸ng thÓ
t−¬ng øng víi FLAG ®−îc dïng ®Ó ph©n lËp protein cÇn nghiªn cøu. Th−êng th× viÖc
ph©n lËp protein dùa trªn nguyªn t¾c “kh¸ng nguyªn - kh¸ng thÓ” ®−îc thùc hiÖn trong
®iÒu kiÖn in-vitro gièng víi ®iÒu kiÖn in-vivo. V× vËy, sau khi ph©n lËp, protein nghiªn
cøu ngoµi liªn kÕt víi kh¸ng thÓ cßn ®ång thêi ë d¹ng phøc hÖ víi c¸c protein kh¸c. Phøc
hÖ protein nµy sau ®ã ®−îc ph©n t¸ch bëi ®iÖn di SDS-PAGE nh»m x¸c ®Þnh xem cã bao
nhiªu protein thµnh phÇn tham gia vµo phøc hÖ. ViÖc x¸c ®Þnh protein thµnh phÇn cã thÓ
thùc hiÖn b»ng ph−¬ng ph¸p khèi phæ hoÆc gi¶i tr×nh tù protein.
353
§inh §oµn Long
Ng−êi ta cã thÓ dïng ph−¬ng ph¸p ®ång kÕt tña HHHHHH Th− viÖn protein
miÔn dÞch ®Ó kiÓm tra mèi t−¬ng t¸c protein – protein HHHHHH ®¸nh dÊu bëi His6
trong hÖ thèng lai hai dßng. Tr−íc tiªn, mçi lo¹i
protein ®−îc quan t©m nghiªn cøu sÏ ®−îc “g¾n” t−¬ng HHHHHH HHHHHH
øng víi c¸c peptide ®¸nh dÊu lµ FLAG vµ His6. Hai HHHHHH
cÊu tróc ADN m· hãa t−¬ng øng cho c¸c protein “dung His6 HHHHHH
hîp” nµy ®−îc “®ång biÕn n¹p” vµo tÕ bµo ®éng vËt.
+
Sau ®ã, lÇn l−ît mçi lo¹i kh¸ng thÓ t−¬ng øng víi tõng
peptide ®¸nh dÊu ®−îc dïng ®Ó ph©n lËp phøc hÖ Lam kÝnh
protein; phøc hÖ nµy sau ®ã ®−îc tiÕn hµnh ®iÖn di g¾n ion Niken
SDS-PAGE. Gel ®iÖn di sau ®ã ®−îc chuyÓn lªn mµng
nitrocellulose vµ ®−îc lai víi “mÉu dß” kh¸ng thÓ
t−¬ng øng víi His6 (anti-His6) vµ FLAG (anti-FLAG).
NÕu hai lo¹i protein t−¬ng t¸c víi nhau, chóng xuÊt
hiÖn trªn c¶ hai b¶n gel trong lai Western.
11.3.6.3. Vi d·y protein (protein microarray) Protein liªn kÕt víi
Ni qua His6
C¸c ph−¬ng ph¸p nghiªn cøu protein tr−íc ®©y
th−êng ph©n tÝch tõng lo¹i protein riªng lÎ. Cïng víi
nh÷ng tiÕn bé gÇn ®©y trong gi¶i tr×nh tù hÖ gen, còng
cã nhiÒu ph−¬ng ph¸p ®−îc c¶i tiÕn cho phÐp ph©n
tÝch ®ång thêi nhiÒu protein. Trong ®ã, cã c¸c ph−¬ng
ph¸p vi d·y protein.
C¸c ph−¬ng ph¸p vi d·y protein ®−îc dïng phæ
biÕn trong c¸c nghiªn cøu hãa sinh vµ x¸c ®Þnh ho¹t
®é enzym; ®ång thêi ®Ó x¸c ®Þnh sù t−¬ng t¸c gi÷a c¸c
protein víi nhau. §Õn nay, phÇn lín qui tr×nh vi d·y
protein dùa trªn m« h×nh ë nÊm men S. cerevisiae.
§Ó nghiªn cøu t−¬ng t¸c cña hÖ protein nÊm H×nh 11.23. Kü thuËt g¾n protein lªn
men (gåm kho¶ng 6000 protein), 90% sè gen m· hãa lam kÝnh trong vi d y protein.
protein tõ ng©n hµng hÖ gen ®· ®−îc t¸i tæ hîp víi ®o¹n ADN m· hãa peptide ®¸nh dÊu
His6. §o¹n peptide ®¸nh dÊu nµy cho phÐp protein "g¾n lªn" chÊt nÒn qua liªn kÕt gi÷a
His vµ Ni (h×nh 11.23). T−¬ng t¸c protein cã thÓ ph©n tÝch gi÷a tõng cÆp protein riªng
biÖt, hoÆc ®−îc "sµng läc" víi hçn hîp toµn bé hÖ protein; sau ®ã ph©n thµnh c¸c nhãm
nhá ®Ó tiÕp tôc ph©n tÝch nÕu kÕt qu¶ t−¬ng t¸c lµ d−¬ng tÝnh.
C¸c thÝ nghiÖm ph©n tÝch chøc n¨ng ®−îc thiÕt kÕ sao cho viÖc ph©n tÝch c¸c d·y
ph¶n øng thuËn tiÖn nhÊt (th−êng dïng c¸c chÊt ph¸t quang, ®«i khi dïng ®ång vÞ phãng
x¹).VÝ dô: ®Ó t×m c¸c protein nÊm men ®Ýnh kÕt víi calmodulin (mét protein liªn kÕt
Ca2+) hay phospholipid (thµnh phÇn mµng tÕ bµo), ng−êi ta sö dông vi d·y protein ®¸nh
®Êu b»ng His6 ®Ýnh kÕt lªn lam kÝnh g¾n Ni. C¶ calmodulin vµ phospholipide ®Òu ®−îc
®¸nh dÊu b»ng biotin. C¸c protein t−¬ng t¸c calmodulin vµ phospholipide ®−îc nhËn diÖn
nhê streptavidin mang chÊt ph¸t quang Cy3 (h×nh 11.24). B»ng ph−¬ng ph¸p nµy, mét
phßng thÝ nghiÖm t¹i §¹i häc Yale (Mü) trong mét thÝ nghiÖm vi d·y protein ®· t×m ®−îc
139 protein liªn kÕt calmodulin vµ 150 protein liªn kÕt phospholipid tõ nÊm men.
11.3.7. VÒ hÖ protein häc (proteomics) vµ hÖ chuyÓn hãa häc (metabolomics)
ViÖc ph¸t triÓn cña c¸c kü thuËt gi¶i tr×nh tù ADN, kÕt hîp víi t¸ch chiÕt, tinh s¹ch
vµ gi¶i tr×nh tù protein ®· më ®−êng cho sù ra ®êi mét chuyªn ngµnh míi gäi lµ hÖ
protein häc (proteomics). HÖ protein häc nghiªn cøu vÒ toµn bé c¸c protein ®−îc mét
354
Ch−¬ng 11. Ph©n tÝch gen vµ s¶n phÈm cña gen
m«, tÕ bµo hoÆc c¬ thÓ t¹o ra trong ®iÒu kiÖn nhÊt ®Þnh, ®ång thêi x¸c ®Þnh møc ®é phæ
biÕn cña mçi lo¹i protein vµ sù t−¬ng t¸c cña chóng víi nhau vµ víi c¸c ph©n tö kh¸c
(nh− ADN hay ARN). NÕu nh− c¸c kü thuËt vi d·y ADN cã thÓ gióp x¸c ®Þnh ®−îc sù
biÓu hiÖn cña c¸c gen trªn cë së ph©n tÝch hÖ gen, th× c¸c kü thuËt proteomics cho phÐp
x¸c ®Þnh ®−îc bøc tranh tæng thÓ vÒ toµn bé protein cña mçi tÕ bµo, m« hoÆc c¬ thÓ.
Proteomics dùa trªn ba ph−¬ng ph¸p chÝnh, bao gåm: (1) 2D-PAGE ®Ó ph©n t¸ch
c¸c protein, (2) MS ®Ó x¸c ®Þnh khèi l−îng ph©n tö vµ tr×nh tù axit amin, (3) tin sinh häc
®Ó so s¸nh gi÷a c¸c ph©n tö protein vµ c¸c ®o¹n peptide víi c¸c tr×nh tù m· hãa chóng
trong hÖ gen. Trong thùc tÕ, c¸c nghiªn cøu hÖ gen häc (genomics) vµ hÖ protein häc
(proteomics) th−êng ®−îc phèi hîp víi nhau trong c¸c nghiªn cøu di truyÒn häc ph©n tö
hiÖn ®¹i.
Bªn c¹nh hÖ gen häc vµ hÖ protein häc, gÇn ®©y mét lÜnh vùc nghiªn cøu míi còng
th−êng ®−îc phèi hîp víi hai chuyªn ngµnh nªu trªn ®−îc gäi lµ hÖ chuyÓn hãa häc
hay hÖ trao ®æi chÊt häc (metabolomics). HÖ chuyÓn hãa häc nghiªn cøu toµn bé c¸c
chÊt chuyÓn hãa ®−îc tÝch lòy trong mét m«, tÕ bµo hoÆc c¬ thÓ ë nh÷ng ®iÒu kiÖn nhÊt
®Þnh. HÇu hÕt c¸c chÊt chuyÓn hãa hiÖn nay ®Òu cã thÓ x¸c ®Þnh ®−îc b»ng ph−¬ng ph¸p
khèi phæ (MS), hoÆc ®«i khi b»ng ph−¬ng ph¸p céng
C¸c protein ®−îc sµng läc h−ëng tõ h¹t nh©n (NMR). Ph−¬ng ph¸p MS cã ®é nh¹y
cao vµ cã thÓ dïng ph©n tÝch nhiÒu nhãm ph©n tö kh¸c
nhau. 12C cã khèi l−îng ®óng 12 Da. Trong khi ®ã, khèi
His6 l−îng cña c¸c nguyªn tö kh¸c, nh− 14N hay 16O, kh«ng
Ni Ni Ni Ni Ni Ni ph¶i lµ mét sè nguyªn. C¸c ph−¬ng ph¸p MS sö dông ®é
ph©n gi¶i khèi l−îng cùc cao, gäi lµ EHMR, cã thÓ gióp
ñ víi phospholipid ®−îc Lam x¸c ®Þnh chÝnh x¸c c«ng thøc ph©n tö cña hÇu hÕt mäi
®¸nh dÊu b»ng Biotin kÝnh chÊt chuyÓn hãa trong tÕ bµo sinh vËt, kÓ c¶ c¸c ®ång
ph©n (cã c«ng thøc ph©n tö gièng nhau).
Biotin
Phospholipid C¸c ph©n tÝch hÖ chuyÓn hãa ®Æc biÖt h÷u Ých
trong nghiªn cøu c¸c chÊt sinh häc thø cÊp (nh− c¸c chÊt
t¹o mµu, t¹o mïi, c¸c alkaloid, saponin, v.v…) vèn ®Æc
thï ë thùc vËt. VÝ dô, khi sö dông c¶ hai dÞch chiÕt n−íc
Ni Ni Ni Ni Ni Ni vµ h÷u c¬ tõ qu¶ d©u t©y, ng−êi ta ®· x¸c ®Þnh ®−îc
Bæ sung avidin g¾n víi kho¶ng 7000 chÊt chuyÓn hãa kh¸c nhau. NÕu in ra th×
chÊt ph¸t quang Cy3 phæ EHMR cã thÓ dµi vµi ba km. ViÖc so s¸nh hÖ chuyÓn
hãa gi÷a mét d¹ng ®ét biÕn qu¶ tr¾ng víi d¹ng kiÓu d¹i
ChÊt ph¸t quang qu¶ ®á ®· trùc tiÕp cho thÊy sù kh¸c nhau vÒ hµm l−îng
mét sè chÊt chuyÓn hãa trung gian trong con ®−êng tæng
Avidin Avidin hîp c¸c chÊt t¹o mµu (s¾c tè) nãi chung vµ s¾c tè ®á nãi
riªng (h×nh 11.25).
Ni Ni Ni Ni Ni Ni Qu¶ tr¾ng
X
Qu¶ ®á
X
Y
H×nh 11.24. Sµng läc protein b»ng
ph−¬ng ph¸p vi d y sö dông H×nh 11.25. Phæ MS cho biÕt thµnh phÇn c¸c chÊt chuyÓn hãa kh¸c
Biotin / Streptavidin.
nhau gi÷a d¹ng kiÓu d¹i (qu¶ ®á) vµ ®ét biÕn (qu¶ tr¾ng) ë d©u t©y.
355