Wybierz wersję / Choose version

Ekspresja genów

Dorota Olszewska

Terminem “ekspresja genów” określamy wyrażanie informacji genetycznej. Proces ten obejmuje dwa etapy:
– transkrypcję – przepisywanie informacji genetycznej z DNA na mRNA,
– translację – tłumaczenie informacji genetycznej z mRNA na białko.

Klasyczny przepływ informacji ma zatem postać:

transkrypcja translacja
DNA RNA białko

 

1. Kod genetyczny

Struktura cząsteczki DNA jest względnie prosta i monotonna, co było przyczyną trudności w zrozumieniu mechanizmów kodowaniu informacji. Problemy te zostały rozwiązane w latach 60, w momencie wykrycia kodu genetycznego.
Informacja potrzebna komórce i całemu organizmowi dotyczy głównie porządku aminokwasów w łańcuchu polipeptydowym. To ich struktura pierwotna warunkuje wyższą organizację i aktywność biologiczną. Jedyną zmienną w cząsteczce DNA jest porządek przyłączania zasad. Istnieją tylko 4 typy zasad azotowych, które łączone w triplety kodują różne aminokwasy (20 aminokwasów budujących białka). Potrzeba uporządkowanego związania trzech zasad (43 = 64 możliwe różne triplety), aby określić kod aminokwasu.
Sekwencyjne ułożenie trzech nukleotydów w DNA lub RNA, które w sposób specyficzny określa kolejność wbudowywanych aminokwasów w cząsteczkę białka, nosi nazwę kodu genetycznego (ryc. 4.1). Rozpatrując dowolnie wybrany region DNA stwierdzono, że tylko jedna z dwóch nici koduje białko. Dlatego kod genetyczny określany jest raczej jako sekwencja zasad, niż par zasad. Opisana w umownym kierunku 5’-3’ sekwencja nukleotydów nici DNA, kodująca białko odpowiada sekwencji aminokwasów białka opisanej w kierunku od N-końcowej do C-końcowej.
Przekodowanie sekwencji nukleotydowej w sekwencję białkową odbywa się w cytozolu drogą translacji. Zgodnie z założeniami procesu translacji, motyw trzech zasad zwany kodonem odpowiada jednemu aminokwasowi, co stwarza pozory nadmiaru kodonów (64 kodony i jedynie 20 aminokwasów). Istnienie “nadmiaru” kodonów nazwano degeneracją (niejednoznacznością) kodu genetycznego, co oznacza, że wiele różnych kodonów może odpowiadać temu samemu aminokwasowi. Mimo pejoratywnego brzmienia, degeneracja kodu genetycznego jest korzystna dla komórki. W niektórych przypadkach mutacji może ulec DNA, jednakże sekwencja aminokwasów w syntetyzowanym białku nie ulegnie zmianie (dotyczy to najczęściej mutacji trzeciej zasady w triplecie).
Trzy z 64 kodonów pełnią funkcję sygnałów interpunkcji czyli kodonów nonsensownych lub “stop” – UAA (ochre), UAG (amber), UGA (opal), które wskazują miejsce zatrzymania translacji.
Rycina 4.2 ukazuje, że zjawisko degeneracji kodu nie jest przypadkowe. Aminokwasami najczęściej występującymi w białkach są te, które posiadają najwięcej kodonów. Analiza porównawcza sekwencji zasad w DNA i sekwencji aminokwasów w białkach wykazała, że kodony nie są wykorzystywane z tą samą częstotliwością u wszystkich organizmów.
Kod genetyczny jest uniwersalny (istnieją trzy wyjątki – tab. 4.1). Z punktu widzenia ewolucji, stwierdzenie to świadczy o wspólnym pochodzeniu wszystkich organizmów żywych (wirusów), organizmów prokariotycznych i eukariotycznych.
Kod genetyczny zbudowany jest z zasad występujących w RNA.

Tabela 4.1: Wyjątki od uniwersalności kodu genetycznego

 

 

Organizm

 

Kodony

 

Mycoplasma capricolum

 

UGA = tryptofan zamiast znaku STOP

 

DNA mitochondrialny ssaków

 

UGA = tryptofan zamiast znaku STOP
AGA i AGG = znak STOP zamiast argininy
AUA i AUU = inicjacja (podobnie jak AUG)
AUA = metionina zamiast izoleucyny

 

Orzęski

 

UAA i UAG = glutamina zamiast znaku
STOP
(u tych organizmów istnieje tylko jeden kodon “STOP” – UGA)

 

Ryc. 4.1. Kod genetyczny, opis klasyczny

Ryc. 4.2. Częstość wbudowywania aminokwasów w białka. Kolorem niebieskim oznaczono średnią częstość występowania odpowiednich aminokwasów w białkach

 

2. Materiał genetyczny

 

Stwierdzono, że nie istnieje żaden związek pomiędzy rozmiarami organizmu a ilością DNA w jądrach komórek. Niektóre rośliny i płazy posiadają prawie 100 razy więcej DNA w jądrze komórki niż człowiek. U Eukaryota, w przeciwieństwie do organizmów prokariotycznych, ilość DNA jest co najmniej 10 razy większa od koniecznej do zakodowania ogółu białek. Geny otoczone są więc olbrzymią ilością DNA niekodującego, którego niektóre sekwencje charakteryzują się szczególną budową. DNA tego rodzaju nazwano śmieciowym (junk –) i ten rodzaj DNA czasami może podlegać transkrypcji.

2.1. Heterogenność DNA

Doświadczenia przeprowadzane w celu zbadania kinetyki ponownego łączenia się dwóch nici DNA (renaturacji), uprzednio zdenaturowanych (nici rozdzielonych pod wpływem temperatury wyższej od temperatury topnienia tego DNA), pozwoliły ustalić istnienie trzech typów DNA:
1. Nici DNA łączące się prawie natychmiast, odpowiadające DNA wysoce powtarzalnemu, satelitarnemu, istniejącemu w olbrzymiej liczbie kopii. DNA ten nie jest kodującym i stanowi od 10 do 15% genomu ssaków (kilkaset milionów par zasad u człowieka). Ten typ DNA zgromadzony jest głównie w okolicy centromerów chromosomu (odpowiada on prążkom C, czyli heterochromatynie strukturalnej). Analiza sekwencji tego DNA pozwoliła wyróżnić trzy odrębne typy:
– najliczniej występujący, składający się z motywów złożonych z krótkich sekwencji tandemowych (5 do 10 par zasad), bardzo często powtarzanych (badania chromosomu Y wykazały, że sekwencje te są hipermetylowane w komórkach somatycznych i hipometylowane w komórkach rozrodczych);
– dłuższe sekwencje tandemowe (100 do 200 par zasad);
– rozproszone sekwencje bardzo często powtarzane (minisatelity), rozmieszczone poza heterochromatyną strukturalną.
2. Nici DNA łączące się wolniej, odpowiadające DNA umiarkowanie powtarzalnemu. Reprezentuje on od 20 do 40% genomu ludzkiego. Jest również zbudowany z powtarzających się sekwencji, lecz najdłuższe z nich liczą do 1000 par zasad. Ten typ DNA rozmieszczony jest w całym genomie. Jego fragmenty często są powtarzane w sposób niedoskonały (są wystarczająco homologiczne aby hybrydyzować, ale w hybrydach często występują błędy w parowaniu – mismatch). Charakterystyczne dla tej grupy są dwie rodziny sekwencji:
– sekwencje Alu (długość sekwencji ok. 300 par zasad; istnieje ich około 500 000 kopii w genomie ludzkim) – należą do rodzin sekwencji SINES (Short Interspersed Repeated Sequences – krótkie rozproszone powtórzenia);
– sekwencje LINE (Long Interspersed Repeated Sequences),długie rozproszone powtórzenia. Są to najdłuższe znane sekwencje niekodujące, otoczone regionami bogatymi w AT, rozproszone w całym genomie.
3. DNA łączący się bardzo wolno, odpowiadający sekwencjom unikalnym, np. gen fibroiny jedwabiu, umożliwiający syntezę dużych ilości białka, występujący w pojedynczej kopii w haploidalnym genomie jedwabnika.
Czas reasocjacji DNA zależny jest od ilości sekwencji powtarzających się wielokrotnie, np. dla 10% połowiczny czas reasocjacji wynosi kilka sekund, co wskazuje na występowanie w nim wielokrotnie powtarzających się sekwencji. Około 20% DNA myszy ulega renaturacji z szybkością pośrednią – DNA ten zawiera umiarkowanie powtarzające się sekwencje. Pozostałe 70% DNA myszy renaturuje bardzo wolno, co sugeruje, że w jego skład wchodzą nie powtarzające się, unikalne sekwencje.

 

2.1.1. DNA umiarkowanie powtarzalny (rozdz. 4.2.1 – typ 2)

Właściwością niektórych genów jest to, że powtarzają się one wiele tysięcy razy. Ogromna ilość kopii zwiększa prawdopodobieństwo napotkania sekwencji komplementarnej. Geny te należą do kategorii DNA umiarkowanie powtarzalnego, a głównym ich typem są geny rybosomów (RNA rybosomowy).
Ten typ DNA może zawierać geny kodujące: rRNA, tRNA, RNA 5S i RNA 7SL (cząsteczka małego, cytoplazmatycznego RNA zawierająca 300 nukleotydów).
Geny rybosomów (ryc. 4.3) są przepisywane przy pomocy polimerazy RNA I (geny klasy I). Zostają one przepisane na prekursory 45S, które po etapie dojrzewania dostarczają 3 z 4 cząstek RNA rybosomalnego (RNA28S – odpowiednik prokariotycznego RNA23S, RNA18S – homologiczny do prokariotycznego RNA16S i 5,8S – występuje tylko u Eukaryota). Geny rybosomów nie są rozproszone w obrębie genomu, ale zebrane w grupy (clusters) mogące przekraczać 200 kopii. U człowieka grupy te znajdują się na krótkich ramionach chromosomów akrocentrycznych 13, 14, 15, 21 i 22.
W chromatynie interfazalnej geny tego typu zgrupowane są w szczególne struktury – jąderka (liczba jąderek jest różna w zależności od typu i aktywności komórki).
tRNA, RNA 5S i 7SL przepisywane są przez polimerazę RNA III (geny klasy III). W tej klasie mieszczą się geny kodujące niektóre małe RNA, odnajdywane w jądrze komórkowym i cytozolu. Człowiek posiada ponad 200 genów kodujących cząstkę RNA 5S, które są zgrupowane w określonych punktach chromatyny. Geny tRNA zebrane są w grupy genów powtarzanych parami (powtórzenia tandemowe). U człowieka znaleziono ich około 1200.

Ryc. 4.3. Uporządkowanie genów kodujących RNA rybosomów człowieka (geny klasy I)

 

2.2. Ogólna budowa genów kodujących białka

Geny kodujące białka przepisywane są przez polimerazę RNA II (geny klasy II). Występują one pojedynczo i ogólnie jest ich niewiele (wyjątek stanowią geny kodujące histony – występują w wielu kopiach).
Najczęściej spotykaną budowę genu kodującego białko przedstawiono na rycinie 4.4. Gen rozpoczyna się w pozycji 5’ nieprzepisywaną sekwencją, której obecność jest niezbędna do prawidłowego przebiegu transkrypcji. Sekwencje tego typu mogą być bardzo wydłużone. W okolicy (-100) par zasad (w odniesieniu do miejsca rozpoczęcia transkrypcji – rozdz. 4.3.2.) rozpoczyna się strefa zwana promotorową (analogicznie jak u organizmów prokariotycznych), gdzie przyłącza się polimeraza RNA II. W okolicy (-70) do (-80) par zasad bardzo często odnajdywana jest sekwencja CAAT, do której przytwierdza się jeden lub wiele białkowych czynników transkrypcji.
W okolicy (-25) do (-30) par zasad znajduje się sekwencja TATA (wyjątek stanowią niektóre geny “domowe”), zwana TATA box (kaseta TATA) lub Goldberg-Hogness box (rozdz. 4.3.3.2). Jest ona odpowiednikiem “Pribnow box” u Prokaryota [u tych organizmów mieści się ona w okolicy (-10pz)]. Na poziomie TATA box przyłącza się polimeraza RNA II. Jeśli sekwencja ta zostanie sztucznie usunięta, zmniejsza się poziom transkrypcji. Rozpocznie się ona w tym przypadku kilka zasad przed lub po właściwym miejscu inicjacji.
Zasadą najczęściej znajdującą się w miejscu inicjacji jest zasada purynowa. Ciągiem dalszym jest fragment niekodujący o zmiennej długości, po którym następuje sekwencja ATG (kodon metioniny), sygnalizująca miejsce początku transkrypcji.
Transkrypt pierwotny powstaje z przepisania sekwencji kodujących – egzonów i niekodujących – intronów. Egzonami nazywa się wszystkie sekwencje przepisane, odnalezione w mRNA cytozolowych (mogą także istnieć sekwencje egzonowe niekodujące: w pozycji 5’ przed kodonem ATG i w pozycji 3’ poniżej pierwszego kodonu STOP). Intronem nazywa się sekwencję przepisaną, a następnie wyeliminowaną poprzez wycięcie w trakcie dojrzewania transkryptu pierwotnego (hnRNA – heterogeneous nuclear RNA, heterogenny, jądrowy RNA), a więc nie odnajdywaną w dojrzałym mRNA cytozolowym. Długość i liczba egzonów i intronów w poszczególnych genach znacznie się różni. Tabela 4.2. ukazuje porównawcze zestawienie budowy kilku genów ludzkich.
Granice genów nie są określone precyzyjnie. Rozmiary genów są różne i mogą sięgać 2 milionów par zasad (np. gen dystrofiny). Nie ma prostej proporcjonalności pomiędzy wielkością białka a długością kodującego je genu, nawet jeśli wielkie łańcuchy polipeptydowe odpowiadają olbrzymim genom.
Przed końcem ostatniego egzonu (10 do 20 par zasad) znajduje się sekwencja AATAAA, niewłaściwie nazywana sekwencją poliadenylacji. Jest to sekwencja rozpoznawcza dla odcięcia transkryptu pierwotnego (hnRNA). Zakończenie transkrypcji następuje poniżej sekwencji AATAAA, w regionie obfitującym w guaninę i cytozynę. Gen kończy się mało znanym regionem 3’, w którym czasami występują sekwencje regulatorowe.

 

 

Tabela 4.2. Przykłady budowy niektórych genów ludzkich

 

 

Gen
(rozmiar łańcucha polipeptyd.)

 

Rozmiar genu
(kb)

 

Długość
mRNA
(kb)

 

Liczba egzonów

 

S intronów
(kb)

S egzonów
--------
długość genu

 

Interferon b1
(20kD)

 

0,9

 

0,9

 

1

 

0

 

100%

 

b globina
(16,4 kD)

 

1,6

 

0,623

 

3

 

0,986

 

39%

 

Kolagen a1
(165 kD)

 

38

 

6,2

 

50

 

32

 

11%

Apolipo-proteina
Apo-B
(512 kD)

 

43

 

14,1

 

29

 

31

 

31%

 

Czynnik krzepnięciaVIII
(330 kD)

 

186

 

9

 

26

 

177

 

5%

 

Dystrofina
(427 kD)

 

>2000

 

14

 

60

 

?

 

0,7%

 

Ryc.4.4. Schemat genu kodującego białko (gen klasy II)

 

 

2.3. Klasyfikacja genów kodujących białka

Geny kodujące białka można sklasyfikować w zależności od liczby ich kopii:
– Geny unikatowe lub prawie unikatowe – do tej grupy należy większość genów. Ich struktura odpowiada opisanej w poprzednim podrozdziale. Często brakuje w nich sekwencji CAAT. Niektóre geny w trakcie ewolucji uległy podwojeniu. Dwie kopie mogą być całkowicie wewnątrzwymienne, jak to ma miejsce w przypadku genów a globiny. W pozostałych przypadkach dwie kopie mogą się nieco różnić, dając dwa białka o zbliżonych, lecz różnych właściwościach. Ekspresja pierwszej lub drugiej z tych kopii zachodzi w zależności od przebiegu ontogenezy lub typu narządu (izoenzymy).
– Rodziny genów – najczęściej powstają w wyniku zjawiska duplikacji (różnicowania). Jeden gen może ulec wielokrotnym powtórzeniom we wczesnym okresie filogenezy, a każda kopia różnicować się będzie niezależnie. Wynikiem tego procesu jest powstanie serii genów kodujących białka o analogicznych właściwościach. Ekspresja każdej kopii zależy od typu lub stanu komórki. Najlepiej poznanymi przykładami genów należących do tej grupy są:
– rodzina genów globiny,
– rodzina genów aktyny,
– rodzina genów miozyny.
– Nadrodziny genów – powstanie ich jest wynikiem zjawiska analogicznego do opisanego powyżej, ale zachodzącego o wiele wcześniej w toku ewolucji. Najciekawszym przykładem są geny odpowiedzialne za funkcjonowanie układu immunologicznego: geny immunoglobulin, receptorów limfocytów T, białek zgodności tkankowej klasy I i II, które są pochodnymi zmiennej liczby duplikatów genów tego samego przodka. Liczba powtarzanych motywów jest zmienna i stąd wynika wysokie zróżnicowanie wśród wymienionych genów. Zachowana zostaje jedynie trzeciorzędowa struktura podstawowej jednostki budulcowej.
Innym przykładem jest nadrodzina genów kodujących jądrowe receptory hormonów steroidowych.

2.4. Geny domowe (house-keeping genes)

Niektóre z genów ulegają ekspresji tylko w określonych tkankach, co jest podstawą różnicowania. Inne kodują białka wszechobecne, niezbędne do życia każdej komórce, np. geny enzymów glikolitycznych i oddechowych. Tego rodzaju geny nazywa się domowymi (house-keeping). Są to geny konstytutywne, funkcjonują przez cały okres życia komórki. Ich ekspresja jest uzależniona od warunków środowiskowych.
Posiadają one wiele wspólnych właściwości:
– stały i ogólnie niski poziom transkrypcji (co nie wyklucza ewentualnej regulacji);
– brak kasety TATA (TATA box);
– są poprzedzane i zawierają często powtarzające się, liczne niemetylowane pary CG (w przeciwieństwie do innych genów);
– obecność w niekodującym rejonie 5’ jednej lub wielu sekwencji GGGGCGGG (kaseta GC, GC box), które są potencjalnym miejscem wiązania białka uczestniczącego w procesie transkrypcji – Sp1 (jedna z pierwszych wykrytych eukariotycznych protein trans-regulatorowych, uczestniczy w wiązaniu kasety GC z onkogennym wirusem SV40 – Simian Virus 40, zakażającym komórki małp).

2.5. Pseudogeny (silent genes, geny milczące)

Niefunkcjonujące sekwencje, które nie podlegają ani transkrypcji ani translacji, a przypominające sąsiednie geny, nazywamy pseudogenami. Brak funkcjonalności może wynikać z nadmiaru kodonów STOP, z braku kodonu metioniny – inicjatora lub z braku regionu promotorowego.
Istnieją dwa typy pseudogenów, rozróżniane w zależności od sposobu ich powstawania. Pierwszy to geny podwojone, które utraciły swoją funkcjonalność już w momencie tworzenia, w trakcie ewolucji lub z powodu pojawienia się mutacji (utrata funkcjonalnego promotora ATG lub pojawienie się kodonu STOP). Ten typ nazywa się pseudogenami z intronami.
Drugi typ to pseudogeny, które zostały utworzone przez wprowadzenie do genomu retrotranskryptu – odwrotnego transkryptu cDNA (najprawdopodobniej przy pomocy retrowirusa). Typ ten nie posiada promotora oraz intronów, a nazywany jest retropseudogenami.
Pseudogeny nie podlegają żadnej selekcji i dlatego zachodzi w nich akumulacja licznych mutacji.

3. Transkrypcja

Informacja genetyczna zawarta jest w kolejności ułożenia zasad purynowych i pirymidynowych w DNA. Zachowywana jest przez replikację (dwie identyczne kopie powstałe z duplikacji kwasu nukleinowego), a wyrażana dzięki dwuetapowemu mechanizmowi: transkrypcji (utworzenie jednoniciowego RNA, którego sekwencja jest komplementarna w stosunku do jednej z dwóch nici DNA) i translacji (przepisanie sekwencji zasad RNA w sekwencje aminokwasów budujących białko).
Obok DNA kodującego znajdują się znaczne ilości sekwencji niekodujących. Ażeby gen uległ ekspresji, musi zostać przepisany i przetłumaczony w sekwencje aminokwasów budujących białko. Biorąc pod uwagę rozmiar tripletów i odpowiadających im aminokwasów, bezpośrednia translacja na poziomie DNA jest niemożliwa. Co więcej, u Eukaryota informacja i aparat translacyjny mieszczą się w dwóch różnych kompartmentach komórkowych (jądro komórkowe/cytozol) – rycina 4.5.
Pierwszy etap przejścia od genotypu do fenotypu opiera się więc na transkrypcji informacji z DNA na messenger RNA (mRNA). W przeciwieństwie do organizmów prokariotycznych RNA u Eukaryota nie jest tłumaczony bezpośrednio. Przechodzi on serię modyfikacji, zwaną dojrzewaniem, polegającą na dodawaniu i wycinaniu określonych fragmentów (splicing). Niektóre z tych modyfikacji są zsynchronizowane z transkrypcją, np. cząsteczka prekursorowego mRNA otrzymuje specyficzną strukturę cap – “czapeczka” (na końcu 5’, a do końca 3’ cząsteczki dodawany jest długi ogon poli [A] – rozdz. 4.3.3.2).

Ryc. 4.5. Transkrypcja i translacja są ściśle powiązane ze sobą u Prokaryota. U Eukaryota rozdzielone są przestrzennie i czasowo. A – u organizmów prokariotycznych służy jako mRNA i zostaje natychmiast wykorzystany jako matryca w syntezie białka. B – u organizmów eukariotycznych prekursory mRNA dojrzewając ulegają splicingowi, a potem dopiero są transportowane do cytozolu.

 

3.1. Rola RNA w syntezie białek

Komórki, w których synteza białek jest szczególnie nasilona są bardzo bogate w RNA (np. komórki wątroby produkujące ogromne ilości białek surowiczych, komórki trzustki syntetyzujące wiele enzymów trawiennych). Synteza RNA odbywa się w jądrze komórki (ponad 90% RNA). RNA znajdowany w cytoplazmie pochodzi z jądra. Nieznaczna ilość syntetyzowana jest w mitochondriach i chloroplastach (< 1% ogółu RNA komórki).
Duża ilość RNA syntetyzowana jest w cytoplazmie komórek zainfekowanych niektórymi wirusami RNA (poliomyelitis) czy DNA (wirus ospy).
Fakt, że RNA tworzony jest w jądrze i stamtąd migruje do cytoplazmy sugeruje, że jest on pośrednikiem pomiędzy DNA zawartym w jądrze a aparatem syntezy białek działającym w cytoplazmie.

3.1.1. mRNA (messenger RNA)

Struktura RNA częściowo sugeruje sposób, w jaki pośredniczy on pomiędzy DNA i białkami. Przekazanie informacji genetycznej odbywa się za pomocą syntezy RNA na podstawie matrycy DNA, zgodnie z zasadami komplementarności obowiązującymi w przypadku replikacji DNA – rycina 4.6. Tymidynie, adeninie, cytozynie i guaninie nici DNA odpowiadają kolejno – adenina, uracyl, guanina i cytozyna nici RNA. Obecność mRNA jest konieczna do określenia specyficznej kolejności aminokwasów w cząsteczce białka. Większość białek syntetyzowanych jest przez komórkę w sposób ciągły (konstytutywny). Niektóre białka mogą być syntetyzowane w zależności od zapotrzebowania organizmu, np. b-galaktozydaza. U Escherichia coli enzym ten katalizuje rozpad dwucukru laktozy na glukozę i galaktozę (heksozy). Bakterie hodowane w środowisku zawierającym glukozę, prawie nie syntetyzują b-galaktozydazy, natomiast hodowane w medium, w którym jedynym cukrem jest laktoza, syntetyzują ten enzym w ogromnej ilości – ok. 1000 razy więcej.
To właśnie cząsteczka mRNA pozwala syntetyzować ograniczoną ilość kopii łańcucha polipeptydowego i następnie ulega degradacji. Syntezę białka można by więc nadzorować poprzez kontrolowaną syntezę mRNA (przy użyciu odpowiedniego genu) – rycina 4.7. Jeśli synteza mRNA określonego genu zostaje przerwana, synteza białka zatrzyma się w momencie degradacji wszystkich istniejących cząstek mRNA. Ciągła synteza białek (np. enzymów katalizujących reakcję szlaku glikolitycznego) wymaga więc nieustannej transkrypcji kodujących je genów (z DNA na mRNA).
mRNA stanowi ok. 2% całego RNA komórkowego.

Ryc. 4.6. Synteza łańcucha RNA wzdłuż pojedynczej nici cząsteczki DNA. A. Konfiguracja helisy. B. Schematyczne przedstawienie komplementarnosci zasad pomiędzy tworzącymi się RNA a nicią DNA służącą jako matryca.

Ryc. 4.7. Synteza b-galaktozydazy w różnych mediach hodowlanych u Escherichia coli

3.1.2. tRNA (transfer RNA)

Cząsteczki tRNA są małymi fragmentami RNA, których długość jest zmienna (76-83 nukleotydów). Stanowią one ok. 6 do 8% całkowitego RNA komórkowego. Cząstki te, współdziałając z syntetazą aminoacylo-tRNA, pozwalają przenieść aminokwas ze swoistym dla niego tRNA. Każdy z dwudziestu aminokwasów posiada swój własny tRNA, do którego się przyłącza w celu utworzenia aminoacylo-tRNA (wysoka specyficzność wiązania) – ryc. 4.8. Glicyna może połączyć się jedynie z tRNA przyjmującym glicynę, adenina z tRNA przyjmującym adeninę, itp.
Mimo, że wszystkie cząstki tRNA są praktycznie tych samych rozmiarów i posiadają wspólne sekwencje nukleotydowe, różnice pomiędzy niektórymi sekwencjami pozwalają rozróżnić poszczególne cząstki tRNA.
W katalizowaniu wiązania pomiędzy danym aminokwasem a jego tRNA bierze udział specyficzna syntetaza (np. syntetaza glicylo-tRNA łączy glicynę z jej specyficznym tRNA). Ta szczególna specyficzność oddziaływań pomiędzy tRNA i jego syntetazą wynika ze zdolności rozpoznawania konkretnego miejsca enzymu i strukturalnych właściwości tRNA, odpowiadających temu enzymowi.
Przestrzenna struktura tRNA tworzona jest przez złożenie łańcucha na kształt podwójnych helis wewnątrzcząsteczkowych (poprzez sparowanie zasad pomiędzy komplementarnymi odcinkami tego samego łańcucha).
Rycina 4.9 przedstawia strukturę drugorzędową cząsteczki tRNA (w formie liścia koniczyny). Oprócz czterech odcinków podwójnej helisy powstają trzy pętle, w których zasady są niesparowane. Ramię końcowe cząsteczki zawiera końce 5’P i 3’OH. Wszystkie pętle oraz ramię końcowe pełnią specyficzną rolę w funkcjonowaniu tRNA. Aminokwas będący na etapie aktywacji (aktywowanymi związkami pośrednimi w syntezie białka są estry aminokwasów, w których grupa karboksylowa aminokwasu jest połączona z grupą 2’- lub 3’-hydroksylową rybozy na końcu 3’ tRNA – ryc. 4.10) przyłącza się do końca 3’OH ramienia końcowego, które z tej racji nazywane jest ramieniem akceptującym.
W odcinkach dwuniciowych tRNA wiązania wodorowe łączą reszty A i U oraz C i G. W ten sposób powstają cztery krótkie regiony w kształcie podwójnej helisy, które nadają cząstce tRNA konfigurację przedstawioną na rycinie 4.11 (struktura trzeciorzędowa). Małe różnice między sekwencjami poszczególnych tRNA manifestują się na poziomie struktury trzeciorzędowej. Interakcje pomiędzy syntetazą a tRNA umożliwia wyeksponowanie centrum aktywnego enzymu w taki sposób, że aminokwas przytwierdza się do ramienia akceptującego tRNA.
Różne cząstki tRNA, każda niosąca specyficzny aminokwas, przenoszą swój “ładunek” na łańcuch polipeptydowy, będący w trakcie syntezy (zgodnie z porządkiem tripletów określonym przez mRNA). Każdy z tRNA zawiera pętlę utworzoną z 7 niesparowanych nukleotydów. Pośrodku tej sekwencji znajdują się trzy nukleotydy formujące miejsce rozpoznania pomiędzy tRNA a cząstką mRNA (antykodon). Pętla, na której mieści się ta trójnukleotydowa sekwencja zwana jest pętlą antykodonową. Antykodon pozwala tRNA (do którego przyłącza się specyficzny aminokwas) rozpoznać sekwencję 3 komplementarnych zasad tworzących kodon na mRNA – rycina 4.12.

Ryc. 4.8. Tworzenie aminoacylo-tRNA. Dwustopniowa reakcja przy udziale enzymu syntetazy aminoacylo-tRNA prowadzi do utworzenia aminoacylo-tRNA. Pierwsza reakcja obejmuje utworzenie kompleksu AMP-aminokwas-enzym. Taki zaktywowany aminokwas jest przenoszony następnie na odpowiednią cząsteczkę tRNA. AMP i enzym uwalniają się i enzym może być ponownie użyty w reakcji

Ryc. 4.9. Pofałdowana struktura (drugorzędowa) cząsteczki tRNA, zawierająca 76 aminokwasów. Ufałdowanie stworzyło trzy pętle, ramię akceptujące i ramię dodatkowe

Ryc. 4.10. Aminokwas ulega estryfikacji i zostaje przyłączony do 2’- lub 3’- hydroksylowej grupy końcowej adenozyny tRNA, dając aminoacylo-tRNA

Ryc. 4.11. Trójwymiarowy model cząsteczki tRNA (struktura trzeciorzędowa)

Ryc. 4.12. Sekwencja nukleotydowa tRNA alaninowego u drożdży. Modyfikowane nukleozydy oznaczono następującymi skrótami: mI – metyloinozyna, UH2 – dihydrourydyna, T – rybotymidyna, Psi – pseudourydyna, mG – metyloguanozyna i m2G – dimetyloguanozyna. I – inozyna, jeszcze inny modyfikowany nukleozyd, który wchodzi w skład antykodonu. Wspólne cechy cząsteczek tRNA