Kontrolní součty v DNA

Technologie |

James Watson a Francis Crick jako první objevili strukturu DNA. Právě deoxyribonukleová kyselina je přitom v biologických systémem nositelem informace. Do historie informatiky však Crick přispěl i popisem způsobu, jak v rámci DNA řeši ...




James Watson a Francis Crick jako první objevili strukturu DNA. Právě deoxyribonukleová kyselina je přitom v biologických systémem nositelem informace. Do historie informatiky však Crick přispěl i popisem způsobu, jak v rámci DNA řešit cosi na způsob kontrolních součtů…

Biologická informatika je podobě jako dnešní počítače důsledně digitální. Neexistuje žádná spojitá analogová škála, kód je důsledně čtyřbitový, respektive čtyřpísmenkový. DNA obsahuje informaci ve čtyřech dusíkatých bázích (nukleotidech) označovaných jako adenin, (A) guanin (G), cytosin (C) a thymin (T). Z nich se posléze přes několik přepisů do ribonukleové kyseliny (v jejíchž vláknech je namísto thyminu uracil – U) odvodí příslušná aminokyselina. Jak ale konkrétně převést abecedu čtyř písmen do jazyka aminokyselin?
Crick uvažoval následujícím způsobem: Pokud by jedna aminokyselina odpovídala jednomu nukleotidu, DNA by mohla kódovat 4 typy aminokyselin. Pokud by aminokyselině odpovídala dvojice nukleotidů, výsledných kombinací je 16. Trojice nukleotidů už umožňují celkem 64 výsledných možností (ve všech případech je výsledné číslo samozřejmě příslušnou permutací – 4 na 1, 4 na 2, 4 na 3 atd.). V živých organismech se vyskytuje 20 aminokyselin, jedna aminokyselina proto musí odpovídat trojici nukleotidů. Z hlediska 64 možností ovšem nutně zbývá celá řada kombinací nevyužitých.
Crick se domníval, že tato "nadbytečná" informace se využije právě pro tvorbu kontrolních součtů. Konkrétně: řetězec bude složen pouze z takovým trojic, které, pokud je začneme číst na jiném místě, nebudou kódovat nic. Příklad: Pokud použijeme trojici ACT pro zápis jedné aminokyseliny, musíme se nějak vyhnout tomu, abychom řetězec chybně přečetli jako A-CTX nebo XAC-T. Varianty CTX a XAC jsou z tohoto pohledu "závadné" a nesmějí kódovat žádnou aminokyselinu. Výsledný výpočet vede k tomu, že povolených sekvencí, ošetřených proti "posunu čtečky", je přesně 20 – tedy právě tolik jako aminokyselin!
Předešlá koncepce vám zřejmě nepřijde u učebnic biochemie příliš povědomá – a není divu. Celou Crickovu teorii lze totiž sice označit za geniální, obsahuje pouze jednu drobnou potíž: Není pravdivá, kód DNA se do struktury bílkovin převádí jiným způsobem. Matt Ridley v knize Genom (nedávno vyšlo i česky) přitom označuje celou myšlenku za "nejskvělejší špatnou teorii v historii".
Ve skutečnosti je biologický zápis méně striktní, a tím pádem umožňuje častější vznik chyb. Aminokyselinám skutečně odpovídají trojice (triplety, kodóny) bází, ovšem přepis informace je ztrátový, respektive "degenerovaný". Některé kombinace nukleotidů odpovídají stejné aminokyselině, z výsledného pořadí aminokyselin nelze tedy zpětně odvodit jednoznačné pořadí nukleotidů. Čtecí systém na rozdíl od Crickovy představy také obsahuje startovní a ukončující (terminační) sekvenci.
Záměna jednoho nukleotidu se tedy často v první fázi nijak neprojeví na výsledné bílkovině. Co je ještě důležitější – posun čtečky nastane automaticky, pokud uprostřed čtené sekvence jeden nukleotid z nějakého důvodu vypadne. V mnoha případech není ve skutečnosti tato závada odhalena, trojice se poskládají naprosto odlišně – a jedinou změnou dostaneme náhle naprosto odlišnou sekvenci aminokyselin!
To sice z hlediska smyslu kontrolních součtů není ideální, nicméně současně umožňuje větší variabilitu. Pokud kontrolní mechanismy rozpoznají méně změn (mutací), vede to na jednu stranu k hromadění chyb, jejichž výsledkem je řada chorob, na druhou stranu však dochází i k podstatnému zrychlení biologické evoluce.
Poznámka na závěr: Pokud bychom z mechanismu přenosu odstranili startovní a terminační část, mohl by se řetězec nukleotidů číst celkem třikrát, pokaždé z jiného místa (víckrát než třikrát by už sekvence byly opět shodné). Dělají to některé viry, které jsou díky tomu schopné kódovat více proteinů, než na první pohled vyplývá z délky jejich DNA.

Jedna mutace změní všechno – příklad

Původní řetězec RNA
CUC-AAG-GUU-UAA-G

Odpovídající řetězec aminokyselin
leucin-lyzin-valin-valin

Řetězec RNA po "vypadnutí" nukleotidu na pozici číslo 1
UCA-AGG-UUU-AAG

Nový řetězec aminokyselin
serin-arginin-fenylalanin-lyzin

Crickova teorie o "biologických kontrolních součtech" měla zabránit situaci uvedené výše: vypadnutím (delecí) jediného písmenka z abecedy nukleové kyseliny se mohou zcela změnit syntetizované aminokyseliny.








Související články




Komentáře

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.