Ihminen pystyy helposti löytämään ongelmia monista kielistä, jopa
sellaisista teknisistä kielistä kuin tietokoneen ohjelmointikielet, joita on
lukuisa määrä kehitetty ja aina vain kehitetään uusia jonkun mielestä parempia.
Sen sijaan DNA:n koodikielestä ei ole heikkouksia keksitty. Teoreetikot ovat
yrittäneet todistaa, josko se olisi jopa täydellisin mahdollinen koodikieli. Ei ole ihan tavallista matematiikkaa ja ohjelmointia se, miten DNA koodikieli on rakennettu. Sukelletaanpa sen perusteisiin.
Elämän käyttämiä
aminohappoja on 20 erilaista ja ne koodataan kolmen nukleotidin (tikapuun
puolan) pätkillä. Yhteen nukleotidiin on neljä eri vaihtoehtoa. Eli kolmella
"bitillä" voidaan koodata 4*4*4 = 64 eri vaihtoehtoa.
Nukleotidit kolmen erissä vastaavat aminohappoja |
Taulukossa näkyy mitkä kolme koodia (codon) vastaavat mitäkin aminohappoa |
Miksi näin? Toisaalta tämä tekee sen, että mutaatio ei välttämättä muuta aminohappoa lainkaan, sillä tässä esimerkkitapauksessa viimeinen nukleotidi tripletistä voi muuttua miksi tahansa ja aina tulee sama proliini aminohappo. Eli proteiini ei muutu mitenkään. Viimeisen nukleotidin mutaatio on siis täysin neutraali tälle proteiinille. Mutta tämä ei ole ainut syy tällaiseen nelinkertaiseen koodaukseen.
DNA:ta voidaan lukea
monella eri tapaa. On havaittu, että sitä luetaan kahteen eri suuntaan ja luku
voidaan aloittaa mistä tahansa, mutta selkeästi määrätystä kohdasta.
Päällekkäisiä lukukehyksiä voi olla jopa kymmenen.
Nuolen osoittamaa nukleotidia käytetään monessa eri lukukehyksessä |
Esimerkkikoodi:
1 2 3 4 5 6 7 8 9
C A T T A T G A T A
A …
Kun lukeminen
aloitetaan kohdasta 1, saadaan CAT, TAT, GAT, …
Kun lukeminen
aloitetaan kohdasta 2, saadaan ATT, ATG, ATA, …
Kun lukeminen
aloitetaan kohdasta 3, saadaan TTA, TGA, TAA, …
Yhdessä nämä kaksi
asiaa (64/20 koodaus ja useat lukukehykset) muodostavat äärimmäisen nerokkaan
tiedon pakkauksen. Näin vähäisellä määrällä DNA:ta voidaan tehdä todella monia
erilaisia lopputuotteita, proteiineja. siksi ihmisellä voi olla lyhyempi DNA kuin sipulilla, mutta silti ihminen on biologisesti monipuolisempi. Tämän päällekkäisen rakenteen suunnitteluhaaste
helposti ylittää ihmisen kyvyn rakentaa tietoa. Voimme lukea sitä ja oppia
siitä, mutta voimmeko koskaan täydellisesti ymmärtää sitä?
Otetaan esimerkki asiaa selventämään:
Haluat
koodata proliini aminohapon, se alkaa aina CC ja kolmas nukleotidi voi olla
mikä tahansa. Valitset satunnaisesti G.
Mutta
haluat koodata sitten glutamiinin (joka koodataan joko CAA tai CAG) alkaen
toisesta lukukehyksestä edellisestä proliini koodauksesta (CCG) eli alku mikä
sinun pitäisi käyttää siitä on CG, kun pitäisi olla CA. Koska proliini voitiin
koodata myös CCA, vaihdat proliinin koodauksen tähän, jotta saat glutamiinin
koodaukseen oikean alun toisesta kirjaimesta eli CA ja lisäät perään toisen
A:n (CAA). Nyt olet koodannut kaksi aminohappoa vain 4:llä merkillä (CCAA)! (Näitä
aminohappoja voidaan käyttää vain eri proteiineissa, koska RNA rakentuu aina
kokonaisista 3 nukleotidin jaksoista.)
Jos olet taitava
DNA:n suunnittelija, voit näin pelata näillä koodausvaihtoehdoilla rakentaen
satoja tai tuhansia aminohappoja pitkiä ketjuja jopa kymmenessä erilaisessa
päällekkäisessä lukukehyksessä! Mutta sinun on silloin todella oltava älykäs ja tiedettävä ihan kaikki mitä olet tekemässä ja osattava laittaa miljoonia nukleotideja oikeaan järjestykseen yhdellä kertaa.
Koska ymmärryksemme
ainakin vielä pitkään tulee olemaan vajavainen, on myös hyvin vaarallista alkaa
muuttamaan DNA:ta. Sillä muuttamalla tietyn kohdan saamme yhteen lukukehykseen
haluamme muutoksen. Mutta esimerkiksi jos poistamme perinnöllisen sairauden
yhdestä lukukehyksestä, saatamme tehdä vielä suuremman virheen toiseen
lukukehykseen, jota emme vielä ole havainneet.
Tämä on
tietokoneohjelmien ohjelmoinnissa hyvin tunnettu ja tavallinen ongelma. Yhden
virheen korjaus saattaa aiheuttaa pahemman virheen toisaalla.
Kaikki
edellinen tarkoittaa myös, että satunnaisen mutaation mahdollisuudet saada
aikaan jotain kehittyneempää pienenivät juuri kymmenkertaisesti verrattuna
siihen, että olisi vain yksi koodaus yhdessä paikassa. Sillä vaikka muutos
olisi jollain tavalla positiivinen yhdessä lukukehyksessä, on todennäköistä,
että se on haitallinen kaikissa muissa!
Myös
tämän takia näyttää siltä, että mutaatiot eivät saa aikaiseksi uusia
rakenteita, vaan vain rikkovat olemassa olevia. Tämä taasen tarkoittaa, ettei
evoluutiolla ole mekanismia. Mekanismin uupuminen taas tarkoittaa, että
evoluutio ei kehitä mitään uutta.
Jos
nyt kävi niin, että tästä blogista et paljon ymmärtänyt, niin ei se mitään.
Otsikossa oli syvin sisältö. DNA koodi on nerokkaasti suunniteltu. Miten siis
ehkä jopa nerokkain mahdollinen koodi syntyisi sattumalta ja itsestään? Luulisi että
sattuman tuloksena on sattumanvarainen koodi, josta ihminen nopeasti havaitsee
älykkyydellään parannusehdotuksia. Kukaan ei ole toistaiseksi pystynyt
osoittamaan DNA-koodissa heikkouksia, joita voisi parantaa.
Todisteet
kumuloituvat. Sattuma ei ehkä ollutkaan se, joka kehitti uutta, vaan se
ainoastaan tuhoaa olemassa olevaa. Tämän tuhoamisen avulla voi syntyä, kumma
kyllä, uusia lajeja, mutta siitä joskus myöhemmin lisää.
Tässä videossa
päällekkäisten lukukehysten havainnollistamista lisää:
HUOM:
Edellisessä blogissa (http://mistametulemme.blogspot.fi/2017/01/14-koneenrakennusta-komponenteista.html) käytiin läpi yksi käsite miten 25 000 geenistä saadaan yli 100 000
proteiinia. Myös nämä päällekkäiset lukukehykset auttavat ratkaisemaan tätä
samaa haastetta.
Ei kommentteja:
Lähetä kommentti