perjantai 6. tammikuuta 2017

15. Nerokkain kieli

Ihminen pystyy helposti löytämään ongelmia monista kielistä, jopa sellaisista teknisistä kielistä kuin tietokoneen ohjelmointikielet, joita on lukuisa määrä kehitetty ja aina vain kehitetään uusia jonkun mielestä parempia. Sen sijaan DNA:n koodikielestä ei ole heikkouksia keksitty. Teoreetikot ovat yrittäneet todistaa, josko se olisi jopa täydellisin mahdollinen koodikieli. Ei ole ihan tavallista matematiikkaa ja ohjelmointia se, miten DNA koodikieli on rakennettu. Sukelletaanpa sen perusteisiin.




Elämän käyttämiä aminohappoja on 20 erilaista ja ne koodataan kolmen nukleotidin (tikapuun puolan) pätkillä. Yhteen nukleotidiin on neljä eri vaihtoehtoa. Eli kolmella "bitillä" voidaan koodata 4*4*4 = 64 eri vaihtoehtoa. 


Nukleotidit kolmen erissä vastaavat aminohappoja
Miten on ratkaistu, että 64:stä vaihtoehdosta aina saadaan jokin vain 20:stä eri aminohaposta? Siten että useampi eri kolmen bitin koodi (tripletti, codon) koodaa samaa aminohappoa. Esimerkiksi CCT, CCC, CCA ja CCG kaikki koodaavat proliini nimistä aminohappoa. Alla olevassa taulukossa kohta 2/2.


Taulukossa näkyy mitkä kolme koodia (codon) vastaavat mitäkin aminohappoa

Miksi näin? Toisaalta tämä tekee sen, että mutaatio ei välttämättä muuta aminohappoa lainkaan, sillä tässä esimerkkitapauksessa viimeinen nukleotidi tripletistä voi muuttua miksi tahansa ja aina tulee sama proliini aminohappo. Eli proteiini ei muutu mitenkään. Viimeisen nukleotidin mutaatio on siis täysin neutraali tälle proteiinille. Mutta tämä ei ole ainut syy tällaiseen nelinkertaiseen koodaukseen.

DNA:ta voidaan lukea monella eri tapaa. On havaittu, että sitä luetaan kahteen eri suuntaan ja luku voidaan aloittaa mistä tahansa, mutta selkeästi määrätystä kohdasta. Päällekkäisiä lukukehyksiä voi olla jopa kymmenen.

Nuolen osoittamaa nukleotidia käytetään monessa eri lukukehyksessä
Eli vaikka aminohappoja koodataan kolmen pätkissä, niin tietyssä tapauksessa sama nukleotidi on ensimmäinen bitti, mutta toisessa tapauksessa toinen, riippuen siis mistä kohtaa lukeminen on alettu. Alla olevan esimerkin mukaisesti.

Esimerkkikoodi:
1 2 3 4 5 6 7 8 9
C A T T A T G A T A A …

Kun lukeminen aloitetaan kohdasta 1, saadaan CAT, TAT, GAT, …
Kun lukeminen aloitetaan kohdasta 2, saadaan ATT, ATG, ATA, …
Kun lukeminen aloitetaan kohdasta 3, saadaan TTA, TGA, TAA, …



Yhdessä nämä kaksi asiaa (64/20 koodaus ja useat lukukehykset) muodostavat äärimmäisen nerokkaan tiedon pakkauksen. Näin vähäisellä määrällä DNA:ta voidaan tehdä todella monia erilaisia lopputuotteita, proteiineja. siksi ihmisellä voi olla lyhyempi DNA kuin sipulilla, mutta silti ihminen on biologisesti monipuolisempi. Tämän päällekkäisen rakenteen suunnitteluhaaste helposti ylittää ihmisen kyvyn rakentaa tietoa. Voimme lukea sitä ja oppia siitä, mutta voimmeko koskaan täydellisesti ymmärtää sitä?


Otetaan esimerkki asiaa selventämään:
Haluat koodata proliini aminohapon, se alkaa aina CC ja kolmas nukleotidi voi olla mikä tahansa. Valitset satunnaisesti G.
Mutta haluat koodata sitten glutamiinin (joka koodataan joko CAA tai CAG) alkaen toisesta lukukehyksestä edellisestä proliini koodauksesta (CCG) eli alku mikä sinun pitäisi käyttää siitä on CG, kun pitäisi olla CA. Koska proliini voitiin koodata myös CCA, vaihdat proliinin koodauksen tähän, jotta saat glutamiinin koodaukseen oikean alun toisesta kirjaimesta eli CA ja lisäät perään toisen A:n (CAA). Nyt olet koodannut kaksi aminohappoa vain 4:llä merkillä (CCAA)! (Näitä aminohappoja voidaan käyttää vain eri proteiineissa, koska RNA rakentuu aina kokonaisista 3 nukleotidin jaksoista.)


Jos olet taitava DNA:n suunnittelija, voit näin pelata näillä koodausvaihtoehdoilla rakentaen satoja tai tuhansia aminohappoja pitkiä ketjuja jopa kymmenessä erilaisessa päällekkäisessä lukukehyksessä! Mutta sinun on silloin todella oltava älykäs ja tiedettävä ihan kaikki mitä olet tekemässä ja osattava laittaa miljoonia nukleotideja oikeaan järjestykseen yhdellä kertaa. 

Koska ymmärryksemme ainakin vielä pitkään tulee olemaan vajavainen, on myös hyvin vaarallista alkaa muuttamaan DNA:ta. Sillä muuttamalla tietyn kohdan saamme yhteen lukukehykseen haluamme muutoksen. Mutta esimerkiksi jos poistamme perinnöllisen sairauden yhdestä lukukehyksestä, saatamme tehdä vielä suuremman virheen toiseen lukukehykseen, jota emme vielä ole havainneet.

Tämä on tietokoneohjelmien ohjelmoinnissa hyvin tunnettu ja tavallinen ongelma. Yhden virheen korjaus saattaa aiheuttaa pahemman virheen toisaalla.

Kaikki edellinen tarkoittaa myös, että satunnaisen mutaation mahdollisuudet saada aikaan jotain kehittyneempää pienenivät juuri kymmenkertaisesti verrattuna siihen, että olisi vain yksi koodaus yhdessä paikassa. Sillä vaikka muutos olisi jollain tavalla positiivinen yhdessä lukukehyksessä, on todennäköistä, että se on haitallinen kaikissa muissa!

Myös tämän takia näyttää siltä, että mutaatiot eivät saa aikaiseksi uusia rakenteita, vaan vain rikkovat olemassa olevia. Tämä taasen tarkoittaa, ettei evoluutiolla ole mekanismia. Mekanismin uupuminen taas tarkoittaa, että evoluutio ei kehitä mitään uutta.

Jos nyt kävi niin, että tästä blogista et paljon ymmärtänyt, niin ei se mitään. Otsikossa oli syvin sisältö. DNA koodi on nerokkaasti suunniteltu. Miten siis ehkä jopa nerokkain mahdollinen koodi syntyisi sattumalta ja itsestään? Luulisi että sattuman tuloksena on sattumanvarainen koodi, josta ihminen nopeasti havaitsee älykkyydellään parannusehdotuksia. Kukaan ei ole toistaiseksi pystynyt osoittamaan DNA-koodissa heikkouksia, joita voisi parantaa.

Todisteet kumuloituvat. Sattuma ei ehkä ollutkaan se, joka kehitti uutta, vaan se ainoastaan tuhoaa olemassa olevaa. Tämän tuhoamisen avulla voi syntyä, kumma kyllä, uusia lajeja, mutta siitä joskus myöhemmin lisää.


Tässä videossa päällekkäisten lukukehysten havainnollistamista lisää:

HUOM: Edellisessä blogissa (http://mistametulemme.blogspot.fi/2017/01/14-koneenrakennusta-komponenteista.html) käytiin läpi yksi käsite miten 25 000 geenistä saadaan yli 100 000 proteiinia. Myös nämä päällekkäiset lukukehykset auttavat ratkaisemaan tätä samaa haastetta.


Ei kommentteja:

Lähetä kommentti