Codons og læserammer

I programmet Virtual Ribosome benytter man viden omkring codons og læserammer til at finde det protein, der er kodet af en given DNA-sekvens. Viden omkring om codons og læserammer er derfor vigtig for at kunne bruge programmet og fortolke resultatet.

Codons

DNA er et makromolekyle, der indeholder en organismes arvemateriale. En DNA-sekvens indeholder normalt et gen, der koder for et protein. Den samlede proces, hvor DNA oversættes til protein, betegnes Det Centrale Dogme og består blandt andet af to trin, transkription (fra DNA til messenger-RNA, mRNA) og translation (fra mRNA til protein).

DNA er sammensat af nukleotider. Under translationen til protein aflæses DNA-sekvensen som codons. Hvert codon aflæses til netop en aminosyre, dvs. tre nukleotider bliver til én aminosyre. Der kan dannes i alt 64 forskellige codons (4³) som således oversættes til forskellige aminosyrer samt stopcodons. Figur 1 viser en codon-translateringstabel, hvor det kan ses hvilke codons, der koder for hvilken aminosyre. Det ses, at flere codons koder for den samme aminosyre, og at nogle codons også koder for start- og stopsignaler. Start- og stopcodons fortæller, hvor translationen fra mRNA til protein skal henholdsvis starte og stoppe på mRNA-sekvensen.

Figur 1. Codon-translationstabel. 

 

Læserammer

Da DNA-sekvenser aflæses i codons (tre nukleotider) og ikke én nukleotid ad gangen, kan der dannes forskellige aminosyrekæder alt afhængig af, i hvilken position på DNA-sekvensen translationen starter. Man siger, at DNA-sekvensen har forskellige læserammer. Antallet af læserammer (forskellige aminosyresekvenser), der kan dannes pr. DNA-streng, er dog begrænset til tre. Grunden til dette er, at en codon som nævnt består af tre nukleotider, og dermed aflæses DNA-sekvensen tre nukleotider ad gangen. Hvis man starter translationen på position 1 eller position 4, vil man således benytte den samme læseramme, og man vil dermed få den samme aminosyresekvens (dog uden den første aminosyre, hvis man starter på position 4). Den samme aminosyrekæde vil fås, hvis man starter på position 7, blot uden de to første aminosyrer etc. Hvis man starter på position 2, 5, 8… vil man få aminosyresekvensen fra læseramme 2. Denne aminosyresekvens vil være en anden end den fra læseramme 1, hvor man startede på position 1, 4, 7… Endelig er det samme princip gældende for læseramme 3, hvor aminosyresekvensen bliver translateret fra position 3, 6, 9…, se figur 2.

Da DNA-molekyler er sat sammen af to DNA-strenge i en dobbeltbundet DNA-helix, findes der ikke kun tre læserammer, men faktisk seks forskellige læserammer for hvert DNA-molekyle; tre forskellige læserammer på hver DNA-streng.
Læserammen mellem to stopcodons betegnes den åbne læseramme (eng. Open Reading Frame, ORF) og er den del af DNA’et, der kan kode for et protein.

Figur 2. Læserammer. Hver DNA-streng har tre forskellige læserammer alt afhængig af startpositionen for aflæsningen. Hver startposition er markeret med en bestemt farve, og det ses, at der dannes forskellige aminosyrekæder alt afhængig af hvilken læserammer der bliver brugt.

 

 

Det er dog ikke alle åbne læserammer, der koder for et funktionelt protein. Faktisk er det som regel kun én åben læseramme ud af de seks mulige, der koder for noget funktionelt. DNA-sekvensen i den åbne læseramme, der koder for det funktionelle protein, kaldes den kodende sekvens (eng. coding sequence, CDS) og er dermed det stykke DNA, der translateres til proteinet.