DNA og Data

Carl Sagan var på TV da jeg var barn. Han med Kosmos-serien. Litt av en type. Den smittende entusiasmen hans, den kitschy, men oppriktige kosmiske visjonen (”billions upon billions of stars”, ”we are all made of star stuff”) hvor alt henger sammen, fra antikkens matematikk til kometer og molekylærbiologi. Episode 2 har den grandiose tittelen ’One voice in the cosmic fugue’. Her snakker Sagan om informasjonsinnholdet i DNA. Han står mellom lange hyller med bøker hvor menneskets genom er skrevet ned, og demonstrerer hvor utrolig mye informasjon du kan pakke inn i et molekyl. Det gjorde inntrykk.

I det samme året, 1980, kjøpte jeg min første datamaskin, en Sinclair ZX80. Det var et fantastisk leketøy, bootet på et millisekund, kræsjet aldri, og med et barnevennlig programmeringsspråk. ZX80 hadde en kilobyte RAM. Ja du leste riktig, 1024 bytes. Det var inkludert skjermminnet, så når programmet var mer enn noen linjer langt, begynte bildet på TV-skjermen å krympe. Det fantes riktignok større datamaskiner på den tiden, og snart skulle det komme en ”IBM PC” med vanvittige 128 Kb eller noe, men likevel, det var harde tider.

Datamaskinen din nå har minst to gigabyte RAM, to millioner ganger en kilobyte. Fargeinformasjonen i 20 ganger 20 piksler på skjermen (størrelsen til en litt stor bokstav) ville fylle opp hele minnnet til en ZX80.

Jeg tror at denne ufattelige eksplosjonen i datamaskinkapasitet har forandret menneskehetens oppfatning av informasjon på en gjennomgripende måte.

To bits kan kode for en base.

To bits kan kode for en base.

Sagan snakker om fem milliarder bits i menneskets DNA. Det stemmer omtrent. Vi regner nå at det er rundt tre milliarder basepar i menneskets haploide genom (altså den ene halvdelen, den andre delen er jo nesten lik). Siden vi trenger to bits for å kode for C, A, G eller T, blir det omtrent seks milliarder bits, eller 750 megabytes. Den gangen ble vi overveldet.

IBM 3380 harddiskmodul. Arnold Reinhold, Creative Commons.

IBM 3380 harddiskmodul. Arnold Reinhold, Creative Commons.

En tredje hendelse i 1980 (et begivenhetsrikt år!) var lanseringen av IBM 3380, den første harddisken som kunne lagre mer enn en gigabyte. Den kostet 98,000 dollar for 2.52 Gb, og var på størrelse med et dobbelt garderobeskap. Du kunne legge tre komplette humane genomer på en sånn en.

I dag kan du lagre hele genomet ditt på en minnepinne. Hvis du zipper (komprimerer) kan du sikkert komme ned i under 200 Mb, det er jo ingenting hva, mindre enn en tusendel av harddisken din.

Så jeg tror vi tenkte annerledes om informasjon i 1980, da ”Kosmos” ble laget. Den gangen var det ikke så mange som spurte: Hvordan i all verden er det mulig at du kan kode for et helt menneske, alle billioner celler, alle blodårer, alle nevroner, en hjerne som har forandret Jorden, med et så latterlig lite genom?

Da jeg var gutt, tenkte jeg: Er det ikke utrolig at DNA inneholder så mye informasjon? I dag tenker  jeg: Er det ikke utrolig at DNA inneholder så lite informasjon?

Dette at vi ser naturen fra en subjektiv synsvinkel, som kan forandre seg, gjelder ikke bare informasjonsinnhold. Bakterier er veldig små bare i forhold til oss. Siste istid var veldig lenge siden bare i forhold til vår levetid. Og kompleksitet er relativ til størrelsen på hjernen vår. Hvordan er det mulig at evolusjon kan frambringe så komplekse organismer? Tja, for en alien fra Alfa Centauri med en hjerne så stor som et hus, vil formodentlig en bananflue ikke framstå som kompleks i det hele tatt, og at den kan oppstå ved evolusjon vil følgelig ikke synes det minste rart.

6 comments

  1. Stian Lågstad · januar 28, 2013

    Ble fascinert av denne artikkelen på digi her om dagen:
    http://www.digi.no/910215/lagrer-2-2-petabyte-per-gram-med-dna

    Du snakker om hvor mye informasjon som lagres i vår DNA, men forskjellen her er hvor mye som _kan_ lagres i DNA?

    • Øyvind Hammer · januar 28, 2013

      Ja altså jeg snakker om mengden DNA i en menneskelig (kjønns)celle, og det er bare noen pikogram DNA tror jeg. Artikkelen din snakker om et helt gram med DNA, og det er veldig mye mer.

  2. Petter B. · januar 28, 2013

    Kosmos med Sagan gjorde et uutslettelig inntrykk! Som biolog i dag er egentlig mer overraket over hvor lite informasjon som faktis trengs for å framstill en hel flercellet organisme. Det er liten tvil om at synsvinkelen har endret seg en del på 25 år…

  3. Simen Kvaal · januar 28, 2013

    Dette minner meg om en sak jeg leste for litt siden: Såkalt «junk DNA» er ikke junk likevel!

    http://www.scientificamerican.com/article.cfm?id=hidden-treasures-in-junk-dna&page=2

  4. urbanix · februar 16, 2013

    Jeg leste dette innlegget da det ble publisert, og kom til å tenke på det igjen i går. En implikasjon slo meg: Hvis all genetisk informasjon kan lagres på et endelig antall bits – seks milliarder er skrevet, kanskje vi slenger på noen milliarder for å være sikre – er også antallet genetisk forskjellige individer endelig. Mer presist blir det vel mulig med 2^(6*10^9) genetisk forskjellige individer? Jeg vet tallet er så stort at det for praktiske formål like gjerne kunne vært uendelig, men tanken på at vi genetisk sett er elementer av den tellelig mengde muligheter er fascinerende. Men det gjenstår et spørsmål om dette er all informasjonen DNAet vår faktisk lagrer. Er dette alt som ligger i genene, eller er det noen poteniselt kontinuerlige størrelser som er forenklet ved diskretisering?

    • Øyvind Hammer · februar 16, 2013

      Heh, morsom tanke. Ja det skulle vel bli det tallet du nevner for antall mulige genotyper. Nå vil jo ikke alle disse kombinasjonene gi seg utslag i ulike fenotyper, på grunn av redundansene i DNA (bl.a. i den genetiske koden). På den annen side vil selvfølgelig de fleste kombinasjoner være dødelige, eller lage nebbdyr eller enhjørninger. Det finnes endel «epigenetisk», arvelig informasjon som ikke ligger i selve DNA-sekvensen, bl.a. hvordan DNA er pakket (kromatinstruktur, metylering). Jeg vet ikke nok om dette til å si om det finnes kontinuerlige epigenetiske data, men det er vel ikke utenkelig.

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s