Förbättrad bioinformatisk genanalys
Ett antal bioinformatiska metoder att analysera hur geners aktivitet regleras presenteras i en aktuell avhandling från Karolinska Institutet. De ger i förlängningen förutsättningar för bättre förståelse av både fosterutveckling och mänskliga sjukdomar.
Alla celler i en människas kropp innehåller samma gener, och samma arvsmassa (DNA) som fanns i embryots första cell. Hur information i arvsmassan kan styra vår utveckling från embryo till fullvuxen människa är en av de mest fundamentala biologiska frågorna.
Den mekanism som slår av och på gener – transkriptionell reglering – är en av livets stora uppfinningar som i stort sett är likadan i alla organismer, och har en stor inverkan på både vår utveckling och våra reaktioner på omgivningen (t.ex. rodnad, adrenalin). De flesta gener i en cell är inaktiva – frågan är hur vissa gener kan aktiveras, och hur cellen vet vilka dessa gener är. Det har visat sig att gener är associerade med en typ av sensorer i arvsmassan som kan känna av vissa typer av molekyler i cellen. Sensorerna är i praktiken en sorts ankarplatser för en typ av DNA-bindande proteiner som kallas transkriptionsfaktorer. Förenklat: om rätt sorters proteiner fäster vid en eller flera ankarplatser kan en gen slås på.
I ett modernt laboratorium är det möjligt att hitta ankringsplatser, men om man inte har någon eller bara lite information att börja med är det kostsamt och tidsödande.
Ankringsplatserna är mycket små i jämförelse med hur stor arvsmassan är. Idag finns DNA-sekvensen för hela den mänskliga arvsmassan tillgänglig. Med den informationen till hands har många hoppats att man skulle kunna hitta ankringsplatser med hjälp av datoranalys. Analys av biologisk information med hjälp av datorer kallas ofta bioinformatik. Med bioinformatiska metoder kan man idag hitta redan kända ankarplatser, men de förutsäger samtidigt orealistiskt många ankarplatser i arvsmassan.
I avhandlingen presenteras ett antal metoder och databaser för förbättrad analys. De två mest allmängiltiga slutsatserna är:
– Att jämförelser av arvsmassan mellan människa och mus kan eliminera runt 85 procent av alla falska förutsägelser
– Att man kan bygga in biologisk kunskap om hur klasser av ankarplatser ser ut i algoritmer som försöker hitta ankringsplatser genom statistisk överrepresentation, och på så sätt mångdubbla metodernas känslighet.
Avhandlingens titel:
In silico prediction of cis-regulatory elements
Författare:
Albin Sandelin, Centrum för genomik och bioinformatik, Karolinska Institutet,
tel 08-524 861 32 eller 073 649 7329 alternativt mail albin.sandelin@cgb.ki.se
Disputation:
Måndag 10 maj 2004, kl. 10.00, Samuelssonsalen, Tomtebodavägen 6, Karolinska Institutet, Solna Campus.
Avhandlingens abstract och ramberättelse (pdf) finns på: http://diss.kib.ki.se/2004/91-7349-879-3/