Logisk-statistisk modellering og analyse af biologiske sekvensdata

  • Christiansen, Henning (Projektdeltager)
  • Gallagher, John Patrick (Projektdeltager)
  • Skovgaard, Ole (Projektdeltager)
  • Pedersen, Martin B. (Projektdeltager)
  • Garrigues, Christel (Projektdeltager)
  • Jaeger, Manfred (Projektdeltager)
  • Forsberg, Roald (Projektdeltager)
  • Steffensen, Peter Johannes (Projektdeltager)
  • Knudsen, Thomas (Projektdeltager)
  • Knudsen, Bjarne (Projektdeltager)
  • Krogh, Anders (Projektdeltager)
  • Sato, Taisuke (Projektdeltager)

Projekter: ProjektForskning

Projektdetaljer

Beskrivelse

Alle levende organismer, fra bakterier til mennesker, har indkodet deres egenskaber i DNA-sekvenser, og i kraft af moderne laboratoriemetoder, er det muligt at aflæse disse og repræsentere dem i en computer som meget lange sekvenser af bogstaver. Dette projekt handler om nye metoder til at finde egenskaber og strukturer i sådanne sekvenser, hvilket er af væsentlig betydning for erhvervsliv og forskning indenfor udvikling af medikamenter, sygdomsforebyggelse, fødevareindustri, landbrug, genetisk forskning m.v. En computerbaseret analyse af sekvenser er baseret på en model, som beskriver mulige strukturer, og traditionelle metoder er ofte baseret på såkaldte ”Hidden Markov Models”, som har en begrænset udtrykskraft. I dette projekt udforskes og udvikles en ny og mere slagkraftig type af logisk-statistiske metoder, som endnu kun i begrænset omfang har været benyttet til sekvensanalyse og andre biologiske problemstillinger. Projektet udføres i et samarbejde mellem forskere fra universiteter og erhvervsliv, med både molekylærbiologisk og datalogisk ekspertise, således at de nye metoder afprøves på aktuelle biologiske problemer.
De beregningsmodeller, som indføres, kombinerer logikprogrammering (som det f.eks. kendes fra sproget Prolog), med maskinindlæring og statistik. Dette giver umiddelbart større fleksibilitet og udtrykskraft (i hvor komplicerede eller subtile mønstre, som kan modelleres), men indebærer også problemer omkring effektivitet af beregninger, som dette projekt også vil forsøge at løse.
Disse metoder har et potentiale for at give mere præcise og detaljerede analyseresultater, som kan lede til ny erkendelse indenfor biologien.
StatusAfsluttet
Effektiv start/slut dato01/05/200731/12/2012

Finansiering

  • Det strategiske forskningsråd; NABIIT, Programkomitéen for nanovidenskab og teknologi, bioteknologi og IT: € 675.014,00

Publikation

  • 3 Konferencebidrag i proceedings
  • 2 Paper
  • 2 Tidsskriftartikel
  • 2 Konferenceartikel

Effects of using coding potential, sequence conservation and mRNA structure conservation for predicting pyrroly-sine containing genes

Have, C. T., Zambach, S. & Christiansen, H., 2013, I : B M C Bioinformatics. 14, 1, 12 s.

Publikation: Bidrag til tidsskriftTidsskriftartikelForskningpeer review

Åben adgang
Fil

A declarative pipeline language for big data analysis

Christiansen, H., Theil-Have, C., Lassen, O. T. & Petit, M., sep. 2012, Proceedings of the 22nd International Symposium on Logic-Based Program Synthesis and Transformation (LOPSTR 2012). Leuven: Katholieke Universiteit Leuven, Bind Report CW 625. s. 3-17

Publikation: Bidrag til bog/antologi/rapportKonferencebidrag i proceedingsForskningpeer review

Efficient tabling of structured data with enhanced hash-consing

Zhou, N-F. & Have, C. T., 1 jul. 2012, I : Theory and Practice of Logic Programming. 12, 4-5, s. 547-563 16 s.

Publikation: Bidrag til tidsskriftKonferenceartikelForskningpeer review

Fil

Constraints and Global Optimization for Gene Prediction Overlap Resolution

Have, C. T., 12 sep. 2011. 8 s.

Publikation: KonferencebidragPaperForskningpeer review

Fil