AnHo – en søgemaskine

Marie Højlt & Anne Rosenstand Hansen

Studenteropgave: Semesterprojekt

Abstrakt

Dette projekt omhandler den søgeproces, der finder sted ved søgning fra et Javaprogram i en fuldtekstdatabase. Med fokus på systemets behandling af forespørgslen, strukturen i databasen samt rangering af søgeresultaterne har vi udviklet en prototype, der afprøver den brugte teori. Teorien omhandler udvalgt litteratur inden for indeksering, normalisering, termvægt og relevansmodeller. Empirien beskæftiger sig, udover den udviklede søgemaskine, AnHo, med Politikens database, Polinfo som eksempeldatabase. Vi udleder, at en strukturering af databasen i form af et inverteret indeks, skabt ud fra dokumenternes termer og termvægte i databasen, med en forudgående normalisering af indekstermerne, er nødvendig for at få et optimalt resultat ud af de indtastede søgetermer.

UddannelserDatalogi, (Bachelor/kandidatuddannelse) Bachelor el. kandidat
SprogDansk
Udgivelsesdato16 jan. 2007
VejledereHenrik Bulskov

Emneord

  • termfrekvens
  • database
  • søgemaskine
  • inverse document frequency
  • vector space model
  • termvægt
  • information retrieval
  • automatisk indeksering
  • polinfo
  • bolean logic model