N-grammeilla toimiva hakukone

Olet Mikko Saaren Elämä ja mielipiteet -blogissa. Tämä kirjoitus on julkaistu 27.11.2004, klo 12:54.

Edellinen kirjoitus: Lisää asiakkaita
Seuraava kirjoitus: Kulutusopetus

Jos haluat lukea lisää kirjoituksiani samasta aiheesta, tämä kirjoitus kuuluu kategoriaan Tietokoneet.

Katso myös:
- Tower Defense ja Google SketchUp
- Muistia ja bisnestä
- Monitoimitulostin, ideoita kaivataan
- Kasvua kasvun päälle
- Uusi Movable Type
- Javascript-widgetti
- Thunderbird-vinkki
- Varmuuskopiointia
- M3U2iTunes
- Writely

Pelisivuillani on jo 92 arvostelua. Tuollaisen paljouden kanssa on jo tekemisissä, kun yrittää keksiä näppäriä tapoja esittää aineistoa helposti löydettävässä muodossa. Tulin siihen tulokseen, että tarvitsen hakukoneen.

Ihan tavallista hakukoneesta ei tullut, vaan hyödynsin kieltenvälisen tiedonhaun kurssilla opittua n-grammitäsmäytystä. Systeemi on näppärä ja hallitsee kirjoitusvirheet ja kirjoitusasun vaihtelut tyylikkäästi. Esimerkiksi hakusanoilla "Eufrat ja Tigris" löytyy Tigris & Euphrates. Ei onnistuisi yksinkertaisella sanahaulla!

Kirjoitin teknisestä toteutuksesta englanninkieliselle puolelle jutun N-Gram String Matching, sieltä löytyy tarkempia yksityiskohtia ja PHP-koodia.

Kommentit ja TrackBackit

Tämän merkinnän TrackBack URL on:
http://www.melankolia.net/mt/mt-tb.cgi/2778

Jätä kommentti




Jätä tietosi säilyttävä keksi?