N-grammeilla toimiva hakukone
Olet Mikko Saaren Elämä ja mielipiteet -blogissa. Tämä kirjoitus on julkaistu 27.11.2004, klo 12:54.
Edellinen kirjoitus: Lisää asiakkaita
Seuraava kirjoitus: Kulutusopetus
Jos haluat lukea lisää kirjoituksiani samasta aiheesta, tämä kirjoitus kuuluu kategoriaan Tietokoneet.
Katso myös:- Tower Defense ja Google SketchUp
- Muistia ja bisnestä
- Monitoimitulostin, ideoita kaivataan
- Kasvua kasvun päälle
- Uusi Movable Type
- Javascript-widgetti
- Thunderbird-vinkki
- Varmuuskopiointia
- M3U2iTunes
- Writely
Pelisivuillani on jo 92 arvostelua. Tuollaisen paljouden kanssa on jo tekemisissä, kun yrittää keksiä näppäriä tapoja esittää aineistoa helposti löydettävässä muodossa. Tulin siihen tulokseen, että tarvitsen hakukoneen.
Ihan tavallista hakukoneesta ei tullut, vaan hyödynsin kieltenvälisen tiedonhaun kurssilla opittua n-grammitäsmäytystä. Systeemi on näppärä ja hallitsee kirjoitusvirheet ja kirjoitusasun vaihtelut tyylikkäästi. Esimerkiksi hakusanoilla "Eufrat ja Tigris" löytyy Tigris & Euphrates. Ei onnistuisi yksinkertaisella sanahaulla!
Kirjoitin teknisestä toteutuksesta englanninkieliselle puolelle jutun N-Gram String Matching, sieltä löytyy tarkempia yksityiskohtia ja PHP-koodia.
Kommentit ja TrackBackit
Tämän merkinnän TrackBack URL on:
http://www.melankolia.net/mt/mt-tb.cgi/2778