Karl Ove Hufthammer

Dumme søkemotor – med eit par lyspunkt

22. april 2003 (oppdatert 26. mai 2009)

Internett kryr av søkemotorar, i alle former, og dei fleste av desse er fryktelig dårlige. Sjølv på nettstader som er heilt avhengige av å ha gode søkemotorar (eksempelvis nettbutikkar) ser dette ut til å vera noko som knapt er ofra ein tanke. Her er tre eksempel på altfor vanlige feil:

Dårlige standardinnstillingar
Den elles utmerka nettbutikken Zailor søker som standard berre etter ord i begynnelsen av titlar. La oss tenka oss at du er interessert i å kjøpa plata Norske viseperler. Du skriv då inn ordet «viseperler» i søkeboksen. Det er vanligvis fornuftig å velja det mest unike ordet i eit søk, for å redusera talet på treff. Her vert det ingen treff. Vel, dei har vel ikkje plata då, tenker du, og leiter heller etter ho i ein annan nettbutikk. Men dei har faktisk plata – eit søk på «norske» viser dette (langt nede i resultatlista). Mon tru kor mange sal dei går glipp av med dette systemet. Eg veit iallfall at eg minst ein gong har gått og kjøpt ei plata ein annan plass då eg ikkje trudde Zailor hadde ho (eg oppdaga heilt tilfeldigvis at dette ikkje stemte ei stund etterpå).
Manglande rangering
Når ein først får ein haug med treff, bør dei mest relevante komma øvst. Dette er det ikkje alle som har forstått. Fagbokhandelen Studia er eit utmerka eksempel. Desse sel fagbøker frå mange spesialområde. La oss for eksempelets skyld tenka oss at du er ein geolog, på jakt etter boka Statistics and data analysis in geology (ei bok Studia har). Du skriv inn tittelen i søkeboksen øvst på sida. Du får 3 000 treff! Her er dei tre øvste:
  • C++ from the ground up 3ed.
  • Get creative! The digital photo idea boo
  • The Changing Shape of Geometry: Celebrating a Century of Geometry and Geometry Teaching
Ingen av desse har noko med statistikk, dataanalyse eller geologi å gjera. Det same gjeld resten av treffa på første resultatsida (som blant anna inneheld bøker om greske skodespel, menneskerettar og pediatrisk endokrinologi!). Kva har skjedd? Jo, søkemotoren har funne alle bøker som inneheld minst eitt av orda (inkludert «and» og «in») i tittelen, beskrivinga eller ein annan plass, og viser dei i ei tilsynelatande tilfeldig rekkefølgja. Prøv sjølv. Nesten same kva du søker etter, so kjem The Changing Shape of Geometry: Celebrating a Century of Geometry and Geometry Teaching blant dei øvste treffa!
For mange søkeval
Prøver eg å søka etter ei bok frå Bokilden, vert eg tvinga til å velja kva eg søker etter, for kvart einaste søk. Er det ein tittel, ein forfattar eller eit emne? Eg spør: Er det verkelig so viktig? Det er faktisk ikkje so farlig om eg for eksempel får opp ei bok om forfattaren når eg søker etter bøker av han (og kanskje den boka òg vil vera av interesse). Nettbutikken Amazon.com klarar seg utmerka med eitt søkefelt, endå dei sel både bøker, plater, filmar, leikar, dataspel, verktøy, klede og reiser. Ikkje gjer det meir tungtvindt for meg enn de treng; då går eg heller ein annan plass.

Dette var berre tre eksempel på kva som er galt med søkemotorane på ein del nettstadar. Det finst mange fleire – dessverre. Ofte fungerer det faktisk betre å bruka ein søkemotor som Google til å søka på nettstaden, i staden for å bruka den interne søkemotoren.

Men det finst faktisk lyspunkt i søkeverda, og eg vil trekka fram to av dei her:

BBC er av dei som skjønt det. Hopp over til artikkelen A Day In The Life Of BBCi Search. Dei har laga fleire funksjonar for å gjera livet til brukarane lettare:

Stavekontroll
I snitt kvart 12. søk inneheld feilstavingar. Utviklarane har derfor lagt til ein stavekontroll, med klikkbare staveforslag. I tillegg har dei laga ein database over dei vanligaste feilstavingane (for blant anna fjernsynsprogram), og desse vert brukt automatisk som erstatting for dei feilstava orda. Hadde me hatt noko tilsvarande her i Norge, ville for eksempel eit søk etter «miljonær» plassert heimesida til «Vil du bli millionær» øvst i resultatlista.
Andre synonym
Systemet ovanfor vert ikkje berre brukt for direkte feilstavingar. For eksempel vil eit søk etter «planets» føra ein til vitskapssida, sjølv om denne berre snakkar om «space» og «solar systems».

BBC-folka arbeider hardt for å få ein god søkemotor. Eg har berre nemnt noko av det dei gjer. Heile artikkelen er anbefalt lesnad.

Eit anna lyspunkt var Voss kommune. Dei hadde ein søkemotor som forsto både nynorsk og bokmål, og set automatisk om, slik at du ikkje trong tenka på kva målform dokumentet du søkte etter var skriven i. Eit søk etter «virksomhet» fann både «virksomhet», «verksemd» og «forretning».

Sjølv viss alle dokumenta (og brukarane) hadde same målform, var søket veldig nyttig. Det tok nemlig òg vanlige feilstavingar (eksempelvis vert «lyøve» automatisk retta til «løyve»), og alternative ordformer og ordtider vert sjekka («vanskelig» finn både «vanskelig», «vanskelige», «problematisk», «problem» og «vanskar»). Dette var ei fantastisk søketenesta eg skulle ønskt mange fleire hadde tatt i bruk. Ho var for øvrig utvikla av firmaet Edda språkresurser (som no er konkurs, so vidt eg kan sjå).

Oppdatering mai 2009: Voss har no gått over til ein annan og dårligare søkemotor, som ikkje forstår norsk. Eit søk på «virksomhet» gjev berre 1 treff, mot 74 for «verksemd», og «lyøve» gjev ingen treff.

Forhåpentligvis får me sjå meir av slike gode søkemotorar. Det er iallfall klart at nettbutikkar som er utforma slik at folk kan finna fram til varene dei er interessert i vil ha ein stor fordel. Dessverre ser det førebels ikkje ut til at dei sjølv forstår at det kan vera lønsamt å investera i ny søketeknologi. Men heldigvis finst teknologien allereie ferdig utvikla!

Emne: Nettsideutvikling

[Abonner på kommentarar til artikkelen]

Kommentarar

Legg til kommentar





Du kan bruka dei vanligaste elementa og attributta i HTML. Avsnitt lagar du med vanlige linjeskift. Eg kan komma til å gjera typografiske og ortografiske endringar i innlegg (men vil aldri endra sjølve innhaldet), samt fjerna upassande innlegg.

Skriven av Karl Ove Hufthammer og driven med WordPress. Du kan abonnera på innleggs-RSS eller kommentar-RSS.