Eg har no lagt ut versjon 2009-08-10 av ordbanken, eit program for kjapt og enkelt oppslag i fullformsordlistene til Norsk ordbank. Denne gongen er det ikkje so mykje nytt, men nokre rettingar, endringar og nye funksjonar er det då:
- Retta nokre kommandoar som ikkje var heilt POSIX-kompatible. Programmet skal altso no fungera betre på ulike system.
Oppslag på «ord» som startar med bindestrek (som «-aktig») verkar no alltid. Før gav det ein rar feilmelding med mindre «look» ikkje var installert, eller ein brukte regulære uttrykk. Merk at ein må bruka
--
for å skilja argument og operand (akkurat som med alle andre POSIX-verktøy). Eksempel: ordbanken -- -aktigAutofullføring fungerer òg med slike «ord», både for auto- fullføring av orda og tilhøyrande ordklassar. (Det hørest enkelt ut, men det var langt frå trivielt å få til!)
Oppslag på eit grunnord som inngår som førsteord i uttrykk med fleire ord (typisk idiom) vil ikkje lenger gje desse uttrykka som resultat. For eksempel vil ordbanken i berre gje bøyinga av ordet «i», og ikkje uttrykka «i huttaheiti» og «i så fall». Dette fører til fleire forbetringar. For det første går søket raskare, for det andre går det an å eksplisitt slå opp uttrykk med fleire ord, og for det tredje går det an å å få ut oversikt over alle slike ord. Eksempel:
Oppslag på «i huttaheiti»: ordbanken "i huttaheiti"
Oppslag på uttrykk som startar med «i»: ordbanken 'i %'
Oppslag på alle uttrykk med fleire ord: ordbanken -r ' 'Autofullføring fungerer òg på slike uttrykk, anten ved bruk av hermeteikna «, « eller «verna» teikn. Eksempel som finn uttrykket «rock and roll»:
ordbanken "rock a[tab]
ordbanken 'rock a[tab]
ordbanken rock\ a[tab]
Meir informasjon finn de på heimesida og prosjektsida. De kan lasta ned programmet frå nedlastingssida.
Tilbakemeldingar er hjertelig velkomne. Legg igjen ein kommentar her, delta på e-postlista vår, eller send ein e-post direkte til meg.
Supert, verkeleg. 🙂
Vet du hva som skal til for at et ord skal komme med i orddatabasen? Jeg fant ting som HIV-positiveste, Hiroshima-bomber, Harvard-professor, Honecker, Hydro-ansatteste og Horizonte.
Orda er i utgangspunktet dei same som i Bokmålsordboka og Nynorskordboka på nett (og ordbankdatabasen vert brukt når du søker etter bøygde former der). I tillegg er det med nokre geografiske namn og samansette ord.
Eit problem er overgenerering av adjektiv, som «høgspentaste» (den mest høgspente), eller bokmålseksempla du nemner, «positiveste» og «ansatteste». Her måtte ein gått over heile orddatabasen og markert kva adjektiv som var fornuftige å gradbøya, og det er ikkje gjort. Og det vert trulig heller ikkje gjort, iallfall ikkje med det første.
For øvrig er det ikkje nødvendigvis klart i kvart tilfelle om eit ord kan gradbøyast. For eksempel kunne kanskje «absurdaste» verta godteken.
Men overgenerering er ikkje noko problem viss du brukar programmet til å slå opp ordbøyingar som du er usikker på. Og overgenereringane kan jo til tider vera ganske underhaldande. Prøv for eksempel å seia «kongregasjonalistiskaste» ti gongar etter kvarandre (eller berre éin gong!).
For meir moro: Hør howjsay.com-fyren uttala ord som floccinaucinihilipilification eller supercalifragilisticexpialidocious. Ei sånn tenesta skulle me hatt for norsk òg!
Så det du sier er at ordbankdatabasen ikke er ment å være brukt som et grunnlag for å lage en ordbok, til for eksempel rettskriving, men bare for referanse om hvordan ord kan bøyes?
Jo, du kan godt bruka ordbankdatabasen som grunnlag for å laga ei ordbok, til for eksempel rettskriving.
Takk, dette er genialt!
Om du har planer for å bringe dette virkelig helt inn på skrivebordet, hadde en plasmoid for vært genialt 🙂
Eg har ingen planar for ein plasmoide. Men eg synest å hugsa ein plasmoide som viste resultatet av eit vilkårlig skript. Då får ein det du er på jakt etter automatisk.
Men dessverre klarar eg ikkje finna denne plasmoiden nett no …