Karl Ove Hufthammer

Ordbanken – norsk bøying på ein lett måte

1. May 2009 (oppdatert 17. februar 2013)

Kva er fleirtal av ordet «forum» på nynorsk? Kva heiter «å lata» i presens, preteritum og imperativ? Heiter det offisielt «ei appelsin», «ein appelsin» eller «eit appelsin»? Når du er ferdig med å lesa nokre bøker, er bøkene då «leste», eller er dei «lesne»? Tilsvarande, når du ein varm sommarkveld sit og nyt ei korg ferske jordbær, kva vil du seia jordbæra er etterpå? «Nytne»? «Nautne»? «Nøtne»? «Nytte»?

Bøying på norsk er ikkje alltid like lett. Heldigvis har me Bokmålsordboka og Nynorskordboka på nett, men oppføringane der er ikkje alltid fullstendige nok til å vera til hjelp for oss ikkje-filologar. Dette er for eksempel det ordbøkene seier om «å lese» og «å nyte»:

Her finn me verken «leste» eller «lesne», sidan ordboksoppføringane ikkje viser fullstendig bøying. Men eitt av alternativa er rett, og me kan finna fram til dette om me veit å lesa oppføringane og kjenner grundig til reglane for samsvarsbøying på norsk. Språkrådet har ei enkel men ufullstendig innføring i full samsvarsbøying, og i bladet Statsspråk nr. 4/97, finn me ei meir omfattande oversikt (med overskrifter som «Berre for spesialistar» og «Berre for professorar»). Men det er tungt å læra og å hugsa alle desse reglane – finst det ikkje ei lettare løysing? Jo, no finst det endeleg det!

[Oppdatering august 2012: Ordbøkene på nett er no kraftig forbetra, slik at dei òg viser fullstendig bøying for ord. Men det er likevel mange fordelar med å bruka programmet omtalt her, so les vidare!] Prøv Linux-programmet Ordbanken. Med dette er fullstendige bøyingar av alle orda på bokmål og nynorsk berre nokre tastetrykk unna. Syntaksen er veldig enkel:
ordbanken [VAL] grunnord [KRITERIUM1] [KRITERIUM2] …

Eksempel: ordbanken appelsin

appelsin appelsin subst mask appell eint ub
appelsin appelsinen subst mask appell eint bu
appelsin appelsinar subst mask appell fl ub
appelsin appelsinane subst mask appell fl bu

Her viser koden «mask» og blåfargen at ordet berre kan vera «hankjønn» på nynorsk, sjølv om mange dialektar har det som hokjønn eller inkjekjønn. (Det finst for øvrig ord som kan vera både han-, ho- og inkjekjønn på nynorsk, som for eksempel «greip».)

Koden «subst» viser at det er snakk om eit substantiv, mens «eint» og «fl» og «bu» og «ub» indikerer høvesvis eintal, fleirtal, bunden og ubunden form. Det finst òg mange andre kodar. Her er eit eksempel for ordet «hoppe»:

hoppe hoppa adj <perf-part> fl
hoppe hoppa adj <perf-part> bu eint
hoppe hoppa adj <perf-part> m/f ub eint
hoppe hoppa adj <perf-part> nøyt ub eint
hoppe hoppande adj <pres-part>
hoppe hoppa subst fem appell eint bu
hoppe hoppe subst fem appell eint ub
hoppe hoppene subst fem appell fl bu
hoppe hopper subst fem appell fl ub
hoppe hoppast verb
hoppe hopp verb imp
hoppe hoppa verb imp
hoppe hoppe verb imp
hoppe hoppa verb inf
hoppe hoppe verb inf
hoppe hoppa verb perf-part
hoppe hoppar verb pres
hoppe hoppa verb pret

Det kan altso vera snakk om både eit verb eller eit substantiv. Me kan òg filtrera etter dei ulike kodane, so viss me berre var interesserte i substantivet, kunne me skriva:
ordbanken hoppe subst

Her er nokre andre brukseksempel. Merk at oppslagsordet må vera fullstendig, mens det held å bruka starten av eventuelle kodar.

Bøying av ordet «å lese»:
ordbanken lese
Eller med a-infinitiv:
ordbanken lesa

Berre perfektum partisipp-former:
ordbanken lese perf

Ordet «hoppe», men berre som substantiv:
ordbanken hoppe subst

Bøying av «å finnes» på bokmål:
ordbanken --sprak=nb finnes

Fleirtal av substantivet «hoppe» på bokmål:
ordbanken -snb hoppe su fl

Ordet «annan», men utan fargekoding:
ordbanken --ikkje-fargekod annan

Same som over, berre mindre å skriva:
ordbanken -F annan

Lagra resultatet som HTML i fila «annan.html»:
ordbanken --html annan > annan.html

Alle oppslagsorda som startar på «kr», etterfølgd av éin vilkårleg bokstav, so bokstavane «ss», so eventuelt nokre vilkårlege bokstavar, og til slutt ein «d». Dette finn blant anna ordet «kryssord»:
ordbanken kr_ss%d

Alle oppslagsorda som sluttar på «rama» men ikkje på «drama» (klarar du å komma på eitt‽):
ordbanken -r [^d]rama$

Bokmålsord med minst 5 etterfølgjande vokalar (det finst fleire!):
ordbanken -snb -r "[aeiouyæøå]{5}"

Programmet støttar òg autofullføring via «bash completion». Viss du har installert og slått på dette, kan du bruka tabulator- tasten slik (køyr ordbanken --eksempel for fleire eksempel):

$ ordbanken -[tab]

-e                  --html              -snn
--eksempel          --ikkje-fargekod    --sprak
-f                  -r                  --tekst
--fargekod          --regulært-uttrykk  -v
--hjelp             -snb                --versjon

(Liste over alle mulege argument vart vist.)

$ ordbanken --sprak nn ym[tab]

ym         ymisskap   ymsefinna  ymt
ymis       ymist      ymsen      ymte
ymiskvar   ymje       ymsesidig  ymting
ymisleg    ymse       ymsing

(Liste over alle nynorskord som startar med «ym» vart vist.)

$ ordbanken --sprak nn hoppe [tab]

adj        fem        m/f        pres-part  verb
appell     fl         nøyt       pret       
bu         imp        perf-part  subst      
eint       inf        pres       ub

(Liste over alle filtreringskriteria me kan bruka for nynorskordet «hoppe».)

Orddatabasen som vert brukt er Norsk ordbank, som vert utvikla og vedlikehalden av Universitet i Oslo. Bokmålsordboka og Nynorskordboka på nett brukar for øvrig den same databasen.

Programmet er heilt gratis og fri programvare, og er tilgjengeleg under den same lisensen som Norsk ordbank, GNU GPL versjon 3 eller seinare. Du kan lasta det ned frå den offisielle prosjektsida. Der kan du òg melda deg på e-postlista vår om du er spesielt interessert i prosjektet.

Til slutt, her er svara på spørsmåla i innleiingsteksten:

Emne: Programvare, Språk

[Abonner på kommentarar til artikkelen]

Kommentarar

Legg til kommentar





Du kan bruka dei vanligaste elementa og attributta i HTML. Avsnitt lagar du med vanlige linjeskift. Eg kan komma til å gjera typografiske og ortografiske endringar i innlegg (men vil aldri endra sjølve innhaldet), samt fjerna upassande innlegg.

Skriven av Karl Ove Hufthammer og driven med WordPress. Du kan abonnera på innleggs-RSS eller kommentar-RSS.