Karl Ove Hufthammer

Norsk Ordbog i terminalen

31. august 2009 (oppdatert 24. oktober 2009)

I 1873 kom Ivar Aasen ut med Norsk Ordbog med dansk Forklaring, grunnlaget for det som seinare skulle verta nynorsk. Boka er tilgjengelig i elektronisk form på Aasentunet, i eit noko uhendig format (Microsoft Word). Men med nokre greie verktøy kan me gjera ho om til eit enkelt koda tekstformat, og med litt skripting få Ivar Aasen rett i terminalen.

Sluttresultatet er eit kjapt, lite GNU/Linux-program for oppslag av enkeltord. Slik ser det ut i praksis:

hjelpa, v.a. (er, te), hjælpe. Nogle Steder hjølpe (Trondhjem
   og fl.), hjolpa (Sogn, Helgeland) og helpa. I den sidste Form
   bruges det ved Mandal med stærk Bøining: help, holp, holpet;
   ogsaa paa andre Steder har Præsens tildeels en stærk Form hjelp
   (hjelp’e), medens Imperf. og Sup. faae Endelsen med “t”:
   hjelpte, hjelpt, sædvanlig udtalt: jelte, jelt. Gammel Norsk
   hjalpa (help, halp, holpit); Svensk hjelpa (tildeels: hjelper,
   halp, hulpit). – Betydning: 1) understøtte, medvirke, arbeide
   med. Egentlig med Dativ; for Exempel han laut hjelpa Grannom. –
   2) frie af Nød eller Fare; bjerge, frelse. – 3) forsyne,
   skaffe Midler. Eg laut hjelpa honom med Pengar. Jævnfør
   hjelpa seg. – 4) nytte, være til Fordeel; ogsaa: virke,
   forslaae, gjøre nogen Forandring. – 5) tjene til Undskyldning,
   eller som Grund til at unddrage sig. Det fær ikkje hjelpa, um
   det gjerer vondt. – 6) afhjælpe, forhindre. Eg kann ikkje
   hjelpa det. (Egentl. hjelpa fyre det). – Reflexivt: hjelpast,
   hjælpe hinanden. Hedder ogsaa: hjelpast aat. – Hjelpa seg:
   a) bjerge sig, slaae sig igjennem; ogsaa: være tjent med noget. b)
   gjøre sig Umage, bruge sine Kræfter.

Omgjering av dataformatet

Først må me lasta ned ordboka frå Aasentunet. For å gjera ho om til rett format, treng me desse verktøya:

Opna ordbokfila i OpenOffice.org, og lagra ho på nytt i HTML-format, med namnet 1873-ordbok.html. Last så ned og kjør bash-skriptet konverter-norsk-ordbog.sh i same mappa som du lagra ordbokfila. Skriptet masserer HTML-fila, og etter nokre minutt (rundt fem på mi ganske gamle og trege maskin), spyttar det ut fila norsk-ordbog.dat, som inneheld ordboka i eit enkelt tekstformat.

(Eg skulle gjerne lagt ut fila ferdigkonvertert, men er usikker på om eg har lov til det. Eg sendte ein e-post til Aasentunet med spørsmål om dette, men fekk aldri svar. Derfor må me gjera det på denne meir tungvinte måten.)

Bruk av programmet

Last ned norsk-ordbog.sh og forkortingar.dat i same mappa som før. Førstnemnde er skriptet me brukar til å slå opp ord med, og syntaksen er so enkel som han kan verta:
./norsk-ordbog.sh oppslagsord

Ting å hugsa på:

Programmet prøver å ta vare på informasjon frå papirutgåva, ved å gjera kursiv og halvfeit tekst om til farga tekst. Men det har òg nokre særs kjekke funksjonar som me ikkje finn i papirutgåva:

Andre plattformer

Skriptet er laga for GNU/Linux, men det kan vera du kan få det til å verka på andre plattformer òg. På Mac skal det visstnok fungera nokolunde viss du byter ut sed med ssed og fjernar valet -t frå fmt-kommandoen. Takk til Kevin Brubeck Unhammer for testing.

Spørsmål og tilbakemeldingar er for øvrig hjertelig velkomne. Legg igjen ein kommentar her, eller send ein e-post direkte til meg.

Emne: Programvare, Språk

[Abonner på kommentarar til artikkelen]

Kommentarar

Legg til kommentar





Du kan bruka dei vanligaste elementa og attributta i HTML. Avsnitt lagar du med vanlige linjeskift. Eg kan komma til å gjera typografiske og ortografiske endringar i innlegg (men vil aldri endra sjølve innhaldet), samt fjerna upassande innlegg.

Skriven av Karl Ove Hufthammer og driven med WordPress. Du kan abonnera på innleggs-RSS eller kommentar-RSS.