Det Centrale Ordregister (COR) er et register over det danske ordforråds lemmaer og ordformer specielt udviklet til at understøtte sprogteknologiske projekter.
På denne side kan du finde forskellige COR-resurser, samt en manual. Det er også muligt at afprøve COR og gå på opdagelse i hvordan registeret er opbygget.
God fornøjelse!
COR 2 svarer til Retskrivningsordbogens 5. udgave (som udkom d. 18/11 2024).
COR 2 kan hentes i en betaversion som en tab-separeret liste her: cor2beta1.tsv
Forskellene mellem COR 1.02 (se nedenfor) og den nye liste can downloades her: cor1.02-cor2beta1.cordiff
Vær opmærksom på at det drejer sig om en betaversion, og filerne kan derfor indeholde fejl. Hvis du finder noget i de to filer som ligner en fejl, bedes du kontakte Thomas Widmann (tw snabel-a dsn.dk
).
Onlinesøgningen i COR nedenfor er endnu ikke opdateret til COR 2.
COR 1.02 er grundresursen i COR. Registeret er baseret på Retskrivningsordbogen og indeholder information om ordklasser og bøjningsformer for alle lemmaer i ordbogen.
Download den aktuelle version, COR 1.02, som en tab-separeret liste her: cor1.02.tsv
Download CORdiff-1.01b-1.02, der indeholder ændringer v1.01b -> v1.02 her: COR-1.01b-1.02.cordiff
Download CORdiff-1.00-1.02, der indeholder ændringer v1.00 -> v1.02 her: COR-1.00-1.02.cordiff
Download bix2bform_UTF8_01.tsv, der indeholder morfologiske oplysninger om COR 1.x (se afsnit om bøjningsinformation i manualen) her: bix2bform_UTF8_01.tsv
Manual kan findes her.
Teknisk Specifikation kan findes her.
Historiske versioner af COR kan downloades nedenunder:
Download COR 1.01b som en tab-separeret liste her: cor1.01b.tsv
Download COR 1.0 som en tab-separeret liste her: cor1.00.tsv
Download CORdiff-0.9-1.0 her: COR-0.9-1.0.cordiff
Licens: CC0
COR.EXT 1.0 indeholder over 25.000 lemmaer fra Den Danske Ordbog som ikke findes i COR 1.0. COR.EXT 1.0 indeholder ordklasser og de fleste bøjningsformer.
Teknisk Specifikation kan findes her
Download COR.EXT 1.0 som en tab-separeret liste her: corext1.0.tsv
Licens: CC0
COR.SOEGEHJAELP 1.0 er en liste med en række stavefejl og alternative stavemåder (både officielle og uofficielle), samt angivelse af korrekt form.
Listen trækker på oplysninger der bruges i søgealgoritmen på Den Danske Ordbogs hjemmeside (ordnet.dk) for at hjælpe brugeren til at finde det ønskede opslagsord.
Teknisk Specifikation kan findes her
Download COR.SOEGEHJAELP 1.0 som en tab-separeret liste her: corsoegehjaelp1.0.tsv
Licens: CC0
COR.SEM 1.0 er en leksikalsk semantisk resurse der er koblet til enten grundresursen COR eller COR.EXT. COR.SEM-resursen beskriver 34.000 danske lemmaers almensproglige betydninger, udtrykt ved hjælp af formaliserede værdier. Resursen er udarbejdet med udgangspunkt i en række oplysninger fra andre ordbøger: DanNet, Den Danske Ordbog, Det Danske FrameNet-leksikon, Det Danske Sentiment-leksikon samt Den Danske Begrebsordbog.
Dansk Sprog- og Litteraturselskab har udarbejdet en brugervenlig visning af COR.SEM-data på sitet corsem.dsl.dk. Der er mulighed for at få en ordbogsvisning af brugervalgte ord og mulighed for en visning med brugervalgte oplysningstyper samt udtræk af skræddersyede data.
Download COR.SEM 1.0 som en tab-separeret liste her: cor.sem.1.0.tsv
Beskrivelse: En detaljeret beskrivelse af resursen findes her.
COR.SEM er udviklet af Det Danske Sprog- og Litteraturselskab og Center for Sprogteknologi, Københavns Universitet.
Teknisk Specifikation kan findes her
Licens: CC0
Kontakt: Henvendelser vedr. COR.SEM kan stiles til:
Sanni Nimb (sn snabel-a dsl.dk
), Bolette S. Pedersen (bspedersen snabel-a hum.ku.dk
)
COR.SEM.EXT 1.0 er en supplerende resurse til COR.SEM.
COR.SEM.EXT indeholder betydningsforklaringer for alle betydninger i COR.SEM. For de fleste betydninger er der desuden et eller flere brugseksempler fra Den Danske Ordbog.
COR.SEM.EXT er udviklet af Det Danske Sprog- og Litteraturselskab (DSL) og Center for Sprogteknologi, Københavns Universitet (CST).
Download COR.SEM.EXT 1.0 som en tab-separeret liste her: cor.sem.ext.1.0.tsv
Beskrivelse: En detaljeret beskrivelse af hovedresursen COR.SEM inkl. oplysningerne i den supplerende resurse COR.SEM.EXT findes her.
Teknisk Specifikation kan findes her
Licens: CC BY-NC-ND
COR.SEM.EXT udgives under en mere lukket licens end COR.SEM, CC BY-NC-ND. Det Danske Sprog- og Litteraturselskab (DSL) og Center for Sprogteknologi, Københavns Universitet (CST) skal krediteres i publikationer og produkter der helt eller delvist er baseret på COR.SEM.EXT.
Kontakt: Henvendelser vedr. COR.SEM.EXT kan stiles til:
Sanni Nimb (sn snabel-a dsl.dk
), Thomas Troelsgård (tt snabel-a dsl.dk
)
Data returneres som html, json eller csv, afhængigt af hvorledes webservicen kaldes.
For at søge på et id kan man lave opslag som følgende:
https://ordregister.dk/id/COR.98891
https://ordregister.dk/id/COR.98891.json
https://ordregister.dk/id/COR.98891.csv
Webservicen er også implementeret så det kan lade sig gøre at søge på valgfrie kolonner i det pågældende register. Vær dog opmærksom på at der maksimalt returneres 100 resultater - har du brug for mere, kan du hente filerne der refereres til ovenfor, og slå op i dem.
En generel søgning ser ud som følgende:
https://ordregister.dk/KOLONNE/REGISTER/RETURDATAFORMAT/SØGETERM
For at søge på lemmaet ”hest” i COR med json som returdataformat skal man således lave et opslag på:
https://ordregister.dk/lemma/COR/json/hest
For at søge på fuldformen ”have” i COR med csv som returdataformat laves der et opslag på:
https://ordregister.dk/fuldform/COR/csv/have
Det er også muligt at bruge html som returdatatype, så får man læselig data direkte i browseren:
https://ordregister.dk/lemma/COR/html/miks
Hvis en søgning ingen resultater returnerer, eller der søges på en ikke eksisterende kolonne, vises der i json en fejlmeddelelse:
https://ordregister.dk/lemma/COR/json/heeest
Du kan skrive til os på følgende email-adresse:
cor.adm snabel-a dsn.dk