Det Centrale Ordregister (COR) er et register over det danske ordforråds lemmaer og ordformer specielt udviklet til at understøtte sprogteknologiske projekter.
På denne side kan du finde forskellige COR-resurser, samt en manual. Det er også muligt at afprøve COR og gå på opdagelse i hvordan registeret er opbygget.
God fornøjelse!
COR 1.02 er grundresursen i COR. Registeret er baseret på Retskrivningsordbogen og indeholder information om ordklasser og bøjningsformer for alle lemmaer i ordbogen.
Download den aktuelle version, COR 1.02, som en tab-separeret liste her: cor1.02.tsv
Download CORdiff-1.01b-1.02, der indeholder ændringer v1.01b -> v1.02 her: COR-1.01b-1.02.cordiff
Download CORdiff-1.00-1.02, der indeholder ændringer v1.00 -> v1.02 her: COR-1.00-1.02.cordiff
Download bix2bform_UTF8_01.tsv, der indeholder morfologiske oplysninger om COR 1.x (se afsnit om bøjningsinformation i manualen) her: bix2bform_UTF8_01.tsv
Manual kan findes her.
Teknisk Specifikation kan findes her.
Historiske versioner af COR kan downloades nedenunder:
Download COR 1.01b som en tab-separeret liste her: cor1.01b.tsv
Download COR 1.0 som en tab-separeret liste her: cor1.00.tsv
Download CORdiff-0.9-1.0 her: COR-0.9-1.0.cordiff
Licens: CC0
COR.EXT 1.0 indeholder over 25.000 lemmaer fra Den Danske Ordbog som ikke findes i COR 1.0. COR.EXT 1.0 indeholder ordklasser og de fleste bøjningsformer.
Teknisk Specifikation kan findes her
Download COR.EXT 1.0 som en tab-separeret liste her: corext1.0.tsv
Licens: CC0
COR.SOEGEHJAELP 1.0 er en liste med en række stavefejl og alternative stavemåder (både officielle og uofficielle), samt angivelse af korrekt form.
Listen trækker på oplysninger der bruges i søgealgoritmen på Den Danske Ordbogs hjemmeside (ordnet.dk) for at hjælpe brugeren til at finde det ønskede opslagsord.
Teknisk Specifikation kan findes her
Download COR.SOEGEHJAELP 1.0 som en tab-separeret liste her: corsoegehjaelp1.0.tsv
Licens: CC0
COR.SEM 1.0 er en leksikalsk semantisk resurse der er koblet til enten grundresursen COR eller COR.EXT. COR.SEM-resursen beskriver 34.000 danske lemmaers almensproglige betydninger, udtrykt ved hjælp af formaliserede værdier. Resursen er udarbejdet med udgangspunkt i en række oplysninger fra andre ordbøger: DanNet, Den Danske Ordbog, Det Danske FrameNet-leksikon, Det Danske Sentiment-leksikon samt Den Danske Begrebsordbog.
Download COR.SEM 1.0 som en tab-separeret liste her: cor.sem.1.0.tsv
Beskrivelse: En detaljeret beskrivelse af resursen findes her.
COR.SEM er udviklet af Det Danske Sprog- og Litteraturselskab og Center for Sprogteknologi, Københavns Universitet.
Teknisk Specifikation kan findes her
Licens: CC0
Kontakt: Henvendelser vedr. COR.SEM kan stiles til:
Sanni Nimb (sn snabel-a dsl.dk
), Bolette S. Pedersen (bspedersen snabel-a hum.ku.dk
)
COR.SEM.EXT 1.0 er en supplerende resurse til COR.SEM.
COR.SEM.EXT indeholder betydningsforklaringer for alle betydninger i COR.SEM. For de fleste betydninger er der desuden et eller flere brugseksempler fra Den Danske Ordbog.
COR.SEM.EXT er udviklet af Det Danske Sprog- og Litteraturselskab (DSL) og Center for Sprogteknologi, Københavns Universitet (CST).
Download COR.SEM.EXT 1.0 som en tab-separeret liste her: cor.sem.ext.1.0.tsv
Beskrivelse: En detaljeret beskrivelse af hovedresursen COR.SEM inkl. oplysningerne i den supplerende resurse COR.SEM.EXT findes her.
Teknisk Specifikation kan findes her
Licens: CC BY-NC-ND
COR.SEM.EXT udgives under en mere lukket licens end COR.SEM, CC BY-NC-ND. Det Danske Sprog- og Litteraturselskab (DSL) og Center for Sprogteknologi, Københavns Universitet (CST) skal krediteres i publikationer og produkter der helt eller delvist er baseret på COR.SEM.EXT.
Kontakt: Henvendelser vedr. COR.SEM.EXT kan stiles til:
Sanni Nimb (sn snabel-a dsl.dk
), Thomas Troelsgård (tt snabel-a dsl.dk
)
Data returneres som html, json eller csv, afhængigt af hvorledes webservicen kaldes.
For at søge på et id kan man lave opslag som følgende:
https://ordregister.dk/id/COR.98891
https://ordregister.dk/id/COR.98891.json
https://ordregister.dk/id/COR.98891.csv
Webservicen er også implementeret så det kan lade sig gøre at søge på valgfrie kolonner i det pågældende register. Vær dog opmærksom på at der maksimalt returneres 100 resultater - har du brug for mere, kan du hente filerne der refereres til ovenfor, og slå op i dem.
En generel søgning ser ud som følgende:
https://ordregister.dk/KOLONNE/REGISTER/RETURDATAFORMAT/SØGETERM
For at søge på lemmaet ”hest” i COR med json som returdataformat skal man således lave et opslag på:
https://ordregister.dk/lemma/COR/json/hest
For at søge på fuldformen ”have” i COR med csv som returdataformat laves der et opslag på:
https://ordregister.dk/fuldform/COR/csv/have
Det er også muligt at bruge html som returdatatype, så får man læselig data direkte i browseren:
https://ordregister.dk/lemma/COR/html/miks
Hvis en søgning ingen resultater returnerer, eller der søges på en ikke eksisterende kolonne, vises der i json en fejlmeddelelse:
https://ordregister.dk/lemma/COR/json/heeest
Du kan skrive til os på følgende email-adresse:
cor.adm snabel-a dsn.dk