Hopp til hovedinnhold
Nasjonalbiblioteket

NST uttaleleksikon for svensk

DatasettAllmenn tilgang Åpne data 

Beskrivelse

Dette uttaleleksikonet for svensk vart opphavleg produsert av Nordisk språkteknologi (NST), og inneheld om lag 927.000 oppslag. Ordlista tek utgangspunkt i dei 100.000 mest frekvente ordformene i det svenske tekstkorpuset til NST.

Heile leksikonet ligg føre som ei stor fil i rein tekst-format. Kvart oppslag er på ei line, det er 51 postar tilgjengeleg på kvar line, og postane er skilde med semikolon. Ikkje alle postane er like relevante for alle føremål, men gitt formatet er det lett å hente ut den informasjonen ein treng.

Leksikonet inneheld mellom anna informasjon om dekomponeringsledd i samansettingar og ein eller flere fonetiske transkripsjon.ar Denne transkripsjonen er delvis gjort manuelt, men det meste er gjort automatisk ved hjelp av ein inflektor, og dette er delvis stikkprøvekontrollert. Sjølve inflektoren, og anna leksikalsk verktøy som kan nyttast til å handsame leksikonet, kan lastast ned som ein eigen zip-fil.

Transkripsjonsformatet er SAMPA (Speech Assessment Methods Phonetic Alphabet).

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/22
Direkte nedlastning:
https://www.nb.no/sbfil/dok/nst_leksdat_se.pdf
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Norsk Acquis CommunautaireNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
N-gram - nynorskNasjonalbiblioteket
Allmenn tilgang