ISO 639-3 - ISO 639-3

Vikipeedia, Vaba Entsüklopeedia

Pin
Send
Share
Send

ISO 639-3: 2007, Keelte nimetuste esitamise koodid. Osa 3: Kolmetäheline kood keelte ulatuslikuks kajastamisekson rahvusvahelised standardid keelekoodid aastal ISO 639 seeria. See määratleb keelte tuvastamiseks kolmetähelised koodid. Standardi avaldas Rahvusvaheline Standardiorganisatsioon (ISO) 1. veebruaril 2007.[1]

ISO 639-3 laiendab standardit ISO 639-2 alfa-3 koodid eesmärgiga katta kõik teadaolevad loomulikud keeled. Laiendatud keelekatvus põhines peamiselt programmis kasutatud keelekoodidel Etnoloog (köited 10–14), väljaandja SIL International, mis on nüüd registreerimisasutus ISO 639-3 jaoks.[2] See annab loetelu võimalikult terviklikest keeltest, sealhulgas elavatest ja väljasurnud, iidsetest ja konstrueeritud keeltest, suurtest ja väiksematest, kirjutatud ja kirjutamata keeltest.[1] Kuid see ei sisalda rekonstrueeritud keeled nagu näiteks Proto-indoeurooplane.[3]

ISO 639-3 on mõeldud kasutamiseks metaandmed koode paljudes rakendustes. Seda kasutatakse laialdaselt arvuti- ja infosüsteemides, näiteks Internetis, kus tuleb toetada paljusid keeli. Arhiivides ja muus teabemälus kasutatakse seda kataloogimissüsteemides, näidates ära, mis keeles ressurss on või mille kohta see on. Koode kasutatakse sageli ka lingvistilises kirjanduses ja mujal, et kompenseerida seda, et keelenimed võivad olla ebaselged või mitmetähenduslikud.

Leidke keel
Vastava keeleartikli leidmiseks sisestage ISO 639-3 kood.

Keelekoodid

ISO 639-3 hõlmab kõiki keeli ISO 639-1 ja kõik üksikud keeled ISO 639-2. ISO 639-1 ja ISO 639-2 keskendusid suurtele keeltele, mida on kõige rohkem esindatud kogu maailma kirjanduses. Kuna ISO 639-2 hõlmab ka keelekogusid ja 3. osa seda ei hõlma, ei ole ISO 639-3 ISO 639-2 superset. Kus B- ja T-koodid on olemas standardis ISO 639-2, kasutab ISO 639-3 T-koode.

Näited ISO keelekoodidest
Keel639-1639–2 (B / T)639-3 tüüp639-3 kood
Ingliseetengindividuaalneeng
Saksa keeldeger / deuindividuaalnedeu
Araabiaararamakroara
individuaalnearb + teised
Hiina keelzhchi / zho[4][5]makrozho
Mandariinindividuaalnecmn
Kantoni keelindividuaalnejah
Minnanindividuaalnenan

Alates 30. jaanuarist 2020, sisaldab standard 7868 kirjet.[6] Keelte loetelu põhineb mitmel allikal, sealhulgas: üksikud keeled, mis sisalduvad versioonis 639-2, tänapäevased keeled Etnoloog, ajaloolised sordid, iidsed keeled ja tehiskeeled alates Keeleteadlaste nimekiri,[7] samuti iga-aastase avaliku kommenteerimisperioodi jooksul soovitatud keeled.

Masinloetavad andmed failid pakub registreerimisasutus.[6] Nende andmefailide abil saab kaardistada ISO 639-1 või ISO 639-2 kuni ISO 639-3.

ISO 639-3 eesmärk on eristada kriteeriume, mis pole täiesti subjektiivsed.[8] Selle eesmärk ei ole dokumenteerida ega pakkuda identifikaatoreid murrete või muude keelte variatsioonide jaoks.[9] Sellegipoolest võivad keelte eristamist käsitlevad hinnangud olla subjektiivsed, eriti keelevariantide puhul, millel pole väljakujunenud kirjanduslikke traditsioone, kasutamist hariduses või meedias või muid tegureid, mis aitavad kaasa keele tavapärasusele. Seetõttu ei tohiks standardit pidada autoriteetseks avalduseks selle kohta, millised erinevad keeled maailmas eksisteerivad (mille osas võib mõnel juhul olla olulisi lahkarvamusi), vaid lihtsalt ühe kasuliku viisina erinevate keelesortide täpseks tuvastamiseks.

Koodiruum

Kuna kood on kolmetäheline tähestikuline, on esindatavate keelte arvu üks ülemine piir 26 × 26 × 26 = 17 576. Kuna ISO 639-2 määratleb erikoodid (4), reserveeritud vahemiku (520) ja ainult B-koodid (22), ei saa 3. osas kasutada 546 koodi. Seetõttu on rangem ülemine piir 17 576 - 546 = 17 030.

Ülemine piir muutub veelgi rangemaks, kui lahutada punktis 639-2 määratletud keelekogud ja need, mis ISO 639-5.

Makrokeeled

Standardis ISO 639-2 on 58 keelt, mida standardi kohaselt peetakse standardis ISO 639-3 makrokeeledeks.[10]

Mõned neist makrokeeled tal ei olnud ISO 639-3 koodikomplektis ISO 639-3 määratletud individuaalset keelt, nt. 'ara' (üldine araabia). Teistel, näiteks norral (norra), olid kaks eraldi osa („ei” (Nynorsk), „nob” (Bokmål)) juba standardis ISO 639-2.

See tähendab, et mõned keeled (nt 'arb', araabia standard), mida ISO 639-2 pidas ühe keele murreteks ('ara'), on nüüd ISO 639-3 standardis teatud kontekstides, mida peetakse eraldi keelteks.

Sellega üritatakse tegeleda sortidega, mis võivad küll keeleliselt üksteisest erineda, kuid kelle kõnelejad käsitlevad neid sama keele kahe vormina, nt. juhtudel diglossia.

Näiteks:

Vaata[11] täieliku loendi jaoks.

Kollektiivkeeled

"Keelekoodielement on identifikaator, mis tähistab rühma üksikuid keeli, mida ei peeta üheski kasutuskontekstis üheks keeleks."[12] Need koodid ei tähenda täpselt konkreetset keelt ega makrokeelt.

Kui ISO 639-2 sisaldab kollektiivkeelte kolmetähelisi identifikaatoreid, siis need koodid ei kuulu ISO 639-3 alla. Seega ei ole ISO 639-3 ISO 639-2 superset.

ISO 639-5 määratleb keeleperekondade ja -rühmade kolmetähelised kollektiivkoodid, sealhulgas ISO 639-2 kollektiivsed keelekoodid.

Erikoodid

Aastal eraldatakse neli koodi ISO 639-2 ja ISO 639-3 juhtudel, kui ükski konkreetsetest koodidest pole sobiv. Need on mõeldud peamiselt sellistele rakendustele nagu andmebaasid, kus on vaja ISO-koodi, olenemata sellest, kas see on olemas.

  • mis (kodeerimata keeled, algselt lühend „mitmesugused”) on mõeldud keelte jaoks, mida pole (veel) ISO standardisse lisatud.
  • mul (mitu keelt) on mõeldud juhtumiteks, kus andmed sisaldavad rohkem kui ühte keelt ja (näiteks) andmebaas nõuab ühte ISO-koodi.
  • und (määratlemata) on mõeldud juhtumiteks, kui andmetes olevat keelt pole tuvastatud, näiteks kui see on valesti märgistatud või seda pole kunagi sildistatud. See pole mõeldud sellisteks juhtumiteks nagu Troojalane kus vaidlustamata keelele on antud nimi.
  • zxx (keeleline sisu puudub / pole kohaldatav) on mõeldud andmete jaoks, mis pole üldse keel, näiteks loomakutsed.[13]

Lisaks 520 koodi vahemikus qaaqtz on „reserveeritud kohalikuks kasutamiseks”. Näiteks Keeleteadlaste nimekiri kasutab neid väljasurnud keeled. Lingvistide nimekiri on määranud ühele neist üldise väärtuse: qnp, nimetu protokeel. Seda kasutatakse sugupuu väljapakutud vahesõlmede jaoks, millel pole nime.

Hooldusprotsessid

ISO 639-3 kooditabel on muudatustele avatud. Olemasoleva kasutamise stabiilsuse kaitsmiseks piirduvad lubatud muudatused järgmisega:[14]

  • muudatused kirje viitenumbris (sealhulgas nimed või liigitused tüübi ja ulatuse osas),
  • uute kirjete lisamine,
  • duplikaatide või võltsitud kirjete vananemine,
  • ühe või mitme kirje ühendamine teise kirjega ja
  • olemasoleva keelekirje jagamine mitmeks uueks keelekirjeks.

Keelele omistatud koodi ei muudeta, välja arvatud juhul, kui muudetakse ka denotatsiooni.[15]

Muudatusi tehakse aastase tsükli järgi. Igale taotlusele antakse avalikuks läbivaatamiseks minimaalselt kolm kuud.

ISO 639-3 veebisaidil on lehti, mis kirjeldavad tähiste ulatust[16] (languoid tüübid) ja keelte tüübid,[17] mis selgitavad, millised mõisted on kodeerimisvaldkonnas ja milliseid kriteeriume tuleb täita. Näiteks saab konstrueeritud keeli kodeerida, kuid ainult siis, kui need on mõeldud inimeste suhtlemiseks ja neil on palju kirjandust, mis takistab idiosünkraatiliste leiutiste taotlusi.

Registreerimisasutus dokumenteerib oma veebisaidil juhised, mis on tehtud standardi ISO 639-3 tekstis, kuidas kooditabeleid hooldada.[18] Samuti dokumenteeritakse muutmistaotluste vastuvõtmiseks ja töötlemiseks kasutatud protsessid.[19]

Pakutakse muudatustaotluse vormi ja pakutavate täienduste kohta teabe kogumiseks on olemas teine ​​vorm. Muudatustaotlusi saab esitada iga osapool. Esitamise korral vaatab registreerimisasutus taotluste täielikkuse üle esialgu läbi.

Kui dokument on täielikult dokumenteeritud, lisatakse see avaldatud muudatustaotluste registrisse. Samuti saadetakse teadaanded lingvistide üldloendisse Lingvistide nimekirjas ja muudesse loenditesse, mida registreerimisasutus võib asjakohaseks pidada, kutsudes avalikkusele ülevaadet ja taotletud muudatuse kohta arvamust avaldama. Iga loendi omanik või üksikisik saab taotleda teatavate piirkondade või keelte perekondade muutmistaotluste teatisi. Saadud märkused avaldatakse teiste osapoolte ülevaatamiseks. Saadud kommentaarides saavutatud konsensuse põhjal võib muutmistaotluse tagasi võtta või tõsta kandidaadistaatus.

Kolm kuud enne iga-aastase ülevaatustsükli lõppu (tavaliselt septembris) seatakse teade LINGUIST-i arutelude loendisse ja muudesse nimekirjadesse kandidaatide staatuse muutmise taotluste kohta. Kõik taotlused jäävad ülevaatamiseks ja kommenteerimiseks avatud iga-aastase ülevaatustsükli lõpuni.

Otsused tehakse teatavaks iga-aastase ülevaatustsükli lõpus (tavaliselt jaanuaris). Sel ajal võib taotlusi vastu võtta täielikult või osaliselt, neid saab muuta ja järgmisse ülevaatustsüklisse edasi kanda või tagasi lükata. Tagasilükkamine sisaldab sageli ettepanekuid uuesti esitamise ettepanekute muutmiseks. Iga muudatusettepaneku avalikku arhiivi säilitatakse koos vastuvõetud otsuste ja nende põhjendustega.[20]

Kriitika

Keeleteadlased Morey, Post ja Friedman tõstatavad ISO 639 ja eriti ISO 639-3 suhtes erinevat kriitikat:[15]

  • Kolmetähelised koodid ise on problemaatilised, sest ametlikult suvaliste tehniliste siltide korral tuletatakse need sageli keelenimede mnemoonilistest lühenditest, millest mõned on pejoratiivsed. Näiteks, Yemsa määrati kood jnj, pejoratiivsest "Janejerost". Seega võivad emakeelena kõnelejad neid koode solvavaks pidada, kuid standardis olevaid koode ei saa pärast nende omistamist muuta.
  • Standardi haldamine on problemaatiline, kuna SIL on misjoniorganisatsioon, mille läbipaistvus ja vastutus on ebapiisavad. Otsused selle kohta, mis väärib keelekodeerimist, tehakse sisemiselt. Ehkki väliseid panuseid võib tervitada või mitte, on otsused ise läbipaistmatud ja paljud keeleteadlased on loobunud standardi parandamise püüdlustest.
  • Keele püsiv tuvastamine pole keelevahetusega kokkusobiv.
  • Keeli ja murdeid ei saa sageli rangelt eristada ja murre continua võib jagada mitmel viisil, samas kui standard annab ühe valiku. Sellised eristused põhinevad sageli hoopis sotsiaalsetel ja poliitilistel teguritel.
  • ISO 639-3 võivad valesti mõista ja vääralt kasutada ametiasutused, kes teevad otsuseid inimeste identiteedi ja keele kohta, kaotades kõnelejate õiguse samastuda või samastuda oma kõnesordiga. Kuigi SIL on selliste probleemide suhtes tundlik, on see probleem omane kehtestatud standardile, mida võib kasutada (või valesti kasutada) viisil, mida ISO ja SIL ei kavatse.

Martin Haspelmath nõustub nelja nimetatud punktiga, kuid mitte keelemuutuse teemaga.[21] Ta ei nõustu, kuna mis tahes keele konto nõuab selle tuvastamist ja me saame hõlpsasti tuvastada keele erinevad etapid. Ta soovitab, et keeleteadlased võiksid eelistada kodakondsuse kodifitseerimist languoid tasemel, kuna "keeleteadlaste jaoks on harva tähtis, kas see, millest nad räägivad, on keel, murre või lähedane keelte perekond". Ta kahtleb ka selles, kas ISO identifitseerimine keele identifitseerimiseks on asjakohane, kuna ISO on tööstusorganisatsioon, samas kui ta peab keeledokumentatsiooni ja nomenklatuuri teadusliku ettevõtmisena. Ta nimetab algset vajadust standardiseeritud keeletähiste järele "tõlke majandusliku tähtsuse ja tarkvara lokaliseerimine", mille jaoks kehtestati ISO 639-1 ja 639-2 standardid. Kuid ta tekitab kahtlusi tööstuse vajaduses ISO 639-3 pakutava ulatusliku katvuse järele, sealhulgas nagu" väikeste kogukondade vähetuntud keeled, ei ole seda kunagi kasutatud ega kirjutamisel peaaegu kasutatud ja mis on sageli väljasuremisohus ".

Kasutamine

Viited

  1. ^ a b "ISO 639-3 olek ja abstraktne". iso.org. 2010-07-20. Laaditud 2012-06-14.
  2. ^ "Hooldusametid ja registreerimisasutused". ISO.
  3. ^ "Üksikute keelte tüübid - iidsed keeled". sil.org. Laaditud 2018-06-11.
  4. ^ ISO 639 koodi etnoloogiaruanne: zho Arhiivitud 2014-09-12 kell Wayback Machine saidil ethnologue.com
  5. ^ ISO639-3 saidil SIL.org
  6. ^ a b "ISO 639-3 koodikomplekt". Sil.org. 2007-10-18. Laaditud 2012-06-14.
  7. ^ "ISO 639-3". sil.org.
  8. ^ "Märgistuse ulatus: üksikud keeled". sil.org.
  9. ^ "Märgistuse ulatus: murded". sil.org.
  10. ^ "Märgistuse ulatus: makrokeeled". sil.org. Laaditud 2012-06-14.
  11. ^ "Macrolanguage Mappings". sil.org. Laaditud 2012-06-14.
  12. ^ "Märgistuse ulatus: kollektiivsed keeled". sil.org. Laaditud 2012-06-14.
  13. ^ Verveti ahvikõnede kohapealsed salvestused. Kanne kataloogi kataloogi Lingvistiliste andmete konsortsium. Laaditud 2012-09-04.
  14. ^ "ISO 639-3 muudatuste taotluste esitamine: muudatuste tüübid". sil.org.
  15. ^ a b Morey, Stephen; Post, Mark W .; Friedman, Victor A. (2013). ISO 639 keelekoodid: ennatlik, lõpuks kättesaamatu ja võib-olla kahjustav standardimine. PARADISEC RRR konverents. Arhiivitud asukohast originaal 23.02.2016. Laaditud 2015-11-03.
  16. ^ "Keeleidentifikaatorite tähiste ulatus". sil.org.
  17. ^ "Keeletüübid". sil.org.
  18. ^ "ISO 639-3 muudatuste haldamine". sil.org.
  19. ^ "ISO 639-3 muutmistaotluste esitamine". sil.org.
  20. ^ "ISO 639-3 muutmistaotluste register". sil.org.
  21. ^ Martin Haspelmath, "Kas keeleidentiteeti saab standardiseerida? Morey jt kriitikast ISO 639-3 kohta", Mitmekesisuse keeleteaduse kommentaar, 2013/12/04
  22. ^ "OLAC-i keelelaiend". language-archives.org. Laaditud 3. august 2015.
  23. ^ "Üle 7000 keele, ainult üks Windows". Microsoft. 2014-02-05.
  24. ^ "Keeleettepanekute eeskirjad". wikimedia.org. Laaditud 3. august 2015.
  25. ^ "BCP 47 - sildid keelte tuvastamiseks". ietf.org. Laaditud 3. august 2015.
  26. ^ a b "EPUB väljaanded 3.0". idpf.org. Laaditud 3. august 2015.
  27. ^ "DCMI metaandmete tingimused". purl.org. Laaditud 3. august 2015.
  28. ^ "Kahetähelised või kolmetähelised ISO keelekoodid". w3.org. Laaditud 3. august 2015.
  29. ^ "Keeleregister". Iana.org. Laaditud 2015-08-12.
  30. ^ "3 HTML-dokumentide semantika, struktuur ja API-d - HTML5". w3.org. Laaditud 3. august 2015.
  31. ^ "Elemendid - MODS-i kasutajajuhised: metaandmete objekti kirjeldamise skeem: MODS (Kongressi raamatukogu)". loc.gov. Laaditud 3. august 2015.
  32. ^ "TEI elemendi keel". tei-c.org. Laaditud 3. august 2015.

Lisalugemist

Välised lingid

Pin
Send
Share
Send