ISO 639-3 - ISO 639-3

ISO 639-3:2007 , Dil adlarının gösterimi için kodlar – Bölüm 3: Dillerin kapsamlı kapsamı için Alfa-3 kodu , ISO 639 serisindeki dil kodları için uluslararası bir standarttır . Dilleri tanımlamak için üç harfli kodlar tanımlar. Standart, Uluslararası Standardizasyon Örgütü (ISO) tarafından 1 Şubat 2007'de yayınlandı.

ISO 639-3, bilinen tüm doğal dilleri kapsamak amacıyla ISO 639-2 alfa-3 kodlarını genişletir . Genişletilmiş dil kapsamı öncelikle, şu anda ISO 639-3 için kayıt yetkilisi olan SIL International tarafından yayınlanan Ethnologue'da (cilt 10-14) kullanılan dil kodlarına dayanıyordu . Yaşayan ve soyu tükenmiş, eski ve inşa edilmiş, büyük ve küçük, yazılı ve yazısız diller de dahil olmak üzere mümkün olduğunca eksiksiz bir dil listesi sağlar. Ancak, Proto-Hint-Avrupa gibi yeniden yapılandırılmış dilleri içermez .

ISO 639-3, çok çeşitli uygulamalarda meta veri kodları olarak kullanılmak üzere tasarlanmıştır . İnternet gibi birçok dilin desteklenmesi gereken bilgisayar ve bilgi sistemlerinde yaygın olarak kullanılmaktadır. Arşivlerde ve diğer bilgi depolamada, bir kaynağın hangi dilde veya hakkında olduğunu gösteren kataloglama sistemlerinde kullanılır. Kodlar, dil adlarının belirsiz veya belirsiz olabileceği gerçeğini telafi etmek için dilbilim literatüründe ve başka yerlerde de sıklıkla kullanılır.

Bir dil bul
İlgili dil makalesini bulmak için bir ISO 639-3 kodu girin.

Dil kodları

ISO 639-3 tüm dilleri içeren ISO 639-1 ve tüm dilleri tek tek ISO 639-2 . ISO 639-1 ve ISO 639-2, en sık dünya literatüründe temsil edilen ana dillere odaklandı. ISO 639-2 ayrıca dil koleksiyonları içerdiğinden ve Bölüm 3 içermediğinden, ISO 639-3, ISO 639-2'nin bir üst kümesi değildir. ISO 639-2'de B ve T kodlarının bulunduğu yerlerde , ISO 639-3 T kodlarını kullanır.

Örnek ISO dil kodları
Dilim 639-1 639-2 (B/T) 639-3 tipi 639-3 kodu
İngilizce tr ingilizce bireysel ingilizce
Almanca de ger/deu bireysel deu
Arapça ar ara makro ara
Standart Arapça bireysel arb
Mısır Arapçası bireysel arz
Çince zh chi/zho makro zho
mandalina bireysel cmn
Kantonca bireysel yue
Minnan bireysel nan

18 Şubat 2021 itibariyle, standart 7.893 giriş içermektedir. Dillerin envanteri, 639-2'de yer alan tek tek diller, Ethnologue'dan modern diller , Linguist List'ten tarihi çeşitler, eski diller ve yapay dillerin yanı sıra yıllık halk içinde önerilen diller de dahil olmak üzere bir dizi kaynağa dayanmaktadır. yorum dönemi

Makine tarafından okunabilen veri dosyaları, kayıt yetkilisi tarafından sağlanır. Bu veri dosyaları kullanılarak ISO 639-1 veya ISO 639-2'den ISO 639-3'e eşlemeler yapılabilir.

ISO 639-3, tamamen objektif olmayan kriterlere dayalı ayrımları üstlenmeyi amaçlamaktadır. Lehçeler veya diğer alt dil varyasyonları için tanımlayıcıları belgelemek veya sağlamak amaçlanmamıştır. Bununla birlikte, diller arasındaki ayrımlara ilişkin yargılar, özellikle yerleşik edebi gelenekler, eğitim veya medyadaki kullanımlar veya dilin gelenekselleşmesine katkıda bulunan diğer faktörler olmadan dil çeşitleri söz konusu olduğunda öznel olabilir. Bu nedenle, standart, dünyada hangi farklı dillerin var olduğuna dair yetkili bir ifade olarak görülmemelidir (bazı durumlarda bu konuda önemli anlaşmazlıklar olabilir), daha ziyade farklı dil çeşitlerini kesin olarak tanımlamanın yararlı bir yolu olarak görülmelidir.

kod alanı

Kod üç harfli alfabetik olduğundan, temsil edilebilecek dil sayısı için bir üst sınır 26 × 26 × 26 = 17.576'dır. ISO 639-2 özel kodlar (4), ayrılmış bir aralık (520) ve yalnızca B kodları (22) tanımladığından, 546 kod 3. bölümde kullanılamaz. Bu nedenle, daha katı bir üst sınır 17.576 − 546 = 17.030'dur.

639-2'de tanımlanan ve henüz ISO 639-5'te tanımlanmayan dil koleksiyonları çıkarılırsa üst sınır daha da katılaşır .

makro diller

ISO 639-2'de, standardın amaçları doğrultusunda ISO 639-3'te "makro diller" olarak kabul edilen 58 dil vardır.

Bu makro dillerden bazılarının, ISO 639-2 kod setinde ISO 639-3 tarafından tanımlandığı gibi, örneğin 'ara' (Genel Arapça) gibi ayrı bir dili yoktu. 'Nor' (Norveççe) gibi diğerleri zaten ISO 639-2'de iki ayrı parçaya ('nno' ( Nynorsk ), 'nob' ( Bokmål )) sahipti.

Bu, ISO 639-2 tarafından bir dilin ('ara') lehçeleri olarak kabul edilen bazı dillerin (örneğin 'arb', Standart Arapça), artık tek tek diller olarak kabul edilen belirli bağlamlarda ISO 639-3'te olduğu anlamına gelir.

Bu, dilsel olarak birbirinden farklı olabilen, ancak konuşmacıları tarafından aynı dilin iki biçimi olarak ele alınan çeşitlerle uğraşmaya yönelik bir girişimdir, örneğin diglossia durumlarında .

Örneğin:

Tam liste için bakınız.

Kolektif diller

"Bir toplu dil kodu öğesi, herhangi bir kullanım bağlamında tek bir dil olarak kabul edilmeyen bir grup ayrı dili temsil eden bir tanımlayıcıdır." Bu kodlar, belirli bir dili veya makro dili tam olarak temsil etmez.

ISO 639-2, toplu diller için üç harfli tanımlayıcılar içerirken, bu kodlar ISO 639-3'ün dışındadır. Dolayısıyla ISO 639-3, ISO 639-2'nin bir üst kümesi değildir.

ISO 639-5 , ISO 639-2'deki toplu dil kodları da dahil olmak üzere dil aileleri ve grupları için 3 harfli toplu kodları tanımlar.

Özel kodlar

Belirli kodların hiçbirinin uygun olmadığı durumlar için ISO 639-2 ve ISO 639-3'te dört kod ayrılmıştır . Bunlar öncelikle, var olup olmadığına bakılmaksızın bir ISO kodunun gerekli olduğu veritabanları gibi uygulamalar için tasarlanmıştır.

  • mis (kodlanmamış diller, orijinal olarak 'çeşitli' için bir kısaltmadır) ISO standardına (henüz) dahil edilmemiş diller için tasarlanmıştır.
  • mul (birden çok dil), verilerin birden fazla dil içerdiği ve (örneğin) veritabanının tek bir ISO kodu gerektirdiği durumlar için tasarlanmıştır.
  • und(belirlenmemiş) verideki dilin tanımlanmadığı, örneğin yanlış etiketlendiği veya hiç etiketlenmediği durumlar için tasarlanmıştır. Onaylanmamış bir dile bir ad verildiği Truva atı gibi durumlar için tasarlanmamıştır .
  • zxx (dilsel içerik yok / uygulanamaz) hayvan çağrıları gibi hiçbir şekilde dil olmayan veriler için tasarlanmıştır.

Ayrıca, aralıktaki 520 kod qaaqtz'yerel kullanım için ayrılmıştır'. Örneğin Rebecca Bettencourt, oluşturulmuş dillere bir kod atar ve istek üzerine yeni atamalar yapılır. Dilbilimci Liste için bunları kullanır sönmüş dilleri . Linguist List bunlardan birine genel bir değer atadı: qnp, adsız ön-dil. Bu, bir soy ağacında adı olmayan önerilen ara düğümler için kullanılır.

Bakım süreçleri

ISO 639-3 kod tablosu değişikliğe açıktır. Mevcut kullanımın kararlılığını korumak için izin verilen değişiklikler şunlarla sınırlıdır:

  • Bir girdinin referans bilgilerinde yapılan değişiklikler (tür ve kapsam için adlar veya kategoriler dahil),
  • yeni girişlerin eklenmesi,
  • yinelenen veya sahte olan girişlerin kullanımdan kaldırılması,
  • bir veya daha fazla girişi başka bir girişle birleştirmek ve
  • mevcut bir dil girişini birden çok yeni dil girişine bölme.

Bir dile atanan kod, ifadede de bir değişiklik olmadıkça değişmez.

Değişiklikler yıllık bir döngüde yapılır. Her talebe, kamu incelemesi için en az üç aylık bir süre verilir.

ISO 639-3 Web sitesinde, "düzenleme kapsamlarını" ( dilsiz türler) ve dil türlerini açıklayan, kodlama kapsamında hangi kavramların bulunduğunu ve karşılanması gereken belirli kriterleri açıklayan sayfalar vardır . Örneğin, yapılandırılmış diller kodlanabilir, ancak yalnızca insan iletişimi için tasarlanmışlarsa ve kendine özgü icat taleplerini önleyen bir literatüre sahiplerse.

Kayıt otoritesi, kod tablolarının nasıl tutulacağına ilişkin ISO 639-3 standardı metninde yapılan talimatları Web sitesinde belgeler. Ayrıca değişiklik taleplerini almak ve işlemek için kullanılan süreçleri de belgeler.

Bir değişiklik talep formu sağlanır ve önerilen eklemeler hakkında bilgi toplamak için ikinci bir form vardır. Herhangi bir taraf değişiklik talepleri gönderebilir. İstekler gönderildiğinde, eksiksizlik açısından ilk olarak kayıt yetkilisi tarafından gözden geçirilir.

Tam olarak belgelenmiş bir talep alındığında, yayınlanmış bir Değişiklik Talebi Dizinine eklenir. Ayrıca, duyurular, Linguist List'teki genel LINGUIST tartışma listesine ve kayıt makamının ilgili olarak değerlendirebileceği diğer listelere gönderilerek, talep edilen değişiklikle ilgili kamuoyu incelemesi ve girdisi davet edilir. Herhangi bir liste sahibi veya birey, belirli bölgeler veya dil aileleri için değişiklik taleplerinin bildirimlerini talep edebilir. Alınan yorumlar diğer tarafların incelemesi için yayınlanır. Alınan yorumlardaki fikir birliğine dayanarak, bir değişiklik talebi geri çekilebilir veya "aday statüsüne" yükseltilebilir.

Yıllık gözden geçirme döngüsünün bitiminden üç ay önce (genellikle Eylül ayında), LINGUIST tartışma listesine ve Aday Statü Değişikliği Talepleriyle ilgili diğer listelere bir duyuru yapılır. Tüm talepler, yıllık inceleme döngüsünün sonuna kadar incelemeye ve yoruma açık kalır.

Kararlar, yıllık gözden geçirme döngüsünün sonunda (genellikle Ocak ayında) duyurulur. O zaman, talepler kısmen veya tamamen kabul edilebilir, değiştirilebilir ve bir sonraki gözden geçirme döngüsüne aktarılabilir veya reddedilebilir. Reddetmeler genellikle yeniden gönderim için tekliflerin nasıl değiştirileceğine ilişkin önerileri içerir. Alınan kararlar ve kararların gerekçesi ile birlikte her değişiklik talebinin halka açık bir arşivi tutulur.

eleştiri

Dilbilimciler Morey, Post ve Friedman, ISO 639'a ve özellikle ISO 639-3'e yönelik çeşitli eleştirilerde bulunuyorlar:

  • Üç harfli kodların kendileri sorunludur, çünkü resmi olarak keyfi teknik etiketler olsalar da, genellikle dil adlarının bazıları aşağılayıcı olan anımsatıcı kısaltmalarından türetilirler. Örneğin, Yemsa'yajnj aşağılayıcı "Janejero"dan kod verildi. Bu nedenle bu kodlar, anadili İngilizce olan kişiler tarafından rahatsız edici olarak değerlendirilebilir. Ancak, kodlar SIL'nin web sitesinde bir talep gönderilerek değiştirilebilir .
  • Standardın yönetimi sorunludur çünkü SIL yetersiz şeffaflık ve hesap verebilirliğe sahip misyoner bir kuruluştur. Neyin dil olarak kodlanmayı hak ettiğine dair kararlar dahili olarak verilir. Dışarıdan gelen girdiler memnuniyetle karşılanabilir veya karşılanmayabilir, ancak kararların kendileri anlaşılmazdır ve birçok dilbilimci standardı iyileştirmeye çalışmaktan vazgeçmiştir.
  • Bir dilin kalıcı olarak tanımlanması, dil değişikliği ile bağdaşmaz.
  • Diller ve lehçeler genellikle kesin olarak ayırt edilemez ve lehçe sürekliliği birçok şekilde alt bölümlere ayrılabilir, oysa standart ayrıcalıklar bir seçimdir. Bu tür ayrımlar genellikle bunun yerine sosyal ve politik faktörlere dayanır.
  • ISO 639-3, insanların kimliği ve dili hakkında kararlar veren yetkililer tarafından yanlış anlaşılabilir ve yanlış kullanılabilir, bu da konuşmacıların konuşma çeşitlerini tanımlama veya tanımlama hakkını ortadan kaldırır. SIL bu tür konulara duyarlı olsa da, bu sorun, ISO ve SIL'nin amaçlamadığı şekillerde kullanılabilen (veya yanlış kullanılabilen) yerleşik bir standardın doğasında vardır.

Martin Haspelmath bu noktalardan dördüne katılıyor, ancak dil değişikliği ile ilgili noktayı değil. Bir dilin herhangi bir açıklaması onu tanımlamayı gerektirdiği için aynı fikirde değil ve bir dilin farklı aşamalarını kolayca tanımlayabiliriz. Dilbilimcilerin, "konuştukları şeyin bir dil mi, bir lehçe mi yoksa birbirine yakın bir dil ailesi mi olduğu nadiren önemli olduğundan, dilbilimcilerin durgun düzeyde yapılan bir kodlamayı kullanmayı tercih edebileceklerini" öne sürüyor . Ayrıca, dil belgelerini ve isimlendirmeyi bilimsel bir çaba olarak görürken, ISO endüstriyel bir kuruluş olduğundan, dil tanımlama için bir ISO standardının uygun olup olmadığını sorguluyor. ISO 639-1 ve 639-2 standartlarının oluşturulduğu " çeviri ve yazılım yerelleştirmesinin ekonomik önemi" olarak standartlaştırılmış dil tanımlayıcılarına olan orijinal ihtiyacı belirtiyor . Ancak, ISO 639-3 tarafından sağlanan ve "yazılı olarak hiçbir zaman veya neredeyse hiç kullanılmayan ve çoğu zaman yok olma tehlikesiyle karşı karşıya olan küçük toplulukların az bilinen dilleri" de dahil olmak üzere, endüstrinin kapsamlı kapsama ihtiyacı hakkında şüpheler uyandırıyor.

kullanım

  • etnolog
  • Dilbilimci Listesi
  • OLAC : Açık Diller Arşiv Topluluğu
  • Microsoft Windows 8 : Yayın sırasında ISO 639-3'teki tüm kodları destekler.
  • Wikimedia temeli: Yeni dil tabanlı projeler (örneğin yeni dillerdeki Wikipedia'lar) ISO 639-1, -2 veya -3'ten bir tanımlayıcıya sahip olmalıdır.
  • ISO 639-3'e dayanan diğer standartlar:
    • İnternet Mühendisliği Görev Gücü (IETF) tarafından tanımlandığı şekliyle dil etiketleri , belgelendiği gibi:
      • BCP 47: En İyi Güncel Uygulama 47 , RFC 
      5646'yı içerir
    • RFC  5646 , RFC yerini,  4646 RFC yerini,  3066 . (Bu nedenle, bu 3 IETF standardından herhangi birine bağlı olan tüm standartlar artık ISO 639-3'ü kullanmaktadır.)
  • EPub dil meta verileri 3.0 standardı Dublin Core Metadata öğeleri kullanır. ePub'lardaki bu dil meta veri öğeleri, diller için geçerli RFC 5646 kodları içermelidir  . RFC5646, daha kısa IANA kodları olmayan diller için ISO 639-3'e işaret eder.
  • Dublin Core Metadata Girişimi : dil için DCMI Meta Veri Terim, IETF en RFC aracılığıyla  4646 (şimdi RFC yerini  5646 ).
  • İnternet Tahsisli Numaralar Otoritesi (IANA) W3C'nin uluslararasılaştırma çabası, dil kodlarının seçilmesi için IANA Dil Alt Etiket Kaydı'nın kullanılmasını önerir. IANA Dil Alt Etiket Kaydı, daha önce ISO 639 standardının diğer bölümlerinde kodları olmayan diller için ISO 639-3 kodlarına bağlıdır.
  • HTML5: IETF'nin BCP 47'si aracılığıyla.
  • MARC kütüphane kodları.
  • MODS kitaplık kodları: IETF'nin RFC  3066'sını içerir (şimdi RFC 5646'nın yerini almıştır  ).
  • Metin Kodlama Girişimi (TEI): IETF'nin BCP 47'si aracılığıyla.
  • Sözlüksel İşaretleme Çerçevesi : Makine tarafından okunabilen sözlüklerin gösterimi için ISO belirtimi.
  • Unicode 'ın Ortak yerel veri deposu : ISO 639-2 yer almayan ISO 639-3 birkaç yüz kodlarını kullanır.

Referanslar

daha fazla okuma

Dış bağlantılar