bayt - Byte

bayt
Birim sistemi bitten türetilen birim
Birimi dijital bilgi, veri boyutu
Sembol B veya  o

Bayt bir olan dijital bilgi birimi en yaygın sekiz oluşur bit . Tarihsel olarak, bayt, bir bilgisayarda tek bir metin karakterini kodlamak için kullanılan bit sayısıydı ve bu nedenle birçok bilgisayar mimarisinde adreslenebilir en küçük bellek birimidir . Yaygın 8 bitlik tanımdan keyfi olarak boyutlandırılmış baytların belirsizliğini gidermek için , İnternet Protokolü ( RFC 791 ) gibi protokolü belgeleri , 8 bitlik bir bayta sekizli olarak atıfta bulunur. . Bir sekizlideki bu bitler, bit endianlığına bağlı olarak genellikle 0'dan 7'ye veya 7'den 0'a numaralandırılarak sayılır . İlk bit 0 sayısıdır ve sekizinci biti 7 yapar.

Baytın boyutu tarihsel olarak donanıma bağlıdır ve boyutu zorunlu kılan kesin standartlar mevcut değildir. 1'den 48 bit'e kadar olan boyutlar kullanılmıştır. Altı bitlik karakter kodu erken kodlayan sistemlerinde sıkça kullanılan uygulama idi ve altı-bit ve dokuz bitlik bayt kullanan bilgisayarlar 1960'larda yaygındı. Bu sistemler genellikle 2, 3, 4, 5, 6, 8 veya 10 altı bitlik bayta karşılık gelen 12, 18, 24, 30, 36, 48 veya 60 bitlik bellek word'lerine sahipti . Bu çağda, komut akışındaki bit gruplamaları, bayt terimi yaygınlaşmadan önce, genellikle heceler veya levha olarak adlandırılırdı .

Modern fiili standart ISO / IEC 2382-1 belgelenen olarak sekiz bitten,: 1993, bir kullanışlı iki güç izin ikili kodlanmış güç 8'e bir byte-2 için 255 üzerinden değerler 0 uluslararası 256. IEC 80000-13 standardı bu ortak anlamı kodlamıştır. Birçok uygulama türü, sekiz veya daha az bitte gösterilebilen bilgileri kullanır ve işlemci tasarımcıları genellikle bu kullanım için optimize eder. Büyük ticari bilgi işlem mimarilerinin popülaritesi, 8 bitlik baytın her yerde kabul edilmesine yardımcı oldu. Modern mimariler tipik olarak sırasıyla dört veya sekiz bayttan oluşan 32 veya 64 bit sözcükler kullanır.

Bayt için birim sembolü, Uluslararası Elektroteknik Komisyonu (IEC) ve Elektrik ve Elektronik Mühendisleri Enstitüsü (IEEE) tarafından büyük harf B olarak belirlenmiştir . Uluslararası olarak, sekizli birim , o sembolü, "bayt" teriminin olası belirsizliğini ortadan kaldırarak, sekiz bitlik bir diziyi açıkça tanımlar.

Etimoloji ve tarih

Bayt terimi , Werner Buchholz tarafından Haziran 1956'da, talimatta kodlanmış bir bayt boyutu ile bit ve değişken alan uzunluğu (VFL) talimatlarına hitap eden IBM Stretch bilgisayarının erken tasarım aşamasında ortaya çıktı. Kasıtlı bir respelling olan lokma için yanlışlıkla mutasyonu önlemek için bit .

Bir bilgisayarın kelime boyutundan daha küçük bit grupları ve özellikle dört bitlik gruplar için bir başka bayt kaynağı , terimi Jules Schwartz ve Dick Beeler ile bir hava savunma sistemi üzerinde çalışırken bulduğunu iddia eden Louis G. Dooley tarafından kayıt altına alınmıştır. Rand , MIT ve IBM tarafından ortaklaşa geliştirilen 1956 veya 1957'de MIT Lincoln Laboratuvarı'nda SAGE olarak adlandırıldı . Daha sonra, Schwartz'ın dili JOVIAL terimi aslında kullandı, ancak yazar belirsiz bir şekilde bunun AN/FSQ-31'den türetildiğini hatırladı .

İlk bilgisayarlar , ABD Ordusu ( FIELDATA ) ve Donanma'da yaygın olan yazdırılabilir grafik desenleri için çeşitli dört bitlik ikili kodlu ondalık (BCD) temsiller ve altı bitlik kodlar kullandı . Bu gösterimler alfanümerik karakterleri ve özel grafik sembollerini içeriyordu. Bu setler, 1963'te , 1960'larda ABD hükümetinin ve üniversitelerinin farklı şubeleri tarafından kullanılan uyumsuz teleprinter kodlarının yerini alan Federal Bilgi İşleme Standardı olarak Amerikan Bilgi Değişimi Standart Kodu (ASCII) olarak adlandırılan yedi bit kodlamaya genişletildi. . ASCII, büyük ve küçük harf ayrımını ve yazılı dilin iletimini kolaylaştırmak için bir dizi kontrol karakterini ve ayrıca sayfa ilerletme ve satır besleme gibi yazdırma aygıtı işlevlerini ve iletim üzerindeki veri akışının fiziksel veya mantıksal kontrolünü içeriyordu. medya. 1960'ların başlarında, aynı zamanda ASCII standardizasyonunda da aktifken, IBM, eşzamanlı olarak System/360 ürün serisinde, altı bitlik ikili kodlu ondalık sayılarının (BCDIC ) bir genişletmesi olan sekiz bitlik Genişletilmiş İkili Kodlu Ondalık Değişim Kodu'nu (EBCDIC) tanıttı. ) önceki kart zımbalarında kullanılan temsiller. System/360'ın öne çıkması, sekiz bitlik depolama boyutunun her yerde benimsenmesine yol açarken, ayrıntılı olarak EBCDIC ve ASCII kodlama şemaları farklıdır.

1960'ların başında AT&T , uzun mesafeli ana hatlarda dijital telefonu tanıttı . Bunlar sekiz bitlik μ kanunu kodlamasını kullandı . Bu büyük yatırım, sekiz bit veri için iletim maliyetlerini düşürmeyi vaat etti.

1970'lerde sekiz bitlik mikroişlemcilerin geliştirilmesi bu depolama boyutunu popüler hale getirdi. İlk kişisel bilgisayarlarda kullanılan 8080 ve 8086'nın doğrudan öncülü Intel 8008 gibi mikroişlemciler , bir bayttaki dört bitlik çiftler üzerinde decimal-add-adjust (decimal-add-adjust) gibi az sayıda işlemi gerçekleştirebilir. DAA) talimatı. Dört bitlik bir miktar genellikle nibble olarak adlandırılır , ayrıca nybble olarak da adlandırılır ve uygun bir şekilde tek bir onaltılık basamakla temsil edilir .

Oktet terimi , sekiz bitlik bir boyutu açık bir şekilde belirtmek için kullanılır. Protokol tanımlarında yaygın olarak kullanılır .

Tarihsel olarak, terim octad veya oktadekanollerin sekiz bit de Batı Avrupa'da en az göstermek için kullanılmıştır; ancak, bu kullanım artık yaygın değildir. Terimin tam kökeni belirsizdir, ancak 1960'ların ve 1970'lerin İngiliz, Hollanda ve Alman kaynaklarında ve Philips ana bilgisayarlarının belgelerinde bulunabilir .

Birim sembolü

Bayt için birim sembolü, IEC 80000-13 , IEEE 1541 ve Metrik Değişim Formatında büyük harf B karakteri olarak belirtilmiştir.

Gelen Uluslararası Büyüklükler Sisteminde (ISQ), B sembolü olan bel , adını logaritmik güç oranının bir birim Alexander Graham Bell IEC özelliği ile çakışma oluşturarak. Bununla birlikte, bel nadiren kullanılan bir birim olduğundan, çok az karışıklık tehlikesi vardır. Öncelikle sinyal gücü ve ses basıncı seviyesi ölçümleri için desibel (dB) olarak dekadik kesriyle kullanılırken, baytın onda biri için bir birim, desibayt ve diğer kesirler yalnızca türetilmiş birimlerde kullanılır. iletim oranları olarak.

Sekizli için küçük harf o , IEC 80000-13'te sekizli sembolü olarak tanımlanır ve yaygın olarak Fransızca ve Rumence gibi dillerde kullanılır ve ayrıca katlar için metrik öneklerle , örneğin ko ve Mo ile birleştirilir.

Sekiz bit için octad(e) teriminin kullanımı artık yaygın değil.

Çok baytlı birimler

Çok baytlı birimler
Ondalık
Değer Metrik
1000 kB kilobayt
1000 2 MB megabayt
1000 3 GB gigabayt
1000 4 tüberküloz terabayt
1000 5 PB petabayt
1000 6 EB eksabayt
1000 7 ZB zettabayt
1000 8 YB yottabayt
İkili
Değer IEC Hafıza
1024 kiB kibibit KB kilobayt
1024 2 MiB mebibit MB megabayt
1024 3 GiB gibibit GB gigabayt
1024 4 TiB tebibit tüberküloz terabayt
1024 5 PiB pebibit -
1024 6 EiB sergi -
1024 7 ZiB zebibit -
1024 8 YiB yobibit -

Bayt bazında daha büyük birimleri tanımlamak için birden fazla sistem mevcuttur. Bazı sistemler 10'un kuvvetlerine dayalıdır ; diğer sistemler 2'nin kuvvetlerine dayanmaktadır . Bu sistemler için isimlendirme karışıklığa konu olmuştur. 10'un kuvvetlerine dayanan sistemler, standart SI öneklerini (' kilo ', ' mega ', ' giga ', ...) ve bunlara karşılık gelen sembolleri (k, M, G, ...) güvenilir bir şekilde kullanır . 2 güçlere tabanlı sistemler, ancak, ( 'Kibi', 'MEBI', 'gibi, ...) ve bunlara karşılık gelen sembolleri (Ki, Mi, Gi, ...) ikili önekleri kullanabilir veya onlar önekleri kullanabilir K, M ve G, belirsizlik yaratıyor.

Ondalık ve ikili yorumlar arasındaki sayısal fark kilobayt için nispeten küçük olsa da (kibibitten yaklaşık %2 daha küçüktür), birimler büyüdükçe sistemler giderek daha fazla sapar (göreceli sapma her üç büyüklük sırası için %2,4 artar). Örneğin, 10'luk bir güce dayalı yottabayt, 2'lik güce dayalı yobibayttan yaklaşık %17 daha küçüktür.

10'un kuvvetlerine dayalı birimler

1 kilobaytın (sembol kB) 1.000 bayta eşit olduğu 10'luk güçler kullanılarak öneklerin tanımlanması, Uluslararası Elektroteknik Komisyonu (IEC) tarafından önerilir . IEC standardı, 1000 8 bayta eşit, 1 yottabayta (YB) kadar sekiz kat tanımlar .

Bu tanım en yaygın kullanılan veri hızı birimlerinde de bilgisayar ağlarının , iç otobüs, sabit disk ve flaş medya aktarım hızları ve en tesislerinin kapasitelerini depolama ortamı , özellikle sabit diskler , flaş tabanlı depolama ve DVD'leri . Ayrıca, CPU saat hızları veya performans ölçüleri gibi bilgi işlemde SI öneklerinin diğer kullanımlarıyla da tutarlıdır .

2'nin kuvvetlerine dayalı birimler

1 kibibitin (KiB) 1.024 (yani, 2 10 ) bayta eşit olduğu 2'nin kuvvetlerine dayalı bir birim sistemi, uluslararası standart IEC 80000-13 tarafından tanımlanır ve ulusal ve uluslararası standart kuruluşları ( BIPM , IEC, NIST ). IEC standardı, 1 yobibayta (YiB) kadar, 1024 8 bayta eşit bu tür sekiz kat tanımlar .

1 kilobaytın (KB) 1.024 bayta, 1 megabaytın (MB) 1024 2 bayta ve 1 gigabayt'a (GB) eşit olduğu , aynı birimler için (burada geleneksel kural olarak anılacaktır) alternatif bir isimlendirme sistemidir. 1024 3 bayta eşit, 1990'ların JEDEC standardında belirtilmiştir. JEDEC standardı tarafından yalnızca ilk üç kattan (GB'ye kadar) bahsedilir ve bu da TB ve daha büyüklerinden bahsetmez. Alışılmış kural, Microsoft Windows işletim sistemi ve ana bellek ve CPU önbellek boyutu gibi rasgele erişimli bellek kapasitesi tarafından ve Vodafone , AT&T , Orange ve Telstra gibi telekomünikasyon şirketleri tarafından pazarlama ve faturalandırmada kullanılır .

Çelişen tanımların tarihi

Birim öneklerinin ondalık ve ikili yorumları arasındaki yüzde farkı, artan depolama boyutuyla birlikte büyür

Çağdaş bilgisayar belleği, en pratik 2'nin gücüne dayalı bellek birimlerinin tanımını yapan ikili bir mimariye sahiptir . İkili katlar için kilo metrik önekinin kullanılması bir kolaylık olarak ortaya çıktı, çünkü 1.024 yaklaşık 1.000'dir. Bu tanım, ilk on popüler olan kişisel bilgisayar gibi ürünlerle, Tandon 5 1 / 4 inçlik GG 1.024 bayt esası, aşağıdaki "360 KB" olarak reklamı yapılan disket biçiminde (368.640 bayt tutarak). Ancak evrensel değildi. Shugart SA-400 5 1 / 4 inçlik disket 109.375 biçimlendirilmemiş bayt düzenlenen, 1000 sistem kullanılarak, "110 kbyte" olarak ilan. Benzer şekilde, 8 inçlik DEC RX01 disketi (1975) biçimlendirilmiş 256.256 bayt tuttu ve "256k" olarak ilan edildi. Diğer disklerin reklamı , iki tanımın bir karışımı kullanılarak yapılmıştır : özellikle, 3+"1.44 MB" olarak tanıtılan 12 inç HD diskler aslında 1.47 MB ​​veya 1.41 MiB eşdeğeri olan 1.440 KiB kapasiteye sahiptir.

1995 yılında, Uluslararası Temel ve Uygulamalı Kimya Birliği (IUPAC) Adlandırma ve Semboller Bölümlerarası Komitesi, kibi (kilobinary), mebi (megabinary) dahil olmak üzere 1024'ün güçleri için bir dizi ikili önek önererek bu belirsizliği çözmeye çalıştı. ve gibi (gigabinary).

Aralık 1998'de, IEC , IUPAC'ın önerdiği önekleri (kibi, mebi, gibi, vb.) kabul ederek bu tür çoklu kullanımları ve tanımları ele alarak 1024'ün kuvvetlerini açık bir şekilde ifade etti. Böylece bir kibibayt (1 KiB), 1024 1   bayt = 1024 bayttır. , bir mebibayt (1 MiB) 1024 2   bayt = 1048576 bayttır, vb.

1999'da Donald Knuth , kibibiti "büyük kilobayt" ( KKB ) olarak adlandırmayı önerdi .

Modern standart tanımlar

IEC, IUPAC teklifini kabul etti ve standardı Ocak 1999'da yayınladı. IEC önekleri artık Uluslararası Miktarlar Sisteminin bir parçasıdır . IEC ayrıca kilobaytın yalnızca 1.000 bayta atıfta bulunmak için kullanılması gerektiğini belirtti.

Tanımı aşan davalar

Bayt katlarının ikili ve ondalık tanımları konusunda tüketicinin kafa karışıklığı iddiasından kaynaklanan davalar genellikle üreticilerin lehine sonuçlandı ve mahkemeler gigabayt veya GB'nin yasal tanımının 1 GB = 1.000.000.000 (10 9 ) bayt (ondalık sayı) olduğuna karar verdi. tanım), ikili tanım (2 30 ) yerine. Spesifik olarak, Amerika Birleşik Devletleri Bölge Mahkemesi, "ABD Kongresi, gigabaytın ondalık tanımını 'ABD ticaret ve ticareti' amacıyla 'tercih edilen' olarak kabul etmiştir [...] Kaliforniya Yasama Meclisi de aynı şekilde ondalık sayıyı kabul etmiştir. tüm 'bu durumdaki işlemler' için sistem.

Daha önceki davalar, sürücü üreticisi Western Digital'e karşı bir dava gibi, soruyla ilgili hiçbir mahkeme kararı olmadan uzlaşmayla sonuçlanmıştı . Western Digital, sorunu çözdü ve kullanılabilir kapasitenin reklamı yapılan kapasiteden farklı olabileceğine dair ürünlere açık sorumluluk reddi beyanları ekledi. Seagate'e de benzer gerekçelerle dava açıldı ve aynı şekilde karara bağlandı.

pratik örnekler

Birim Yaklaşık eşdeğer
bayt Bir temel latin karakteri.
kilobayt " Jabberwocky " metni
tipik bir favicon
megabayt Harry Potter ve Ateş Kadehi'nin metni
gigabayt yaklaşık yarım saatlik video
Mellon Collie and the Infinite Sadness'ın CD kalitesinde ses kaydı
terabayt 2007'deki en büyük tüketici sabit diski
Avatar: The Last Airbender televizyon dizisinin tamamı 1080p 4:3 videosu
petabayt 2000 yıllık MP3 kodlu müzik
eksabayt 2004 yılında küresel aylık internet trafiği
zettabayt 2016 yılında küresel yıllık İnternet trafiği

Yaygın kullanımlar

Birçok programlama dili , veri türü baytını tanımlar .

ve C ++ programlama dilleri tanımlayan bayt "olduğu gibi işletme ortamı temel karakter kümesinin herhangi bir üyesini tutmak için veri depolama yeterince büyük adreslenebilir birimi (bölüm C standardının 3.6)". C standardı, unsigned char integral veri tipinin en az 256 farklı değer içermesini ve en az sekiz bit ile temsil edilmesini gerektirir (madde 5.2.4.2.1). Çeşitli C ve C++ uygulamaları, bir baytın depolanması için 8, 9, 16, 32 veya 36 bit ayırır. Ayrıca, C ve C++ standartları, iki bayt arasında boşluk olmamasını gerektirir. Bu, bellekteki her bitin bir baytın parçası olduğu anlamına gelir.

Java'nın ilkel veri türü baytı sekiz bit olarak tanımlanır. −128 ile 127 arasındaki değerleri tutan imzalı bir veri türüdür.

C# gibi .NET programlama dilleri , sırasıyla 0 ile 255 ve −128 ile 127 arasındaki değerleri tutan , baytı işaretsiz bir tür olarak ve sbyte'ı da imzalı bir veri türü olarak tanımlar .

Veri iletim sistemlerinde, bayt, en küçük ayırt edici veri birimini temsil eden bir seri veri akışında bitişik bir bit dizisi olarak kullanılır. Bir iletim birimi ek olarak başlangıç ​​bitlerini, bitiş bitlerini ve eşlik bitlerini içerebilir ve bu nedenle boyutu tek bir yedi bitlik ASCII kodunu içerecek şekilde yedi ila on iki bit arasında değişebilir .

Ayrıca bakınız

Notlar

Referanslar

daha fazla okuma