Bilgi birimleri - Units of information

Bilgi işlem ve telekomünikasyonda , bir bilgi birimi , diğer sistem ve kanalların kapasitelerini ölçmek için kullanılan bazı standart veri depolama sistemlerinin veya iletişim kanallarının kapasitesidir. Olarak bilgi teori , bilgilerin birimleri ölçmek için kullanılır bilgi mesajların içerdiği ve entropi rastgele değişkenlerin.

Veri depolama kapasitesi en yaygın olarak kullanılan birimler biraz sadece iki durumu olan bir sistemin kapasitesi ve bayt (veya sekizli sekiz bit eşdeğerdir). Bu birimlerin katları, bunlardan SI önekleri ( onluğun gücü önekleri) veya daha yeni IEC ikili önekleri ( ikinin gücü önekleri) ile oluşturulabilir.

Birincil birimler

Bilgi birimlerinin karşılaştırılması: bit , trit , nat , ban . Bilgi miktarı çubukların yüksekliğidir. Koyu yeşil seviye "nat" birimidir.

1928 yılında, Ralph Hartley , ek olarak formel bir temel depolama prensibi, gözlenen Claude Shannon orantılı olan bir sistem içinde saklanabilir bilgi: 1945 logaritması arasında K gösterilen bu sistemin olası durumları, log b N . Logaritmanın tabanını b'den farklı bir c sayısına değiştirmek, logaritmanın değerini sabit bir sabitle, yani log c N  = (log c b ) log b N ile çarpma etkisine sahiptir . Bu nedenle, b tabanının seçimi, bilgiyi ölçmek için kullanılan birimi belirler. Özellikle, eğer b a, pozitif tam sayı, daha sonra bir ünite ile de sistemde saklanabilir bilgi miktarı , N olası durumlar.

Tüm b 2, birim Shannon , bir "bit" (ikili rakam bir portmanteau) bilgi içeriğine eşit. Örneğin, 8 olası durumu olan bir sistem, 2 8 = 3 bitlik bilgiyi günlüğe kaydedebilir . Adlandırılmış diğer birimler şunlardır:

  • Baz b  = 3: Birime " trit " denir ve log 2 3 (≈ 1.585) bit'e eşittir .

Trit, ban ve nat depolama kapasitesini ölçmek için nadiren kullanılır; ancak nat, özellikle bilgi teorisinde sıklıkla kullanılır, çünkü doğal logaritmalar matematiksel olarak diğer temellerdeki logaritmalardan daha uygundur.

bitten türetilen birimler

Koleksiyonlar veya bit grupları için birkaç geleneksel ad kullanılır.

Bayt

Tarihsel olarak, bir bayt , bilgisayar donanım mimarisine bağlı olarak bilgisayardaki bir metin karakterini kodlamak için kullanılan bit sayısıydı; ama bugün neredeyse her zaman sekiz bit anlamına gelir – yani bir sekizli . Bir bayt temsil 256 (2 8 ), örneğin, negatif olmayan bir 0 ile 255 arasında bir tamsayı, ya da ayrı değerler, imzalanmış -128 127. üzere tamsayılar IEEE 1541-2002 sembolü gibi standart belirtir, "B" (büyük harf) bayt ( IEC 80000-13 , Fransızca'da sekizli için "o" kullanır, ancak aynı zamanda İngilizce'de "B"ye de izin verir, bu aslında kullanılan şeydir). Bayt veya katları, neredeyse her zaman bilgisayar dosyalarının boyutlarını ve depolama birimlerinin kapasitesini belirtmek için kullanılır. Modern bilgisayarların ve çevre birimlerinin çoğu, verileri tek tek bitler yerine tam bayt veya bayt grupları halinde işlemek için tasarlanmıştır.

kemirmek

Dört bit, ya da yarım bayt bir grup, bazen adlandırılır yarım bayt , Nybble veya nyble. Bu birim çoğunlukla onaltılık sayı gösterimleri bağlamında kullanılır , çünkü bir kemirme, bir onaltılık basamakla aynı miktarda bilgiye sahiptir.

Kırıntı

Bir çift iki bit veya çeyrek bayt, genellikle erken 8 bitlik hesaplamada kullanılan kırıntı olarak adlandırıldı (bkz. Atari 2600 , ZX Spectrum ). Şimdi büyük ölçüde feshedilmiş durumda.

Kelime, blok ve sayfa

Bilgisayarlar genellikle bitleri, geleneksel olarak word olarak adlandırılan sabit boyutlu gruplar halinde işler . Bir kelimedeki bit sayısı genellikle bilgisayarın CPU'sundaki kayıtların boyutu veya tek bir işlemde ana belleğinden alınan veri bitlerinin sayısı ile tanımlanır . Olarak , IA-32 daha yaygın x86-32 olarak bilinen mimari, bir kelime 16 bit, ama diğer geçmiş ve mevcut mimarileri taşıyan kelimeler 4, 8, 9, 12, 13, 16, 18, 20, 21, 22, 24 , 25, 26, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 44, 48, 50, 52, 54, 56, 60, 64, 72, 80 bit veya diğerleri.

Bazı makine talimatları ve bilgisayar numarası biçimleri iki kelime ("çift kelime" veya "dword") veya dört kelime ("dört kelime" veya "dörtlü") kullanır.

Bilgisayar bellek önbellekleri genellikle birkaç ardışık sözcükten oluşan bellek blokları üzerinde çalışır . Bu birimler, geleneksel olarak adlandırılır önbellek blokları içinde, ya da işlemci önbellekleri , önbellek hatları .

Sanal bellek sistemleri, bilgisayarın ana depolamasını geleneksel olarak sayfa adı verilen daha büyük birimlere böler .

sistematik katlar

Bit büyük miktarlarda koşulları, 10, güçler için SI önekleri standart aralığı kullanılarak oluşturulabilir, örneğin, kilo  = 10 3  = 1000 (deki gibi kilobit veya kbit), Mega  = 10 6  = 1 000 000 deki gibi ( megabit veya Mbit) ve giga  = 10 9 = 1 000 000 000 ( gigabit veya Gbit'te olduğu gibi). Bu önekler, kilobayt (1 kB = 8000 bit), megabayt (1 MB = 8 000 000 bit ) ve gigabayt (1 GB = 8 000 000 000 bit ) gibi daha çok bayt katları için kullanılır .

Bununla birlikte, teknik nedenlerle, bilgisayar belleklerinin ve bazı depolama birimlerinin kapasiteleri genellikle 2 28  = 268 435 456 bayt gibi iki büyük gücün katlarıdır . Böyle hantal numaralarını önlemek için, insanlar genellikle kullanılarak, örneğin ikinin en yakın gücü, demek SI önekleri başka bir amaca uygun olması önek kilo 2 için 10  = 1024, Mega 2 için 20  = 1 048 576 ve giga 2 için 30  = 1 073 741 824 , vb. Örneğin, 2 28 bayt kapasiteli bir rastgele erişimli bellek yongası, 256 megabaytlık bir yonga olarak anılacaktır. Aşağıdaki tablo bu farklılıkları göstermektedir.

Sembol Önek SI Anlamı ikili anlam Boyut farkı
k kilo 10 3    = 1000 1 2 10  = 1024 1 %2,40
m mega 10 6    = 1000 2 2 20  = 1024 2 %4.86
G giga 10 9    = 1000 3 2 30  = 1024 3 %7.37
T tera 10 12  = 1000 4 2 40  = 1024 4 %9,95
P peta 10 15  = 1000 5 2 50  = 1024 5 %12.59
E örneğin 10 18  = 1000 6 2 60  = 1024 6 %15.29
Z zeta 10 21  = 1000 7 2 70  = 1024 7 18.06%
Y yota 10 24  = 1000 8 2 80  = 1024 8 %20.89

Geçmişte, 1000 yerine 1024'ü belirtmek için küçük k harfi yerine büyük K harfi kullanılmıştır . Ancak bu kullanım hiçbir zaman tutarlı bir şekilde uygulanmamıştır.

Öte yandan, harici depolama sistemleri için ( optik diskler gibi ), SI önekleri genellikle ondalık değerleriyle (10'un kuvvetleri) kullanılır. İki katın kuvveti için alternatif gösterimler sağlayarak karışıklığı çözmek için birçok girişimde bulunulmuştur. 1998'de Uluslararası Elektroteknik Komisyonu (IEC) bu amaç için bir standart yayınladı, yani ana sayı tabanı olarak 1000 yerine 1024 kullanan bir dizi ikili önek :

Sembol Önek
Ki kibi, ikili kilo 1 kibibayt (KiB) 2 10 bayt 1024 B
Mi mebi, ikili mega 1 mebibayt (MiB) 2 20 bayt 1024 KiB
gi gibi, ikili giga 1 gibibit (GiB) 2 30 bayt 1024 MiB
Ti tebi, ikili tera 1 tebibayt (TiB) 2 40 bayt 1024 GiB
Pi pebi, ikili peta 1 pebibyte (PIB) 2 50 bayt 1024 TiB
Ei exbi, ikili exa 1 exbibyte (EIB) 2 60 bayt 1024 PiB

JEDEC bellek standart kilosu tanımları (K), iki üssü dayalı giga (G), ve mega (M) dahil olduğunu JESD88F notları tek ortak kullanımını yansıtmak için.

Boyut örnekleri

  • 1 bit: Evet/hayır sorusuna cevap
  • 1 bayt: 0 ile 255 arasında bir sayı
  • 90 bayt: Bir kitaptan tipik bir metin satırını saklamak için yeterli
  • 512 bayt = 0,5 KiB: Bir sabit diskin tipik sektörü
  • 1024 bayt = 1 KiB: UNIX dosya sistemlerinde klasik blok boyutu
  • 2048 bayt = 2 KiB: Bir CD-ROM sektörü
  • 4096 bayt = 4 KiB: Bir bellek sayfası içinde x86 (beri Intel 80386 )
  • 4 kB: Bir romandan yaklaşık bir sayfa metin
  • 120 kB: Tipik bir cep kitabının metni
  • 1 MiB: 256 renkli (8 bpp renk derinliği) 1024×1024 piksel bitmap görüntüsü
  • 3 MB: Üç dakikalık bir şarkı (133 kbit/sn)
  • 650–900 MB – bir CD-ROM
  • 1 GB: 1.4 Mbit/s'de 114 dakikalık sıkıştırılmamış CD kalitesinde ses
  • 8/16 GB: İki yaygın USB flash sürücü boyutu
  • 4 TB: 100 dolarlık bir sabit diskin boyutu (2018'in başlarından itibaren)
  • 12 TB: En büyük sabit disk sürücüsü (2018 başından itibaren)
  • 16 TB: Piyasada bulunan en büyük katı hal sürücüsü (2018 başından itibaren)
  • 100 TB: İnşa edilen en büyük katı hal sürücüsü (2018'in başlarından itibaren)
  • 1.3 ZB: 2016'daki tüm internet hacminin tahmini

Eski ve olağandışı birimler

Diğer birkaç bilgi depolama birimi adlandırılmıştır:

  • 1 bit: unibit, koklama
  • 2 bit: dibit, kırıntı, çeyrek basamak, dörtlü, çeyrek, tat, tayste, tidbit, tydbit, yalamak, lyck, yarı kemirme, snort
  • 3 bit: tribit, triad, triade, tribble
  • 4 bit: karakter ( Intel 4004'te  – ancak karakterler diğer işlemcilerde genellikle 8 bit genişliğinde veya daha büyüktür), diğerleri için bkz. Nibble
  • 5 bit: pentad, pentad, nikel, nyckle
  • 6 bit: bayt ( BCD alphamerics kullanan erken IBM makinelerinde ), hexad, hexade, sextet
  • 7 bit: yedili, yedili
  • 8 bit: oktet , genellikle bayt olarak da adlandırılır
  • 9 bit: nonet, nadiren kullanılır
  • 10 bit: declet, decle, decle, dyme
  • 12 bit: levha
  • 15 bit: paket ( CDC 6600 ve CDC 7600'de )
  • 16 bit: doublet, wyde, parsel ( Cray-1 üzerinde ), plate, playte, chomp, chawmp (32-bit makinede)
  • 18 bit: chomp, chawmp (36-bit makinede)
  • 32 bit: dörtlü, tetra, akşam yemeği, dynner, gawble (32 bit makinede)
  • 48 bit: yalamak, gawble (belirsiz kalan koşullar altında)
  • 64 bit: sekizli, sekizli
  • 96 bit: bentobox ( ITRON OS'de )
  • 128 bit: altıgen
  • 16 bayt: paragraf ( Intel x86 işlemcilerde)
  • 256 bayt: sayfa (Intel 4004, 8080 ve 8086 işlemcilerde ve ayrıca diğer birçok 8 bit işlemcide – genellikle birçok 16 bit/32 bit işlemcide çok daha büyüktür)
  • 6 trit : deneme
  • tarak

Bu adlardan bazıları jargondur , eskidir veya yalnızca çok sınırlı bağlamlarda kullanılır.

Ayrıca bakınız

Notlar

Referanslar

Dış bağlantılar