Ikili veri - Binary data

İkili veri , birimi yalnızca iki olası durumu alabilen, ikili sayı sistemine ve Boole cebrine göre geleneksel olarak 0 ve 1 olarak etiketlenen verilerdir .

İkili veriler de dahil olmak üzere farklı isimler tarafından çağrılabilir birçok farklı teknik ve bilimsel alanlarda, meydana bit içinde (ikili sayı) bilgisayar bilimi , gerçeklik değerine de matematiksel mantık ve ilgili alanlar ve ikili değişken istatistiklerinde.

Matematiksel ve birleştirici temeller

Bir ayrık sadece alabilir değişken bir devlet sıfır içeren bilgi ve 2 yanındadır doğal sayı yüzden bu 1 sonra biraz , sadece iki olası değerlere sahip bir değişken, bir standart birincil olduğunu bilgilerin birimi .

n bitlik bir koleksiyonun 2 n durumu olabilir: ayrıntılar için ikili sayıya bakın. Bir ayrık değişkenler topluluğunun durum sayısı, üstel olarak değişkenlerin sayısına bağlıdır ve yalnızca bir güç yasası olarak her bir değişkenin durum sayısına bağlıdır. On bit, üç ondalık basamaktan ( 1000 ) daha fazla ( 1024 ) duruma sahiptir . 10 k bit, 3 k ondalık basamak gerektiren bir bilgiyi (bir sayı veya başka herhangi bir şeyi) temsil etmek için fazlasıyla yeterlidir , bu nedenle 3 , 4, 5, 6, 7, 8, 9, 10 … durumlu ayrık değişkenlerde bulunan bilgiler , iki, üç veya dört kat daha fazla bit tahsis edilerek hiçbir zaman değiştirilemez. Dolayısıyla, 2'den başka bir küçük sayının kullanılması bir avantaj sağlamaz.

Bir Hasse diyagramı : yönlendirilmiş bir grafik olarak bir Boole cebirinin temsili

Ayrıca, Boole cebri, bir önerme değişkenleri koleksiyonunun semantiğiyle, bitlerin toplanması için uygun bir matematiksel yapı sağlar . Boole cebri işlemleri, bilgisayar bilimlerinde " bitsel işlemler " olarak bilinir . Boole fonksiyonları da birlikte de, teorik ve kolay uygulanabilir iyi incelenir bilgisayar programları ya da böyle adlandırıldığını tarafından mantık kapıları içinde dijital elektronik . Bu, başlangıçta ikili olmayanlar da dahil olmak üzere farklı verileri temsil etmek için bitlerin kullanımına katkıda bulunur.

istatistiklerde

Olarak istatistik , ikili veri a, istatistiksel veri türü oluşan Kategorik veriler , örneğin "A" ve "B" veya "kafa" ve "kuyruk" ile tam olarak iki olası değerleri alabilir. Bir kategorik veri biçimi olarak ikili veriler, sayısal olarak karşılaştırılamayan niteliksel olarak farklı değerleri temsil ettikleri anlamına gelen nominal verilerdir . Bununla birlikte, ikili veriler sıklıkla , iki değerden biri "başarı" olarak kabul edilerek ve sonuçların 1 veya 0 olarak temsil edilmesiyle sayı verilerine dönüştürülür ; bu, tek bir denemedeki başarıların sayısını saymaya karşılık gelir: 1 (başarı) veya 0 ( arıza); bkz. § Sayma .

Genellikle ikili veriler, kavramsal olarak karşıt iki değerden birini temsil etmek için kullanılır, örneğin:

  • bir deneyin sonucu ("başarı" veya "başarısızlık")
  • evet-hayır sorusuna verilen yanıt ("evet" veya "hayır")
  • bazı özelliklerin varlığı veya yokluğu ("mevcut" veya "mevcut değil")
  • bir önermenin doğruluğu veya yanlışlığı ("doğru" veya "yanlış", "doğru" veya "yanlış")

Bununla birlikte, kavramsal olarak karşıt olmasalar veya kavramsal olarak uzaydaki tüm olası değerleri temsil etseler bile, yalnızca iki olası değere sahip olduğu varsayılan veriler için de kullanılabilir. Örneğin, ikili veriler genellikle Amerika Birleşik Devletleri'ndeki seçimlerde , yani Cumhuriyetçi veya Demokrat seçmenlerin parti seçimlerini temsil etmek için kullanılır . Bu durumda, yalnızca iki siyasi partinin var olmasının doğal bir nedeni yoktur ve aslında ABD'de başka partiler de vardır, ancak bunlar o kadar küçüktür ki genellikle basitçe göz ardı edilirler. Analiz amacıyla, bir ikili değişken olarak sürekli veri (ya da en fazla 2 kategoriden kategorik verileri) Modelleme adlandırılır olmaması durumundaki (oluşturarak ikiliği ). Tüm ayrıklaştırma gibi, ayrıklaştırma hatası içerir , ancak amaç, hataya rağmen değerli bir şey öğrenmektir: eldeki amaç için ihmal edilebilir olarak ele almak, ancak genel olarak ihmal edilebilir olarak kabul edilemeyeceğini hatırlamak.

ikili değişkenler

Bir ikili değişken bir bir rastgele değişken iki muhtemel değere sahip, yani ikili Çeşidi. Bağımsız ve özdeş olarak dağıtılmış (iid) ikili değişkenler bir Bernoulli dağılımını takip eder , ancak genel olarak ikili verilerin iid değişkenlerinden gelmesi gerekmez. iid ikili değişkenlerinin toplam sayısı (eşdeğer olarak, 1 veya 0 olarak kodlanmış iid ikili değişkenlerinin toplamları) bir binom dağılımını takip eder , ancak ikili değişkenler iid olmadığında, dağılımın binom olması gerekmez.

sayma

Kategorik veriler gibi, ikili veriler dönüştürülebilir vektör bir sayım verileri , bir olası her değeri için koordinat yazma ve oluşmaz değeri oluşur değeri ve 0 1 hesaplanması suretiyle hesaplanabilir. Örneğin, değerler A ve B ise, o zaman A, A, B veri kümesi (1, 0), (1, 0), (0, 1) olarak sayımlarla temsil edilebilir. Sayılara dönüştürüldüğünde, ikili veriler gruplandırılabilir ve sayımlar eklenebilir. Örneğin, A, A, B kümesi gruplandırılmışsa, toplam sayımlar (2, 1): 2 A ve 1 B (3 denemeden) şeklindedir.

Yalnızca iki olası değer olduğundan, bir değer "başarı" ve diğeri "başarısızlık" olarak kabul edilerek, başarının değeri 1 ve başarısızlığın değeri olarak kodlanarak bu, tek bir sayıya (skaler bir değer) basitleştirilebilir. 0. Örneğin, A değeri "başarılı" olarak kabul edilirse (ve dolayısıyla B "başarısızlık" olarak kabul edilirse), A, A, B veri kümesi 1, 1, 0 olarak temsil edilir. Bu gruplandırıldığında, değerler eklenirken, deneme sayısı genellikle örtülü olarak izlenir. Örneğin, A, A, B, 1 + 1 + 0 = 2 başarı ( }} denemeden) olarak gruplandırılacaktır . Diğer taraftan, verileri saymak ikili verilerdir, iki sınıf 0 (başarısızlık) veya 1 (başarılı) olur.

IID ikili değişkenlerin sayar seçilmiş bir programı takip binom dağılımını ile, (gruplanmış veriler noktaları) toplam deneme sayısı.

regresyon

İkili değişkenler olan tahmin edilen sonuçlara ilişkin regresyon analizi , ikili regresyon olarak bilinir ; ikili veriler sayım verilerine dönüştürüldüğünde ve iid değişkenleri olarak modellendiğinde (böylece bir binom dağılımına sahiptirler), binom regresyon kullanılabilir. İkili veriler için en yaygın regresyon yöntemleri, lojistik regresyon , probit regresyon veya ilgili ikili seçim modelleridir.

Benzer şekilde, ikiden fazla kategoriye sahip iid kategorik değişkenlerin sayısı, çok terimli bir regresyon ile modellenebilir . Iid olmayan ikili verilerin sayıları , beta-binom dağılımı (bir bileşik dağılım ) gibi daha karmaşık dağılımlarla modellenebilir . Seçenek olarak ise, bir ilişki açık teknikleri kullanarak çıkış değişkeni dağılımını model gerek kalmadan modellenebilir model doğrusal genelleştirilmiş gibi (GLM), yarı-olabilirlik ve quasibinomial modeli; bkz. Aşırı Dağılma § Binom .

bilgisayar biliminde

Bir ikili görüntü a QR Code tipik 24 bit karşı piksel başına 1 bit temsil, gerçek renk görüntüsü.

Modern bilgisayarlarda , ikili veriler, daha yüksek bir düzeyde yorumlanmak veya başka bir forma dönüştürülmek yerine ikili biçimde temsil edilen herhangi bir veriyi ifade eder . En alt düzeyde, bitler, iki durumlu bir aygıtta, örneğin bir flip-flop'ta depolanır . Çoğu ikili verinin sembolik anlamı olsa da ( don't care hariç ) tüm ikili veriler sayısal değildir. Bazı ikili veriler bilgisayar talimatlarına karşılık gelir , örneğin getir-kodunu çöz-yürüt döngüsü boyunca kontrol birimi tarafından kodu çözülen işlemci kayıtları içindeki veriler . Bilgisayarlar, performans nedenleriyle bireysel bitleri nadiren değiştirir. Bunun yerine veriler , genellikle 1 bayt (8 bit) olmak üzere sabit sayıda bitlik gruplar halinde hizalanır . Bu nedenle, bilgisayarlardaki "ikili veriler" aslında bayt dizileridir. Daha yüksek düzeyde, 32 bit sistemler için 1 kelime (4 bayt) ve 64 bit sistemler için 2 kelimelik gruplar halinde verilere erişilir .

Uygulamalı bilgisayar biliminde ve bilgi teknolojisi alanında, ikili veri terimi , metin olarak yorumlanamayan her türlü veriye atıfta bulunarak , genellikle metne dayalı verilerin karşıtıdır . "Metin" ve "ikili" ayrımı bazen bir dosyanın anlamsal içeriğine atıfta bulunabilir (örneğin yazılı bir belgeye karşı dijital bir görüntü ). Bununla birlikte, genellikle bir dosyanın bireysel baytlarının metin olarak yorumlanıp yorumlanamayacağına (bkz. karakter kodlaması ) veya bu şekilde yorumlanamayacağına atıfta bulunur . Bu son anlam kastedildiğinde, bazen ikili biçim ve metin(ual) biçim gibi daha özel terimler kullanılır. Anlamsal olarak metinsel veriler ikili formatta gösterilebilir (örneğin sıkıştırıldığında veya Microsoft Word tarafından kullanılan DOC formatında olduğu gibi çeşitli formatlama kodlarını karıştıran belirli formatlarda ); aksine, görüntü verileri bazen metin biçiminde gösterilir (örneğin , X Pencere Sisteminde kullanılan X PixMap görüntü biçimi ).

Ayrıca bakınız

Referanslar