Ses bit derinliği - Audio bit depth

4 bitlik PCM dijital örneklerine (mavi) kodlanmış bir analog sinyal (kırmızı); bit derinliği dörttür, bu nedenle her örneğin genliği 16 olası değerden biridir.

Olarak , dijital ses ile darbe kod modülasyonu (PCM), bit derinliği sayısı bit her bilginin örnek ve doğrudan karşılık gelen çözünürlük her numunenin. Bit derinliği örnekleri arasında örnek başına 16 bit kullanan Kompakt Disk Dijital Ses ve örnek başına 24 bit'e kadar destekleyebilen DVD-Audio ve Blu-ray Disk bulunur.

Temel uygulamalarda, bit derinliğindeki değişiklikler öncelikle niceleme hatasından kaynaklanan gürültü seviyesini etkiler - dolayısıyla sinyal-gürültü oranı (SNR) ve dinamik aralık . Ancak, titreme , gürültü şekillendirme ve aşırı örnekleme gibi teknikler , bit derinliğini değiştirmeden bu etkileri azaltır . Bit derinliği, bit hızını ve dosya boyutunu da etkiler .

Bit derinliği yalnızca bir PCM dijital sinyaline ilişkin olarak anlamlıdır . Kayıplı sıkıştırma biçimleri gibi PCM olmayan biçimler, ilişkili bit derinliklerine sahip değildir.

ikili gösterim

Bir PCM sinyali, orijinal analog sinyali yeniden oluşturmak için gerekli bilgileri sağlayan verileri içeren bir dizi dijital ses örnekleridir . Her örnek , zaman içinde belirli bir noktadaki sinyalin genliğini temsil eder ve örnekler zaman içinde eşit aralıklarla yerleştirilmiştir. Genlik, örnekte açıkça depolanan tek bilgidir ve tipik olarak , sabit sayıda basamaklı bir ikili sayı olarak kodlanmış bir tam sayı veya kayan noktalı sayı olarak depolanır : örneğin bit derinliği , ayrıca kelime uzunluğu olarak da adlandırılır veya kelime boyutu.

Çözünürlük, analog değerler aralığında temsil edilebilecek ayrık değerlerin sayısını gösterir. İkili tamsayıların çözünürlüğü , kelime uzunluğu arttıkça katlanarak artar. Bir bit eklemek çözünürlüğü iki katına, iki dört katına çıkarmak vb. Bir tamsayı bit derinliği ile temsil edilebilecek olası değerlerin sayısı, n'nin bit derinliği olduğu 2 n kullanılarak hesaplanabilir . Böylece 16 bitlik bir sistem 65.536 (2 16 ) olası değerin çözünürlüğüne sahiptir .

Tamsayılı PCM ses verileri tipik olarak ikinin tamamlayıcı biçiminde imzalı sayılar olarak saklanır .

Birçok ses dosyası formatı ve dijital ses iş istasyonu (DAW'lar) artık kayan nokta sayılarıyla temsil edilen örneklerle PCM formatlarını desteklemektedir. Hem WAV dosya formatı hem de AIFF dosya formatı, kayan nokta temsillerini destekler. Bit deseni tek bir bit dizisi olan tam sayıların aksine, kayan noktalı sayı bunun yerine matematiksel ilişkisi bir sayı oluşturan ayrı alanlardan oluşur. En yaygın standart, üç alandan oluşan IEEE 754'tür : sayının pozitif mi yoksa negatif mi olduğunu gösteren bir işaret biti , bir üs ve üs tarafından yükseltilen bir mantis . Mantis, IEEE temel-iki kayan nokta formatlarında ikili bir kesir olarak ifade edilir .

niceleme

Bit derinliği , yeniden oluşturulan sinyalin sinyal -gürültü oranını (SNR) nicemleme hatası tarafından belirlenen maksimum bir seviyeye sınırlar . Bit derinliğinin, örnekleme hızı tarafından sınırlandırılan frekans yanıtı üzerinde hiçbir etkisi yoktur .

Analogdan dijitale dönüştürme (ADC) sırasında ortaya çıkan niceleme hatası nicemleme gürültüsü olarak modellenebilir . ADC'ye giden analog giriş voltajı ile çıkış sayısallaştırılmış değeri arasındaki yuvarlama hatasıdır. Gürültü doğrusal değildir ve sinyale bağlıdır.

Bir 8 bitlik ikili sayı (149 ondalık LSB vurgulanmış),

Nicemleme hatasının en az anlamlı bit (LSB) arasında eşit olarak dağıtıldığı ve sinyalin tüm niceleme seviyelerini kapsayan tekdüze bir dağılıma sahip olduğu ideal bir ADC'de , sinyal-niceleme-gürültü oranı (SQNR) aşağıdakilerden hesaplanabilir.

burada Q, niceleme bitlerinin sayısıdır ve sonuç, desibel (dB) cinsinden ölçülür .

Bu nedenle, CD'lerde bulunan 16 bit dijital sesin teorik maksimum SNR'si 96 dB'dir ve profesyonel 24 bit dijital ses, 144 dB'dir. 2011 itibariyle, dijital ses dönüştürücü teknolojisi, entegre devre tasarımındaki gerçek dünya sınırlamaları nedeniyle yaklaşık 123 dB'lik bir SNR ( etkin olarak 21 bit) ile sınırlıdır . Yine de, bu yaklaşık olarak insan işitsel sisteminin performansıyla eşleşir . Aynı sinyalin farklı aralıklarını kapsamak için birden fazla dönüştürücü kullanılabilir, uzun vadede daha geniş bir dinamik aralığı kaydetmek için bir araya birleştirilirken, kısa vadede tek dönüştürücünün dinamik aralığı ile sınırlandırılır, buna dinamik aralık uzantısı denir .

Sinyal-gürültü oranı ve bit derinliklerinin çözünürlüğü
# bit SNR Olası tamsayı değerleri (örnek başına) Taban-on işaretli aralık (örnek başına)
4 24.08 dB 16 -8 ila +7
8 48,16 dB 256 -128 ila +127
11 66,22 dB 2048 −1024 ila +1023
12 72,24 dB 4096 -2048 ila +2047
16 96,33 dB 65.536 -32.768 ila +32.767
18 108,37 dB 262.144 -131072 ila +131071
20 120,41 dB 1.048.576 -524.288 ila +524.287
24 144,49 dB 16.777.216 -8,388,608 ila +8,388,607
32 192,66 dB 4,294,967,296 -2,147,483,648 ile +2,147,483,647 arası
48 288,99 dB 281.474.976.710.656 −140.737.488.355.328 ila +140.737.488.355.327
64 385,32 dB 18,446,744,073,709,551,616 −9,223,372,036,854,775,808 ila +9,223,372,036,854,775,807

Kayan nokta

Kayan noktalı örneklerin çözünürlüğü, tamsayılı örneklerden daha az basittir çünkü kayan nokta değerleri eşit aralıklı değildir. Kayan nokta gösteriminde, herhangi iki bitişik değer arasındaki boşluk, değerle orantılıdır. Bu, bir tamsayı sistemine kıyasla SNR'yi büyük ölçüde artırır, çünkü yüksek seviyeli bir sinyalin doğruluğu, daha düşük bir seviyedeki özdeş bir sinyalin doğruluğu ile aynı olacaktır.

Kayan nokta ve tamsayılar arasındaki ödünleşim, büyük kayan nokta değerleri arasındaki boşluğun, aynı bit derinliğindeki büyük tamsayı değerleri arasındaki boşluktan daha büyük olmasıdır. Büyük bir kayan noktalı sayıyı yuvarlamak, küçük bir kayan noktalı sayıyı yuvarlamaktan daha büyük bir hatayla sonuçlanırken, bir tam sayıyı yuvarlamak her zaman aynı düzeyde hatayla sonuçlanır. Başka bir deyişle, tamsayılar, LSB'yi her zaman 0 veya 1'e yuvarlayan tek biçimli yuvarlamaya sahiptir ve kayan nokta tekdüze olan SNR'ye sahiptir, nicemleme gürültü seviyesi her zaman sinyal düzeyiyle belirli bir orandadır. Bir kayan noktalı gürültü tabanı, sinyal yükseldikçe yükselir ve sinyal düştükçe düşer, bu da bit derinliği yeterince düşükse işitilebilir varyansa neden olur.

Ses işleme

Dijital ses üzerindeki çoğu işleme işlemi, örneklerin yeniden nicelenmesini içerir ve bu nedenle analogdan dijitale dönüştürme sırasında ortaya çıkan orijinal niceleme hatasına benzer ek yuvarlama hatası oluşturur. ADC sırasındaki örtük hatadan daha büyük yuvarlama hatasını önlemek için, işleme sırasındaki hesaplamalar giriş örneklerinden daha yüksek hassasiyetlerde yapılmalıdır.

Dijital sinyal işleme (DSP) işlemleri, sabit nokta veya kayan nokta kesinliğinde gerçekleştirilebilir. Her iki durumda da, her işlemin kesinliği, giriş verilerinin çözünürlüğü ile değil, işlemin her adımını gerçekleştirmek için kullanılan donanım işlemlerinin kesinliği ile belirlenir. Örneğin, x86 işlemcilerde kayan nokta işlemleri tek veya çift ​​hassasiyetle ve sabit nokta işlemleri 16, 32 veya 64 bit çözünürlükte gerçekleştirilir. Sonuç olarak, Intel tabanlı donanım üzerinde gerçekleştirilen tüm işlemler, kaynak biçiminden bağımsız olarak bu kısıtlamalarla gerçekleştirilecektir.

Sabit noktalı dijital sinyal işlemcileri , belirli sinyal çözünürlüklerini desteklemek için genellikle belirli kelime uzunluklarını destekler. Örneğin, Motorola 56000 DSP yongası, taşma veya kesilme olmadan iki 24 bitlik örnek üzerinde çoklu biriktirme işlemleri gerçekleştirmek için 24 bit çoğaltıcılar ve 56 bitlik akümülatörler kullanır . Büyük akümülatörleri desteklemeyen cihazlarda, sabit nokta sonuçları kesilerek kesinlik azaltılabilir. Hatalar, gerçekleştirilen işlemlere bağlı olarak DSP'nin birden çok aşaması boyunca birleşir. DC ofseti olmayan ses verileri üzerindeki korelasyonsuz işlem adımları için, hataların sıfır ortalama ile rastgele olduğu varsayılır. Bu varsayım altında, dağılımın standart sapması hata sinyalini temsil eder ve nicemleme hatası işlem sayısının karekökü ile ölçeklenir. Evrişim gibi tekrarlanan işlemeyi içeren algoritmalar için yüksek düzeyde hassasiyet gereklidir . Sonsuz dürtü yanıtı (IIR) filtreleri gibi özyinelemeli algoritmalarda da yüksek düzeyde hassasiyet gereklidir . IIR filtrelerinin özel durumunda, yuvarlama hatası frekans yanıtını bozabilir ve kararsızlığa neden olabilir.

titreme

Titreşim seviyesi ile karşılaştırma amacıyla ses işlem aşamalarında tavan boşluğu ve gürültü tabanı

Yuvarlama hataları ve ses işleme sırasında ortaya çıkan kesinlik kaybı dahil olmak üzere nicemleme hatasının neden olduğu gürültü, nicelemeden önce sinyale titreşim adı verilen az miktarda rastgele gürültü eklenerek azaltılabilir . Titreşim, doğrusal olmayan nicemleme hata davranışını ortadan kaldırarak çok düşük bozulma sağlar, ancak biraz yükseltilmiş gürültü tabanı pahasına . ITU-R 468 gürültü ağırlığı kullanılarak ölçülen 16-bit dijital ses için tavsiye edilen titreşim, hizalama seviyesinin yaklaşık 66 dB altında veya dijital tam ölçeğin 84 dB altındadır ; bu, mikrofon ve oda gürültü seviyesi ile karşılaştırılabilir ve dolayısıyla 16- bit ses.

24 bit ses taklidi gerektirmez, çünkü dijital dönüştürücünün gürültü seviyesi her zaman uygulanabilecek herhangi bir taklidin gerekli seviyesinden daha yüksektir. 24 bit ses teorik olarak 144 dB dinamik aralığı kodlayabilir, ancak üreticinin veri sayfalarına dayanarak ~ 125 dB'den daha yüksek sağlayabilen hiçbir ADC yoktur.

Titreşim, etkili dinamik aralığı artırmak için de kullanılabilir. Algılanan 16-bit ses dinamik aralığı devamı 120 dB ya da olabilir, ve gürültü şekilli insan kulağının frekans yanıtının yararlanarak, taklidi.

Dinamik aralık ve boşluk payı

Dinamik aralık , bir sistemin kaydedebileceği veya yeniden üretebileceği en büyük ve en küçük sinyal arasındaki farktır. Titreşim olmadan, dinamik aralık nicemleme gürültü tabanıyla ilişkilidir. Örneğin, 16 bit tamsayı çözünürlüğü, yaklaşık 96 dB'lik bir dinamik aralığa izin verir. Titreşimin uygun şekilde uygulanmasıyla, dijital sistemler, çözünürlüklerinin normalde izin verdiğinden daha düşük seviyelerde sinyaller üretebilir ve etkin dinamik aralığı, çözünürlüğün dayattığı sınırın ötesine genişletebilir. Aşırı örnekleme ve gürültü şekillendirme gibi tekniklerin kullanılması, niceleme hatasını ilgili frekans bandının dışına taşıyarak örneklenen sesin dinamik aralığını daha da genişletebilir.

Sinyalin maksimum seviyesi, bit derinliğinin izin verdiğinden daha düşükse, kaydın boşluk payı vardır . Stüdyo kaydı sırasında daha yüksek bit derinliklerinin kullanılması, aynı dinamik aralığı korurken boşluk payının kullanılabilir olmasını sağlayabilir. Bu , düşük hacimlerde nicemleme hatalarını artırmadan kırpma riskini azaltır .

aşırı örnekleme

Aşırı örnekleme, örnek başına bit sayısını değiştirmeden PCM sesinin dinamik aralığını artırmak için alternatif bir yöntemdir. Aşırı örneklemede, ses örnekleri istenen örnekleme hızının katlarında elde edilir. Niceleme hatasının frekansla eşit olarak dağıldığı varsayıldığından, niceleme hatasının çoğu ultrasonik frekanslara kaydırılır ve oynatma sırasında dijitalden analoğa dönüştürücü tarafından kaldırılabilir .

n ek çözünürlük bitine eşdeğer bir artış için , bir sinyalin aşırı örneklenmesi gerekir.

Örneğin, 14 bitlik bir ADC, 16× aşırı örneklemede veya 768 kHz'de çalıştırılırsa 16 bit 48 kHz ses üretebilir. Bu nedenle, aşırı örneklenmiş PCM, aynı çözünürlüğü elde etmek için daha fazla örnek için örnek başına daha az bit değiştirir.

Dinamik aralık, kaynakta aşırı örnekleme olmadığında, sinyal yeniden oluşturma sırasında aşırı örnekleme ile de geliştirilebilir. Yeniden yapılandırmada 16× aşırı örneklemeyi düşünün. Yeniden oluşturma sırasındaki her bir numune, orijinal numune noktalarının her biri için, tümü bir dijital yeniden yapılandırma filtresi tarafından hesaplanmış olan on altı eklendiğinden benzersiz olacaktır . Arttırılmış efektif bit derinliği mekanizması daha önce tartışıldığı gibidir, yani nicemleme gürültü gücü azaltılmamış, ancak gürültü spektrumu ses bant genişliğinin 16 katı üzerine yayılmıştır.

Tarihsel not—Kompakt disk standardı, Sony ve Philips arasındaki bir işbirliği ile geliştirilmiştir. İlk Sony tüketici biriminde 16 bitlik bir DAC bulunuyordu; ilk Philips üniteleri çift 14 bit DAC'ler. Bu, pazarda ve hatta profesyonel çevrelerde kafa karışıklığına neden oldu, çünkü 14-bit PCM, 84 dB SNR'ye, 12 dB 16-bit PCM'den daha azına izin veriyor. Philips , CD formatının tam 96 dB dinamik aralığını teorik olarak gerçekleştiren birinci dereceden gürültü şekillendirme ile 4x aşırı örnekleme uygulamıştı . Pratikte Philips CD100, Sony'nin CDP-101'iyle aynı 20Hz-20kHz ses bandında 90 dB SNR'de derecelendirildi.

Gürültü şekillendirme

Bir sinyalin aşırı örneklenmesi, tüm frekanslarda birim bant genişliği başına eşit nicemleme gürültüsü ve yalnızca aşırı örnekleme oranının karekökü ile gelişen dinamik bir aralık ile sonuçlanır. Gürültü şekillendirme, daha yüksek frekanslarda ek gürültü ekleyen ve düşük frekanslardaki bazı hataları ortadan kaldıran ve aşırı örnekleme sırasında dinamik aralıkta daha büyük bir artışa neden olan bir tekniktir. İçin N inci düzey gürültü şekillendirme, bir örneklenmiş sinyalin dinamik aralığı ek olarak 6 ile geliştirilir n  gürültü şekillendirme olmadan yüksek hızda orneklemeye dB'lik. Örneğin, ikinci dereceden gürültü şekillendirme ile 4x aşırı örneklemede örneklenen 20 kHz analog ses için dinamik aralık 30 dB artırılır. Bu nedenle, 176 kHz'de örneklenen 16 bitlik bir sinyal, gürültü şekillendirme olmadan 44,1 kHz'de örneklenen 21 bitlik bir sinyale eşit bir bit derinliğine sahip olacaktır.

Gürültü şekillendirme genellikle delta-sigma modülasyonu ile uygulanır . Delta-sigma modülasyonunu kullanan Direct Stream Digital , 64× aşırı örnekleme ile 1 bit ses kullanarak ses frekanslarında teorik 120 dB SNR elde eder.

Uygulamalar

Bit derinliği, dijital ses uygulamalarının temel bir özelliğidir. Uygulama gereksinimlerine ve ekipman özelliklerine bağlı olarak, farklı uygulamalar için farklı bit derinlikleri kullanılır.

Örnek uygulamalar ve desteklenen ses bit derinliği
Başvuru Açıklama Ses format(lar)ı
CD-DA (Kırmızı Kitap) Dijital medya 16 bit LPCM
DVD-Ses Dijital medya 16-, 20- ve 24-bit LPCM
Süper Ses CD'si Dijital medya 1-bit Doğrudan Akış Dijital ( PDM )
Blu-ray Disk ses Dijital medya 16-, 20- ve 24-bit LPCM ve diğerleri
DV ses Dijital medya 12 ve 16 bit sıkıştırılmamış PCM
ITU-T Tavsiyesi G.711 Telefon için sıkıştırma standardı Sıkıştırmalı 8 bit PCM
NICAM -1, NICAM-2 ve NICAM-3 Yayın için sıkıştırma standartları Sırasıyla 10-, 11- ve 10-bit PCM, sıkıştırmalı
hırs DAW , Paul Davis ve Ardor Topluluğu 32 bit kayan nokta
Profesyonel Araçlar 11 Avid Technology'den DAW 16 ve 24 bit veya 32 bit kayan nokta oturumları ve 64 bit kayan nokta karıştırma
Mantık Pro X DAW, Apple Inc. 16 ve 24 bit projeler ve 32 bit veya 64 bit kayan nokta karıştırma
Küba dili Steinberg tarafından DAW 32 bit kayan nokta veya 64 bit kayan nokta için ses işleme hassasiyetine izin verir
Ableton Canlı Ableton tarafından DAW 32 bit kayan nokta bit derinliği ve 64 bit toplama
neden 7 Propellerhead Software tarafından DAW 16-, 20- ve 24-bit G/Ç, 32-bit kayan nokta aritmetiği ve 64-bit toplama
Azrail 5 DAW, Cockos Inc. 8-bit PCM, 16-bit PCM, 24-bit PCM, 32-bit PCM, 32-bit FP, 64-bit FP, 4-bit IMA ADPCM & 2-bit cADPCM oluşturma ;

8 bit int, 16 bit int, 24 bit int, 32 bit int, 32 bit kayan nokta ve 64 bit kayan nokta karıştırma

GarageBand '11 (sürüm 6) DAW, Apple Inc. 24 bit gerçek enstrüman kaydı ile 16 bit varsayılan
cüret Açık kaynak ses düzenleyici 16 ve 24 bit LPCM ve 32 bit kayan nokta
FL Stüdyo Image-Line ile DAW 16 ve 24 bit int ve 32 bit kayan nokta (işletim sistemi tarafından kontrol edilir)

Bit hızı ve dosya boyutu

Bit derinliği, bit hızını ve dosya boyutunu etkiler . Bitler, bilgi işlem ve dijital iletişimde kullanılan temel veri birimidir. Bit hızı, saniyede iletilen veya alınan veri miktarı, özellikle bitler anlamına gelir. In MP3 ve diğer kayıplı sıkıştırılmış ses formatları , bit hızı, bir ses sinyalini kodlamak için kullanılan bilgi miktarını tanımlamaktadır. Genellikle kb/s cinsinden ölçülür .

Ayrıca bakınız

Notlar

Referanslar

  • Ken C. Pohlmann (15 Şubat 2000). Dijital Ses İlkeleri (4. baskı). McGraw-Hill Profesyonel. ISBN'si 978-0-07-134819-5.