MP3 Nedir, Ne İşe Yarar?

MP3 (MPEG-1 Ses Katmanı 3), MPEG (Moving Picture Experts Group) tarafından MPEG video formatının 1 versiyonunun bir parçası olmak üzere geliştirilmiş kayıplı bir sıkıştırılmış dijital ses formatıdır.

MP3 Nedir, Ne İşe Yarar?

MP3 Dosyası ve Uzantısı Nedir?

MP3’ün standart değeri 144 kHz ve kalite/boyut oranı için 317 kbps bittir. Bu terim MPEG-1 Ses Katmanı 3’ün kısaltmasıdır ve bir MP3 çalar ile karıştırılmamalıdır.

Tarihi

MP3 uzantısı, Thomson Multimedia ile birlikte MP3 ile ilgili patentlerin çoğunu kontrol eden Fraunhofer-Gesellschaft Alman araştırma merkezleri ağının bir parçası olan Fraunhofer IIS Enstitüsü’nün elektronik medya teknolojileri direktörü Karlheinz Brandenburg tarafından geliştirilmiştir.

Birinci versiyon 1986’da yayınlandı fakat 1991’de geliştirilmiş sürümler devam etti. Ancak Brandenburg, bilgisayarında tuttuğu MP3 ile ilgili dosyalar için .mp3 uzantısını ilk kez Temmuz 1995’de kullandı.

Bir yıl sonra, enstitüsü patentler için 1,2 milyon avro ödedi ve on yıl sonra bu miktar 26,1 milyona ulaştı.

MP3, sıkıştırma kalitesini, saniye başına boyut bit hızı ile orantılı olarak ayarlayabilme ve dolayısıyla dosyanın kaplayabileceği son boyut ayarlaması sayesinde ses akışı ve yüksek kaliteli ses için orijinal sıkıştırılmamış dosyadan 12 ve hatta 15 kat daha az olan standart oldu.

Müzik dosyalarının değişimini mümkün kıldığı için İnternet sayesinde popüler hale gelen ilk ses sıkıştırma formatıdır.

Bu tür dosyaların paylaşılma kolaylığının sonucunda Napster ve AudioGalaxy gibi şirketlere yönelik yasal işlemler başlatıldı.

Müzik kanallarında (stereo) otonom, taşınabilir veya entegre oynatıcıların geliştirilmesinden sonra, MP3 formatı bilgisayar dünyasının vazgeçilmez bir unsuru oldu.

2002’nin başında, Windows Media Audio ve Ogg Vorbis gibi diğer sıkıştırılmış ses formatları, programlara, işletim sistemlerine ve oynatıcılara büyük ölçüde dahil edilmeye başladı ve bunun sonucunda MP3’ün diğer formatlar karşısında yavaş yavaş kullanılmayacağı öngörüldü.

MP3 ses formatının düşüşünü etkileyen faktörlerden biri de patent sorunlarıdır.

Teknik olarak, kalitesinin düşük veya üstün olduğu anlamına gelmez, ancak topluluğun onu geliştirmeye devam etmesini önler ve bazı codec bileşenlerinin kullanımı için ödeme yapmaya zorlayabilir, bu durum MP3 çalarlarda olan birşeydir.

Yine de, MP3 dosya formatı ve uzantısı günümüzde en çok kullanılan ve en başarılı buluşlardan biridir.

Ses formatını daha karmaşık hale getiren hibrit filtre bankası olarak adlandırılan MPEG-1 ve MPEG-2 standartları ile ilgili farklılıklar vardır.

Frekans çözünürlüğündeki bu gelişme, öngörülen ve düzeltilen yankı öncesi problemler getirerek zamansal çözünürlüğü kötüleştirir ve 64 kbps’ye kadar düşük hızlarda ses kalitesi sağlar.

Filtre Bankası

Bu katmanda kullanılan filtre bankası, hibrit çok fazlı / MDCT filtre bankasıdır.

Zaman alanını hem kodlayıcı hem de kod çözücü yeniden yapılandırma filtreleri için frekansla eşlemekten sorumludur.

Değişken frekans çözünürlüğü, 6×32 veya 18×32 alt bantlar sağlar ve farklı frekansların kritik bantlarına çok daha iyi ayarlanır.

18 nokta kullanıldığında, maksimum frekans bileşeni sayısı 32 x 18 = 576’dır. Bunun sonucu olarak 24000/576 = 41,67 Hz frekans çözünürlüğü elde edilir.

6 frekans çizgisi kullanılırsa, frekans çözünürlüğü daha düşüktür, ancak zamansal çözünürlük daha yüksektir ve eko öncesi etkilerin yüksek enerji seviyelerinde ani sessizlik geçişleri beklendiği alanlarda uygulanır.

Katman III, 32 filtre bankası çıkışının tümünün pencerelerden ve MDCT dönüşümlerinden geçebileceği üç çalışma bloğu moduna ve en düşük iki frekans bandının uzun bloklar ve ilk 30 bandın kısa bloklar kullandığı karışık bir blok moduna sahiptir.

MPEG-1 standardı için üçüncü ses katmanı anlamına gelen MPEG-1 Ses Katmanı 3’ün özel durumu için dört tür pencere belirtir; normal, uzun pencereden kısa pencereye geçiş (BAŞLAT), 3 kısa pencereden (KISA) ve kısa pencereden uzun pencereye geçiş (DURDUR).

MP3 Yapısı

Bir Mp3 dosyası, bir başlık ve verilerden oluşan farklı çerçevelerden oluşur ve bu veri elementer stream olarak adlandırılır.

Çerçevelerin her biri bağımsızdır, yani bir kişi bir MP3 dosyasının çerçevelerini kesebilir ve daha sonra bunları herhangi bir MP3 çalarda çalabilir.

Başlık, geçerli bir karenin başlangıcını belirtmek için kullanılan bir senkronizasyon kelimesinden oluşur.

Psikoakustik Model

Sıkıştırma, alakasız dinamik aralığın azaltılmasına, yani işitme sisteminin maskeleme koşulları altında niceleme hatalarını tespit edememesine dayanır.

Bu standart, sinyali kritik bantlara yaklaşan frekans bantlarına böler ve ardından her alt bandı o bant içindeki gürültü algılama eşiğine göre nicelleştirir.

Psikoakustik model bir değişikliktir ve polinom tahmini olarak adlandırılan bir yöntem kullanır.

Ses sinyalini analiz eder ve frekansın bir fonksiyonu olarak sokulabilen gürültü miktarını, yani frekansın bir fonksiyonu olarak maskeleme miktarını/eşiğini hesaplar.

Kodlayıcı bu bilgileri, kullanılabilir bitleri harcamanın en iyi yoluna karar vermek için kullanır.

Bu standart, farklı karmaşıklık model I’in psikoakustik model II’den daha az karmaşık olduğu iki psikoakustik model sağlar ve hesaplamaları büyük ölçüde basitleştirir.

Bu durumda, üretilen bozulmanın, 256 kbps ve normal koşullar altında optimal bir ortamda deneyimli kulağa algılanamayacağını göstermektedir.

128 kbps veya 96 kbps’ye kadar deneyimsiz veya ortak kulak için, bas eksikliğinin aşırı derecede farkedildiği ve tiz sesinin yüksek olduğu ses kalitesine sahip olmadığınız sürece iyi bir ses duyabilirsiniz.

Çok fazla müzik dinleyen ve deneyime sahip insanlar, 192 veya 256 kbps’den sesi iyi duyabilir. İnternette dolaşan müzik çoğunlukla 128 ila 192 kbps arasında kodlanmıştır.

Kodlama

Bu standart tarafından bitlerin veya gürültünün dağıtımı, dahili ve harici bir döngüden oluşan bir yineleme döngüsünde yapılır.

Hem filtre bankası çıktı örneklerini hem de psikoakustik model tarafından sağlanan sinyal-maske oranını (SMR) inceler ve bit hızı gereksinimlerini ve maskelemeyi aynı anda karşılamak için kullanılan şemaya bağlı olarak bit veya gürültü ayarlanabilir.

   Dahili Döngü

Dahili döngü, her bir MDCT spektral değerinin 3/4 gücüne yükseltildiği kayan nokta sistemine göre eşit olmayan nicemleme yapar.

Çevrim belirli bir nicemleme aralığı seçer ve Huffman kodlaması bir sonraki bloktaki nicelenmiş verilere uygulanır.

Huffman ile kodlanan nicelenmiş değerler, izin verilen maksimum bit sayısından daha az veya eşit sayıda bit kullandığında döngü sona erer.

   Harici Döngü

Şimdi dış döngü, her alt bant için ölçek faktörünün izin verilenden daha fazla bozulmaya sahip olup olmadığını doğrulamaktan sorumludur. Ölçek faktörünün her bandını daha önce psikoakustik analizde hesaplanan verilerle karşılaştırır.

Harici döngü, her iki ölçek faktörü bandında fazla gürültü olmadığında veya bir sonraki yineleme bantlardan birini izin verilenden daha fazla arttırdığında sona erer. Sonuçta, bantlar en az bir kez amplifiye edilmiştir.

Bit Akımı Paketleme

Bu blok, ses verileriyle birlikte nicelenen örnekleri filtre bankasından alır ve kodlanan sesi ve bazı ek verileri karelerde saklar.

Her çerçeve 1152 ses örneğinden bilgi içerir ve bir başlık, ses verileri ve CRC tarafından hata kontrolü ve yardımcı verilerden oluşur.

Başlık, kodlanmış ses için hangi katmanın, bit hızının ve örnek hızının kullanıldığını açıklar.

Çerçeveler aynı senkronizasyon ve farklılaştırma üstbilgisiyle başlar ve uzunlukları değişebilir.

Bu bilgi ile uğraşmanın yanı sıra, bilgi kaybı olmadan fazlalığı ortadan kaldıran bir kodlama yöntemi olan değişken uzunlukta Huffman kodlamasını da içerir.

Bilgiyi kodlamak için sıkıştırma sonunda hareket eder.

Değişken uzunluklu yöntemler genellikle en sık karşılaşılan olaylara kısa sözcükler atayarak, en sık rastlananlar için uzun kelimeler bırakarak karakterize edilir.

   İlgili Yazılar


Mobil Telefon Nedir?
CD Medyası
DVD Medyası
Bluray Medyası
Ses Formatları

Add a Comment

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

error: