Ses Sinyali Nedir, Formatları Nelerdir?

Hızlı Bakış

Ses sinyali, 20 Hz ile 20 kHz arasındaki analog titreşimleri dijital veriye dönüştürüyor. Bu işlem, örnekleme hızı sayesinde saniyede 44.100 kez anlık genlik ölçümü alıyor. Dalga formatları, mikrofonun yakaladığı ham sesi olduğu gibi saklıyor. MIDI ise notaları ve enstrüman bilgilerini bir dizi halinde kaydediyor. MOD gibi karma formatlar hem örnek hem de nota dizisini birleştiriyor. Böylece yüksek kaliteli müziği minimum depolama alanıyla çalma imkanı buluyorsunuz.

Ses sinyali, bir ses sinyali için elektriksel olarak doğru olan bir analog sinyaldir. Normalde insanlar tarafından duyulabilen frekans aralığı 20 ile 20.000 Hz arasındadır, yaklaşık olarak eşdeğerdir, neredeyse 10 oktavdadır.

Ses Sinyali Tanımı ve Özellikleri

Dijital İletişimde Ses Formatı Nedir?

Dijital ses dosyası, bir bilgisayarda saklanmak için sayısal bir biçime dönüştürülmüş bir ses veya ses dizisidir. 3 genel ses formatı tipini ayırt edebiliriz:

Dalga Biçimleri

Bilgileri bir mikrofon tarafından yakalandığı gibi saklar, sesin genliğini ve frekansını belirli bir zaman diliminde saklar.

Bu zaman dilimi, ses dosyasının örnekleme hızı olarak bilinir ve genellikle mikrofonun her saniyede dinlediği şeyden alınan örnek sayısında ölçülür. Genel değerler 11000 Hz, 22000 Hz ve 44000 Hz’dir. Bu sayı ne kadar yüksek olursa ses kalitesi o kadar iyi olur. Ağ üzerinde en yaygın kullanılan formatlar dalga formatlarıdır.

Dizi Formatları

Notları bir çeşit MIDI girişinden (Music Instrument Digital Interphase) okuyarak saklarlar. Bazı kanallar kaydedilir ve belirli kanallara yerleştirilir.

Her kanalın nasıl oynatılacağını tanımlayan bilgisayara ve uluslararası bir standarda bırakılmıştır. Tipik örnek tam olarak MIDI’dir.

Karışık Formatlar

Başlangıçta ses dalgası formatlarına benzer şekilde her kanalın nasıl ses çıkaracağına dair bir örnek depolarlar ve daha sonra her kanal için bir dizi not kaydederler.

Bu formatın tipik örneği, mükemmel ses kalitesi üretme kabiliyeti nedeniyle tam olarak birkaç sistemde çalışan ve aynı zamanda depolandığında çok az disk alanı kaplayan MOD’dur.

Ses dosyaları, hangi araçlara veya uygulamalara ve hangi amaçlarla oluşturulduğuna bağlı olarak farklı biçimlere sahiptir. Belirli bir uygulamayla çalışırken yazılım, daha sonra tanımlayabilmek için oluşturulan dosya türüne bağlı olarak bir uzantı atar.

Bazıları videonun oynatılmasına izin verse de ana ses formatları şunlardır:

Ses Değişim Dosyası Biçimi (AIFF)

Apple tarafından oluşturulan, Mac bilgisayarlarda ve sesli ve görsel içeriklerde kullanılır, ancak Web’de çok yaygın değildir. .Aif (F) ve .snd uzantıları.

Unix için Ses (AU) – Au, uLaw ve MuLaw Uzantısı

Sun şirketi tarafından oluşturulan ve çok sıkıştırılmamış numuneler için çok popüler bir formattır. İnternette, özellikle Unix platformlarında en eskilerinden biridir.

Ses-Video Araya Eklenmiş (AVI)

Microsoft tarafından oluşturulmuştur. Kendi başına bir biçim değil, bir ses/video kabıdır. Görüntülemek için codec bileşenlerini ve Windows oynatıcıyı yüklemiş olmanız gerekir.

Director/Yönetmen (DIR)

Macromedia tarafından oluşturulan dosyalar DIR dosyaları .İr ve .dxr uzantılarıdır.

MIDI (Music Instrument Digital Interface/Müzik Enstrümanı Dijital Arayüzü) – .Mid Uzantısı

Bu tür dosyalar PC sentezleyicileri kullanılarak oluşturulur. MIDI dosyaları notaları ve diğer sekans bilgilerini temsil eder, böylece müzik sentezlenebilir.

MOD – .Mod ve .Dxr Uzantıları

Bu biçim Commodore tarafından oluşturulan Amiga platformlarından kaynaklanmıştır. Dijital modülleri yeniden üretmek için başka bir biçim türüdür. MIDI, S3M, FAR veya MTM gibi, tüm bu formatlar müzik modelini ve bir dizi örneği içerir, böylece modelin müziği uygun enstrümanla çalınabilir.

MPEG Ses

MPEG (Moving Pictures Experts Groups) tarafından oluşturulmuştur. Bu, ses sinyalinin 3 farklı kodlama-kod çözme seviyesini tasarlayan bir ses sıkıştırma formatı standardıdır.

Ses ve Medya Oynatıcılar

Farklı ses biçimi türlerini okumak için, ses sesini çalan ve genellikle Internet Explorer veya Google Chrome gibi ana web tarayıcılarından dinlemeye izin veren eklentiler veya programlar içeren bir oynatıcıya ihtiyacınız vardır.

Taşınabilir ses söz konusu olduğunda, bilgisayara ek olarak, bir MP3 çalar programı ile, bilgisayardan bağımsız diğer cihazlarda, özel olarak tasarlanmış taşınabilir bir cihazla veya başka bir oynatıcı aracılığıyla MP3 formatındaki şarkıları ve sesleri dinleyebiliriz bu tür dosyaların okunmasını ve çoğaltılmasını destekler.

Günümüzde, birçok DVD veya DTV oynatıcı (Dijital TV), Dolby Digital surround ses sistemi ile birleştirilebilen seçeneğe sahiptir. Bu seçenek hatta cep telefonlarında bile vardır.

Dijital Ses

Dijital ses, örnekleme frekansı ile ölçülür, yani, belirli bir süre boyunca sesin kaç kez dijitalleştirildiğini ölçmeniz gerekir.

Örnekleme hızları, sesin saniyede kaç kez örneklendiğini gösteren kilohertz (kHz) cinsinden belirtilir. Örneğin, CD ses kalitesi 44.1 kHz veya saniyede 44.100 örnekte elde edilir.

Stereo ses durumunda, her biri 8 bitlik iki kanal gereklidir; Örnek başına 16 bit olduğunda bu, bir CD’den 705.600 bit veriyle sonuçlanarak yüksek kaliteli ses üretir. Sesi ağ üzerinden bu şekilde iletecek olsaydık, bu muazzam miktarda verinin iletimi ağın bant genişliğinin neredeyse yarısını kaplardı.

Ortalama web kullanıcılarının bant genişliği boyutu olmadığından, web üzerinden gönderilebilen dijital bir ses oluşturmak için örnekleme frekansını azaltmak gerekir.

8 kHz mono örnekleme hızı, konuşma dili gibi basit uygulamalar için iyi sonuçlar verir. Oynatma donanımının genellikle basit bir ses kartı ve küçük bir hoparlörden oluştuğunu unutmayın.

Düşük kaliteli ses saniyede 64.000 bitten fazla veri gerektirmez, ancak kullanıcının sesin indirilmesini beklemesi gerekir ve sürekli ses neredeyse imkansızdır.

DAT (veri) sistemleri gibi ses CD’leri, en basit kodlama biçimlerinden biri olan ve telefonda yaygın olarak kullanılan PCM (Pulse Code Modulation/Darbe Kodu Modülasyonu) veya kodlanmış darbe modülasyonu kullanarak sinyalin sayısallaştırılmasını kullanır.

Bununla birlikte, bu kodlama sistemleri tarafından saklanan ses bilgilerinin çoğu atılabilir, çünkü insan kulağı belirli bir kritik bant adı verilen belirli frekansları algılayamaz.

Sayısallaştırma sinyale gürültü ekler ve bundan kaçınmak için, bir sayısallaştırma işleminin oluşturulduğu 2 aşaması olan örnekleme ve nicelemede daha fazla sayıda bit kullanmak gerekir.

Yüksek kaliteli ses elde etmek için CD durumunda 44,1 kHz ve DAT durumunda 48 kHz’e kadar frekanslar kullanılır. Nicemleme ile ilgili olarak, ne kadar çok bit kullanılırsa, çözünürlük de o kadar iyi olur.

44.1 kHz’de ve sinyali ölçmek için 16 bit kullanarak (Hi-Fi Ses), CD’deki iki kanaldan biri 700 kbit/s’den fazla üretir.

Ses Standları

1982’de ilk müzik CD’sinin piyasaya sürüldüğü ve aynı yıl oyuncuların ticarileştirildiği unutulmamalıdır, bu nedenle dijital sesin kısa bir gelişme süresi vardır ve daha da net aracılığıyla müzik veya ses dinleme olasılığı vardır. Ana dijital ses destekleri şunlardır:

CD-A (Compact Disc Audio/Kompakt Disk Ses)

Bu, dijital ortamda çok kaliteli bir sestir ve daha fazla işlem yapmadan dijital bir kayda dayanır, yani kayıtta üretilen tüm bilgiler sıkıştırma olmadan kompakt diskte saklanır.

Normal 650 Mb’lık bir CD’de, bu bize CD başına yaklaşık 74 dakika maksimum süre verir, bu nedenle uzun zamandır beklenen vinil kayıtlarının veya LP’lerin içerdiği tüm bilgilere uyar.

CD-R (Recordable Compact Disc/Kaydedilebilir Kompakt Disk)

Yeniden yazmayı desteklemeyen boş bir CD’dir.

CD-RW (Rewritable Compact Disk/Yeniden Yazılabilir Kompakt Disk)

Yeniden yazmayı destekleyen boş bir kompakt disktir.

HDCD (High Definition Compatible Digital/Yüksek Tanımlı Uyumlu Dijital)

Pacific Microsonics şirketi tarafından standart ses CD’lerinin geliştirilmesi için geliştirilen High Definition Definition Digital, ses kodlama işlemidir.

SACD ve DVD Audio gibi yeni ses formatlarının tanıtılmasıyla yaşam döngüsü kısa sürdü.

SACD (Super Audio Compact Disk/Süper Ses Kompakt Disk)

Dijital sinyal üretmek için SDS veya Direct Stream Digital sistemini kullanan Sony ve Philips tarafından tanıtılan CD ortamında yüksek tanımlı bir ses formatıdır. Geleneksel stereo bilgileri CD’ye kaydedilebilir, ancak ek kanal bilgilerinin dahil edilmesi için yer vardır.

DVD Ses

DVD’de 24 bit çözünürlük ve 16 k/44 kHz CD Audio’nun çok üzerinde 192 kHz örnekleme hızı ile çalışan yüksek tanımlı bir ses formatıdır.

VCD (Video Compact Disc/Video Kompakt Disk)

Performansından ve kalitesinden DVD’den çok daha düşük, ancak yaygın olarak uygulanan CD ortamında bir video biçimidir.

Analog Dalgalardan Dijital Bitlere: Ses Dosyaları Hakkında SSS

Bir ses sinyalini analogdan dijitale çevirirken aslında tam olarak ne oluyor?

Bunu mikrofona konuştuğun an ile bilgisayarın onu anladığı an arasındaki yolculuk olarak düşün. Ses sinyali, havada yayılan upuzun ve pürüzsüz bir dalga. Bilgisayar bu dalgayı anlayamaz. Ona sadece sayılar lazım.
İşte burada örnekleme devreye giriyor. Ses kartı saniyede on binlerce kez dalganın yüksekliğine bakıp anlık bir değer atar. Bu işleme niceleme denir. Pürüzsüz eğriyi alır, onu ufacık merdiven basamaklarına çevirirsin. Örnekleme hızın ne kadar yüksekse, o merdivenin basamakları o kadar sıklaşır.
Nihayetinde insan kulağı artık bu basamakları değil, kayıpsız bir ses işitir. İşin sırrı tam da burada. Saniyede 44 bin 100 örnek alırsan, CD kalitesinde bir şaheser elde edersin.

Müzik yapımcılarının kullandığı MIDI formatı neden MP3 veya WAV gibi davranmıyor?

MIDI, bildiğiniz kayıt formatlarından tamamen farklı bir zihin yapısına sahiptir. Bir WAV dosyası sesin fotoğrafını çeker. MIDI ise sadece bir tarif defteridir. İçinde enstrümana ‘şu notayı, şu hızda, şu kadar süre çal’ diyen emirler vardır.
Yani MIDI dosyası tek başına bir sese sahip değildir. Kalitesi tamamen onu çalan sentezleyiciye bağlıdır. 90’ların efsane oyun müziklerini hatırla. Aynı MIDI dosyası, pahalı bir Roland cihazında büyüleyici tınlarken, ucuz bir bilgisayar hoparlöründe ciyaklama gibi duyulurdu.
Saklama alanı açısından ise bir devrimdir. Dakikalarca süren orkestral bir parça, bir text mesajı kadar yer kaplar. Zira o sadece bir veri akışıdır, sesin kendisi değil.

Kalite kaybı olmadan dosyayı küçültmek mümkün mü, yoksa MP3 bizi kandırıyor mu?

Açık konuşalım, MP3 bir illüzyon ustasıdır. İnsan kulağının psikoakustik zaaflarını acımasızca kullanır. Ses sinyali sıkıştırılırken, kulağın duyamayacağı frekanslar çöpe atılır. Yüksek bir zil sesiyle aynı anda çalan kısık bir bas notasını asla ayırt edemezsin. MP3 işte o bas sesi siler.
Dolayısıyla bu işlem kayıplıdır. Attığın verileri geri getiremezsin. Elbette bu kaybı sıradan kulaklıklarla asla fark edemezsin. Lakin stüdyo monitörlerinde MP3, orijinal kayda kıyasla cansız ve düz gelir.
Buna karşın FLAC gibi formatlar kayıpsızdır. Tıpkı bir zip dosyası gibi sesi sıkıştırır ama hiçbir veriyi yok etmez. Arşivcilik için tek gerçek yol budur.

Farklı ses formatları arasında seçim yaparken neye dikkat etmeliyim?

Kararını tamamen amacına göre şekillendirmelisin. Eğer bir müzisyensen ve projeni miks için göndereceksen, WAV veya AIFF gibi sıkıştırılmamış dalga formatlarını tercih et. Bunlar ham veriyi tutar. Miks mühendisinin işleyeceği bolca malzeme verir.
Günlük dinleme ve telefon hafızası içinse MP3 veya AAC idealdir. Hem mükemmel bir yerden tasarruf sağlarsın hem de kalite kaybı kulaklıkla anlaşılmaz. Ağırlıklı olarak web tabanlı bir iş yapıyorsan, akış formatlarına yönel. Tarayıcılar bu ham formatları oynatmakta iyi değildir.
Neticede tek bir doğru yok. Format seçimi bir ödünleşimdir. Yerden tasarruf et, kaliteyi kontrol et, uyumluluğu garanti altına al.

CD kalitesi 44.1 kHz olarak kabul ediliyor. Bu rakam neden farklı bir sayı değil de tam olarak bu?

Bu sihirli sayının ardında Nyquist Teoremi yatıyor. Bu teorem, sinyali kayıpsız yakalamak için en yüksek frekansın en az iki katı hızda örneklemen gerektiğini söyler. İnsan kulağı en fazla 20 kHz’i duyar. Bunun iki katı 40 kHz eder.
Mühendisler güvenlik payı ekleyip 44.1 kHz’de karar kıldı. Peki neden 44.1? İlk dijital ses kayıtları video kasetlerine yapılıyordu. Mühendisler bu rakamı video sinyalinin çizgi ve alan sayılarıyla uyumlu olacak şekilde hesapladı. Tamamen fiziksel bir uyumluluk şartıydı.
Böylece bu standart, sırf geçmişle uyumlu kalsın diye bugün hâlâ baş tacımız. Daha yüksek hızlar var ama 44.1, müzik endüstrisinin değişmez temel taşı olarak kaldı.

Sıkıştırılmış bir ses dosyasını tekrar orijinal kalitesine döndürmek neden imkansız?

Bir küp şeker ile bir kahve çekirdeğini düşün. Şekeri kahveye atıp karıştırdığında artık onu ilk haline getiremezsin. Kayıplı sıkıştırma da tam olarak budur. Ses sinyali sıkıştırılırken, kodlayıcı gereksiz gördüğü harmonikleri ve tınıları fiziksel olarak siler.
O veri artık dosyada yoktur. Formatı dönüştürüp MP3’ü WAV yapmak, sadece kalan sesi daha büyük bir kaba boşaltmak demektir. Kaba su ekleyerek şekeri geri alamazsın. Ses de aynıdır. Dalga formu yeniden çizilir ama kaybolan detaylar gömleğin cebi gibi boş kalır.
Bunu akustik bir anı kaybı olarak gör. Bu nedenle ana kayıtlar her zaman sıkıştırılmamış bir formatta saklanır.

Bu Rehberi Keşfettikleri İçin Sana Teşekkür Edecekler!

Sadece bir tıkla sevdiklerine dev bir iyilik yapmaya hazır mısın? Bilgi paylaştıkça devleşir.

İlk yorumu sen paylaş