".mp3" (MPEG-1 III) nedir?

qυєєη

Elit Üye
Yeni Üye
Apple Sever
Katılım
19 Haz 2018
Konular
70
Mesajlar
434
Tepkime puanı
122
Puanları
2,254
Multimedya kategorisinin ilk konusuna hoş geldiniz. Burayı sırf bu ve devamı gelecek rehberlerim için istedim. Tabii ki sorusu olana, çözüm isteyene de yardım ederim, o ayrı. Yazdıklarımda sesle ilgili tıbbi ve teknolojik terimlerin neredeyse hepsini, konu bütünlüğünü yitirtmeyecek şekilde es geçtim. Bilimsel bir makaleden çok, kavramların anlaşılması ve akılda küçük bir yer edinebilmesi için yazdım yani, sonrasında geleceklerde de böyle yapmaya çalışacağım.


Sıkıştırılmış Ses Dosyası Formatları -1-

.mp3

MP3, MPEG-1'in* bir parçası olan sıkıştırılmış ses dosyası formatıdır. 1993 yılında bu pakete eklenen MP3, daha sonraları MPEG 2 ve 2.5 ile revize edilse de bu paketlerin amacı düşük bitrate, az boyut olmasından dolayı bugün o halleriyle kullanılmamaktadır. MP3'ün ayrıntılarına geçmeden önce, şimdi; gelin biraz MP nedir, ona bakalım.

MP nedir?
Aslında böyle bir şey yok. Konuya MP nedir diye başlamamın sebebi, bunun bir seri olduğu ve günümüzde 3. versiyonunun kullanıldığı hakim, hatalı görüş. MP aslında MPEG'deki ilk iki harf. Tam açılımlarına bakalım:

MP1: MPEG-1 Audio Layer I
MP2: MPEG-1 Audio Layer II
MP3: MPEG-1 Audio Layer III
(MPEG: Moving Picture Experts Group* yani Hareketli Görüntü (burda kastedilen medya) Uzmanları Birliği)

MP1 ve MP2 iki sanılanın aksine MP3'le birlikte piyasaya sürüldü. 1 ve 2'nin amacı daha basit algoritmalarla, kalitenin önemli olmadığı sesleri en düşük boyutlara çekebilmek. Yakın zamana kadar telefon tuş sesleri, basit alarm saatlerinin sesleri gibi az işlem gücü ile halledilmesi gereken alanlarda bunlar kullanılmaya devam ediliyordu. Ancak OGG formatının gelişmesi ile bu alanlarda egemen olması, MP1 ve MP2 için yolun sonu oldu. MPEG-1 audio III ise 320 kbps değerine kadar çıkabildiği için hâlâ kullanılmaktadır. Ana konuya gelelim:


MP3

Tarihçesi - MP3 ve öncesi

MP3 çıkmadan önce farklı ses dosyaları da mevcuttu. Ancak bu dosya formatları, mikrofonun en geniş frekans aralığında sesi sıkıştırdıktan sonra kaydediyordu. Yani mikrofonun duyup da insan kulağının duymadığı aralıklar da veri olarak yazılıyor. Bu, o zamanlar için sınırlı olan boyutların, gereksiz şeylerle doldurulması demek. 1985'e değin bu frekansların yazılıp yazılmamasıyla ilgili tartışmalar sürerken Bishnu S. Atal adında bir Hint ses mühendisi Manfred R. Schroeder'ın teknolojik yardımlarıyla celp adında bir format geliştirdi ve aynı sesin (insan kulağının duyduğu aynı sesin) çok daha düşük boyutlarda saklanabileceğini gösterdi. celp formatının anlayışını devam ettirmeyen format ise kalmadı. Bugün son tüketici tarafından kullanılan hiçbir format, 20 Hz - 20 kHz aralığı dışında frekansları kaydetmiyor. Buna kayıpsız formatlar (WAV, FLAC, ALAC)** da dahil. Bu aralık dışındaki sesler, yazma esnasında geri dönmeyecek şekilde siliniyor. Yalnız bilimsel çalışmalarda farklı formatlarla kaydedilmeye devam ediliyor gerekli aralıklardaki sesler.


Geliştirilme süreci
MP3'ün geliştirilmesinde yer alanlar:
Avrupa ve Amerika ayağı
MUSICAM ve ASPEC grupları (grupların başlıca geliştiricileri Philips ve AT&T)
Uzak Doğu ayağı
Fujitsu
Sony
NEC


Frekans Aralığını Optimum Kodlama (OCF) Projesi için bir araya gelen şirketlerin kafasında ortaya çıkmasına sebep olacakları bir kodek yoktu. Kodek algoritması tamamlanan MP3, tamamlanması için MPEG tanımlaması yapıldığı sırada yanlışlıkla ASPEC kodekeriyle birleştirildi ve ortaya çok karmaşık, oynatımı güç lakin seste herhangi bir aksamaya sekme vermeyen bir codec çıktı. Bu ikisinin birlikte kullanımının bir alternatif olabileceğini düşünen mühendisler optimizasyon sorunlarını gidererek MP3'ün son halini her oynatıcı tarafından rahatlıkla çözülebilecek hale getirdiler. Bugün MP3'ün; artması gereken kalitlelere rağmen hâlâ en yaygın format olmasının sebebi kodeklerinin çok rahat çözülmesi, bununla birlikte her aygıtın bu formatı hiç zorlanmadan oynatabilmesidir.


Yapısı

Mp3filestructure.png


(Repeadet, bir bölüm değildir. Çift kanal sesin ikincili repeadet ve sonrasından oluşur. Mono ses, saf haliyle yalnız ilk bölüme sahiptir. Sonradan monoya çevrilen stereo seste alttaki kanal silinmez, alttaki üsttekinin üzerine yazılır.)

MP3 dosyası, şemada belirtilen MP3 çerçevelerinden önce veya sonra gelen ID3 meta verilerinden oluşur. MP3 Veri blokları, frekanslar ve genlikler açısından sıkıştırılmış ses bilgilerini coding etmeyi ve basitçe encoding etmeyi amaçlar. MP3'ün coding algoritması şu mantıkla çalışır:
MP3 kodlama algoritması dört bölüme ayrılmıştır. Bölüm 1; ses sinyalini divide adı verilen daha küçük parçalara böler ve daha sonra çıktı üzerinde değiştirilmiş bir ayrık kosinüs dönüşümü (MDCT) filtresi gerçekleştirilir. (Bu dönüştürme işlemi, AT&T'nin ses sinyallerini iletmek maksadıyla geliştirdiği ve MP3'e sonradan, az önce bahsettiğim yanlışlıkla eklenen filtredir.) Bölüm 2, numuneyi 1024 noktalı Fast Fourier (FFT)*** adı verilen filtreye sokar ardından psikoakustik model uygulanır. Bölüm 3, bit hızı ve optimum frekans haricindeki silmek için kendini gürültü tahsisi olarak bilinen bir ayara sokar ve her bir numuneyi bu ayarla nicelendirir ve kodlar. Bölüm 4, ses çerçevesi adı verilen ve 4 bölümden oluşan, başlık, hata kontrolü, ses verileri ve yardımcı verilerden oluşan kısımdır. Yani albüm kapağı, sanatçı ve şarkı bilgileri gibi ses etiketlerinin yazıldığı kısım.

Kullanıldığı başlıca yerler:
CD - DVD albümler
Deezer baz üyelik
Dijital (somut olmayan) albüm ve şarkıların satışlarındaki ucuz ve düşük boyutlu versiyonlar

Oynatılabildiği ortamlar:
Ses çalma yetisine sahip hemen hemen her cihaz. İşletim sistemi, donanım ve uygulama gibi sınırlamaları yok ve oynatımı her türlü işlemci için çocuk oyuncağı.

Alternatifleri:
AAC
WMA
OGG
ATRAC


*MPEG'nin ve MPEG paketlerinde yer alan diğer formatların neler olduğuna başka konularda değineceğim.
**Bu formatlar kayıpsız ses dosyaları formatlarının en yaygınlarıdır. Her bir formatı da yine ilerleyen konularda anlatacağım.
***Fast Fourier Transform: Bir dizinin ayrık Fourier dönüşümünü (DFT) ya da ters ayrık dönüşümünü hesaplayan bir algoritmadır. (Bunun ne demek olduğunu ben de bilmiyorum. Meraklısı kendisinin bilgi edinebilir.)



 
Geri
Üst