Tom’s Diner…
Vamos lá. Post novo. Pra variar, deve ficar um pouco longo.
Na época de faculdade, ao me dar conta que eu odiava direito, resolvi direcionar o lado jurídico pra parte de Internet, que é o que realmente gosto. Entre outros assuntos, comecei a estudar a questão da evolução do conceito de propriedade intelectual na Sociedade da Informação. Como os direitos autorais existem nesse mundo de dvdrip, mp3, e torrent?
Nesses estudos, resolvi, até por curiosidade própria, aprender um pouco mais sobre o catalisador do processo de compartilhamento de arquivos em grande escala pela internet: o MP3.
Explica-se: a questão de envio, troca de dados via rede é antiga, surgiu nos anos 60. A questão toda sempre foi quantidade de dados X largura de banda de transmissão. Hoje, a banda é imensa, e os dados compartilhados são menores, em função de algoritmos de compressão. São os codecs de que se escuta falar (compressor-decompressor). Temos o dvix, o xvid, entre vários outros (esse assunto é mais da área do Shayani)
Mas, “todo mundo” hoje sabe o que é MP3, mas não sabe direito “o que” é MP3, então pensei em escrever sobre isso.
O MP3 significa “MPEG-1 Audio Layer 3” e é um formato de codificação de informações. No caso em tela, dados de áudio. Ele foi criado pelo “Moving Picture Experts Group” (MPEG), em uma série de laboratorário, com destaque para o Instituto Fraunhofer, na Alemanha (“ze germans, tommy!”)
O seu objetivo é comprimir as informações, alterar, fazer o que for, para reduzir o seu tamanho, podendo assim enviá-las pela rede (hoje, em tempos de real banda larga, acho até mais importante a questão do armazenamento do que a transmissão em si. Eu tenho uns 40 giga de música. Imagina como isso seria sem compressão?)
O MP3 é um tipo de compressão de dados conhecida como lossy (com perda, em oposição a lossless, sem perda), porque informações são perdidas, descartadas. Como, então, conseguimos ainda escutar a música toda? Bom, aí é que está a sacada: quais os dados que são descartados na compressão.
Inicialmente, o que determina isso (e, conseqüentemente, a sua qualidade) é o chamado bit rate , que corresponde à “quantos kilobits o arquivo pode usar por segundo de áudio”. Logicamente, quanto mais kilobits (maior o bit rate) melhor será a qualidade, e maior será o arquivo. Hoje, a maioria dos mp3 que vocês puxam pela internet está codificada num bit rate de 128 kbps. Digo vocês porque eu não faço isso. Pirataria é ilegal e sustenta o tráfico de drogas. Ou seja, pare. A não ser você não seja pego, ou goste de drogas.
Um arquivo comprimido a 128 kbps dará um tamanho final de menos de um décimo do tamanho original do arquivo, e ainda soará (para o grande público) como o arquivo original.
Como isso acontece? Se eles “jogam coisa fora” como ainda escuto tudo? O que foi jogado fora?
Primeiramente, vamos entender como um CD, por exemplo, funciona. O CD tem informações digitais armazenadas. Essas informações estão sem compressão, em alta resolução. Quando o CD é criado, a música é sampleada 44.100 vezes por segundo. Cada sample tem 2 bytes (16 bits) de tamanho. Além disso, o som é gravado duas vezes: para o canal direito e esquerdo do som (stereo). Assim, o CD, que tem em média 740 megabytes, para cada segundo de música está armazenando 44.100 x 16 x 2 bits = 1.411,200 bits por segundo ou 176,000 bytes. Em uma música de 3 minutos, isso dá mais ou menos 32 mega por música. Assim, 740 megabytes dividido por 32 mega, dá 23 e algo. Então, cabem 23 músicas não comprimidas de 3 minutos num CD normal.
Está explicado porque aquele seu CD do Pink Floyd era duplo. Não era só pra lhe cobrarem mais caro.
Então, como o MP3 faz?
Bom, primeiramente, é necessário entender que a audição humana não é perfeita.
Existem sons que não escutamos. Existem sons que escutamos melhor. E, se ouvirmos dois sons em freqüências diferentes ao mesmo tempo, apenas vamos ouvir o mais leve. Então, o que o MP3 faz é “tirar” aquilo que não vamos escutar mesmo. (explicação beeeemm simplificada)
A audição humana apenas percebe sons mais ou menos entre 16z e 16.000hz. Sons acima e abaixo dessa freqüência não serão escutados (pense no apito para cães). Assim sendo, essas partes podem ser retiradas, sem prejuízo para a percepção do som.
Existem também algoritmos de compressão variável ao longo da música, entendendo-se que algumas partes da música são mais simples, e podem ser mais comprimidas, enquanto outras terão um bit rate maior.
Hoje, usamos o termo MP3 pra tudo, mas na verdade há outros encoders, mais recentes, e melhores (embora muitos deles sejam proprietários, e tenham DRM (Digital Rights Management) como forma de combater a pirataria.
Bom, pra variar, me alonguei. E, evitei entrar na questão técnica mesmo por uma série de motivos. Primeiramente, porque não é este o escopo deste blog, e essa informação está disponível na net. E, porque trata-se de algo complexo (em um certo momento, li o termo “psychoacoustic”) e acho que você, caro leitor, não conseguiria entender as filigranas envolvidas (tá, tá, eu também não…).
Foi mais pra dar um ideia sobre o assunto, e porque estou preso no trabalho, sem vontade de produzir, e o blog anda meio às traças.





Certo. Resolvi abraçar o papel de uber-geek do grupo, pelo menos no que se refere às coisas menos técnicas.







Últimos comentários