Puikus garso mitas: kodėl jums nereikia to 32 bitų DAC

Autorius: Randy Alexander
Kūrybos Data: 1 Balandis 2021
Atnaujinimo Data: 1 Liepos Mėn 2024
Anonim
How to use ESP32 with Arduino IDE full details with examples and code
Video.: How to use ESP32 with Arduino IDE full details with examples and code

Turinys


Kaip jau tikriausiai pastebėjote, išmaniųjų telefonų pramonėje pastebima nauja tendencija - „studijos kokybės“ garso lustus įtraukti į šiuolaikinius pavyzdinius išmaniuosius telefonus. Nors 32 bitų DAC (skaitmeninis į analoginį keitiklį) su 192 kHz garso palaikymu specifikacijų lape tikrai atrodo gerai, tiesiog nėra jokios naudos padidinti mūsų garso įrašų kolekcijas.

Aš čia norėčiau paaiškinti, kodėl šis bitų gylis ir imties dažnis gali pasigirti tik dar vienu garso pramonės pavyzdžiu, kuris pasinaudoja tuo, kad trūksta žinių apie vartotoją ir net garsoofilus. Nepamirškite savo strėnų dangtelių, mes pateksime į rimtus techninius dalykus, kad paaiškintume profesionaliojo garso pranašumus ir trūkumus. Ir tikiuosi, kad aš jums taip pat įrodysiu, kodėl turėtumėte nepaisyti daugelio rinkodaros principų.

Ar girdi tai?

Prieš miegą, šiame pirmame segmente pateikiama tam tikra reikalinga pagrindinė informacija apie dvi pagrindines skaitmeninio garso, bitų gylio ir imties spartos sąvokas.


Imties dažnis nurodo, kaip dažnai mes imame ar atkuriame signalo amplitudės informaciją. Iš esmės, mes suskaidome bangos formą į daug mažų dalių, kad sužinotume daugiau apie ją tam tikru laiko momentu. Nyquisto teorema teigia, kad didžiausias įmanomas dažnis, kurį galima užfiksuoti ar atkurti, yra tiksliai pusė mėginio dažnio. Tai gana paprasta įsivaizduoti, nes norint tiksliai žinoti jos dažnį, reikia viršutinės ir apatinės bangos formos amplitudės (tam prireiktų dviejų pavyzdžių).

Padidinus mėginių ėmimo dažnį (viršutinę) gaunami papildomi mėginiai per sekundę, o didesnis bitų gylis (apačia) suteikia daugiau galimų verčių, kad būtų galima įrašyti pavyzdį.

Dėl garso įrašo mums rūpi tik tai, ką galime išgirsti, o didžioji dauguma žmonių klausos liejasi prieš pat 20 kHz. Dabar, kai mes žinome apie Nyquisto teoremą, galime suprasti, kodėl 44,1 kHz ir 48 kHz yra įprasti mėginių ėmimo dažniai, nes jie yra šiek tiek daugiau nei dvigubai didesni už maksimalų dažnį, kurį galime išgirsti. Studijų kokybės 96 kHz ir 192 kHz standartų priėmimas neturi nieko bendra su aukštesnio dažnio duomenų fiksavimu, o tai būtų beprasmiška. Tačiau per minutę pasinerkime į tai daugiau.


Kai mes žiūrime į amplitudę bėgant laikui, bitų gylis tiesiog nurodo skiriamąją gebą arba taškų skaičių, kurį galima išsaugoti šiems amplitudės duomenims. Pvz., 8 bitų mums siūlo 256 skirtingus taškus, 16-bitų rezultatus gaunant 65 534 taškus, o 32 bitų vertės duomenys suteikia mums 4 294 967 294 duomenų taškus. Nors akivaizdu, kad tai labai padidina bet kokių failų dydį.

Gali būti lengva iš karto pagalvoti apie bitų gylį, atsižvelgiant į amplitudės tikslumą, tačiau svarbesnės sąvokos, kurias reikia suprasti, yra triukšmas ir iškraipymai. Turėdami labai mažą skiriamąją gebą, mes greičiausiai praleisime mažesnės amplitudės informacijos gabaliukus arba nukirpsime bangų formų viršūnes, kurios sukelia netikslumą ir iškraipymus (kiekybinės paklaidos). Įdomu tai, kad dažnai atkuriant mažos skiriamosios gebos failą tai skambės kaip triukšmas, nes mes efektyviai padidinome mažiausią įmanomą signalą, kurį galima užfiksuoti ir atkurti. Tai visiškai tas pats, kas įtraukti triukšmo šaltinį į mūsų bangos formą. Kitaip tariant, sumažinus bitų gylį, sumažėja ir triukšmo aukštis. Tai taip pat gali padėti pagalvoti apie dvejetainį pavyzdį, kuriame mažiausias reikšmingumas yra triukšmo aukštis.

Todėl didesnis bitų gylis suteikia mums didesnį triukšmo lygį, tačiau praktiška tai realiame pasaulyje yra ribota. Deja, visur tvyro fono triukšmas, ir neturiu omenyje autobuso, einančio praeityje gatve. Pradedant kabeliais ir baigiant ausinėmis, stiprintuvo tranzistoriais ir net ausimis ausyse, maksimalus signalo ir triukšmo santykis realiame pasaulyje yra apie 124 dB, o tai sudaro maždaug 21 bitų vertės duomenis.Žargonas Busteris:

DAC- Skaitmeninis-analoginis keitiklis priima skaitmeninius garso duomenis ir paverčia juos analoginiu signalu, kad galėtų nusiųsti į ausines ar garsiakalbius.

Imties dažnis Matuojant hercais (Hz), tai skaitmeninių duomenų pavyzdžių, paimtų kiekvieną sekundę, skaičius.

SNR- Signalo ir triukšmo santykis yra skirtumas tarp norimo signalo ir foninės sistemos triukšmo. Skaitmeninėje sistemoje tai yra tiesiogiai susiję su bitų gyliu.

Palyginimui, 16 bitų fiksavimas siūlo 96,33 dB signalo ir triukšmo santykį (skirtumas tarp signalo ir foninio triukšmo), o 24 bitų siūlo 144,49 dB, kuris viršija aparatūros fiksavimo ir žmogaus suvokimo ribas. Taigi 32 bitų DAC iš tikrųjų tik kada nors galės išvesti daugiausiai 21 bitų naudingų duomenų, o kiti bitai bus užmaskuoti grandinės triukšmu. Tačiau iš tikrųjų dauguma vidutinės kainos įrenginių turi SNR nuo 100 iki 110 dB, nes dauguma kitų grandinės elementų sukels savo triukšmą. Aišku tada 32 bitų failai jau atrodo gana nereikalingi.

Dabar, kai jau supratome skaitmeninio garso pagrindus, pereikime prie kai kurių labiau techninių punktų.

Laiptai į rojų

Dauguma klausimų, susijusių su garso supratimu ir klaidingu supratimu, yra susiję su tuo, kaip švietimo ištekliai ir įmonės bando paaiškinti pranašumus naudodamos vaizdinius užuominas. Jūs turbūt visi matėte garso įrašą, vaizduojamą kaip bitų gylio ir stačiakampio formos linijų laiptelių žingsniai mėginių ėmimo dažniui. Tai tikrai neatrodo labai gerai, kai lyginate jį su sklandžiai atrodančia analogine bangos forma, todėl lengva nubrėžti subtiliau atrodančius, „lygesnius“ laiptus, kad būtų tikslesnė išėjimo bangos forma.

Nors tai gali būti lengva parduoti visuomenei, ši įprasta „laiptų“ tikslumo analogija yra didžiulis klaidingas nukreipimas ir neįvertinama, kaip skaitmeninis garsas iš tikrųjų veikia. Ignoruok tai.

Tačiau šis vaizdinis vaizdas klaidingai atspindi, kaip garsas veikia. Nors tai gali atrodyti nepatogu, matematiškai duomenys, mažesni už Nyquist dažnį, ty pusę atrankos dažnio, buvo užfiksuoti tobulai ir gali būti atkuriami nepriekaištingai. Pavaizduokite tai, net esant Nyquisto dažniui, kuris dažnai gali būti vaizduojamas kaip kvadratinė, o ne sklandi sinuso banga. Turime tikslius amplitudės duomenis tam tikru laiko momentu, o tai yra viskas, ko mums reikia. Mes, žmonės, dažnai klaidingai žiūrime į tarpą tarp pavyzdžių, tačiau skaitmeninė sistema veikia ne taip.

Bito gylis dažnai susijęs su tikslumu, tačiau tai iš tikrųjų nusako sistemos triukšmo efektyvumą. Kitaip tariant, mažiausias aptinkamas ar atkuriamas signalas.

Atkuriant tai gali būti šiek tiek sudėtingesnė, nes lengvai suprantama „nulinės eilės sulaikymo“ DAC koncepcija, kuri paprasčiausiai perjungs reikšmes nustatytu imties greičiu ir duos laiptelio laiptelio rezultatą. Tai iš tikrųjų nėra teisingas garso ir vaizdo DAC veikimo vaizdas, tačiau kol esame čia, galime naudoti šį pavyzdį, norėdami įrodyti, kad jums vis tiek neturėtų rūpėti tie laiptai.

Svarbu atkreipti dėmesį į tai, kad visos bangos gali būti išreikštos kelių sinuso bangų, pagrindinio dažnio ir papildomų komponentų, esančių harmonikose, kartotiniais, suma. Trikampio bangą (arba laiptų pakopą) sudaro nelyginės harmonikos, mažėjančios amplitudės. Taigi, jei mūsų atrankos dažnyje yra daugybė labai mažų žingsnių, galime pasakyti, kad pridedamas papildomas harmoninis turinys, tačiau jis atsiranda dvigubai garsiau (Nyquist) ir turbūt kelios harmonijos viršija, taigi, mes laimėjome niekaip negalėsi jų išgirsti. Be to, tai bus gana paprasta filtruoti naudojant kelis komponentus.

Jei atskirtume DAC pavyzdžius, nesunkiai pamatytume, kad mūsų norimas signalas puikiai vaizduojamas kartu su papildoma bangos forma DAC imties dažniu.

Jei tai tiesa, turėtume tai pastebėti atlikdami greitą eksperimentą. Paimkime išėjimą tiesiai iš pagrindinio nulinės eilės palaikymo DAC ir taip pat perduodame signalą per labai paprastą 2nd užsisakykite žemų dažnių filtrą, nustatytą perpus mažiau. Aš iš tikrųjų čia naudojau tik 6 bitų signalą, kad galėtume iš tikrųjų pamatyti osciloskopo išvestį. 16 ar 24 bitų garso failas turėtų daug mažiau signalo tiek prieš filtruodamas, tiek po jo.

Gana grubus pavyzdys, tačiau tai įrodo, kad garso duomenys puikiai atkuriami šiame nepatogiai atrodančiame laiptinėje.

Ir tarsi stebuklingai, laiptų laipteliai beveik visiškai išnyko, o išėjimas yra „išlygintas“, tiesiog naudojant žemo pralaidumo filtrą, kuris netrukdo mūsų sinuso bangos išėjimui. Iš tikrųjų viskas, ką mes padarėme, yra filtruojama tam tikros signalo dalys, kurių jūs vis tiek nebūtumėte girdėję. Tai tikrai nėra blogas rezultatas papildomų keturių komponentų, kurie iš esmės yra nemokami (dviejų kondensatorių ir dviejų rezistorių kaina yra mažesnė nei 5 pensai), tačiau iš tikrųjų yra sudėtingesnių metodų, kuriuos galime naudoti norėdami dar labiau sumažinti šį triukšmą. Dar geriau, kad jie yra standartiškai įtraukti į daugumos geros kokybės DAC.

Kalbant apie realistiškesnį pavyzdį, bet kuriame DAC, skirtoje naudoti su garsu, taip pat bus naudojamas interpoliacijos filtras, dar žinomas kaip aukščiausia atranka. Interpoliacija yra paprasčiausias būdas apskaičiuoti tarpinius taškus tarp dviejų mėginių, todėl jūsų DAC iš tikrųjų pats daro šį „išlyginimą“ ir daug daugiau nei tai padidins arba padidins imties dažnį. Dar geriau, tai neužima daugiau vietos faile.

Interpoliacijos filtrai, dažniausiai randami bet kuriame DAC, verta jos druskos, yra daug geresnis sprendimas, nei nešiojant failus su didesne atrankos sparta.

Metodai tai padaryti gali būti gana sudėtingi, tačiau iš esmės jūsų DAC keičia išvesties vertę daug dažniau, nei tai sugalvotų jūsų garso failo imties dažnis. Tai išstumia negirdimą laiptų laiptelių harmoniką už mėginių ėmimo dažnio ribų, todėl galima naudoti lėtesnius, lengviau pasiekiamus filtrus, kurie turi mažiau bangų, todėl išsaugomi bitai, kuriuos iš tikrųjų norime išgirsti.

Jei jums įdomu, kodėl norime pašalinti šį turinį, kurio negirdime, paprasčiausia priežastis yra tai, kad atkuriant šiuos papildomus duomenis žemiau signalo grandinės, tarkime stiprintuve, eikvojama energija. Be to, atsižvelgiant į kitus sistemos komponentus, šis aukštesnio dažnio „ultragarsinis“ turinys iš tikrųjų gali sukelti didesnius moduliavimo iškraipymus riboto pralaidumo komponentuose. Todėl jūsų 192 kHz failas tikriausiai padarytų daugiau žalos nei naudos, jei tuose failuose iš tikrųjų būtų koks nors ultragarsinis turinys.

Jei prireiktų daugiau įrodymų, aš parodysiu ir aukštos kokybės DAC išvestį, naudodamas „Circus Logic CS4272“ (nuotrauka viršuje). CS4272 turi interpoliacijos sekciją ir stačiai įmontuotą išvesties filtrą. Viskas, ką mes darome šiam bandymui, yra naudojant mikro valdiklį, kad būtų pateikiami DAC du 16 bitų aukšto ir žemo pavyzdžiai 48 kHz dažniu, suteikiant mums maksimalią išėjimo bangos formą 24 kHz dažniu. Kitų naudojamų filtravimo komponentų nėra. Ši išvestis gaunama tiesiai iš DAC.

24 kHz išėjimo signalas (viršuje) iš šio studijinio lygio DAC komponento tikrai neatrodo kaip stačiakampio formos banga, susieta su įprasta rinkodaros medžiaga. Mėginių ėmimo dažnis (Fs) rodomas osciloskopo apačioje.

Atkreipkite dėmesį, kaip išėjimo sinuso banga (viršutinė dalis) yra tiksliai pusė dažnio laikrodžio greičio (apačia). Nėra jokių pastebimų laiptų pakopų ir ši labai aukšto dažnio bangos forma atrodo beveik kaip tobula sinuso banga, o ne blogai atrodanti kvadratinė banga, kurią galėtų nurodyti rinkodaros medžiaga ar net atsitiktinis žvilgsnis į išvesties duomenis. Tai rodo, kad net turint tik du pavyzdžius, Nyquisto teorija praktiškai veikia puikiai ir mes galime atkurti gryną sinuso bangą, neturėdami jokio papildomo harmoninio turinio, be didžiulio bitų gylio ar atrankos greičio.

Tiesa apie 32 bitų ir 192 kHz

Kaip ir daugelyje kitų dalykų, už viso žargono ir 32 bitų paslėpta tiesa yra 192 kHz garsas, kuris praktiškai naudojamas, tik ne jūsų delne. Šie skaitmeniniai atributai iš tikrųjų naudingi, kai esate studijos aplinkoje, todėl teigiama, kad „studijos kokybės garsas yra mobilus“, tačiau šios taisyklės paprasčiausiai netaikomos, kai norite įtaisyti gatavą takelį į savo kišenę.

Pirmiausia pradėkime nuo imties dažnio. Vienas dažnai vertinamas didesnės skiriamosios gebos garso įrašų pranašumas yra ultragarsinių duomenų išsaugojimas, kurių negirdite, bet darai įtaką muzikai. Šiukšlės, dauguma instrumentų iškrenta gerokai anksčiau nei mūsų klausos dažnio apribojimai, mikrofonas, naudojamas fiksuoti erdvės nutolimą, esant ne daugiau kaip 20 kHz, ir jūsų naudojamos ausinės tikrai neišsiplės. Net jei jie galėtų, jūsų ausys to tiesiog negali aptikti.

Tipiškas žmogaus klausos jautrumas būna 3 kHz dažniu ir greitai pradeda riedėti po 16 kHz.

192 kHz mėginių ėmimas yra gana naudingas mažinant triukšmą (dar kartą tai raktinis žodis) imant duomenis, leidžia paprasčiau sukonstruoti svarbiausius įvesties filtrus ir taip pat yra svarbus didelės spartos skaitmeninis efektas. Viršijus garsinį spektrą, mes galime vidutiniškai sumažinti signalą, kad sumažintume triukšmo aukštį. Paaiškės, kad dauguma geriausių ADC (analoginių skaitmeninių keitiklių) šiais laikais yra su įmontuota 64 bitų ar didesne atranka.

Kiekvienam ADC taip pat reikia pašalinti dažnius, viršijančius „Nyquist“ ribą, arba jūs patirsite siaubingą garsinį alias, nes aukštesnieji dažniai „sulenkiami“ į garsinį spektrą. Didesnis atotrūkis tarp mūsų 20 kHz filtrų kampo dažnio ir maksimalaus mėginių ėmimo dažnio labiau tinka realaus pasaulio filtrams, kurie paprasčiausiai negali būti tokie statūs ir stabilūs, kaip reikalauja teoriniai filtrai. Tas pats pasakytina ir DAC pabaigoje, tačiau, kaip mes aptarėme, moduliavimas gali labai efektyviai padidinti šį triukšmą iki aukštesnių dažnių, kad būtų lengviau filtruoti.

Kuo staigesnis filtras, tuo daugiau praeis pralaidumo juostos. Padidinus atrankos dažnį, galima naudoti „lėtesnius“ filtrus, kurie padeda išsaugoti vienodo dažnio atsaką garsinėje pralaidumo juostoje.

Skaitmeniniame domene panašios taisyklės galioja filtrams, kurie dažnai naudojami studijos maišymo procese. Didesnis mėginių ėmimo dažnis leidžia naudoti staigesnius, greitesnio veikimo filtrus, kuriems norint tinkamai veikti reikia papildomų duomenų. To nereikia, kai kalbama apie atkūrimą ir DAC, nes mums įdomu tik tai, ką iš tikrųjų galite išgirsti.

Pereinant prie 32 bitų, visi, kurie kada nors bandė užkoduoti bet kokią nuotoliniu būdu sudėtingą matematiką, supras bitų gylio svarbą tiek su sveikaisiais, tiek su slankiojo kablelio duomenimis. Kaip mes jau aptarėme, kuo daugiau bitų, tuo mažiau triukšmo, ir tai tampa dar svarbiau, kai pradedame dalyti ar atimti signalus skaitmeninėje srityje dėl apvalinimo klaidų ir išvengiant kirpimo klaidų dauginant ar pridedant.

Papildomas bitų gylis yra svarbus norint išsaugoti signalo vientisumą atliekant matematines operacijas, pavyzdžiui, studijos garso programinės įrangos viduje. Bet mes galime išmesti šiuos papildomus duomenis, kai tik baigsime naudoti.

Štai pavyzdys, tarkime, kad imame 4 bitų pavyzdį, o dabartinis pavyzdys yra 13, tai yra 1101 dvejetainėje vietoje. Dabar pabandykite padalinti tai iš keturių ir mums liks 0011 arba paprasčiausiai 3. Mes praradome papildomą 0,25 ir tai reikš klaidą, jei bandysime atlikti papildomą matematiką arba paversti savo signalą atgal į analoginės bangos formą.

Šios apvalinimo klaidos pasireiškia kaip labai maži iškraipymai ar triukšmai, kurie gali kauptis atliekant daugybę matematinių funkcijų. Tačiau jei mes išplėtėme šį 4 bitų pavyzdį su papildomais informacijos bitais, kad būtų naudojami kaip frakcija ar dešimtainis taškas, tada mes galime toliau dalinti, sudėti ir dauginti daug ilgiau, naudodami papildomus duomenų taškus. Taigi realiame pasaulyje 16 ar 24 bitų atranka ir šių duomenų konvertavimas į 32 bitų formatą apdorojimui padeda sutaupyti dėl triukšmo ir iškraipymų. Kaip jau minėjome, 32 bitai yra nepaprastai daug tikslumo taškų.

Ne mažiau svarbu pripažinti, kad mums nereikia šio papildomo aukšto, kai grįžtame į analoginę sritį. Kaip mes jau aptarėme, maždaug 20 bitų duomenų (-120 dB triukšmo) yra absoliutus maksimumas, kurį galima aptikti, todėl galime konvertuoti atgal į priimtinesnį failo dydį nepakenkdami garso kokybei, nepaisant to, kad „audiofilai“ yra turbūt gailisi dėl prarastų duomenų.

Tačiau neišvengiamai įvesime kai kurias apvalinimo klaidas, kai judame į mažesnį bitų gylį, todėl visada bus šiek tiek papildomų iškraipymų, nes šios klaidos ne visada atsiranda atsitiktinai. Nors tai nekelia problemų su 24 bitų garsu, nes jis jau pranoksta analoginį triukšmo lygį, metodas, vadinamas „diteringu“, tinkamai išsprendžia šią problemą 16 bitų failams.

Trupinimo, kurį sukelia sutrumpinimas ir sumažinimas, palyginimo pavyzdys.

Tai atliekama atsitiktinai atrenkant mažiausiai reikšmingą garso pavyzdžio bitą, pašalinant iškraipymo klaidas, tačiau įvedant labai tylų atsitiktinį foninį triukšmą, pasklidantį tarp dažnių. Nors triukšmo įvedimas gali būti laikomas intuityviu, tai iš tikrųjų sumažina garsinių iškraipymų kiekį dėl atsitiktinumų. Be to, naudojant specialius triukšmo formos difuzijos modelius, kuriais piktnaudžiaujama žmogaus ausies dažnio reakcija, 16 bitų difuzinis garsas iš tikrųjų gali išlaikyti suvoktą triukšmo aukštį labai arti 120dB, ties mūsų suvokimo riba.

32 bitų duomenų ir 192 kHz atrankos sparta turi didelę naudą studijoje, tačiau tos pačios taisyklės netaikomos atkūrimui.

Paprasčiau tariant, leiskite studijoms užsikimšti standžiausius diskus su šiuo didelės raiškos turiniu, mums tiesiog nereikia visų tų nereikalingų duomenų, kai reikia aukštos kokybės atkūrimo.

Apvyniokite

Jei vis dar esate su manimi, neteiskite šio straipsnio kaip visiško pastangų patobulinti išmaniųjų telefonų garso komponentus atmetimo. Nors numerio pakeitimas gali būti nenaudingas, aukštesnės kokybės komponentai ir geresnis grandinės dizainas vis dar yra puikus pokytis mobiliųjų telefonų rinkoje, mes tiesiog turime įsitikinti, kad gamintojai sutelkia savo dėmesį į tinkamus dalykus. Pavyzdžiui, 32 bitų „LG V10“ DAC skamba nuostabiai, tačiau jums nereikia jaudintis dėl didžiulių garso failų dydžių, kad juo pasinaudotumėte.

Galimybė vairuoti mažos varžos ausines, išlaikyti žemą triukšmo lygį nuo DAC iki lizdo ir pasiūlyti minimalius iškraipymus yra daug svarbesnės išmaniųjų telefonų garso savybės nei teoriškai palaikomas bitų gylis ar imties sparta, ir mes, tikimės, sugebėsime ateityje pasinerkite į šiuos dalykus išsamiau.

Išmaniųjų telefonų kamero yra neįtikėtino. Jie pažengė taip, kad dauguma žmonių galėtų juo naudoti viiem avo fotografavimo poreikiam, tačiau vieno ritie vi tiek trūkta: priartinti. Tai riboto trukmė a...

Yra daugybė pagrindinių komponentų, kurie udaro kiekvieną išmanųjį telefoną, o telefonų augykla yra viena iš jų. Galų gale, ka gi yra telefona, jei jame netelpa vio programo, nuotrauko ir vaizdo įraša...

Įspūdingos Pareigybės