Den store lydmyten: hvorfor trenger du ikke den 32-biters DAC-en

Innhold

Hører du det?
Trapp til himmelen
Sannheten om 32-bit og 192 kHz
Pakk sammen

Som du sikkert har lagt merke til, er det en ny trend i smarttelefonindustrien å inkludere lydstudier av “studiokvalitet” i moderne flaggskip-smarttelefoner. Selv om en 32-biters DAC (digital til analog omformer) med 192 kHz lydstøtte absolutt ser bra ut på spesifikasjonsarket, er det ganske enkelt ingen fordel å øke størrelsen på lydsamlingene våre.

Jeg er her for å forklare hvorfor denne bitdybden og samplingsraten bare er et annet tilfelle av lydindustrien som drar nytte av mangelen på forbruker og til og med audiofilen kunnskap om emnet. Don nerdkappene dine, vi skal inn på noen alvorlige tekniske punkter for å forklare inn- og utsalg for pro-lyd. Og forhåpentligvis vil jeg også bevise for deg hvorfor du bør ignorere det meste av markedsføringshype.

Hører du det?

Før vi dykker videre, tilbyr dette første segmentet litt nødvendig bakgrunnsinformasjon om de to hovedbegrepene digital lyd, bitdybde og samplingsfrekvens.

Eksempelhastighet refererer til hvor ofte vi skal fange opp eller reprodusere amplitudeinformasjon om et signal. I hovedsak kutter vi opp en bølgeform i mange små deler for å lære mer om det på et bestemt tidspunkt. Nyquist-teoremet sier at den høyeste mulige frekvensen som kan fanges eller reproduseres, er nøyaktig halvparten av samplingshastigheten. Dette er ganske enkelt å forestille seg, da vi trenger amplituder for toppen og bunnen av bølgeformen (som vil kreve to prøver) for å kunne vite nøyaktig frekvensen.

Øking av samplingshastigheten (øverst) resulterer i ytterligere prøver per sekund, mens en større bitdybde (bunn) gir flere mulige verdier å registrere prøven på.

For lyd er vi bare opptatt av hva vi kan høre, og det store flertallet av menneskers hørselshaler er like før 20 kHz. Nå som vi vet om Nyquist teorem, kan vi forstå hvorfor 44,1 kHz og 48 kHz er vanlige samplingsfrekvenser, ettersom de er litt over dobbelt så høy som vi kan høre. Bruken av standardkvalitet på 96 kHz og 192 kHz har ingenting å gjøre med å fange opp høyere frekvensdata, det vil være meningsløst. Men vi vil dykke mer innom det om et øyeblikk.

Når vi ser på amplituder over tid, refererer bitdybden ganske enkelt til oppløsningen eller antall tilgjengelige punkter for å lagre disse amplitude-dataene. For eksempel tilbyr 8-bits oss 256 forskjellige punkter å runde til, 16-bits resultater i 65,534 poeng, og 32-bits verdier av data gir oss 4 294 967 294 datapunkter. Selv om det åpenbart øker størrelsen på filer.

Det kan være lett å umiddelbart tenke på bit-dybde når det gjelder amplitude-nøyaktighet, men de viktigere konseptene å forstå her er støy og forvrengning. Med en veldig lav oppløsning vil vi sannsynligvis gå glipp av deler av informasjon med lavere amplitude eller kutte av toppen av bølgeformene, som introduserer unøyaktighet og forvrengning (kvantiseringsfeil). Interessant nok vil dette ofte høres ut som støy hvis du skulle spille av en fil med lav oppløsning, fordi vi effektivt har økt størrelsen på det minste signalet som kan tas og reproduseres. Dette er nøyaktig det samme som å legge en kilde til støy til vår bølgeform. Med andre ord, å senke bitdybden reduserer også støybunnen. Det kan også hjelpe å tenke på dette i form av en binær prøve, der den minst betydningsfulle biten representerer støybunnen.

Derfor gir en høyere bitdybde oss et større støygulv, men det er en begrenset grense for hvor praktisk dette er i den virkelige verden. Dessverre er det bakgrunnsstøy overalt, og jeg mener ikke bussen går forbi på gaten. Fra kabler til hodetelefonene dine, transistorene i en forsterker, og til og med ørene inne i hodet ditt, er det maksimale signal / støyforholdet i den virkelige verden rundt 124 dB, som fungerer til omtrent 21 bits verdt data.Jargon Buster:

DAC- En digital-til-analog-omformer tar digital lyddata og omdanner den til et analogt signal for å sende til hodetelefoner eller høyttalere.

Prøvefrekvens- Målt i Hertz (Hz), er dette antall digitale dataprøver tatt hvert sekund.

SNR- Signal-til-støyforhold er forskjellen mellom ønsket signal og bakgrunnssystemstøy. I et digitalt system er dette koblet direkte til bit-dybden.

Til sammenligning tilbyr 16-bits fangst et signal / støyforhold (forskjellen mellom signal og bakgrunnsstøy) på 96,33 dB, mens 24-bits tilbyr 144,49 dB, som overskrider grensene for maskinvarefangst og menneskelig oppfatning. Så din 32-biters DAC er faktisk bare noen gang i stand til å gi ut maksimalt 21-bit med nyttige data, og de andre bitene vil bli maskert av kretsstøy. Men i virkeligheten, de mest moderat prisede utstyrsutstyrene toppes med en SNR på 100 til 110dB, da de fleste andre kretselementer vil introdusere sin egen støy. Det er klart at 32-biters filer allerede virker ganske overflødige.

Nå som vi har forstått det grunnleggende om digital lyd, la oss gå videre til noen av de mer tekniske punktene.

Trapp til himmelen

De fleste problemstillingene rundt forståelse og misforståelse av lyd er relatert til måten utdanningsressurser og selskaper prøver å forklare fordelene ved å bruke visuelle signaler. Du har sannsynligvis sett lyd representert som en serie trappetrinn for bitdybde og rektangulære linjer for samplingsfrekvensen. Dette ser absolutt ikke veldig bra ut når du sammenligner det med en jevn, analog bølgeform, så det er lett å trave ut finere, "jevnere" trapper for å representere en mer nøyaktig utgangsbølgeform.

Selv om det kan være et enkelt salg til publikum, er denne vanlige "trapp" nøyaktighetsanalogien en enorm feilretning og klarer ikke å sette pris på hvordan digital lyd faktisk fungerer. Ignorer det.

Imidlertid representerer denne visuelle representasjonen feil hvordan lyd fungerer. Selv om det kan virke rotete, er matematisk dataene under Nyquist-frekvensen, det er halvparten av samplingshastigheten, fanget perfekt og kan reproduseres perfekt. Se for dette, selv ved Nyquist-frekvensen, som ofte kan være representert som en firkantbølge i stedet for en jevn sinusbølge, har vi nøyaktige data for amplituden på et bestemt tidspunkt, som er alt vi trenger. Vi mennesker ser ofte feilaktig på rommet mellom prøvene, men et digitalt system fungerer ikke på samme måte.

Bitdybde er ofte knyttet til nøyaktighet, men egentlig definerer den systemets støyytelse. Med andre ord det minste detekterbare eller reproduserbare signalet.

Når det gjelder avspilling, kan dette bli litt vanskeligere, på grunn av det lettfattelige konseptet "DOC-er for null-orden hold", som ganske enkelt vil bytte mellom verdier med en bestemt samplingshastighet, og gi et trappetrinnsresultat. Dette er egentlig ikke en rettferdig fremstilling av hvordan lyd-DAC-er fungerer, men mens vi er her kan vi bruke dette eksemplet for å bevise at du ikke burde være bekymret for trappene uansett.

Et viktig faktum å merke seg er at alle bølgeformer kan uttrykkes som summen av flere sinusbølger, en grunnfrekvens og tilleggskomponenter ved harmoniske multipler. En trekantbølge (eller et trappetrinn) består av rare harmonikker ved reduserende amplituder. Så hvis vi har mange veldig små trinn som skjer med utvalgsfrekvensen, kan vi si at det er lagt til noe ekstra harmonisk innhold, men det forekommer med dobbelt så høy hørbar (Nyquist) frekvens og sannsynligvis noen få harmoniske utover det, så vi vant kan ikke høre dem uansett. Videre vil dette være ganske enkelt å filtrere ut ved hjelp av noen få komponenter.

Hvis vi skiller ut DAC-prøvene, kan vi enkelt se at vårt ønskede signal er perfekt representert sammen med en ekstra bølgeform ved DAC-samplingshastigheten.

Hvis dette er sant, bør vi kunne observere dette med et raskt eksperiment. La oss ta en utgang rett fra en grunnleggende null-ordens hold-DAC og også mate signalet gjennom en veldig enkel 2^nd bestill lavpassfilter satt til halvparten av prøvefrekvensen. Jeg har faktisk bare brukt et 6-bits signal her, bare slik at vi faktisk kan se utdataene på et oscilloskop. En 16-bit eller 24-bit lydfil ville ha langt mindre støy på signalet både før og etter filtrering.

Et ganske grovt eksempel, men dette beviser poenget at lyddata er perfekt gjenskapt i denne rotete trapp.

Og som med magi forsvant trappetrinnet nesten fullstendig, og utdataene blir "jevnet ut", bare ved å bruke et lavpassfilter som ikke forstyrrer sinusbølgen. I virkeligheten er alt vi har gjort filtrert ut deler av signalet som du ikke ville ha hørt uansett. Det er egentlig ikke et dårlig resultat for fire ekstra komponenter som i utgangspunktet er gratis (to kondensatorer og to motstander koster mindre enn 5 pence), men det er faktisk mer sofistikerte teknikker som vi kan bruke for å redusere denne støyen ytterligere. Bedre ennå, disse er inkludert som standard i de fleste god kvalitet DAC.

Håndterer et mer realistisk eksempel, vil enhver DAC for bruk med lyd også ha et interpolasjonsfilter, også kjent som up-sampling. Interpolering er ganske enkelt en måte å beregne mellompunkter mellom to prøver, så DAC-en din gjør faktisk mye av denne "utjevningen" på egen hånd, og mye mer enn å doble eller firdoblere prøvehastigheten. Bedre ennå, den tar ikke noe ekstra filplass.

Interpolasjonsfilter som ofte finnes i en hvilken som helst DAC som er verdt saltet, er en mye bedre løsning enn å transportere filer med høyere prøvetakingshastighet.

Metodene for å gjøre dette kan være ganske kompliserte, men egentlig endrer DAC sin utgangsverdi mye oftere enn prøvefrekvensen til lydfilen din antyder. Dette skyver de uhørbare trappetrinnets harmonikker langt utenfor prøvetakingsfrekvensen, noe som gjør det mulig å bruke tregere, lettere oppnåelige filtre som har mindre krusning, og bevarer derfor bitene som vi faktisk vil høre.

Hvis du er nysgjerrig på hvorfor vi vil fjerne dette innholdet som vi ikke kan høre, er den enkle grunnen at å reprodusere disse ekstra dataene lenger nede i signalkjeden, si i en forsterker, ville kaste bort energi. Avhengig av andre komponenter i systemet, kan dette "ultra-soniske" innholdet med høyere frekvens faktisk føre til større mengder intermodulasjonsforvrengning i begrensede båndbreddekomponenter. Derfor vil sannsynligvis din 192 kHz fil forårsake mer skade enn godt, hvis det faktisk er noe ultralydisk innhold inneholder i disse filene.

Hvis det skulle være behov for mer bevis, vil jeg også vise et output fra en høy kvalitet DAC ved hjelp av Circus Logic CS4272 (bildet øverst). CS4272 har en interpolasjonsseksjon og bratt innebygd utgangsfilter. Alt vi gjør for denne testen bruker en mikrokontroller for å mate DAC to 16-biters høye og lave prøver på 48 kHz, noe som gir oss maksimal mulig bølgeform ved 24 kHz. Det er ingen andre filterkomponenter som brukes, denne utgangen kommer rett fra DAC.

24kHz utgangssignal (topp) fra denne studioklasse DAC-komponenten ser absolutt ikke ut som den rektangulære bølgeformen som er knyttet til det vanlige markedsføringsmaterialet. Prøvehastigheten (Fs) vises nederst i oscilloskopet.

Legg merke til hvordan sinusbølgen (øverst) er nøyaktig halvparten av hastigheten på frekvensuret (nederst). Det er ingen merkbare trappetrinn, og denne veldig høyfrekvente bølgeformen ser nesten ut som en perfekt sinusbølge, ikke en blokkerende kvadratisk bølge som markedsføringsmaterialet eller til og med et tilfeldig glimt på outputdataene antyder. Dette viser at selv med bare to prøver, fungerer Nyquist-teorien perfekt i praksis, og vi kan gjenskape en ren sinusbølge, fraværende av noe ekstra harmonisk innhold, uten en stor bitdybde eller prøvehastighet.

Sannheten om 32-bit og 192 kHz

Som med de fleste ting, er det noen sannheter som er skjult bak all sjargongen og 32-biters, 192 kHz lyd er noe som har praktisk bruk, bare ikke i håndflaten. Disse digitale attributtene kommer faktisk til nytte når du er i et studiomiljø, derav påstandene om å bringe "lydkvalitet i studio til mobil", men disse reglene gjelder ganske enkelt ikke når du vil legge det ferdige sporet i lommen.

For det første, la oss begynne med utvalgshastighet. En ofte spisset fordel med lyd med høyere oppløsning er oppbevaring av ultralyddata som du ikke kan høre, men påvirker musikken. Søppel, de fleste instrumenter faller av i god tid før høreapparatets frekvensgrenser, mikrofon som brukes til å fange en plassrulling på det meste rundt 20 kHz, og hodetelefonene dine du bruker, vil absolutt ikke utvide så langt heller. Selv om de kunne det, kan ørene dine rett og slett ikke oppdage det.

Typisk menneskelig hørselsfølsomhet topper ved 3 kHz og begynner raskt å rulle av etter 16 kHz.

Imidlertid er prøvetaking av 192 kHz ganske nyttig til å redusere støy (det stikkordet igjen) når du sampler data, muliggjør enklere konstruksjon av viktige inngangsfilter, og er også viktig for høyhastighets digital effekt. Oversampling over det hørbare spekteret gjør at vi kan gjennomsnitts signalet for å skyve ned støydulvet. Du vil finne at de fleste gode ADC-er (analog til digitale omformere) i disse dager kommer med innebygd 64-biters over-sampling eller mer.

Hver ADC må også fjerne frekvenser over sin Nyquist-grense, ellers vil du ende med forferdelige klingealiaseringer når høyere frekvenser blir "brettet ned" i det hørbare spekteret. Å ha et større gap mellom vår 20 kHz filterhjørnefrekvens og den maksimale samplingshastigheten er mer imøtekommende for virkelige filtre som rett og slett ikke kan være så bratte og stabile som de teoretiske filtrene som kreves. Det samme er tilfelle ved DAC-enden, men som vi diskuterte kan intermodulasjon veldig effektivt presse denne støyen opp til høyere frekvenser for enklere filtrering.

Jo brattere filteret er, jo mer krusning i passbåndet. Å øke prøvehastigheten gjør det mulig å bruke "tregere" filtre, noe som hjelper til med å bevare en flat frekvensrespons i det hørbare passbåndet.

I det digitale domenet gjelder lignende regler for filtre som ofte blir brukt i studioblandingsprosessen. Høyere samplingshastighet gir rom for brattere, raskere fungerende filtre som krever tilleggsdata for å fungere ordentlig. Ikke noe av dette er nødvendig når det kommer til avspilling og DAC, da vi bare er interessante i det du faktisk kan høre.

Ved å gå videre til 32-biters vil alle som noen gang har forsøkt å kode en ekstern kompleks matematikk, forstå viktigheten av bitdybde, både med heltal- og flytende punktdata. Som vi har diskutert, jo flere biter desto mindre støy, og dette blir viktigere når vi begynner å dele eller trekke fra signaler i det digitale domenet på grunn av avrundingsfeil og for å unngå klippefeil når vi multipliserer eller legger til.

Ekstra bit-dybde er viktig for å bevare integriteten til et signal når du utfører matematiske operasjoner, for eksempel inne i lydprogramvare i studio. Men vi kan kaste bort disse ekstra dataene når mastering er ferdig.

Her er et eksempel, si at vi tar en 4-biters prøve, og vår nåværende prøve er 13, som er 1101 i binær. Forsøk nå å dele det med fire, og vi sitter igjen med 0011, eller ganske enkelt 3. Vi har mistet den ekstra 0,25, og dette vil representere en feil hvis vi forsøkte å gjøre ytterligere matematikk eller slå signalet tilbake til en analog bølgeform.

Disse avrundingsfeilene manifesterer seg som veldig små mengder forvrengning eller støy, som kan akkumuleres over et stort antall matematiske funksjoner. Imidlertid, hvis vi utvidet denne 4-biters prøven med flere informasjonsbiter som kan brukes som fraksjon eller desimal, kan vi fortsette å dele, legge til og multiplisere mye lenger takket være de ekstra datapunktene. Så i den virkelige verden hjelper prøvetaking ved 16 eller 24 bit og konvertering av disse dataene til et 32-biters format for behandling igjen å spare på støy og forvrengning. Som vi allerede har sagt, er 32-bits veldig mange poeng med nøyaktighet.

Det som er like viktig å erkjenne er at vi ikke trenger denne ekstra takhøyden når vi kommer tilbake til det analoge domenet. Som vi allerede har diskutert, er rundt 20-bits data (-120dB støy) det absolutte maksimum som muligens kan oppdage, slik at vi kan konvertere tilbake til en mer fornuftig filstørrelse uten å påvirke lydkvaliteten, til tross for at "lydfiler" er sannsynligvis beklager disse tapte dataene.

Imidlertid vil vi uunngåelig introdusere noen avrundingsfeil når vi går til en lavere bitdybde, slik at det alltid vil være en veldig liten mengde ekstra forvrengning, da disse feilene ikke alltid oppstår tilfeldig. Selv om dette ikke er et problem med 24-bits lyd da det allerede strekker seg langt utover det analoge støybunnen, løser en teknikk som kalles “dithering” dette problemet pent for 16-biters filer.

Et eksempel på sammenligning av forvrengning introdusert ved avkortning og dithering.

Dette gjøres ved å randomisere den minst betydningsfulle biten av lydprøven, eliminere forvrengningsfeil, men introdusere noe veldig stille tilfeldig bakgrunnsstøy som er spredt over frekvenser. Selv om det å introdusere støy kan virke mot intuitivt, reduserer dette faktisk mengden hørbar forvrengning på grunn av tilfeldigheten. Ved å bruke spesielle støyformede diteringsmønstre som misbruker frekvensresponsen til det menneskelige øret, kan 16-biters avviklet lyd faktisk beholde et opplevd støygulv veldig nær 120dB, rett på grensen til vår oppfatning.

32-bits data og 192 kHz samplingsfrekvens har bemerkelsesverdige fordeler i studio, men de samme reglene gjelder ikke for avspilling.

Enkelt sagt, la studioene tette opp harddiskene med dette høye oppløsningsinnholdet, vi trenger rett og slett ikke alle overflødige data når det kommer til avspilling av høy kvalitet.

Pakk sammen

Hvis du fremdeles er sammen med meg, må du ikke tolke denne artikkelen som en fullstendig avskjed for arbeidet med å forbedre lydkomponenter for smarttelefoner. Selv om antallet påvisning kan være ubrukelig, komponenter av høyere kvalitet og bedre kretsdesign er fremdeles en utmerket utvikling i mobilmarkedet, trenger vi bare å sørge for at produsenter fokuserer oppmerksomheten på de riktige tingene. 32-biters DAC i LG V10 høres for eksempel fantastisk ut, men du trenger ikke å bry deg med store lydfilstørrelser for å dra nytte av den.

Muligheten til å kjøre hodetelefoner med lav impedans, bevare et lavt støynivå fra DAC til kontakten, og tilby minimal forvrengning er mye viktigere egenskaper for smarttelefonlyd enn den teoretisk støttede bitdybden eller samplingsfrekvensen, og vi vil forhåpentligvis kunne å dykke nærmere inn på disse punktene i fremtiden.

Innhold

Hører du det?

Trapp til himmelen

Sannheten om 32-bit og 192 kHz

Pakk sammen

Slik sletter du Snapchat-konto

Adobe Photoshop Camera-app dro til Android-telefoner i 2020

Vi snakker med OnePlus om T-Mobile, den nye TV-en og invitasjonssystemet

OnePlus-avtaler har noen rabatterte bunter med Valentinsdag-tema

OnePlus vil at du skal designe sin neste OxygenOS-funksjon