haavard@stereopluss.no - Håvard Holmedal

Vi har snakket med folk vi kjenner fra fjern og nær, sjekket dokumenter, white papers og kanskje særlig sett på hva folkene bak MQA selv har skrevet lenge før det var noe som het MQA eller det var mulig å strømme musikk fra Tidal. Dessverre blir dette ganske teknisk og det ber vi om unnskyldning for. Det er ingen vei utenom.

Stereo+ er ikke de eneste her i verden som har mulighet til å undersøke og måle. Derfor er noe av formålet med artikkelen å sjekke om vi kunne finne noen av de samme problemene med imagestøy forårsaket av rekonstruksjonsfilterne MQA bruker, og som er omtalt i flere bloggposter fra Archimago (fotnote 1- se under), og nå også i videoen til Goldensound (2). De kan jo ha rett, men hvem vet? 

MQA har gjentatte ganger den siste tiden påpekt at selve enkoderen vil ha problemer med signaler som ikke er musikalske, det vil si typiske testsignaler slik som Goldensound pakket inn i sine MQA-filer da han sendte dem for publisering på Tidal, og som kan ha en unaturlig høy energi på de høyeste frekvensene nær Nyquistgrensen eller lignende. For å få en fullgod testsekvens måtte vi derfor ta i bruk mastere vi hadde tilgang på i hi-res, der vi med en rimelig grad av sikkerhet kunne si at vi satt på samme materiale og samme versjon av masteren som MQA har enkodet i MQA-FLAC-filen som ligger på TIDAL sine servere. Hvis ikke ville testen ikke holdt mål. 

Det er verdt å nevne at analysene av avspillingene er slik både MQA og hi-res PCM vil oppføre seg i et normalt hjemmemiljø, og altså ikke kun i et studio. Som analysene etter hvert viser, fant vi også tydelige tegn på andre ting det er verdt å belyse både når det gjelder hi-res, native oppløsning i MQA-avspillingen, og ikke minst hvor godt den autentiseringen MQA har lovet oss faktisk virker.

Hvordan testen ble utført

Testen ble utført med en andregenerasjons UAD Apollo 8 lydinterface som A/D (analog til digitalkonverter) sammen med Roon som MQA dekoder og en iFi Zen DAC som MQA-renderer. Roon gir en glimrende beskrivelse av hele signalkjeden og er derfor den best egnede MQA-dekoderen i denne sammenhengen. Vi foretok så spektrum- og spektrogramanalyser av signalet vi registrerte ut fra DAC-en og inn i A/D-en. Som back-up prøvde vi også flere andre MQA-sertifiserte digitalkonvertere som referanse, for å se om vi så de samme funnene. Programvaren er et typisk analyseverktøy (Acoustica for Mac) for studiobruk du selv lett kan finne på nett, og som i basisversjonen ikke behøver å koste all verden. Målingene er ikke vanskelige å gjøre, og resultatene er pålitelige. 

Alle opptak ble foretatt i 24/192 kHz (det maksimale A/D-en støtter) og analysert med en minimumsamplitude på -144db for å dekke støy i hele det teoretiske dynamikkområdet til kildefilene. For å sjekke lot vi A/D-en også ta opp fullstendig stillhet for å kunne vise eventuelle støykomponenter som tilhører systemet og ikke MQA-DAC-en. Analysene av disse filene kan du finne helt nederst i artikkelen som referanse.

Dette er vanskelig

Det har tatt oss mye tid, og det må innrømmes at læringskurven har vært stupbratt. Mye av dette er vanskelig å forstå, og mangler du kunnskap om MQA systemets basisprinsipper kan det være verdt å ta en titt på MQAs hjemmesider. (4) (https://www.mqa.co.uk/how-it-works) eller lese gjennom vår Stereopluss-skole der vi snakker om hires og MQA

Det er også greit å kjenne begrepet «Nyquist-frekvens», (her ofte bare omtalt som Nyquist) (8), selv om vi har snakket litt om dette i magasinartikkelen i utgave 5 - 2021, og «Nyquist-rate», også omtalt som samplingfrekvens eller samplingrate (9). Vi lenker til mer informasjon om de ulike begrepene og emnene i fotnotene under artikkelen.

Måling og analyse

Joni Mitchell - Free man in Paris fra Court and Spark, Spektrogramanalyse A

bilde1.jpg

Venstre vindu: iFi Audio Zen DAC spiller av original PCM 24/192
Høyre vindu: iFi Audio Zen DAC spiller av MQA versjonen i 24/192

1) Her ser du imagestøy introdusert av MQA-renderen. 2) Dette er imagestøy fra original master. 3) Her er øverste grensefrekvens for all musikalsk informasjon - ca 24kHz.

Her har vi et meget godt eksempel på at high-res PCM fra gammelt arkivmateriale ikke alltid er en helt enkel øvelse. PCM-originalen viser mange ultrasoniske komponenter, men som ventet (hvis du har lest innledningsartiklene) er det ingen betydelige musikalske signaler over 24kHz (*3) (Se det som er merket med 3 i bildet). Der både er det og skal det være sort, støyfritt, ingenting.

Det er tydelige tegn på såkalt image eller speilbilder (det som gjerne omtales som kalles mirroring). Dette er fortettede speilbilder av basebandkomponenten på 30 og 60kHz (merket 2 i bildet over), og er særlig synlig i høyre kanal. Original-filen har derfor mest sannsynlig, og på et eller annet stadium, blitt klokket på en 48 kHz sampling-frekvens, men uansett er det nok gjort betydelig lavere enn 192kHz. Vi tar likevel høyde for at filen er en native 24/192 master og ikke en oppsampling. Gammelt arkivmateriale som her kan ha vært spilt inn på analogt bånd etter digital mastring, og vi kan for eksempel se støy skapt fra denne prosessen når den nok en gang konverteres fra analogt til digitalt med en høyere klokke.

Et godt analyseverktøy i en autentiseringsprosess burde likevel enkelt kunne identifisere disse opp-aliasene og melde fra om at original sampling-frekvens kan være lavere enn det filen er tagget med. Selv om det påstås at den er såkalt «White glove MQA» og ikke bare en del av en stor batch-konvertering, må vi likevel konstatere at MQA ikke avslørte denne lavere klokken før pakking! Forslag: Kanskje den kunne vært flagget som «possible non high-res master origin»? (!)

Ut ifra spektrogramanalysen over kan vi si at:

- MQA «end- to end» i 24/192 i akkurat dette tilfellet klokker faktisk native i 96kHz (*2). Det vil si det er tydelig at ingen frekvenser over 48kHz rekonstrueres slik de er i originalfilen.

- Analysen viser ekstra imagestøy fra apodizing-filterne til MQA som beskrevet i (1) (2). Om vi hadde mye ultrasonisk støy fra før, har vi dessverre enda mer nå. Fra 48 kHz brettes hele basebandet ut i et omvendt speilbilde eller image. (*1)

- Som nevnt innledningsvis. Autentiseringen ser ikke ut til å avsløre tydelige problemer med originale PCM hi-res filer. Et viktig spørsmål som da dukker opp: Er autentiseringen som gjøres kun for å gjenkjenne MQA-filen og taggingen av den originale klokkefrekvensen på 192kHz?

*1 En del DAC-produsenter bruker enkle filtre med så få poler som mulig fordi de mener høyere strømtrekk og aritmetisk kalkuleringstøy fra mer krevende prosessering, er enda verre for DAC-ytelsen enn bruken av enkle filtre. Kanskje er det tankevekkende at vi har med et audiofilt format å gjøre som både krever svært mye prosessorkraft i dekodingen, (som vil føre til aritmetisk støy) og som bevisst innfører både aliasstøy i sonisk område og imaging i ultrasonisk område. Sistnevnte vil føre til mer intermodulasjonsstøy ved avspilling gjennom en høyttaler. Skal virkelig impulsresponsen ned til teoretiske 10 mikrosekunder (noe som tilsvarer en frekvens på 125kHz) prioriteres til fordel for mer støy? Dette er en av problemstillingene med MQA, og her burde de tillate åpen testing av formatet, slik at man kunne fått en uavhengig verifisering av fordelene vs ulempene med teknologien – slik vi tidligere har skrevet.

*2 Dette er ingen overraskelse hvis vi ser på pakkepatenten (1) til MQA, og ikke minst Bob Stuarts egen MQA white paper (3) der han og Peter Craven (også fra MQA) beskriver at alt mellom 48 og 96kHz i en 192kHz fil, kan regnes som ren innspillingstøy og kan ses bort fra eller forsakes. Derfor lar de dette foldes tilbake som downward-alias inn i MQA Core med 96kHz samplingfrekvens, for å unngå å måtte filtrere under ned-samplingen. Dette er for å bevare originalfilens impulsrespons selv med lavere klokke.

Likevel er det et poeng at vi nå har fått ny ikke-lineær aliasstøy fra en ultrasonisk støykomponent som er til stede gjennom hele det soniske området - mot å bevare impulsresponsen i filen. (Denne støyen vil ikke alltid ligge veldig lavt nede i støygulvet om man har med noiseshaping i DSD-domenet å gjøre. Slik støy kan stige voldsomt jo høyere man er i frekvens). I rendrings-prosessen begrenser MQA seg likevel til den originale samplingfrekvensen i masteren, når de i praksis skal oppsample fra MQA Core på 96kHz.

Det ser ut som om de kunne unngått mange tekniske utfordringer med apodising-filterne sine om de brukte en langt høyere oppsampling-klokke enn å bare rekonstruere opp til originalen. Imagestøy ville for eksempel dyttes langt høyere i frekvens. (5)

*3 - Det er også her vanlig musikk har begrenset båndbredde fra studioet. Svært få studioer bruker mikrofoner som vil være i stand til å strekke frekvensspekteret forbi 25 kHz i noe betydelig grad selv om man sampler med høyere Nyquistrate som her i 192kHz, og dermed tar opp frekvenser ned til 96kHz korrekt. Studioene kan uansett ikke mikse på det oversoniske materialet, for enhver fornuftig mastringstekniker ville nok bli bekymret om han/hun skulle finne materiale med mye energi oppe i det ultrasoniske området i en hi-res fil. Da dette som regel betyr at man har en ukontrollert støykilde i signalkjeden.

Man sampler altså høyere for å flytte anti-aliasfilteret langt vekk fra frekvensområdet som er av musikalsk interesse – altså området opp til ca 24-25kHz. Noe som til gjengjeld betyr at man får mulighet til å bruke filtre med slow roll-off, forbedre impuls-responsen og introdusere mindre pre/post ringing.

På bonussiden vil DAC-er uten støtte for MQA kunne få 192kHz originalens impulsrespons når de får levert et dekodet 24/96 MQA-signal fra TIDALs desktop-klient eller Roon. Den nedarvede impulsresponsen fra den originale masteren blir ikke borte fra 24/96-signalet siden dette samplet ned uten filtrering. Hvorfor ikke bare lisensiere «first unfold» (4) eller første utpakking, og så la DAC-produsentene bestemme hva de skal gjøre med det innkommende 88,2 eller 96 kHz signalet? DSP-en og filtervalgene er alle produsenters såkalte «special sauce», og har nok bidratt til en del av kontroversene rundt MQA.

Spektrogramanalyse B

Bilde2.jpg

Venstre vindu: Original PCM 24/192
Høyre vindu: iFi Audio Zen DAC spiller av original PCM 24/192

Spektrogrammet under (B) viser en original 24/192 AIFF (PCM) master sett opp mot avspillingen av samme fil gjennom iFi Audio Zen DAC. Vi ser med en gang at den ultrasoniske imagestøyen er til stede i masteren, og at den ikke er introdusert av DAC-en under avspilling av PCM-filen. Merk at i en native 192kHz fil, vil eventuelle speilbilder (imagestøy) dukke opp høyere i frekvens enn analyseområdet som er opp til 96kHz, men som vi senere skal se av spektrogramanalysen av CD redbook versus MQA16, leverer iFi DAC-ens vanlige rekonstruksjonsfilter ved PCM-avspilling helt glimrende når det gjelder undertrykking av imagestøy. Vi kan derfor forutsette at det ikke introduseres noe imagestøy under vanlig PCM-avspilling fra denne DAC-en, det skjer kun når den rendrer MQA.

Spektrumanalyse

Joni Mitchell - Court and Spark

Bilde3.jpg

Venstre vindu: iFi Audio Zen DAC spiller av original PCM 24/192
Høyre vindu: iFi Audio Zen DAC spiller av MQA versjonen i 24/192

Her legger vi merke til de ulike støynivåene og den tydelige fortettingen av basebandimaget ved ca. 73kHz på MQA versjonen. Original-imagene fra PCM-utgaven er også forflyttet, noe som betyr at reell samplingfrekvens, som vi så i spektrogrammet, er på 96kHz og ikke 192kHz som MQA rendering-prosessen hevder. Origami-utpakkingen ser likevel ut til å rekonstruere filen rimelig likt opp til ny Nyquistfrekvens i MQA-en på 48kHz. Men filen er per definisjon (6) ikke lossless 24/192 verken i samplingfrekvens eller ordlengde. Se gjerne Craven og Stuarts (MQA) sin egen white paper. (3)

Mer måling og analyse

The Divine Comedy - Bad Ambassador, Spektrogramanalyse

Bilde4.jpg

Venstre vindu: Original PCM 16/44.1
Høyre vindu: Ifi Zen DAC spiller av MQA 16/44.1

I motsetning til PCM-versjonen viser MQA-versjonen tydelig imagestøy (*4) (altså ren speiling av det soniske området) nær Nyquist-frekvensen på 22050 Hz. Den minner nå mer om den originale high-res masteren vi så av Court and Spark over. Det svarte båndet viser at filteret (*5) kun demper svakt i et område rundt Nyquistfrekvensen (se også spektrumet under) og lar så frekvensene tydelig passere over Nyquist. Det er lett å tolke spektrogrammet av MQA-en som en high-res utgave i 88.2 kHz, men selv om speilbildene ser ut som musikk, er de falske fremstillinger (5) av det originale musikksignalet, og må regnes som ren og skjær støy.

*4 Dette er på ingen måte en original versjon av masteren og den tydelige imagingen er en høyst diskutabel trade-off versus den eventuelle forbedringen i tidsdomenet MQAs apodiseringsfilter tilbyr. Siden ingen får mulighet til å måle MQA på en fullgod måte, er det usikkert hvor effektiv forbedring av impulsresponsen til MQA er i praksis og ikke bare på papiret. Man vet f.eks. ikke om dekoderen faktisk bruker et B-spline (3) resamplingspatent eller om dette er noe bare MQA ønsker å oppnå i fremtiden for å forbedre impulsreponsen. Om de faktisk bruker B-spline sampling, ville det ikke vært naturlig å brande teknologien. Altså sette et navn på det? (F.eks MQA Spline Kernel Sampling system TM eller lignende.) Uten uavhengige målinger vil usikkerheten rundt en forbedret impulsrepons gjelde både MQA16 som her og fullrendret MQA med høyere originale samplingfrekvenser.

*5 Å sample høyt i frekvens som man gjør med 96, 192 eller 384kHz vil gi en proporsjonal forbedring av impulsresponsen. Enten man spiller av i lineær PCM eller MQA first unfold der den eventuelle originale impulsresponsen er bevart, vil den forbedrede impulsreponsen uansett påvirkes via DAC-ens rekonstruksjonsfilter også om det er et MQA-filter. (3) Det finnes mange gode filterløsninger der ute, spesielt når klokken er høy i originalen. Det ser derfor ikke ut til at man trenger et MQA-filter for å oppnå en bra impulsrespons på high-res. Man trenger heller ikke lete lenge for å finne DAC-er som tilbyr MQA-inspirerte apodiseringsfiltre både til Redbook PCM og high-res PCM. (F.eks. Topping (2), Audioquest (11) og Arcam (12) har alle modeller som tilbyr apodiseringsfiltre og disse vil oppføre seg som MQA-filteret vi her har analysert i større eller mindre grad, også på vanlig PCM.)

Spektrumanalyse

Bilde5.jpg

Venstre vindu: Original PCM 16/44.1
Høyre vindu: Ifi Zen DAC spiller av MQA 16/44.1

Selv om støyen er under det dynamiske området for CD, vil de aller fleste DAC-er servere dette ut til høyttalerne, og det finnes mange nok høyttalere på markedet i dag som vil spille av denne støyen. Dette kan forårsake IMD (intermodulasjons-forvrengning) i det hørbare (soniske) området. Den hørbare relevansen dette har, er blitt diskutert av Bob Stuart og Ashihara i forskjellige vitenskapelige rapporter og lyttetester, men med helt ulike konklusjoner. (7) (10 )

Enda flere spørsmål som det er verdt å stille

1.   Er bevaring av impulsreponsen fra høyere sample rate virkelig så viktig at vi skal akseptere flere omganger med downaliasing og ekstra støy i det soniske området? Er det en for stor «trade off» versus fordelen når man har vanlig high-res å gå til? Alternativet med kun datakomprimert FLAC 24/96 vil for eksempel både gi god impulsrespons og spare båndbredde for strømmetjenestene.

2. Er MQA filteret det eneste som utgjør en forskjell på impulsrespons versus vanlig high-res? Da finnes det jo flere alternative DAC-er som vil gjøre akkurat det samme på vanlig Redbook og high-res. (ref. Audioquest, Topping, Ayre osv.) 

DAC-er med et såkalt «brickwall» apodiseringfilter vil også kunne fjerne all pre-ringing uten å introdusere imagestøy. (men introduserer mer post-ringing.) Slike filtre er det vanlige å bruke i dagens streamere og DAC-er.

3. Skaper MQA press på masteringhusene til å fikse innspillinger med lavere sampling-rater og gjøre de om til high-res? Det finnes både gode og mindre gode løsninger for å behandle slike forespørsler fra plateselskapene på fra masteringhusene (analog resampling etter prosessering versus ren digital triksing.) MQA ser dessverre ikke ut til å avsløre eventuell triksing i prosessen sin.

Spenner MQA ben på seg selv?

Ser man tilbake på historien før MQA, finner man noen spennende poenger i Peter Cravens AES-paper om apodiseringsfiltre for audio. Her kommer han med mange av de samme argumentene som MQA har solgt inn til publikum om at MQA fikser alle problemer med filtrene og impulsresponsen i studio. Nok en gang er det god grunn til å spørre oss selv om det kun er apodiseringsfilteret i MQA-renderen som sørger for forbedret impulsrespons versus native high-res?

"...A previous paper [14] featuring low preresponses aroused interest from recording engineers and from manufacturers of playback equipment and samplerate converters. Should those people all replace their brickwall filters by apodizing filters? No. As we saw in Section 1.8 just one filter is needed to apodize the whole chain..."

"...Ideally there should be just one apodizing filter in a transmission chain, the remaining filters being of the brickwall type. If the transmission chain contains two apodizing filters, it is arguable whether the resulting impulse response is better or worse than that of an unapodized system. A metadata flag to indicate apodization seems strongly indicated.."

"...There is no strong theoretical reason to place the apodizing filter at one part of the chain rather than another. However, it seems sensible in the current climate to encourage mastering engineers to experiment with apodization..."

Peter Craven, AES paper 2004

Det som beskrives over av Craven, er at de som bruker apodising filterteknikk vil oppnå den samme korreksjonen av pre-ringing impulsresponsproblemer fra studio som MQA hevder de gjør. Spørsmålet som da melder seg: Er det eneste MQA egentlig tilbyr en videreutvikling av dette filteret? De ser nemlig ikke ut til å kunne forbedre impulsresponsen i MQA-enkoderen i forhold til native high-res.* og **

Man sitter da igjen med at MQA kanskje kun fikser et problem som i høy grad håndteres av DAC-produsentene selv, med mindre de bevisst har valgt et lineært filter på utgangene. 

Fjerning av uønsket pre-ringing fra innspillingene er også det eneste som virkelig er relevant, da disse artefaktene ikke finnes i naturen. Det er likevel omdiskutert om dette har en skikkelig lydmessig relevans. Post-ringingens relevans er derimot mye vanskeligere å definere som et reelt problem, da man har masse andre ting som foregår i avspillingskjeden utenom post-ringing når man spiller av en impuls i et system (f.eks. rompåvirkning). Det å fjerne postringing fra apodisingfilteret gir uunngåelig nye problemer med imagestøy forårsaket av at filteret må ha en slow roll-off (langsom avrulling).

*Ref. Peter Cravens 2004 AES paper der han foreslår bruk av apodisingfiltere. Disse filtrene er i dag utbredt for å forhindre pre-ringing, og gjør den jobben på helt vanlige PCM eller FLAC-filer, helt uten MQA-teknologi. 

**Ref. MQA sin patentsøknad og 2014/2019 White paper – Spline-sampling er ikke nevnt i patenten og fremstår som noe de kan ønske seg i fremtiden. Det finnes ingen konkrete bevis for at de bruker denne teknologien.

Fotnoter:

1.    Archimago - Audiophilestyle - «A review of controversies» https://audiophilestyle.com/ca/reviews/mqa-a-review-of-controversies-concerns-and-cautions-r701/
2.    Goldensound YT video
3.    Bob Stuart / Craven - AES paper - A Hierarchical Approach to Archiving and Distribution - 2014 - reissue 2019 https://www.aes.org/tmpFiles/elib/20210525/20456.pdf + https://www.aes.org/tmpFiles/elib/20210525/17501.pdf
4.    MQA webside - how it works - https://www.mqa.co.uk/how-it-works
5.    Reconstruction filter Wikipedia https://en.wikipedia.org/wiki/Reconstruction_filter
6.    Lossless compression https://en.wikipedia.org/wiki/Lossless_compression
7.    B. Stuart m.fl. «Is high frequency distortion… etc.» https://www.aes.org/journal/online/jaes.cfm?file=JAES_V67_5/JAES_V67_5_PG310hirez.pdf&elibID=20459
8.    Nyquistfrekvens https://en.wikipedia.org/wiki/Nyquist_frequency
9.    Samplingfrekvens - Nyquistrate https://en.wikipedia.org/wiki/Nyquist_rate
10. K. Ashihara and K. Shugo, “Influence of Expanded Frequency Band of Signals on Non-Linear Characteristics of Loudspeakers,” ASJ, vol. 56, no. 8, pp. 549–555 (2000 Aug.).
11. http://archimago.blogspot.com/2019/08/measurements-dragonflies-audioquest.html
12. Test i Stereophile https://www.stereophile.com/content/arcam-fmj-d33-da-processor-follow-april-2013

Referansespektrogram

Bilde6.jpg

Venstre vindu: Apollo 8 MKII «recorded silence» tilkobling på inngangene.
Høyre vindu: Ifi Zen DAC tilkoblet Apollo 8 MKII «recorded silence».

Ifi Zen DAC er ubalansert og man vil plukke opp litt naturlig grunnstøy tilkoblet. XLR ville heller ikke på noen måte klart å danne et fullt svart resultat slik som «gatingen» uten noen tilkoblinger kan tilby. Bildet viser også at analyseverktøyet er 100% transparent til formålet.