Time 14 (30.01.07)

 

 

Psykoakustikk (teoretisk grunnlag for forståelsen av stereofoni)

 

 

 


Oppgave til neste time:

 

1)     Finn en solomusiker, f.eks. en vokalist, saxofonist, fløytist e.l. (men bare én om gangen)

 

2)     Rigg opp følgende stereo-mikrofoner:

o       2 Schoeps MK4 (nyremikrofoner) i X/Y-oppstilling

o       2 Schoeps MK4 (nyremikrofoner) i på stereo-skinne (”fransk-oppstilling”)

           

3)     Send mikrofonene inn på sporene 1+2 resp. 3+4 i Cubase, og spill synkront inn ca. 5 min. med musikk. La musikeren vandre frem og tilbake i ca. en halv meters avstand foran mikrofonene, og ikke for langt ut på sidene (i en sektor på ca. 120 grader).

 

4)     Ved avlytting av opptaket, “panorér” sporene 1 og 3 helt til venstre, og sporene 2 og 4 helt til høyre. Lytt på “parene” sporene 1+2 og sporene 3+4, hver for seg.

 

5)     Sammenlign og vurder følgende egenskaper:

o       Befinner lydkilden seg i venstre og høyre høyttaler når du forventer det?

o       Eksakthet av lokaliseringen av fantomlydkilden

o       Avstands-inntrykket

o       Klarhet, diffushet, romlyd

 

6)     Gjør stereosignalene for sporene 1+2 resp. 3+4 om til mono-signaler ved å sette “pan-potten”for alle 4 kanalene på midtstilling (“kl.12”). Sammenlign nå 1+2 med 3+4 og vurdér.

 

7)     Lytt bare på én av de 4 kanalene (det samme, hvilken). Skru på pan-potten. Hva skjer? Hvordan forklarer du dette?

 

8)     Koble opp en CD inn på to kanaler på mikseren. Panorér venstre kanal helt til venstre, og høyre kanal helt til høyre. Mens du lytter på CD-en, skru begge pan-pottene til midt-stilling og hør etter hva som skjer med lydbildet (gjør gjerne dette flere ganger frem og tilbake). Panorér helt ut igjen (helt til venstre og høyre) og trykk ned fase-knappen i inngangstrinnet til en av kanalene. Hva skjer med lydbildet?

 






Psykoakustikk 

 

Øret, vårt viktigste kontrollinstrument

 

Til tross for alle gode elektroniske instrumenter i kontrollrommet, så er øret, eller hørselen, det beste og viktigste kontrollinstrumentet vi har. Dette kommer av at vår oppfattelse av lyd er basert på subjektive vurderinger, mens elektriske måleinstrumenter baserer seg på objektive kriterier. Det finnes ingen enkel sammenheng mellom fysikalsk lydpåvirkning og lytterens vurdering av denne.

 

Skal man lage et elektrisk instrument som kan måle alle elementene vi legger i en lydopplevelse, må vi først finne en objektiv verdinorm for subjektive sanseinntrykk. Dette kan skaffes til veie ved å teste et stort antall mennesker, og så statistisk å slå fast hvordan personer subjektivt oppfatter lyd. Men enkeltpersoners vurderinger kan da fortsatt avvike betydelig fra en slik norm.

 

 

Ørets frekvensområde

 

Barn kan høre lydsvingninger innenfor frekvensområdet 20 Hz - 20 000 Hz (= 20 kHz). Fra 10-års-alderen synker den øvre grensen for vårt høreområde med ca. 200 Hz pr. år.

 

 

Ørets dynamikkområde

 

Som vi tidligere har sett, er det vi oppfatter som lydstyrke et resultat av små lufttrykksvariasjoner som treffer trommehinnen. Lydtrykket er et mål for styrken av disse variasjonene. Det minste lydtrykket vi kan oppfatte er ca. 0.00002 N/m^2 (1 Newton pr. kvadratmeter = 1 Pascal = 1 Pa). Til sammenligning er lufttrykket i atmosfæren ca. 100 000 N/m^2. Ørets dynamikkområde ligger mellom høreterskelen og smertegrensen.

 

Høreterskelen:         

Et trykk på 0.00002 N/m^2 er definert som høreterskelen eller ørets nullnivå. Dette tilsvarer en vekt-innvirkning på trommehinnen på ca. 0.16 milliondels gram. Dette trykket ligger bare så vidt i overkant av luftmolekylenes tilfeldige varmebevegelser. Dette lydtrykket defineres som 0 dB SPL (SPL = Sound Pressure Level).

 

Smertegrensen:      

Øker vi dette trykket en million ganger, dvs. til 20 N/m^2 (eller 0.16 gram vekt innvirkning på trommehinnen), så når vi smertegrensen. Dette tilsvarer lydtrykk vi kan bli utsatt for på rockekonserter eller når vi befinner oss ca. 50 m fra en jet-motor.

 

Lydtrykkskala:         

dB-skalaen brukes for å beskrive relative lydstyrkeforskjeller. Defineres 0.00002 N/m^2 som 0 dB SPL, så tilsvarer smertegrensens 20 N/m^2 120 dB SPL:                       20*log(20/0.00002) = 120 dB SPL



Hva er dB?

 

Menneskets hørsel er høyst subjektivt, og det kreves lang trening for å tilegne seg en tilnærmet objektiv vurderingsevne av f.eks. en bestemt økning i lydstyrke.

 

Øret vårt reagerer på små lufttrykkforandringer i lufta som en høyttaler produserer, men i programkjeden er disse signalene omdannet til elektriske signaler. Vi trenger derfor en måleenhet som tilnærmet kan beskrive sammenhengen mellom vår subjektive oppfatning av lydstyrkeøkningen og den elektriske reguleringen som forårsaker denne lydstyrkeøkningen.

 

Eksperiment:

Når oppfattes lyden fra en høyttaler subjektivt som dobbelt så sterk?

 

Svar:

Statistisk viser det seg at den elektriske effekten (P1) (målt i Watt) til en høyttaler må økes 10 ganger (til P2 = 10*P1) for at en fordobling av lydstyrken skal oppleves.

 

Nå har man innført en skala med jevne trinn, hvor hvert trinn tilsvarer en 10-dobling av den elektriske effekten. En slik skala kalles en logaritmisk skala. Da kan man altså si at for å fordoble lydstyrken, 10-dobles den elektriske effekten, og for å oppnå dette, økes posisjonen på vår logaritmiske skala med ett trinn. Ett slikt trinn kalte man 1 Bel. Det viste seg imidlertid at 1 Bel ble en for grov enhet for å beskrive lydstyrkeforandringer, derfor har man inndelt 1 Bel i 10 underenheter som man kaller desiBel eller dB. Begrepet dB er ingen enhet, men definerer forholdet mellom to størrelser.

 

I vårt eksempel ovenfor kan vi si at            log(P2/P1) = log(10) = 1 Bel.

eller at                                                           10*log(P2/P1) = 10*log(10) = 10 dB.

 

Nå har vi hele tiden operert med begrepet ”elektrisk effekt”. Men i en programkjede refererer man nesten alltid til elektriske spenninger. Kaller vi den elektriske spenningen for U, så sier Ohms lov:         P = U^2/R

 

Setter vi dette inn i formelen ovenfor, får vi:

 

10*log((U^2)^2/((U^1)^2) = 20*log(U2/U1).

 

Dette betyr at hvis vi skyver faderen på mikseren fra ”20”-merket opp til ”0”-merket, så øker vi lydstyrken med 20 dB, og dette gir inntrykket av en fordobling av lydstyrken (men som nevnt varierer dette betydelig fra person til person).

 

På en enkel måte kan vi si at begrepet ”dB” angir forholdet mellom to størrelser, f. eks. mellom to spenninger. For at et forholdstall i dB skal gi noen mening må vi altså vite hva vi måler i forhold til. I lydstudioer er det vanlig å bruke referansespenningen U=0.775Volt.

Når et signal leverer en spenning på 0.775 Volt, kalles denne lydstyrken 0 dBu.

(”u” informerer om at det er 0.775 Volt som er referansespenningen).

 

På Sony mikseren kan vi sende inn signaler på maks. +24 dBu. Dette tilsvarer fullt utslag på meteret for digitale signaler (0dB).

 

 

Oppfattelse av lydstyrkeforskjeller ved forskjellige frekvenser

 

I praksis viser det seg at vi ikke hører alle frekvenser like godt. Vi hører best i området 1kHz til 5kHz og dårligst ved dype og ved de aller høyeste frekvensene. Dessuten er evnen til å høre de forskjellige frekvensene avhengig av lydstyrken vi lytter med.

 

Ved høyttalerlytting betyr dette at klangfargen og det frekvensmessige inntrykket forandrer seg, avhengig av lydstyrken vi lytter med. Dette er meget viktig å være klar over.

 

 

Phon-kurver

 

Figuren nedenfor viser ørets standardiserte følsomhetskurver, de såkalte phon-kurvene. Phon er et mål for subjektivt opplevd lydstyrke. Varierer vi lydtrykket og frekvensen langs en phon-kurve, vil vi oppfatte det som om lyden er like sterk heletiden.

 

Betrakter vi f.eks. 50-phon-kurven, ser vi at lydtrykket ved 100 Hz må være ca. 20dB kraftigere enn lydtrykket ved 4 kHz for at disse to frekvensene skal oppfattes som like ”høyt”. Vi ser også at følsomhetsvariasjonene i bassen er mindre ved kraftige lydtrykk enn ved svake.

 

 

 

 

Praktiske konsekvenser av phon-kurvene

 

Gjør vi for eksempel et opptak mens vi lytter med kraftig lyttenivå i kontrollrommet, vil vi ved avspilling med betraktelig lavere lyttenivå få inntrykket av at det er mye mindre bass i opptaket enn forventet. Det er derfor vanlig å bruke en moderat avlyttings-lydstyrke under opptak, og at man underveis sjekker klangfargen ved svakere og sterkere lyttenivåer.

 

 

Binaural hørsel

 

Hørselen vår skiller ikke bare frekvenser og styrkevariasjoner, men den kan også oppfatte retning og avstand til en lydkilde. Dette er mulig fordi vi har to ører og en hjerne som koordinerer inntrykkene fra disse to ørene. Evnen til å sammenligne to lydinntrykk og å bestemme retning og avstand kaller vi binaural hørsel.

 


Retningsbestemmelse

 

Hørselen vår benytter seg av følgende egenskaper for å bestemme retningen som lyden kommer fra:

 

Tidsforskjell: Lyden treffer ørene våre med en tidsdifferanse, fordi ørene våre har en avstand fra hverandre på ca. 17 cm.

 

Lydstyrke: Fordi hodet vårt skygger for lyden som kommer inn fra motsatt side av det ene øret, og fordi ørene våre har forskjellig avstand til lydkilden, treffer lyden ørene våre med forskjellig lydstyrke.

 

Klangfarge: Jo mer hodet vårt skygger for lyden inn på det ene øret, jo mer forandrer klangfargen seg ved dette øret, fordi denne ”skyggingen” er frekvensavhengig.

 

 

Avstandsbedømmelse

 

Avstandsbedømmelsen skjer ved en kombinert analyse av lydens styrke, klangfarge og ”romklang”: Lyden blir svakere ved større avstand. De ulike frekvensene dempes forskjellig avhengig av avstanden, slik at klangfargen forandrer seg. I lukkede rom øker andelen av romklang med avstanden.

 

 

Lokalisering

 

For lave frekvenser (opp til ca. 800 Hz) er det vanskelig å lokalisere lydkilden ved hjelp av lydstyrkeforskjeller, fordi den halve bølgelengden da er ca. like stor eller større enn hodets diameter, slik at lydstyrken (=”lufttrykket”) da omtrent blir like stor på begge ørene. Ved lave frekvenser er derfor tidsforskjellen viktigst for lokaliseringen. Jo høyere frekvensene blir, jo mer virker hodet som lydskjerm for det ene øret, og jo viktigere blir dermed lydstyrkeforskjellen for lokaliseringen. Ørebrusken skygger for lyden som kommer bakfra, endrer dermed altså litt på lydens klangfarge, og er derfor viktig for å bestemme om lyden kommer forfra eller bakfra.



Maskering

 

Vår hørsel har den egenskap at noen lyder kan fortrenge andre. Fører vi f.eks. en samtale i normal lydstyrke og skrur så opp kraftig musikk, vil vi etter en stund ikke høre noe av det som blir sagt. Dette kalles maskering. Musikken ”maskerer” samtalen.

Figuren nedenfor viser hvor sterk en tone må være (som funksjon av frekvensen) for at den ikke skal bli maskert av en tone med 1 kHz frekvens og 100 dB, 80 dB, 60 dB, 40 dB og 20 dB lydstyrke.

Vi kan se i figuren at også ”nabofrekvensene” til den maskerte tonen blir maskert.

Det er lettere å maskere høyere frekvenser enn lavere frekvenser.

Man kan bevisst utnytte denne effekten for å fortrenge uønskete bakgrunnslyder.

 

 

 

Cocktailparty-effekten

 

Vår hørsel klarer ved hjelp av retnings- og avstandsvurderingsevnen å ”plukke” ut en enkel lydkilde blant mange forskjellige lydkilder som høres samtidig. Vi kjenner denne effekten f.eks. fra situasjoner, der vi fører en samtale på et høylytt sted, hvor mange mennesker snakker samtidig. Takket være vår binaurale hørsel klarer vi å skille lydkilder fra hverandre som ligger mer enn 3 grader fra hverandre. Maskeringseffekten er mye mindre effektiv for lydkilder som ikke befinner seg på samme punkt.

 

 

”Mono” og ”Stereo”

 

Ved lydopptak og lydgjengivelser anvendes to hovedprinsipper: Mono- og stereo-teknikk.

 

Mono-teknikken går ut på å ”samle inn” forskjellige lydkilder og å konsentrere dem på ett lydpunkt, som kan gjengis med bare én høyttaler.

 

Stereo-teknikken utnytter menneskets binaurale hørsel og kan på dette grunnlaget reprodusere et romlig fordelt lydbilde. Et slikt lydbilde kan gjengis med to eller flere høyttalere, på en slik måte at vi får muligheten til å oppfatte retning og dybde av lydkildene, - (nesten) på samme måte som i virkeligheten.

 

 

To-kanals-stereo

 

Grunnlaget for to-kanals-stereogjengivelse er at vi benytter to samtidige og likeverdige lydkanaler. Prinsippet går ut på at vi benytter tidsforsinkelser og styrkeforskjeller i høyttalerne til å bestemme retningen til de forskjellige lydene i det totale lydbilde.

 

 

Sumlokalisering

 

Når man tilfører to høyttalere ett og samme signal, skulle man kanskje tro at resultatet ville blitt to punktformete lydkilder, én i venstre og én i høyre høyttaler. Men det viser seg at hørselen vår under en slik forutsetning blir ”lurt” til å tro at lyden bare kommer fra ett punkt - som befinner seg midt i mellom begge høyttalerne, hvor det i virkeligheten ikke finnes noen lydkilde. Forandrer vi på lydstyrkeforholdet og gangtiden mellom de to høyttalerne, kan vi få lyden til å ”vandre” mellom høyttalerne. Denne hørselsmessige illusjonen kalles sumlokaliserings-effekten.

 

 

Fantomlydkilder

 

Er begge høyttaler-signalene avledet fra samme primær-signal, og er avviket mellom dem i styrke og tid mindre enn 20 dB resp. 2 ms, så dannes det pga. sumlokaliserings-effekten fiktive lydkilder mellom høyttalerne. Disse fiktive lydkildene kalles fantomlydkilder.

 

 

Intensitetsstereofoni

 

Benytter vi oss bare av lydstyrkeforskjeller mellom høyttalerne for å plassere fantomlydkildene, snakker vi om intensitetsstereofoni.

 

 

Gangtidsstereofoni

 

Benytter vi oss bare av gangtidsforskjeller mellom høyttalerne for å plassere fantomlydkildene, snakker vi om gangtidsstereofoni.



Stereofoni

 

I praksis har vi som oftest en blanding av både intensitetsstereofoni og gangtidsstereofoni mellom høyttalerne. For å få fullt utbytte av denne ”miksturen” ved avlytting må vi definere ”riktig plassering” av de to høyttalerne og lytteposisjonen i forhold til hverandre.

Den såkalte lyttetrekanten gir den beste forutsetningen for riktig lytting (se figur).

 

 

 

 

Som vi tidligere har sett, vil vi ved et mono-program (der det samme programmet spilles i begge høyttalerene uten styrke- og tidsforskjeller) oppfatte det som om lydkilden befinner seg midt i mellom høyttalerne.

 

Endrer vi styrkeforholdet mellom høyttalerne (forutsatt at vi ikke har noen tidsforsinkelse mellom høyttalerne), vil fantomlydkilden bevege seg gradvis mot høyttaleren med det sterkeste lydnivået. Når styrkeforskjellen mellom høyttalerne har nådd 20 dB, har fantomlydkilden vandret helt bort til den ene (kraftigste) høyttaleren.

 

Endrer vi tilsvarende tidsforsinkelsen mellom høyttalerne (forutsatt at vi ikke har noen lydstyrke-forskjell mellom høyttalerne), vil fantomlydkilden bevege seg gradvis bort fra den høyttaleren som har forsinket lyd. Når tidsforsinkelsen mellom høyttalerne har nådd 2 ms, har fantomlydkilden vandret helt bort til den høyttaleren som ikke har forsinket lyd.

 

Ved hjelp av motfasekomponenter kan man til en viss grad få fantomlydkilden til å vandre på utsiden av basislinjen mellom høyttalerne (”wide-stereo”). Her må man huske på at man får utslukking av motfasekomponentene når man lytter på programmet i mono.

 

Tester viser at hørselens lokaliseringsevne er langt mer eksakt og entydig ved intensitetsstereo enn ved gangtidsstereo.

 

 

Haas-effekten

 

Vi har altså sett at så lenge tidsforsinkelsen mellom høyttalerne er på mellom 0 ms og 2 ms, så danner det seg en fiktiv lydkilde et sted mellom høyttalerne (sumlokalisering).

 

Øker vi tidsforsinkelsen utover 2 ms, blir lyden entydig lokalisert til den høyttaleren hvor lyden kommer fra først. Dette fenomenet kalles Haas-effekten. Haas-effekten gjelder for tidsforsinkelser mellom 2 ms til ca. 50 ms.

 

Øker vi tidsforsinkelsen ytterligere utover 50 ms, begynner vi å høre lyden fra den forsinkete høyttaleren som et ekko.

 

Det viser seg at tidsforsinkelser og styrkeforskjeller mellom høyttalerne til en viss grad kan utjevne hverandre. Har vi f.eks. en tidsforsinkelse på 25 ms mellom høyttalerne, så vil vi høre lyden fra begge høyttalerne når vi øker lydstyrken i den forsinkete høyttaleren med ca. 10 dB. Men i dette tilfellet danner det seg ingen fantomlydkilde, men et noe mer diffust sammensmeltet lydbilde som høres fra begge høyttalerne.

 

Figuren nedenfor viser disse sammenhengene:





Tilbake til forsiden