Ambisonic Tutorial
6 pages
Deutsch

Ambisonic Tutorial

-

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

AMBISONICS TUTORIALEINLEITUNGAmbisonic hat etliche Vorteile verglichen mit anderen Surroundsound- Techniken:- Es ist perifonisch (D.h. es beinhaltet auch die Höhenkomponente des Tons)- Das Klangbild ist stabil und präzise, unabhängig von der Position des virtuellenKlanges (Egal ob direkt von den Lautsprechern kommend oder von einem Punktzwischen ihnen). Das bedeutet, der Klang verändert sich nicht, während erumherwandert; der Klang wird von der Lautsprecheraufstellung befreit.- Die Position des Zuhörers ist nicht so wichtig für eine wahrheitsgetreue Lokalisationdes Klanges wie bei anderen surroundsound -techniken. Sogar Zuhörer weit entferntvon der Mitte erhalten noch ein realistischen Raumeindruck.- Ist der Klang einmal räumlich kodiert kann er für eine Aufführung auf jede gewünschteLautsprecher- Konfiguration dekodiert werden, solange diese symmetrisch ist.- Ambisonics kostet nichts und ist wirkungsvoll.- Es kann mit Entfernungs- Hinweisen der virtuellen Klangquelle kombiniert werden,was zu Klängen führt, die als näher oder weiter entfernt vom Zuhörer wahrgenommenwerden.DAS AMBISONIC FORMATDie räumliche Wiedergabe mit Ambisonic teilt sich in zwei grundlegende Teile auf:1. Encodierenund2. DecodierenENCODIERENBeim encodieren wird entweder eine Tonquelle mit einem Soundfield – Mikrofon oderaufgenommen, oder Winkel und Höhenwinkel- Koordinaten werden mithilfe derEncodiergleichungen einer beliebigen Mono- Quelle (Tonspur/ Sprache/ Instrument ...

Sujets

Informations

Publié par
Nombre de lectures 57
Langue Deutsch
AMBISONICS TUTORIAL EINLEITUNG Ambisonic hat etliche Vorteile verglichen mit anderen Surroundsound- Techniken:
-Es ist perifonisch (D.h. es beinhaltet auch die Höhenkomponente des Tons)
-Das Klangbild ist stabil und präzise, unabhängig von der Position des virtuellen Klanges (Egal ob direkt von den Lautsprechern kommend oder von einem Punkt zwischen ihnen). Das bedeutet, der Klang verändert sich nicht, während er umherwandert; der Klang wird von der Lautsprecheraufstellung befreit.
-Die Position des Zuhörers ist nicht so wichtig für eine wahrheitsgetreue Lokalisation des Klanges wie bei anderen surroundsound -techniken. Sogar Zuhörer weit entfernt von der Mitte erhalten noch ein realistischen Raumeindruck.
-Ist der Klang einmal räumlich kodiert kann er für eine Aufführung auf jede gewünschte Lautsprecher- Konfiguration dekodiert werden, solange diese symmetrisch ist.
-Ambisonics kostet nichts und ist wirkungsvoll.
-Es kann mit Entfernungs- Hinweisen der virtuellen Klangquelle kombiniert werden, was zu Klängen führt, die als näher oder weiter entfernt vom Zuhörer wahrgenommen werden.
DAS AMBISONIC FORMAT
Die räumliche Wiedergabe mit Ambisonic teilt sich in zwei grundlegende Teile auf:
1. Encodieren und 2. Decodieren
ENCODIEREN Beim encodieren wird entweder eine Tonquelle mit einem Soundfield – Mikrofon oder aufgenommen, oder Winkel und Höhenwinkel- Koordinaten werden mithilfe der Encodiergleichungen einer beliebigen Mono- Quelle (Tonspur/ Sprache/ Instrument/ synthetischer Klang/ mikrofonierter Klang) auf dem Computer zugeordnet. Das Ergebnis sind 4 Audio Spuren (W, X, Y, Z) inAmbisonics erster Ordnung oder 9 Audio Spuren (W, X, Y, Z, R, S, T, U, V) im Ambisonics Format zweiter Ordnung. W ist omnidirektional/ scalar (= Richtungsungebunden) und enthält lediglich den Schalldruckpegel des Signals, währen die anderen vektorielle, d.h. gerichtete Gröen sind, die die Richtungen im Kartesischen Raum repräsentieren. W enthält das gesamte Signal, aber ohne Richtungskomponente, als sei es ein Mono- Signal. X zum Beispiel dagegen enthält nur die Komponente des Klanges, die sich in X- Richtung fortbewegt. Es wird das volle Signal (Amplitude =1)für eine Tonquelle genau vor oder hinter (Amplitude
=-1)dem Zuhörer liegend erhalten (also genau auf der X-Achse), aber kein Signal (Amplitude =0) von einem Signal das genau auf der Y- Achse liegt, also rechts oder links des Zuhörers. Alle Töne zwischen den Hauptrichtungen der Achsen werden in Bezug auf ihre Richtungsenergie aufgeteilt, ihrer Position entsprechend. So werden die räumlichen Richtungen encodiert. Schöne Visualisierungen der Richtungs- Bereiche hier: http://members.tripod.com/martin_leese/Ambisonic/harmonic.html
Hier sind die Encodier- Gleichungen für Ambisonic zweiter Ordnung von Richard Furse and Dave Malham (FMH -set of encoding equations). Das Signal wird mit ihnen multipliziert um die Information räumlich zu encodieren. Winkel (A) und Höhenwinkel (E) werden nach belieben zugeordnet. Dies projiziert die Töne an Punkte auf der Einheits-Entfernung. Für nähere und weiter entferntere Klänge müssen Entfernungs- Hinweise hinzugefügt werden.
FMH -Sammlung der Encodier-Gleichungen:
Bezeichnung Polar-KoordinatensystemKartesisches Koordinatensystem W= Signal* 0.7071070.707107 X= Signal* cos(A)cos(E)x Y= Signal* sin(A)cos(E)y Z= Signal* sin(E)z R= Signal* 1.5sin(E)sin(E)-0.51.5zz-0.5 S= Signal* cos(A)sin(2E)2zx T= Signal* sin(A)sin(2E)2yz U= Signal* cos(2A)cos(E)cos(E)xx-yy V= Signal* sin(2A)cos(E)cos(E)2xy Empfehlungen: http://www.york.ac.uk/inst/mustech/3d_audio/ambis2.htm Spatial Hearing Mechanisms and Sound Reproduction von D.G. Malham, University of York, England
http://www.york.ac.uk/inst/mustech/3d_audio/ambitips.html Ambisonics hints and tips page
http://www.muse.demon.co.uk/3daudio.html Ambisonics von Richard Furse http://members.tripod.com/martin_leese/Ambisonic/ Ambisonics Info –Page von Martin Leese
DEKODIEREN Beim dekodieren werden die encodierten Tonspuren den Lautsprechern in Relation zu deren Position (abhängig vom Gewählten Lautsprecher Setup) zugeordnet: Jedem Lautsprecher wird der genaue Anteil aus jeder räumlich encodierten Richtung zugeordnet, seiner Position im Raum entsprechend. Jedes Symmetrische Lautsprecher-Layout von 1 bis N Lautsprechern kann gewählt werden, wobei die Klarheit der räumlichen Wiedergabe sich verbessert, je mehr Lautsprecher zur Verfügung stehen. Auerdem werden die vektoriell aufgezeichneten Spuren in einem bestimmten Verhältnis mit dem omnidirektionalen W kombiniert.
Es kann direkt nach dem enkodieren dekodiert werden, so brauchen keine encodierten Tonspuren aufgezeichnet werden. Der üblichere Weg ist jedoch, die 9 encodierten Spuren aufzuzeichnen und sie zu decodieren, um die Tonspuren zu erhalten, die dann die Lautsprecher ansteuern. Natürlich kann man mit genügend CPU- Leistung auch die vorgefertigten encodierten Spuren in Echtzeit decodieren.
Hier sind die Ambisonic Decodiergleichungen erster und zweiter Ordnung von Dave Malham und Richard Furse: http://www.muse.demon.co.uk/ref/speakers.html
VERRÄUMLICHUNG MIT DER SAMMLUNG DER CSOUND-VERRÄUMLICHUNGSINSTRUMENTE
Diese Sammlung von Csound- Instrumenten verräumlicht 20 Klangquellen unabhängig voneinander im dreidimensionalen Raum mithilfe von Ambisonics 2ter Ordnung und kombiniert diese mit Distanz- Hinweisen. Es gibt drei Hauptbereiche in dieser Instrumentensammlung:
1. Erzeugung eines Bewegungspfades für jede der 20 Klangquellen im 3d Raum 2. Erweiterung der Tonspur um Distanz- Hinweise und Erzeugung eines akustischen Raumumfeldes 3. Verräumlichung der Klangquelle, des Halls und der Ersten Reflexionen mithilfe der Ambisonic- Gleichungen
Wichtig zu beachten ist, daAmbisonic keine Entfernungs- Informationen umsetzen kann. Ambisonic ist nur für die Richtung des Schalls zuständig. Alle Töne werden auf die gedachte Kugeloberfläche projiziert, auf der die Lautsprecher in gleicher Distanz zum Mittelpunkt angeordnet sind, wenn sie nicht mit Distanz -Information angereichert werden. Zum Glück können Distanz Informationen sehr gut mit Ambisonics kombiniert werden. Für manche Distanzhinweise wie z.B. das Muster der Erstreflexionen ist eine Kombination mit Ambisonic sogar Voraussetzung, sodasie perifonisch aus verschiedenen Richtungen beim Zuhörer eintreffen können.
Für Richtungsinformation: Ambisonics Für Distanz- Information: Distanzhinweise (Teilweise durch Ambisonics verräumlicht)
Diese Trennung muklar hervorgehoben werden.
BEWEGUNGSPFADE Ziel ist, eine Sammlung von Bewegungspfaden zu erzeugen, die jeweils den Winkel(A), den Höhenwinkel(E) und die Entfernung(D) eines Klanges zu jedem Moment beinhalten. So wird eine Position eines Klanges im dreidimensionalen Raum zu jedem Zeitpunkt definiert. Es ist egal, ob für diese Wege Polar- oder Kartesische Koordinaten verwendet werden, sie können sogar ineinander Konvertiert werden. Sogar eine aufeinanderfolgende Kombination beider Systeme ist möglich: Einige Teile des Bewegungspfades können mit Polar- Koordinaten, andere mit Kartesischen beschrieben
werden. Was jedoch nie passieren sollte ist, daein Teilstück des Pfades an einem Punkt endet und das Folgende sich an einem anderen Punkt im Raum fortsetzt. Es müssen gleitende Übergänge erzeugt werden, ansonsten sind Klicks und Plopps die Folge. Anfangs und Endpunkt, sowie die Zeit, die es braucht vom einen zum anderen zu kommen, definieren ein Teilstück eines Bewegungspfades. Das folgende Teilstück schliet am Endpunkt des Vorhergehenden an. Alle diese Start und Endpunkte sind jeweils mit einer Funktionstabelle genügend hoher Auflösung verbunden, die für einen kontinuierlichen Übergang zwischen beiden sorgt. Die Funktionen können gerade Linien sowie Exponential- Funktionen sein, sowie jede andere gewünschte Funktion. Diese Funktion kann danach noch mit Zufallsbewegungen oder einer/ mehreren periodischen Schwingungen moduliert werden, sodakomplexe Bewegungsmuster entstehen.
ENCODIEREN VON TIEFE
Dies sind die wichtigsten Entfernungshinweise:
1. Abschwächung 2. Omnidirektionaler Hall 3. Direktionaler Hall 4. Filterung 5. Erste Reflexionen
Abschwächung Am wichtigsten ist die Tatsache, dasich die Lautstärke des Schalls mit zunehmender 1 Entfernung abschwächt. Daher sollten entferntere Klänge mit dem Faktor 1/D(D= Distanz in Entfernungseinheiten, 1 Entfernungseinheit ist die Entfernung vom Ursprung des Koordinatensystems zur gedachten Kugelebene, auf der die Lautsprecher angeordnet sind) abgeschwächt werden. Nähere Töne nehmen dagegen an Lautstärke zu. Ein Ton mit genau einer Entfernungseinheit Abstand bekommt also den Lautstärkefaktor 1, alle anderen Töne bekommen einen Lautstärkefaktor von 1/D. Der Opcode locsig“ macht dieses automatisch. Beachten sollte man, dadie Töne fast unendlich Laut werden können, wenn sie nahe an den Ursprungspunkt des Koordinatensystems kommen: Entweder mu verhindert werden, dadie Töne so nah kommen (Beschränkung von D) oder die resultierende Lautstärke mu beschränkt werden. Man beachte dader Ton mit seiner Entfernung dadurch so verbunden wird, daer keine absolute Lautstärke mehr besitzt: die Komposition ändert sich mit der Position des Tones.
Omnidirektionaler Hall Ein anderer wichtiger Entfernungshinweis ist das Verhältnis des reflektierten Teils des Schalles zum direkten Schall. Entfernt sich der Ton, sollte der Hall nicht so sehr abgeschwächt werden wie der direkte Schall. Das Ergebnis ist ein fast trockener“ Schall nahe des Zuhörers und ein zunehmend verhallter, wenn er sich entfernt. Man kann das Modell von Chowning anwenden, das das Verhältnis des verhallten Schalles auf 1/D 2 setzt, während der direkte Schall mit 1/D abnimmt. Direktionaler Hall
1 Charles Dodge, Thomas A. Jerse: Computer Music (zweite Auflage), Kapitel 10.2C, S. 314 2 Charles Dodge, Thomas A. Jerse: Computer Music (zweite Auflage), Kapitel 10.2F, S. 319
In Chownings Modell, das hier angewendet wird, wird die Geammthallenergie nochmals aufgeteilt in omnidirektionalen und direktionalen Hall. Während die omnidirektionale Hallenergie von etlichen Richtungen kommt (Mehrere Hallerzeugungseinheiten mit leicht abweichenden Parametern), ist der direktionale Hall an die Position der Schallquelle gebunden. Ihr Verhältnis wird mit 1/D für die omnidirektionale Hallenergie und 1-1/D für den direktionalen Hall ausgedrückt. Dies führt zu einem höheren Anteil direktionalen Halles für entfernte Schallquellen.
Filterung Auf weiter entfernte Schallquellen sollte eine Tiefpassfilterung angewendet werden. Dies simuliert den Verlust von hohen Frequenzen aufgrund langer Wege durch das Luftmedium. Die Parameter des Filters sollten dynamisch mit der Entfernung (D) des Schalls verbunden werden.
Muster von Erstreflexionen Die Wahrnehmung des räumlichen Eindrucks wird erhöht mit der Hinzufügung eines sich dynamisch ändernden Musters von Erstreflexionen. Vier virtuelle Wände, Decke und Boden werden in einer bestimmten Entfernung generiert, an denen die Schallenergie reflektiert wird. Die Positionen der Reflexion ändern sich mit der Bewegung des Schalles. Auch die Lautstärke verändert sich mit der Entfernung, die der reflektierte Schall 3 zurückgelegt hat. David Griesingerzufolge sollten die Parameter so gewählt werden, 4 dadie ersten Reflexionen in einem Zeitbereich von 20-50msnach dem Schallereignis eintreffen. Zwei Arten von Reflexionen werden hier berechnet: Spiegelung und diffuse Reflexion, da die Reflexionsgesetze beider verschieden sind. Natürlich werden die Erstreflexionen nach Richtung im Raum verteilt um ihre Herkunftsrichtung zu simulieren. Das Ergebnis ist mehr Transparenz, eine gesteigerte Tiefenwahrnehmung des Raumes sowie eine gesteigerte Wahrnehmung der Entfernung des Tones.
Coderen der Bewegung Im Csound- Spatializing.orc wird die Dopplerverschiebung der Tonhöhe dynamisch berechnet mit der Formel f = f(c/c-v), während f‘ die veränderte Tonhöhe ist, c die Geschwindigkeit des Schalls in der Luft (345 m/s) und v die Geschwindigkeit der Schallquelle in Bezug auf den Zuhörer. Man beachte dader Ton mit seiner Geschwindigkeit dadurch so verbunden wird, daer keine absolute Tonhöhe mehr besitzt: die Komposition ändert sich mit der Bewegung des Tones.
ALLGEMEINES (ZAK- PATCH- SYSTEM) Bitte beachten, dadie Verarbeitung des Klanges in Bezug auf Verräumlichung, Erzeugung von Tiefe usw. auf etliche Instrumente innerhalb des Csound- Orchestras verteilt ist. Der Schall wird unter den Instrumenten als a-Rate- Variable weitergegeben, während die A- (Winkel), E- (Höhenwinkel) und D- (Entfernung) Positionen als k-Rate Variable weitergegeben werden, beide mittels des Zak- patch- Systems.
3 David Griesinger: The Psychoacoustics of Listening Area, Depth, and Envelopment in Surround Recordings and their relationship to Microphone Technique“, Session- Paper der 19 AES Konferenz, Juni 2001 4 The Theory and Practice of Perceptual Modeling - How to use Electronic Reverberation to Add Depth and Envelopment Without Reducing Clarity“ herunterladbar auf D. Griesingers Seiten http://www.world.std.com/~griesngr
DECODIEREN Das decodieren erfolgt in einem separaten .orc. Einige Lautsprecheraufstellungen sind bereits codiert, sie können aber nach persönlichen Erfordernissen ergänzt werden. Es mu normalerweise ein Testlauf unternommen werden, bei dem der Lautstärkefaktor girescale“ auf 1 gesetzt worden ist. Im Ausgabefenster werden am Schlu die maximalen Lautstärkepegel einer jeden generierten Tonspur erscheinen, der korrekte Lautstärkefaktor kann sodann durch teilen von 32768 durch die maximale Lautstärke ermittelt werden. Dieser Faktor wird sich jedes mal aufgrund des verwendeten Rohmaterials und der gewählten Lautsprecheraufstellung unterscheiden Falls 8bit-Tonspuren als output mit "soundout" gewählt wurde müssen diese jedoch in 16bit umgewandelt werden und mit dem entsprechenden Header versehen werden. Dies kann zum Beispiel mit dem Programm Soundhack (freeware, aber nur macintosh: http://www.soundhack.com/). getanwerden. Die Tonsuren können dann in einen Audio-Editor geladen werden, um sie simultan zu spielen.
Copyright bei Jan Jacob Hofmann. Für jegliche Kommentare, Hinweise, Feedback, Bug-Reports und Fragen bittejjh@sonicarchitecture.dekontaktieren. www.sonicarchitecture.de