Mixed pseudo analogue-digital speech and audio coding [Elektronische Ressource] / Carsten Eric Johannes Hoelper
166 pages
Deutsch

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris

Mixed pseudo analogue-digital speech and audio coding [Elektronische Ressource] / Carsten Eric Johannes Hoelper

Découvre YouScribe en t'inscrivant gratuitement

Je m'inscris
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
166 pages
Deutsch
Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Mixed Pseudo Analogue-DigitalSpeech and Audio CodingGemischt Pseudoanalog-DigitaleSprach- und AudiocodierungVon der Fakultät für Elektrotechnik und Informationstechnikder Rheinisch-Westfälischen Technischen Hochschule Aachenzur Erlangung des akademischen Grades eines Doktors derIngenieurwissenschaften genehmigte Dissertationvorgelegt vonDiplom-IngenieurCarsten Eric Johannes Hoelperaus KorschenbroichBerichter: Universitätsprofessor Dr.-Ing. Peter VaryUniv D Stefan HeinenTag der mündlichen Prüfung: 3. Dezember 2010Diese Dissertation ist auf den Internetseiten der Hochschulbibliothek online verfügbar.AACHENER BEITRÄGE ZU DIGITALEN NACHRICHTENSYSTEMENHerausgeber:Prof. Dr.-Ing. Peter VaryInstitut für Nachrichtengeräte und DatenverarbeitungRheinisch-Westfälische Technische Hochschule AachenMuffeter Weg 3a52074 AachenTel.: 0241-80 26 956Fax.: 0241-80 22 186Bibliografische Information der Deutschen BibliothekDie Deutsche Bibliothek verzeichnet diese Publikation in derDeutschen Nationalbibliografie; detaillierte bibliografischeDaten sind im Internet über http://dnb.ddb.de abrufbar1. Auflage Aachen:Wissenschaftsverlag Mainz in Aachen(Aachener Beiträge zu digitalen Nachrichtensystemen, Band 27)ISSN 1437-6768ISBN 3-86130-653-0© 2010 Carsten HoelperWissenschaftsverlag MainzSüsterfeldstr. 83, 52072 AachenTel.: 02 41 / 2 39 48 oder 02 41 / 87 34 34Fax: 02 41 / 87 55 77www.Verlag-Mainz.deHerstellung: Druckerei Mainz GmbH,Süsterfeldstr.

Informations

Publié par
Publié le 01 janvier 2011
Nombre de lectures 36
Langue Deutsch
Poids de l'ouvrage 14 Mo

Extrait

Mixed Pseudo Analogue-Digital
Speech and Audio Coding
Gemischt Pseudoanalog-Digitale
Sprach- und Audiocodierung
Von der Fakultät für Elektrotechnik und Informationstechnik
der Rheinisch-Westfälischen Technischen Hochschule Aachen
zur Erlangung des akademischen Grades eines Doktors der
Ingenieurwissenschaften genehmigte Dissertation
vorgelegt von
Diplom-Ingenieur
Carsten Eric Johannes Hoelper
aus Korschenbroich
Berichter: Universitätsprofessor Dr.-Ing. Peter Vary
Univ D Stefan Heinen
Tag der mündlichen Prüfung: 3. Dezember 2010
Diese Dissertation ist auf den Internetseiten der Hochschulbibliothek online verfügbar.AACHENER BEITRÄGE ZU DIGITALEN NACHRICHTENSYSTEMEN
Herausgeber:
Prof. Dr.-Ing. Peter Vary
Institut für Nachrichtengeräte und Datenverarbeitung
Rheinisch-Westfälische Technische Hochschule Aachen
Muffeter Weg 3a
52074 Aachen
Tel.: 0241-80 26 956
Fax.: 0241-80 22 186
Bibliografische Information der Deutschen Bibliothek
Die Deutsche Bibliothek verzeichnet diese Publikation in der
Deutschen Nationalbibliografie; detaillierte bibliografische
Daten sind im Internet über http://dnb.ddb.de abrufbar
1. Auflage Aachen:
Wissenschaftsverlag Mainz in Aachen
(Aachener Beiträge zu digitalen Nachrichtensystemen, Band 27)
ISSN 1437-6768
ISBN 3-86130-653-0
© 2010 Carsten Hoelper
Wissenschaftsverlag Mainz
Süsterfeldstr. 83, 52072 Aachen
Tel.: 02 41 / 2 39 48 oder 02 41 / 87 34 34
Fax: 02 41 / 87 55 77
www.Verlag-Mainz.de
Herstellung: Druckerei Mainz GmbH,
Süsterfeldstr. 83, 52072 Aachen
Tel.: 02 41 / 87 34 34; Fax: 02 41 / 87 55 77
www.Druckservice-Aachen.de
Gedruckt auf chlorfrei gebleichtem Papier
"D 82 (Diss. RWTH Aachen University, 2010)"Acknowledgements
This thesis was written between 2005 and 2010, mostly during my time as a research
and teaching assistant at the Institut für Nachrichtengeräte und Datenverarbeitung
(IND) at the Rheinisch-Westfälische Technische Hochschule (RWTH) Aachen.
First of all, I would like to express my sincere gratitude to my supervisor, Prof.
Dr.-Ing. Peter Vary, whose continuous support made this work possible.
Also I would like to thank my colleagues at IND for providing a very pleasant and
enjoyable working environment. For many inspiring discussions and proof-reading
of the manuscript, I particularly thank Dipl.-Ing. Tobias Breddermann, Dipl.-Ing.
Hauke Krüger, and Dipl.-Ing. Laurent Schmalen and I want to thank my former
colleague Dr.-Ing. Marc Adrat for his valuable input especially during the initial
phase of this research.
Special thanks go to the students who contributed to this work.
Last but not least, I want to thank my wife and sons, Aneliya, Maksim, and
Darian, my family and my friends for supporting and encouraging me all the time.
Aachen, July 2010 Carsten HoelperAbstract
Current speech, audio, and video coding and transmission systems are either
analogue or digital, with a strong shift from analogue systems to digital systems
during the last decades for the benefit of exploiting digital channel coding for error
correction. Combining both, digital and analogue schemes results in the benefit of
saving transmission bandwidth, complexity, and of improving the achievable quality
at any given signal-to-noise ratio on the channel within the range of interest.
The combination was achieved by transmitting pseudo analogue samples of the
unquantized residual signal of a linear predictive digital filter. This principle, called
Mixed Pseudo Analogue-Digital (MAD) transmission, is applied to both, narrow-
band, and wideband speech, as well as to audio signals.
After introduction of the MAD transmission principle, this contribution exam-
ines the performance of the novel scheme for speech and audio transmission over a
channel modelled as fading Additive White Gaussian Noise (AWGN with flat fad-
ing) with Rayleigh fading. An implementation of MAD transmission is compared
to the GSM Adaptive Multi-rate speech codec mode 12.2 kbit/s (Enhanced Fullrate
Codec, EFR), which uses a comparable transmission bandwidth if channel coding
is included.
The simulative results are backed by a thorough information theoretical analysis
of the principles used in MAD transmission, pointing out that the increased per-
formance mainly stems from the combination of digitally transmitting the spectral
envelope of the signal while at the same time the Gaussian residual signal is the
optimum input for the AWGN channel.
Modulation schemes using the Archimedes Spiral for mapping the pseudo ana-
logue residual to a 2-dimensional signal space are theoretically motivated and de-
veloped to enhance the quality of the basic system.
Finally, possible applications like MAD microphones and headsets are suggested
and further prospects like channel adaptive MAD are briefly given.Kurzfassung
Heutige Systeme zur Codierung und Übertragung von Sprach-, Audio- und
Videodaten sind entweder digital oder analog, wobei es in den letzten Jahrzehn-
ten einen starken Trend von analogen hin zu digitalen Systemen gegeben hat, die
mittels Kanalcodierung Übertragungsfehler ausgleichen können. Eine Kombina-
tion von digitaler und analoger Welt spart sowohl Übertragungsbandbreite als auch
Komplexität, während die erzielbare Qualität im interessanten Bereich der Signal-
Rausch-Abstände auf dem Kanal gesteigert wird.
Die Kombination wird hier erreicht, indem die pseudo-analogen Abtastwerte
des Restsignals nach linearer Prädiktion unquantisiert übertragen werden. Dieses
Prinzip, gemischt pseudoanalog-digitale Übertragung (MAD: Mixed Pseudo Ana-
logue-Digital transmission), wird auf Telefonsprache, breitbandige Sprache und Au-
dioübertragung angewendet.
Die vorliegende Arbeit untersucht die Leistungsfähigkeit des MAD Übertraguns-
systems anhand von Sprach- und Audioübertragung über einen AWGN Kanal mit
flachem Rayleigh Fading. MAD Übertragung wird mit dem Adaptiven Multiraten-
codec im 12.2 kbit/s Modus (Enhanced Fullrate Codec) verglichen, der mit Kanal-
codierung eine vergleichbare Bruttobandweite auf dem Kanal benötigt.
Die simulativen Ergebnisse werden mit einer informationstheoretischen Betra-
chtung hinterlegt. Es wird gezeigt, dass nach digitaler Codierung der spektralen
Einhüllenden ein Gaussförmiges Restsignal zu übertragen bleibt, welches ideal an
den AWGN Kanal angepasst ist.
Modulationsschemata, die mit der Archimedesspirale das pseudoanaloge Restsig-
nal in einen zweidimensionalen Signalraum überführen, werden vorgestellt und the-
oretisch beleuchtet um die Qualität des MAD Systems weiter zu steigern.
Schließlich werden Anwendungsszenarien wie ein MAD Mikrofon, Hörgerät oder
Headset umrissen und es wird ein kurzer Ausblick auf kanaladaptive MAD Über-
tragung gegeben.Contents
1 Introduction 1
1.1 AnalogueTransmission.......................... 2
1.2 DigitalTransmision....... 2
1.3 MixedTransmision....................... 3
2 Fundamentals 5
2.1 SourceCoding .............................. 5
2.1.1 AudioBandwidth .... 6
2.1.2 LinearPrediction......................... 6
2.1.3 ResidualCoding..... 8
2.2 ChannelCoding.............................. 11
2.2.1 BlockCodes........ 12
2.2.2 ConvolutionalCodes....................... 12
2.2.3 AMRMode12.2kbit/sErorCorection....... 12
2.3 ModelsforTransmision......................... 13
2.3.1 AnalogueSchemes.... 15
2.3.2 DigitalSchemes.......................... 16
2.4 QualityEvaluation........ 17
2.4.1 PerceptualEvaluationofSpechQuality(PESQ)....... 18
2.4.2 PerceptualEvaluationofAudioQuality(PEAQ)... 18
3 Mixed Pseudo Analogue-Digital Speech & Audio Transmission 21
3.1 Pseudo Analogue ............................. 22
3.2 State-Of-The-ArtofAnalogue-DigitalTransmision..... 22
3.2.1 Pseudo-Analog Speech Transmission in Mobile Radio
CommunicationSystems..................... 22ii
3.2.2 HybridDigital-AnalogCoding ................. 23
3.3 PrinciplesofMADCoding.............. 24
3.3.1 ProcesingintheDigitalDomain................ 25
3.3.2 BasebandTransmisionModel ....... 29
3.3.3 TransmissionoverBandPassAWGNChannels........ 31
3.3.4 TransmisionoverRayleighFadingChannels.... 35
3.3.5 Scalability of the MAD Transmission Scheme . . ....... 36
4 MAD Modulation Schemes 39
4.1 DigitalInformation............................ 39
4.2 PseudoAnalogueInformation...... 40
4.2.1 MappingtotheUnitCircle................... 41
4.2.2 PulseAmplitudeModulation(PAM).... 46
4.2.3 QuadraturePulseAmplitudeModulation(QPAM)...... 47
4.2.4 ArchimedesSpiralMapping(ASM)............... 47
5 Information Theoretic Evaluation of MAD Transmission 59
5.1 IntroductiontoInformationTheory .................. 59
5.1.1 Entropy,MutualInformation.. 60
5.1.2 Channel,ChannelCapacity................... 61
5.1.3 Channel Capacity of an AWGN Channel for Gaussian or
Binary Input ........................... 61
5.1.4 CapacityofMultiplexedChannels..... 65
5.2 RateDistortionTheory......................... 68
5.3 PerformanceLimit....... 71
5.4 Information Theoretic Comparison to Digital Transmission . . . . . 72
5.4.1 SimplifiedTra

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents