Identification and analysis of patterns in DNA sequences, the genetic code and transcriptional gene regulation [Elektronische Ressource] / von Swetlana Nikolajewa
105 pages
English

Identification and analysis of patterns in DNA sequences, the genetic code and transcriptional gene regulation [Elektronische Ressource] / von Swetlana Nikolajewa

Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres
105 pages
English
Le téléchargement nécessite un accès à la bibliothèque YouScribe
Tout savoir sur nos offres

Description

Identification and Analysis of Patternsin DNA sequences, the Genetic Codeand Transcriptional Gene RegulationDissertationzur Erlangung des akademischen Gradesdoctor rerum naturalium (Dr. rer. nat.)vorgelegt dem Rat der Biologisch-Pharmazeutischen Fakult¨atder Friedrich-Schiller-Universit¨at Jenavon Magister der Mathematik Swetlana Nikolajewageboren am 19. November 1975 in Rostow-am-Don, RusslandDie vorliegende Arbeit wurde in der Arbeitsgruppe Theoretische Systembiolo-gie (TSB) des Leibniz-Instituts fur¨ Altersforschung Fritz-Lipmann-Institut e. V.(vormals IMB) unter der Leitung von Dr. Thomas Wilhelm angefertigt.Gutachter:1. Prof. Dr. Stefan Schuster2.3.Tag des Rigorosums:Tag der offen¨ tlichen Verteidigung:1AbstractThe present cumulative work consists of six articles linked by the topic ”Identifi-cation and Analysis of Patterns in DNA sequences, the Genetic Code and Tran-scriptional Gene Regulation”. We have applied a binary coding, to efficiently findpatterns within nucleotide sequences. In the first and second part of my workone single bit to encode all four nucleotides is used. The three possibilities ofa one - bit coding are: keto (G,U) - amino (A,C) bases, strong (G,C) - weak(A,U) bases, and purines (G,A) - pyrimidines (C,U). We found out that thebest pattern could be observed using the purine - pyrimidine coding.

Sujets

Informations

Publié par
Publié le 01 janvier 2006
Nombre de lectures 10
Langue English
Poids de l'ouvrage 2 Mo

Extrait

Identification and Analysis of Patterns
in DNA sequences, the Genetic Code
and Transcriptional Gene Regulation
Dissertation
zur Erlangung des akademischen Grades
doctor rerum naturalium (Dr. rer. nat.)
vorgelegt dem Rat der Biologisch-Pharmazeutischen Fakult¨at
der Friedrich-Schiller-Universit¨at Jena
von Magister der Mathematik Swetlana Nikolajewa
geboren am 19. November 1975 in Rostow-am-Don, RusslandDie vorliegende Arbeit wurde in der Arbeitsgruppe Theoretische Systembiolo-
gie (TSB) des Leibniz-Instituts fur¨ Altersforschung Fritz-Lipmann-Institut e. V.
(vormals IMB) unter der Leitung von Dr. Thomas Wilhelm angefertigt.Gutachter:
1. Prof. Dr. Stefan Schuster
2.
3.
Tag des Rigorosums:
Tag der offen¨ tlichen Verteidigung:1
Abstract
The present cumulative work consists of six articles linked by the topic ”Identifi-
cation and Analysis of Patterns in DNA sequences, the Genetic Code and Tran-
scriptional Gene Regulation”. We have applied a binary coding, to efficiently find
patterns within nucleotide sequences. In the first and second part of my work
one single bit to encode all four nucleotides is used. The three possibilities of
a one - bit coding are: keto (G,U) - amino (A,C) bases, strong (G,C) - weak
(A,U) bases, and purines (G,A) - pyrimidines (C,U). We found out that the
best pattern could be observed using the purine - pyrimidine coding. Apply-
ing this coding we have succeeded in finding a new representation of the genetic
code which has been published under the title ”A New Classification Scheme of
the Genetic Code” in ”Journal of Molecular Biology” and ”A Purine-Pyrimidine
Classification Scheme of the Genetic Code” in ”BIOForum Europe”. This new
representation enables to reduce the common table of the genetic code from 64 to
32 fields maintaining the same information content. It turned out that all known
and even new patterns of the genetic code can easily be recognized in this new
scheme. Furthermore, our new representation allows us for speculations about
the origin and evolution of the translation machinery and the genetic code. Thus,
we found a possible explanation for the contemporary codon - amino acid assign-
ment and wide support for an early doublet code. Those explanations have been
published in ”Journal of Bioinformatics and Computational Biology” under the
title ”The New Classification Scheme of the Genetic Code, its Early Evolution,
and tRNA Usage”. Assuming to find these purine - pyrimidine patterns at theAbstract 2
DNA level itself, we examined DNA binding sites for the occurrence of binary
patterns. A comprehensive statistic about the largest class of restriction enzymes
(type II) has shown a very distinctive purine - pyrimidine pattern. Moreover,
we have observed a higher G+C content for the protein binding sequences. For
both observations we have provided and discussed several explanations published
under the title ”Common Patterns in Type II Restriction Enzyme Binding Sites”
in ”Nucleic Acid Research”. The identified patterns may help to understand how
a protein finds its binding site.
InthelastpartofmyworktwosubmittedarticlesabouttheanalysisofBoolean
functionsarepresented. Booleanfunctionsareusedforthedescriptionandanaly-
sisofcomplexdynamicprocessesandmakeiteasiertofindbinarypatternswithin
biochemical interaction networks. It is well known that not all functions are nec-
essary to describe biologically relevant gene interaction networks. In the article
entitled ”Boolean Networks with Biologically Relevant Rules Show Ordered Be-
havior”, submitted to ”BioSystems”, we have shown, that the class of required
Boolean functions can strongly be restricted. Furthermore, we calculated the
exact number of hierarchically canalizing functions which are known to be bio-
logically relevant. In our work ”The Decomposition Tree for Analysis of Boolean
Functions”submittedto”JournalofComplexity”, weintroducedanefficientdata
structure for the classification and analysis of Boolean functions. This permits
the recognition of biologically relevant Boolean functions in polynomial time.3
Zusammenfassung
Die vorliegende kumulative Arbeit besteht aus 6 Artikel, die durch das Thema
”IdentifikationundAnalysevonMusterninDNASequenzen,imgenetischenCode
und in der transkriptionellen Genregulation” verbunden sind.
Im ersten und zweiten Teil meiner Arbeit wurde eine bin¨are Kodierung ange-
wandt,umeffizientMusterinNukleotidsequenzenfindenzuk¨onnen. DieKodierung
aller 4 Basen durch ein einzelnes Bit stellte sich als die Einfachste heraus. Es
gibt die folgenden M¨oglichkeiten einer Einzelbitkodierung: Keto (G,U) - Amino
(A,C) Basen, Starke (G,C) - Schwache (A,U) Basen und Purine (G,A) - Pyrim-
idine (C,U). Beim Test aller drei M¨oglichkeiten erkannten wir, dass bei einer
Purin/Pyrimidin Kodierung der Basen die signifikantesten Muster entstanden.
Mittels der bin¨aren Kodierung (Purine (1) - Pyrimidine (0)) gelang es uns eine
neue Darstellung des genetischen Codes zu finden und unter dem Titel ”A New
Classification Scheme of the Genetic Code” in ”Journal of Molecular Evolution”,
sowie unter dem Titel ”A Purine-Pyrimidine Classification Scheme of the Ge-
netic Code” in ”BIOForum Europe” zu ver¨offentlichen. Diese neue Darstellung
erlaubteunseineReduzierungdesbekanntenSchemasvonbisher64auf32Felder,
bei gleichbleibendem Informationsgehalt. Es stellte sich heraus, dass alle bereits
bekannten Muster des genetischen Codes leicht zu erkennen sind und sogar noch
weitere hinzukommen. Weiterhin l¨asst das neue Schema Spekulationen ub¨ er
die Entstehung und Entwicklung der heutigen Translationsmaschinerie und des
genetischen Codes zu. Wir fanden eine m¨ogliche Erkl¨arung der heutigen tRNA
- Aminos¨aure Zuordnung und breite Unterstutzung¨ fur¨ einen fruheren¨ DoubletZusammenfassung 4
Code. Dies konnten wir in ”Journal of Bioinformatics and Computational Biol-
ogy” unter dem Titel ”The New Classification Scheme of the Genetic Code, its
Early Evolution, and tRNA Usage” ver¨offentlichen. Annahmen, dass die Purin -
Pyrimidin Kodierung auch Muster auf h¨oherer DNA Ebene zeigen wurde,¨ waren
richtig. In einer Analyse der DNA Bindemotive untersuchten wir das Vorkommen
bin¨arerMuster. EineumfassendeStatistikub¨ erdiegr¨oßteKlassevonRestriktion-
senzymen ergab tats¨achlich ein sehr ausgepr¨agtes und einfaches Purin-Pyrimidin
Muster und einen erh¨ohten G+C Gehalt. Fur¨ beide Beobachtungen fanden wir
mehrere Erkl¨arungen, welche ausfuhr¨ lich in dem Artikel ”Common Patterns in
Type II Restriction Enzyme Binding Sites” ver¨offentlicht in ”Nucleic Acid Re-
search” diskutiert wurden. Die gefundenen Muster k¨onnten beispielsweise die
Bindung des Proteins unterstutzen¨ und das Finden der Bindestelle erleichtern.
Im letzten Teil meiner Arbeit werden zwei eingereichte Artikel zur Analyse
BoolescherFunktionenvorgestellt. BoolescheFunktionen lassen die Beschreibung
und Analyse komplizierter dynamischer Prozesse zu und erleichtern damit das
Finden ub¨ ergeordneter bin¨arer Muster in biochemischen Interaktionsnetzwerken.
Es ist bekannt, dass nicht alle Funktionen n¨otig sind, um biologisch relevante
Geninteraktionsnetzwerke zu beschreiben. Im Artikel mit dem Titel ”Boolean
Networks with Biologically Relevant Rules Show Ordered Behavior”, eingereicht
in ”BioSystems” konnten wir durch Analyse gemessener Daten zeigen, dass sich
die Klasse ben¨otigter Boolescher Funktionen stark einschr¨anken l¨asst. Weiter-
hin gelang uns die Berechnung der exakten Anzahl hierarchisch kanalisierender
Funktionen, welche oft in realen Geninteraktionsnetzwerken vorkommen. In der
Arbeit ”The Decomposition Tree for Analysis of Boolean Functions”, eingereicht
in ”Journal of Complexity”, stellen wir eine effiziente Datenstruktur zur Klassi-
fizierung und Analyse Boolescher Funktionen vor. Diese erlaubt uns die Erken-
nung biologisch relevanter Funktionsklassen in Polynomialzeit.5
Contents
Abstract 1
Zusammenfassung 3
Introduction 7
New Classification Scheme of the Genetic Code 14
A new classification scheme of the genetic code. Thomas Wilhelm and
Swetlana Nikolajewa, 2004. Journal of Molecular Evolution, vol-
ume 59, pp. 598-605. . . . . . . . . . . . . . . . . . . . . . . . . . 15
A purine-pyrimidine classification scheme of the genetic code. Thomas
Wilhelm and Swetlana Nikolajewa, 2004. BIOforum Europe Jour-
nal, volume 6, pp. 46-49. . . . . . . . . . . . . . . . . . . . . . . . 22
The new classification scheme of the genetic code, its early evolution,
and tRNA usage. Swetlana Nikolajewa, Maik Friedel, Andreas
Beyer and Thomas Wilhelm, 2006. Journal of Bioinformatics and
Computational Biology, accepted to the publication on December,
nd22 , 2005, in press. . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Common Patterns in Type II Restriction Enzyme Binding Sites 38Contents 6
Common patterns in type II restriction enzyme binding sites. Swet-
lana Nikolajewa, Andreas Beyer, Maik Friedel, Jens Hollunder and
Thomas Wilhelm, 2005. Nucleic Acid Research, volume 33(8), pp.
2726-2733. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Pattern Analysis of Gene Regulatory Rules 47
BooleanNetworkswithbiologicallyrelevantrulesshoworderedbehavior.

  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • Podcasts Podcasts
  • BD BD
  • Documents Documents