Max Planck Institut für Biochemie
AG Bioorganische Chemie
BioFuture Forschungsgruppe Molekulare Biotechnologie



EXPANDING THE CODED REPERTOIRE WITH
FLUORINATED AMINO ACIDS



Prajna Paramita Pal


Vollständiger Abdruck der von der Fakultät für Chemie der Technischen Universität
München zu Erlangung des akademischen Grades eines

Doktor der Naturwissenschaften

genehmigten Dissertation.


Vorsitzender: Univ.-Prof. Dr. Stefan Glaser


Prüfer der Dissertation:

1. apl. Prof. Dr. L. Moroder

2. Univ.-Prof. Dr. J. Buchner




Die Dissertation wurde am 27.02.2006 bei der Technischen Universität München
eingereicht und durch die Fakultät für Chemie am 22.03.2006 angenomen.
Prajna Paramita Pal, PhD Thesis




















To Dida and Mama
With all my love



Prajna Paramita Pal, PhD Thesis

Zusammenfassung

Im Rahmen dieser Arbeit wurde der Einfluß von der Substitution aromatischer und
aliphatischer Aminosäuren durch fluorinierter Analoge auf Proteine untersucht. Mit Hilfe
fluorinierten Varianten von EGFP und β-Galaktosidase in Zellinien wurde das Konzept
überprüft, daß so veränderte Proteine als diagnostische Marker dienen könnten, welche in
Zellen in inaktiver „prodrug“ Form eingeschleust werden und während der Einschleusung
in die Zellen noch keine Toxizität ausüben.
Es konnte gezeigt werden, daß die Halogenierung von aromatischen Aminosäuren, speziell
der Austausch von Tyrosin durch Fluorotyrosin, dramatische Veränderungen der
spektralen Eigenschaften von Proteinen hervorruft, ohne die räumliche Struktur zu
verändern. Diese spektralen Eigenschaften dienen als sensible Reporter für
Wechselwirkungen innerhalb des Chromophores oder zwischen Chromophor und
Proteinmatrix.
Es wurden verschiedene Varianten des Chromophores als auch der umgebenden
Proteinmatrix durch klassische Methoden des „Protein-engineering“ hergestellt. Mittels
ortsspezificher Mutagenese in Kombination mit dem Einbau von monofluorinierten
aromatischen Aminosäuren wurden neue Klassen von autofluoreszierenden Proteinen
hergestellt. Mit dem Einbau von elektronegativen Fluor-Atomen in Proteine gelang es zum
einen den Chromophor kovalent zu modifizieren, zum anderen elektrostatische
Wechselwirkungen zwischen Chromophore und umgebender Proteinmatrix zu
manipulieren.
In den Proteinen EGFP und EYFP aus der Qualle Aequorea victoria wurde Tyrosin durch
2-Fluorotyrosin ((2-F)Tyr oder o-FTyr) und 3-Fluorotyrosin ((3-F)Tyr oder m-FTyr)
ersetzt wodurch der direkte Einfluß dieses Austausches auf die Proteineigenschaften
untersucht werden konnte. Es wurde gezeigt, daß sich der pK -Werte der Proteine a
verändert sowie Änderungen im Anion/Kation-Äquilibrium bei Titrationsversuchen und
Blau/Rot-Verschiebungen in Absorptions- und Fluoreszenzspektren auftreten. Diese
Unterschiede traten verstärkt im fluorinierten EYFP auf und sind zurückzuführen auf die
Fluorinierung von Tyr203, welches einzigartig in EYFP ist.
Anhand von Modellingstudien konnte vorgeschlagen werden, das in einem
Konformationszustand von EGFP Platz für ein mögliches Chromophore „flipping“
vorhanden ist, welches im EYFP nicht der Fall ist, da hier das Tyr203 aufgrund sterischer
Prajna Paramita Pal, PhD Thesis

Hindernisse durch überlappende Wechselwirkungen beeinträchtigt ist. Tatsächlich konnten
in den 3D-Strukturen von (3-F)Tyr EGFP zwei Konformationszustände vom Fluor im
Chromophor im Kristall nachgewiesen werden, ebenso wie in der Mehrheit der (3-F)Tyr
Seitenketten des Proteins.
Erstaunlicherweise gibt es bei (2-F)TyrEGFP im Chromophore und anderen (2-F)Tyrresten
nur einen Konformationszustand. Diese Eigenschaften sind zweifellos wesentliche
Merkmale der fluorinierten Chromophore im Zusammenhang mit ihrer starren
Proteinumgebung und sind verantwortlich für die einzigartigen Fluoreszenzeigenschaften
von fluorinierten autofluoreszierenden Proteine. In einem zusätzlichen Versuch wurde die
ausschlaggebende Aminosäure Tyr203 in EYFP durch Phe ersetzt und in ortho-, para- und
meta-Position fluoriniert und die spektralen Eigenschaften dieses Proteins untersucht.
Untersuchungen von ortho- und meta Fluorinierungen des dsRed zeigten keine
signifikanten Änderungen in den Absorptions- und Fluoreszenzspektren dieser Varianten,
möglicherweise zurückzuführen auf einen nur teilweise erfolgten Ersatz der Analogen.

Ein weiterer Aspekt dieser Arbeit waren Inkorporationsversuche in GFP mit fluorinierten
aliphatischen Aminosäuren wie Met und Leu, welche eine Trifluoromethyl-Gruppe
besaßen. Die interessanteste Eigenschaft dieser nichtkanonischen Aminosäuren ist deren
erhöhte Hydrophobizität (fast zweimal so hydrophob wie das kanonische Gegenstück).
Diese Besonderheit wird oft zur Verbesserung der Leistung bei Medikamenten im
Unterdrücken metabolischer Toxizität oder beim Erhöhen der Verfügbarkeit im Beliefern
von vielen Pharmazeutika in die Zellen benutzt. Bis zum heutigen Zeitpunkt konnten nur
geringfügige Substitutionen von Leucin- und Methioninresten mit deren Trifluoro-
Analogen in GFP erreicht werden. Durch Erhöhung des genomischen Level der Methionyl-
tRNA-Synthetase, könnte das Substitutionsniveau erhöht werden, mit dem eine fast
quantitative Inkorporation von Trifluoromethionin in das Protein Annexin V erreicht
werden konnte.





Prajna Paramita Pal, PhD Thesis

ACKNOWLEDGMENTS


Prof. Luis Moroder is warmly acknowledged for giving me the opportunity to do this Ph D
work in his group, and Prof. Dieter Oesterhelt and Prof. Robert Huber, for allowing me free
access of the infrastructure. Prof. Padmanabhan Balaram (IISc) is thanked for giving me a
foothold in science. Prof. Axel Ullrich and Drs. Pjotr and Tatjana Knayazev for help during
work in cell biology. Dr. Habil. Nediljko Budisa is thanked for his help and supervision.

Waltraud Wenger, Petra Birle and Tatjana Krywcun are acknowledged for introducing me to
this work, and Elisabeth Weyher for her help in mass spectrometry.

My coworkers in the Departments of Prof. Moroder and Prof. Huber are acknowledged for
the collegial atmosphere and for being as much faithful and supportive in front of me, as
they were behind me. The “Oesterhelts” are thanked for all the help whenever required and
for their warmth when there was none around.

Florian Kurschus and Edward Fellows of the Dept of Neurobiology are remembered for help
in experiments and for all the fun times.

My family members are remembered here with love.


Prajna Paramita Pal










Prajna Paramita Pal, PhD Thesis

Parts of this work are published in the following publications:

[1] Pal, P.P. and Budisa, N. (2006). Engineering green fluorescent proteins using an
expanded genetic code. Green Fluorescent Protein (Series: Topics in Fluorescence
Spectroscopy, Vol. 12) Lakowicz, J.R., Geddes, C.D. (Eds.), Springer Verlag,
Berlin, Heidelberg, New York.


[2] Pal, P.P., Bae, J. H., Azim, M. K., Hess, P., Huber, R, Moroder, L. and Budisa, N.
(2005). Structural and spectral response of the Aequorea victoria Green Fluorescent
Proteins to chromophore fluorination. Biochemistry. 44, 3663 -3672.


[3] Budisa, N., Pipitone, O., Slivanowiz, I., Rubini, M., Pal, P. P., Holak, T. A. and
Gelmi, M. L. (2004). Efforts toward the design of ‘Teflon’ proteins: In vivo
translation with trifluorinated leucine and methionine analogues. Chem.& Biodiv. 1,
1465-1475.

[4] Budisa, N. and Pal, P.P. (2004). Designing novel spectral classes of proteins with
tryptophan-expanded genetic code. Biol. Chem. 385, 893 - 904.

[5] Bae, J. H., Pal, P. P. Moroder, L., Huber, R. and Budisa, N. (2004).
Crystallographic Evidence for Chromophore Isomerisation in 3-Fluorotyrosyl-
Green Fluorescent Protein. ChemBioChem. 5, 720-722.

[6] Budisa, N., Pal, P. P., Alefelder, S., Birle, P., Krywcun, T., Rubini, M., Wenger,
W., Bae, J. H. and Steiner, S. (2004). Probing the Role of Tryptophans in Aequorea
victoria Green Fluorescent Proteins with an Expanded Genetic Code. Biol. Chem.
385, 191-202.




















1Prajna Paramita Pal, PhD Thesis
1 CONTENTS
1 CONTENTS ............................................................................................................... 1
2 DEFINITIONS AND ABBREVIATIONS .............................................................. 5
2.1 Definitions .................................................................................................................. 5
2.2 Abbreviations............................................................................................................. 5
3 SUMMARY................................................................................................................ 7
4 INTRODUCTION ..................................................................................................... 9
4.1 Genetic information and the genetic code............................................................... 9
4.1.1 Decoding the code: evolutionary controversies and historical milestones.................. 9
4.1.2 A code that runs like clockwork................................................................................ 10
4.1.3 Getting the punctuation marks right.......................................................................... 11
4.2 The Flow of the Genetic Information .................................................................... 12
4.2.1 Replication of DNA................................................................................................... 12
4.2.2 Gene transcription ..................................................................................................... 13
4.2.3 The highways and byways of protein synthesis ........................................................ 14
4.2.4 Error correction runs deep......................................................................................... 16
4.3 Reprogramming the coded message ...................................................................... 17
4.3.1 The weak links in the chain of genetic message transmission: Its interpretation...... 17
4.3.1.1 Manipulation of AARS catalytic functions............................................................................17
4.3.2 Other approaches to manipulate protein translation.................................................. 19
4.4 Syntax and architecture of the standard and expanded genetic code ................ 20
4.4.1 Basic features of the universal code .......................................................................... 20
4.4.2 Strategies for codon reassignment: Flexibility within constraints ............................ 21
4.4.2.1 Nonsense codons suppression – a brief overview..................................................................22
4.4.2.2 Sense codon reassignment by using auxotrophic cells ..........................................................23
4.4.2.3 Selective pressure incorporation (SPI): Basic principles.......................................................23
4.4.2.4 Hierarchy of the expanded code ............................................................................................25
4.4.2.5 Comparison of main approaches for noncanonical amino acids incorporation .....................27
4.5 Halogenated aromatic amino acids........................................................................ 28
4.5.1 Why fluorine?............................................................................................................ 28
4.5.2 Chemistry and biology of fluorinated amino acids ................................................... 29
2Prajna Paramita Pal, PhD Thesis
4.5.3 Canonical amino acid residues that serve as substitution targets.............................. 32
4.5.3.1 Chemistry and metabolism of tyrosine and its fluorinated derivatives..................................32
4.5.3.2 Human recombinant annexin V and β galactosidase as carriers of fluorotyrosines ..............34
4.5.3.3 Biophysics and biomedicine of fluorinated phenylalanines ..................................................35
4.5.3.4 Spectroscopy of Fluorinated Tryptophans.............................................................................37
4.5.3.5 Trifluoromethionine...............................................................................................................40
4.5.4 Fluorination of aromatic residues in autofluorescent proteins .................................. 41
4.5.4.1 Enhanced Green Fluorescent Protein, EGFP.........................................................................43
4.5.4.2 Enhanced Yellow Fluorescent Protein, EYFP.......................................................................44
4.5.4.3 Enhanced Cyan Fluorescent Protein, ECFP...........................................................................45
4.5.4.4 Red fluorescent protein from Discosoma striata, dsRed .......................................................46
5 MATERIALS AND METHODS............................................................................ 48
5.1 Materials and instruments...................................................................................... 48
5.1.1 Chemicals and accessories ........................................................................................ 48
5.1.2 Preparation of (7-F)Trp ............................................................................................. 48
5.1.3 Liquid Luria-Bertani (LB) Media and LB-Agar ....................................................... 48
5.1.4 New minimal medium (NMM) and limiting concentrations of amino acids of
interest ....................................................................................................................... 49
5.1.5 Difco yeast nitrogen base without amino acids......................................................... 49
5.1.6 Restriction enzymes, polymerases, ligases and reaction conditions ......................... 50
5.1.7 Chemicals, media and instruments for handling of tumour cell lines ....................... 51
5.1.8 Reagents for protein delivery in cell lines................................................................. 51
5.1.9 Materials and proteins for staining mammalian cell lines......................................... 52
5.1.10 Instruments ................................................................................................................ 52
5.1.11 Antibiotics, column material and commonly used buffers........................................ 53
5.1.12 SDS-polyacrylamide gel electrophoresis .................................................................. 55
5.2 Plasmids and cell lines............................................................................................. 56
5.2.1 Plasmids..................................................................................................................... 56
5.2.2 Auxotrophic strains of E. coli for expression experiments ....................................... 57
5.2.3 Tumour cell lines....................................................................................................... 58
5.3 Methods .................................................................................................................... 58
5.3.1 Fermentation and expression of the target proteins................................................... 58
5.3.2 Vector multiplication................................................................................................. 59
5.3.3 Preparation of electrocompetent cells ....................................................................... 59
3Prajna Paramita Pal, PhD Thesis
5.3.4 Transformation of E. coli .......................................................................................... 59
5.3.5 Gene sequences and expression vectors.................................................................... 60
5.3.5.1 Expression vectors for Annexin V.........................................................................................60
5.3.5.2 Plasmids for ECFP, EGFP and EYFP expression .................................................................60
5.3.5.3 Red fluorescence protein form Discosoma striata (dsRed)...................................................61
5.3.5.4 β-Galactosidase......................................................................................................................62
5.3.6 Determining plasmid DNA concentrations ............................................................... 62
5.3.7 Mutagenesis experiments 62
5.3.8 Expression tests ......................................................................................................... 65
5.3.9 Protein expression in LB media ................................................................................ 65
5.3.10 Protein expression in minimal media ........................................................................ 65
5.3.11 Fermentation protocol modification – media shift for TFM ..................................... 66
5.3.12 Co-expression experiments of Annexin V with MetRS511...................................... 67
5.3.13 Solubility test............................................................................................................. 67
5.3.14 Protein Purification................................................................................................. 68
5.3.14.1 Purification of Annexin V......................................................................................................68
5.3.14.2 Purification of β-galactosidase ..............................................................................................69
5.3.14.3 avGFPs, dsRed, and their mutants and variants.............................................69
5.3.15 Determining protein extinction coefficients and concentrations............................... 69
5.4 Analytical quantification of incorporation levels ................................................. 70
5.4.1 Amino acid analyses.................................................................................................. 70
5.4.2 Mass spectrometry..................................................................................................... 71
5.5 Spectroscopic methods ............................................................................................ 75
5.5.1 UV/VIS-spectroscopy. .............................................................................................. 75
5.5.2 Steady state fluorescence........................................................................................... 76
5.5.3 Fluorescence pH titration of chromophore................................................................ 76
5.5.3.1 Refolding capacity measured by fluorescence recovery........................................................76
195.5.4 One-dimensional F-NMR of TFM-EGFP .............................................................. 77
5.6 Tables with spectroscopic features of autofluorescent proteins.......................... 78
5.6.1 Spectral parameters derived from steady state spectroscopic measurements ........... 78
5.6.2 Absorbance of denatured native and fluorinated avGFP at low and high pH values 80
5.7 Crystallisation experiments, crystal structures and modelling........................... 81
5.8 Delivery of substituted proteins in mammalian cell lines .................................... 81
5.8.1 Protein delivery and processing of transformed cell lines ........................................ 81
4Prajna Paramita Pal, PhD Thesis
5.8.2 Tumour cell staining.................................................................................................. 83
5.8.3 Measuring effects of fluorinated proteins on tumour cell lines in culture ................ 84
6 RESULTS AND DISCUSSION.............................................................................. 85
6.1 GFP design and engineering with an expanded amino acid repertoire ............. 85
6.2 Fluorination of the Trp-residues in avGFPs......................................................... 86
6.2.1.1 Spectral effects of EGFP Trp57 replacements with fluorinated analogues ...........................87
6.2.1.2 Fluorinating the chromophore of ECFP.................................................................................88
6.2.1.3 Wild-type and fluorinated EGFP/ ECFP: pH titrations89
6.2.1.4 Structure of (4-F)Trp-ECFP revealed the importance of Met218/Trp57 pair .......................90
6.2.1.5 Uptake and influence of fluorotryptophans on the growth of tumour cells in culture...........92
6.3 EGFP and EYFP with globally fluorinated Tyr-residues ................................... 92
6.3.1.1 Spectral properties of fluorinated EGFPs and EYFPs at neutral pH .....................................92
6.3.1.2 pH Dependence of absorbance and fluorescence in EGFP and EYFP and their fluorinated
variants...................................................................................................................................95
6.3.1.3 Changes in stability and spectral properties of avGFPs upon fluorination............................98
6.3.1.4 Effects of the fluorine on the chromophore photophysics .....................................................99
6.3.1.5 Fluorinated tyrosines in the crystal structures of (2-F)Tyr-EGFP, and (3-F)Tyr-EGFP .....100
6.3.1.6 Molecular microenviroments of fluorinated Tyr-residues...................................................102
6.3.1.7 Fluorination of the Chromophore Environment in EYFP....................................................104
6.3.1.8 Y203F-EGFP spectral features in native and fluorinated proteins ......................................105
6.3.1.9 Chromophore fluorination. ..................................................................................................106
6.3.1.10 Fluorination of the Tyrosine residues in dsRed ...................................................................108
6.3.1.11 Electrophoretic behaviour of fluorinated proteins – gel shift ..............................................109
6.3.1.12 Affecting the growth of tumor cells by Tyr-fluorinated proteins ........................................110
6.4 Trifluoromethionine incorporation into 2M-EGFP and annexin V ................. 112
6.4.1 General considerations ............................................................................................ 112
6.4.2 2M-EGFP: A mutant designed for TFM incorporation in avGFP .......................... 113
6.4.3 Incorporation of TFM in annexin V by co-expression with MetRS551 ................. 115
6.5 Outlook and future directions .............................................................................. 117
7 LITERATURE....................................................................................................... 118