Verfasst von: Dagmar Wieczorek und Hermann-Josef Lüdecke
Das menschliche Genom beinhaltet die Information für die Entwicklung einer befruchteten Eizelle zu einem multizellulären Organismus. Sie ist in der DNA des Kerngenoms in 46 Chromosomen in Genen kodiert. Dies enthält a) Gene, deren Information in Messenger-RNA transkribiert und letztlich in eine Vielzahl von Proteinen mit ganz unterschiedlichen Funktionen übersetzt wird, b) Gene, die für Struktur-RNAs wie Transfer-RNA oder ribosomale RNA kodieren, sowie c) Gene, die für lange und kurze nichtkodierende RNAs oder Antisense-RNAs kodieren. Diese RNA-Moleküle spielen eine wichtige, noch nicht gänzlich aufgeklärte Rolle bei der zeitlichen und räumlichen Steuerung von Genaktivität bei der Entwicklung. Die Kraftwerke der Zellen, die Mitochondrien, besitzen ebenfalls ein Genom, das für einige rRNAs, tRNAs und Atmungskettenproteine kodiert. Veränderung der nukleären oder mitochondrialen DNA, sowohl in proteinkodierenden als auch regulatorischen Bereichen können zu Fehlentwicklungen oder Krankheiten führen.
Das menschliche Genom besteht aus der DNA (deoxyribonucleic acid; Desoxyribonukleinsäure, DNS) im Zellkern (dem nukleären Genom) und der DNA im Zytoplasma in den Mitochondrien (dem mitochondrialen Genom). Das haploide menschliche Genom besteht aus etwa 3,2 Mrd. Basenpaaren, aufgeteilt auf 23 verschiedene Chromosomen mit Längen zwischen 46,71 Mio. (Chromosom 21) und 248,96 Mio. (Chromosom 1) Basenpaaren. Aneinandergereiht ergäbe sich ein etwa 1 m langer DNA-Strang. Außer den Keimzellen und den roten Blutkörperchen beinhalten alle Zellen 2 Chromosomensätze, also 46 Chromosomen (Diploidie), einen mütterlichen und einen väterlichen Satz. Das mitochondriale Genom hat eine Länge von 16.569 Basenpaaren.
Der Anteil der Protein-kodierenden Gene (etwa 20.000) am Genom, das sog. Exom, das in mRNA (messenger ribonucleic acid; Messenger-Ribonukleinsäure, mRNS) transkribiert wird, beträgt nur etwa 1,5 %. Allerdings werden insgesamt etwa 75 % des menschlichen Genoms in verschiedenen Typen von Ribonukleinsäuren repräsentiert. Neben mRNAs sind dies z. B. ribosomale RNAs (rRNAs), Antisense-RNAs, lange nichtkodierende RNAs (long ncRNAs) oder kleine nichtkodierende RNAs (small ncRNAs), sodass sich die Gesamtzahl aller Gene auf etwa 58.000 summiert. Dies deutet darauf hin, dass der überwiegende Teil des Genoms nicht einen bedeutungslosen Ballast der Entwicklung darstellt. Sondern vielmehr belegt eine Vielzahl von Untersuchungen, dass große Bereiche des Genoms für die Steuerung entwicklungs- oder gewebsspezifischer Genaktivität unverzichtbar sind und auch Veränderungen in intergenischen und intronischen Bereichen eine Bedeutung für die Entstehung von Krankheiten haben.
Chromosomen
Die Chromosomen im Zellkern (griech. „chroma“, Farbe; „soma“, Körper), die Träger der Erbanlagen (Gene), bestehen aus Chromatin, einem Komplex aus DNA und speziellen Proteinen. Die DNA ist mithilfe von sowohl Histonen als auch Nicht-Histon-Proteinen in den Chromosomen verpackt. Zunächst erfolgt die Verpackung als Nukleosom: Die DNA ist um 8 Histone (Oktamer) gewickelt. Die N- und C-terminalen Domänen ragen aus den Oktameren heraus. Hier finden epigenetische Modifikationen statt, die Acetylierung, Methylierung und Phosphorylierung. Über Linker-Bereiche können die benachbarten Nukleosomen miteinander verbunden sein. Hieran bindet das Histon H1. Die Bildung der Superhelix führt zur weiteren Kondensierung der DNA, die im Endzustand die Basis für das Metaphase-Chromosom darstellt (Abb. 1a).
×
Die Chromosomen lassen sich nach Kultivierung verschiedener Zelltypen (meistens Blutlymphozyten) durch spezifische Aufarbeitung (Präparation und Färbung) im Lichtmikroskop (Vergrößerung etwa 1000-fach) in der Metaphase, aber auch in der Prometaphase darstellen. Der Mensch hat in somatischen Zellen 22 Chromosomenpaare (Autosomen) und 2 Geschlechtschromosomen (Gonosomen), also 46 Chromosomen: einen weiblichen (46,XX) oder einen männlichen Chromosomensatz (46,XY; Abb. 1b). Jedes Chromosom in der Metaphase hat eine bestimmte Länge, eine typische Position des Zentromers, das als Trennung von kurzem (p, petit) und langem (q) Chromosomenarm erkennbar ist und die beiden Schwesterchromatiden verbindet, und ein charakteristisches Bandenmuster (nach spezifischer Färbung erkennbare Abfolge heller und dunkler Chromosomenabschnitte). Je nach Lage des Zentromers teilt man die Chromosomen in akrozentrische (der p-Arm ist sehr kurz), submetazentrische (der p-Arm ist deutlich kürzer als der q-Arm) und metazentrische (p- und q-Arm sind etwa gleich lang) Chromosomen ein (Abb. 1b). Die Chromosomenenden (Telomere) setzen sich aus repetitiver DNA zusammen und schützen die Chromosomen vor dem Abbau der informationstragenden DNA.
Der Karyotyp ist definiert als Anordnung der Chromosomen nach Größe, Form und Bandenmuster. Zur Beurteilung der Qualität eines Karyotyps kann der Bandenstatus herangezogen werden, d. h. die Bandenzahl pro haploidem Genom. 400–550 Banden sollten je nach Fragestellung erreicht werden. Das Auflösungsvermögen unterschreitet 5–10 Mb (Megabasen, Millionen Basenpaare) aber nicht.
Mittlerweile stehen hochauflösende Array-Techniken für die Diagnose von lichtmikroskopisch nicht sichtbaren Chromosomenstörungen wie Deletionen (Verlust eines Chromosomenbereichs) oder Duplikationen (Zugewinn eines Chromosomenbereichs) zur Verfügung. Diese erreichen ein Auflösungsvermögen von ca. 50 kb (Kilobasen, tausend Basenpaare) oder weniger. Dennoch findet die konventionelle Chromosomenanalyse immer noch ihre Anwendung bei der Diagnose von Trisomien, Monosomien und besonders bei balancierten Translokationen, die mit den Array-Techniken nicht erkannt werden können.
Kerngenom
Das Kerngenom ist definiert als Gesamtmenge DNA in einem Zellkern. DNA besteht aus Nukleinsäureketten, wobei 1 Nukleotid aus 1 organischen Base (Purin- oder Pyrimidinbase), 1 Zuckermolekül (Desoxyribose) und 1 Phophatrest besteht (Abb. 1c). Purine sind das Adenin (A) und das Guanin (G), Pyrimidine das Thymin (T) und das Cytosin (C). Aneinandergereiht werden diese Nukleotide durch die Phophatgruppen an den Zuckermolekülen. Die DNA ist doppelsträngig und besteht aus 2 Nukleotidsträngen, die antiparallel verlaufen, und eine α-Doppelhelix bilden. Dabei paaren sich immer A und T, verbunden durch 2 Wasserstoffbrücken, und G und C, verbunden durch 3 Wasserstoffbrücken. An jedem Nukleotidstrang gibt es ein 3′-Ende mit 3′-OH-Gruppen des Zuckermoleküls, und ein 5′-Ende mit Phosphatgruppen. Damit hat ein Nukleotidstrang eine Richtung.
Bestandteile des Genoms
Gene
Gene sind funktionelle Einheiten des Genoms. Viele Gene kodieren für Proteine, d. h. sie werden durch die komplizierten Prozesse Transkription und Translation in Proteine übersetzt. Andere Gene jedoch üben ihre Funktion als RNA wie ribosomale RNA (rRNA) und Transfer-RNA (tRNA) bei der Proteinsynthese oder als Antisense-RNA durch Steuerung der Genaktivität aus.
„Housekeeping genes“ sind Gene, deren Proteine eine wichtige Rolle im Zellstoffwechsel spielen. Sie werden permanent und in allen Zellen exprimiert.
Pseudogene
Dies sind DNA-Sequenzen, die über weite Bereiche funktionsfähigen Genen entsprechen, also z. B. Promotorbereiche, kodierende Regionen, Spleißstellen enthalten können, oder aus prozessierten RNAs entstanden sind. In der Regel enthalten sie eine Vielzahl von Veränderungen, die eine Transkription und Translation, also die Bildung funktioneller Produkte verhindern.
Repetitive Sequenzen
Neben den spezifischen Sequenzen, den Genen, findet man auch eine Vielzahl sich wiederholende, repetitive, Sequenzen im Genom, deren Bedeutung nicht bekannt ist. Hierzu gehören Satelliten-DNAs, aber auch mobile genetische Elemente, wie die Transposons oder Retrotransposons, die eine Bedeutung bei der Evolution und bei der Entstehung von Krankheitsbildern zu haben scheinen.
Replikation der DNA
Wenn sich Zellen vermehren, muss die genetische Information an die Tochterzellen weitergegeben werden. Daher muss vor einer Zellteilung das genetische Material verdoppelt (repliziert) werden. Dies geschieht in der S-Phase (Synthesephase) des Zellzyklus und es entsteht ein zweiter Chromatidstrang.
Zunächst werden die zahlreichen Startpunkte der Replikation (Origins) durch Initiationskomplexe aus Polymerasen, Helikasen und Hilfsproteinen erkannt und die Doppelhelix durch Helikasen entspiralisiert. In einem nächsten Schritt wird die DNA aufgespreizt und durch Bindungsproteine stabilisiert. Dadurch entstehen Einzelstränge an den sog. Replikationsgabeln. Topoisomerasen verhindern, dass es zu einer Überdrehung der DNA-Helix kommt. Sie können die Einzelstränge hierzu an einigen Stellen aufschneiden. Ligasen fügen anschließend einzelne Schnittstücke wieder zusammen. Durch diesen Prozess entstehen etwa 2000 Basenpaare umfassende Einzelstrangregionen, an denen die Replikation stattfinden kann.
Da bei den Eukaryonten eine große DNA-Menge repliziert werden muss, ist es sinnvoll, dass die Replikation zeitgleich an verschiedenen Stellen beginnt. Startpunkte sind die Origins, die durch Replikationseinheiten (Replikons) unterbrochen sind. Von diesen Punkten läuft die Replikation in beide Richtungen (bidirektional). Es gibt viele verschiedene Polymerasen, die an der Replikation beteiligt sind. Es wird immer von 3′- in 5′-Richtung abgelesen, die Synthese erfolgt vom 5′- zum 3′-Ende. Am führenden Strang wird kontinuierlich synthetisiert, am nachfolgenden Strang diskontinuierlich, d. h. die gebildeten Fragmente (Okazaki-Fragmente) sind nur ca. 200 bp lang. Ligasen fügen die einzelnen Stücke anschließend zusammen.
Bei diesem komplexen Prozess treten Fehler auf. Korrekturpolymerasen sind in der Lage, diese Fehler durch Herausschneiden einer defekten Stelle und Reparatur, zu korrigieren.
Das Ergebnis der Replikation sind 2 DNA-Stränge, die immer aus einem Eltern-DNA-Strang und einem neu synthetisierten DNA-Strang bestehen.
Transkription und mRNA-Reifung
Bei der Transkription wird die DNA in einen komplementären RNA-Strang umgeschrieben. Die Promotorregion reguliert die Transkription. Die Transkription wird initiiert durch sog. Transkriptionsfaktoren, die sich an den Promotor lagern, die Polymerase in die richtige Position bringen und die Wasserstoffbrücken zwischen den einzelnen Basenpaaren auflösen und damit die DNA-Stränge teilen. Die Transkription wird durch die Phosphorylierung der Polymerase in Gang gesetzt. Die RNA-Polymerase hat die Fähigkeit die Windungen der DNA aufzulösen (Helikasefunktion). Durch die Polymerase II wird ein komplementärer RNA-Strang gebildet. Die DNA wird in 3′–5′-Richtung vom kodogenen Strang abgelesen, die RNA in 5′–3′-Richtung gebildet. Die RNA ist im Gegensatz zur DNA einzelsträngig. Statt der Base Thymidin enthält sie Uracil (U) und statt des Zuckers Desoxyribose Ribose. Wenige Nukleotide nach einem Polyadenylierungssignal endet die Transkription. Den entstehenden RNA-Strang nennt man primäre mRNA (Messenger-RNA). Die meisten Gene, deren Information in Proteine übersetzt wird, enthalten diese Information nicht in einer kontinuierlichen Sequenz, sondern in einer Abfolge von kodierenden (Exons) und nichtkodierenden (Introns) Regionen. Bereits während der Transkription werden die Introns aus der primären mRNA entfernt. Dies nennt man Spleißen, d. h. die nichtkodierenden Bereiche werden mithilfe von Ribozymen (Ribonukleinsäuren mit katalytischer Aktivität) herausgeschnitten. Die verbleibenden Sequenzen, die nur die Exonsequenzen enthalten, bilden die reife mRNA (Abb. 2). Diese gelangt aus dem Zellkern ins Zytoplasma und zu den Ribosomen.
×
In der Nähe der Promotorregion von Genen können weitere regulatorische Sequenzen liegen, die die Transkription entweder positiv (Enhancer) oder negativ (Silencer) beeinflussen. Ferner kann die Transkription durch epigenetische Veränderungen wie die Methylierung von Cytosinen oder die Methylierung oder Acetylierung von Histonen reguliert werden (Kap. „Epigenetik“).
Im Gegensatz zur mRNA erfolgt die Transkription der rRNA (ribosomalen RNA) durch die RNA-Polymerase I (45S-rRNA, die nachfolgend in 18S-, 5.8S- und 28S-rRNA gespalten wird) und die Transkription von tRNA (transfer-RNA), 5S-rRNA und anderen nichtkodierenden RNAs durch die RNA-Polymerase III.
Translation
Die Translation ist definiert als Proteinbiosynthese und findet an den Ribosomen im Zytoplasma statt. Ribosomen bestehen aus 2 Untereinheiten, die aus mehreren Proteinen bestehen, mit ribosomaler RNA assoziiert sind und im Zytoplasma vorliegen. Die Ribosomen übersetzen die mRNA-Information in eine Aminosäuresequenz. Hierbei tragen jeweils 3 aufeinander folgende Nukleotide (Triplett; Kodon) die Information für 1 Aminosäure (siehe Kodon-Sonne, Abb. 1d). Die kleeblattförmige tRNA transportiert die zu jedem Kodon passende Aminosäure an das Ribosom, das die einzelnen Aminosäuren zu der Proteinkette aneinanderreiht. Die Translation beginnt mit einem Initiationskomplex, der das AUG-Triplett für Methionin auf der mRNA als Translationsstart erkennt. Mithilfe von Elongationsfaktoren werden dann entlang des offenen Leserahmens („open reading frame“, ORF) die einzelnen Aminosäuren aneinandergereiht, bis ein Stopp-Signal folgt, das durch ein UAG-, UGA- oder UAA-Triplett definiert ist. Hier erfolgt dann die Beendigung der Translation (Abb. 2). Das Polypeptid löst sich vom Ribosom, welches in seine 2 Untereinheiten zerfällt. Manche Proteine sind direkt nach der Translation funktionsfähig, andere erreichen die Funktionsfähigkeit erst nach einem Reifungsprozess durch post-translationale Veränderungen.
Mitochondriales Genom
Einige Merkmalsanlagen findet man im Zytoplasma (Plasmom), da Mitochondrien auch DNA enthalten. Die Mitochondrien dienen dem oxidativem Energiestoffwechsel. In 1 Zelle liegen bis zu 1000 Mitochondrien vor. Das mitochondriale Genom besteht aus 1 ringförmigen DNA (mtGenom) und umfasst 16.569 Basenpaare. Es kodiert für 2 Gene der ribosomalen RNA (rRNA, 12S- und 16S-rRNA), die 22 Gene der tRNAs und 13 Proteine der Atmungskette. Die mitochondriale DNA wird nur über die mütterliche Keimbahn an die Nachkommen beiderlei Geschlechts weitergegeben, da das Spermium Mitochondrien nur im Schwanzteil enthält, der bei der Befruchtung nicht in die Eizelle gelangt. Veränderungen im mitochondrialen Genom führen in der Regel zu Defekten der oxydativen Phosphorylierung, also zu Defekten der Atmungskette. Bei Heteroplasmie liegt normale und mutierte mtDNA in einer Zelle vor, bei Homoplasmie ist nur mutierte mtDNA vorhanden.
Genmutationen
Neben dem Verlust, dem Zugewinn oder der Umlagerung ganzer Chromosomenabschnitte mit häufig vielen betroffenen Genen, können auch Veränderungen (Mutationen) innerhalb eines Gens zu Fehlentwicklungen und Erkrankungen führen. Mutationen können einzelne oder mehrere Exons oder auch nur einzelne oder wenige Bausteine (Nukleotide) eines Gens betreffen. Sie können durch unterschiedliche Umwelteinflüsse oder Fehler bei der Replikation bereits während der Gametogenese (Keimbahnmutation), also vor der Befruchtung, oder erst später in Körperzellen, also somatisch, entstehen. Mutationen, die früh in der Zygote in einer einzelnen Zelle auftreten, führen zu somatischen Mosaiken. Werden hierdurch nicht die Vorläufer der Gonaden betroffen, werden sie nicht an die nächste Generation weitergegeben. Somatische Mutationen können ohne phänotypische Konsequenzen sein, dies insbesondere dann, wenn sie zu einem späten Zeitpunkt der Entwicklung auftreten. Treten sie jedoch in der frühen Embryonalentwicklung auf, können sie zu einer deutlichen Beeinträchtigung des betroffenen Gewebes und damit zu einem Phänotyp führen. Später auftretende somatische Mutationen sind z. B. Auslöser für Tumorerkrankungen. Individuen, die eine elterliche Keimbahnmutation geerbt haben und sie somit in jeder Körperzelle tragen (konstitutionelle Mutation), können diese auch an ihre Kinder weitergeben.
Die häufigsten Veränderungen der DNA sind Punktmutationen, Veränderungen einzelner oder weniger Nukleotide, in Exons. Dies können zum einen Deletionen (Verlust) oder Insertionen (Einfügung) von Nukleotiden sein, die eine Verschiebung des offenen Leserahmens bedingen und in der Regel zum vorzeitigen Translationsstopp führen (Frameshift-Mutationen). Zum anderen können es Einzelbasenaustausche (Substitutionen) sein, deren Konsequenzen für das entstehende Protein sehr unterschiedlich sein können.
Substitutionen, die die kodierte Aminosäure nicht verändern, werden als stille oder synonyme Mutationen bezeichnet. Jedoch können auch synonyme Mutationen gelegentlich pathogen wirken, wenn sie z. B. eine kryptische Spleißstelle aktivieren.
Kommt es durch die Substitution zu einem Aminosäureaustausch im Protein, spricht man von einer Missense-Mutation. Ob diese Mutation einen Einfluss auf die Proteinfunktion hat, hängt von der Ähnlichkeit der beiden Aminosäuren ab. Aminosäuresubstitutionen in evolutionär hoch konservierten funktionellen Protein-Domänen verändern häufig die Eigenschaften und Aktivität des betroffenen Proteins.
Durch Substitutionen kann auch unmittelbar ein Translationsstopp-Signal generiert werden (Nonsense-Mutation). Dies führt je nach seiner Lage im Gen zu einem instabilen Transkript, das unmittelbar abgebaut wird (nonsense-vermittelter mRNA-Abbau), oder die mutierte mRNA kodiert nur noch ein verkürztes Protein.
Auch nichtexonische Basensubstitutionen können echte Genmutationen sein. Spleiß-Mutationen betreffen die Übergangsbereiche zwischen Exon und Intron. Spleiß-Donor-Mutationen liegen am 5′-Ende des Introns, Spleiß-Akzeptor-Mutationen am 3′-Ende des Introns. Diese Mutationen führen dazu, dass ein Exon herausgeschnitten oder ein Intron in der mRNA belassen wird. Seltener sind Punktmutationen im Promotorbereich eines Gens. Promotormutationen können zu einer verminderten Genexpression führen.
Wiederholungen von identischen Trinukleotiden, sowohl von intragenen, kodierenden Basentripletts als auch von promotorständigen Trinukleotiden, können zu dynamischen Mutationen, sog. Trinukleotidexpansionen, führen. Solche repetitiven Sequenzen werden ab einer gewissen Wiederholungszahl instabil und neigen dann zu einer Verlängerung von einer Generation zur nächsten. Wenn ein Grenzwert überschritten wird, kommt es zur Ausprägung eines Krankheitsbildes (Trinukleotiderkrankung).
Verkürzte oder veränderte Proteine können funktionslos („loss of function“) sein oder eine andere Funktion ausüben („gain of function“). Mutationen in Proteinen, die Bestandteil von Proteinkomplexen sind, können die Bildung dieser Komplexe verhindern oder ihre räumliche Anordnung verändern. Dies sind sog. dominant-negative Mutationen. Abgesehen von den Genen der Geschlechtschromosomen haben alle Individuen 2 Kopien jedes Gens. Wenn bei einem Gen diese doppelte aktive Dosis wichtig ist, führt bereits eine mutierte, inaktive Genkopie zur Ausprägung eines Phänotyps. Dann spricht man von Haploinsuffizienz. Bei einer rezessiv-erblichen Erkrankung reicht die Hälfte der Genfunktion für einen normalen Phänotyp noch aus. Ein Krankheitsbild tritt erst dann auf, wenn beide Allele des betreffenden Gens durch Mutationen verändert sind.
Der zunehmende Einsatz von Hochdurchsatz-Sequenziertechnologien hat die Identifizierung von Genmutationen deutlich beschleunigt und zur Klärung der genetischen Ursache vieler Fehlbildungen und Erkrankungen geführt. Jedoch bedarf es weiterer experimenteller Anstrengungen zur Aufklärung der Pathomechanismen.
Buselmaier W, Tariverdian G (2008) Humangenetik. Springer, Heidelberg
Ezkurdia I, Juan D, Rodriguez JM, Frankish A, Diekhans M, Harrow J, Vazquez J, Valencia A, Tress ML (2014) Multiple evidence strands suggest that there may be as few as 19000 human protein-coding genes. Hum Mol Genet 23:5866–5878CrossRef
Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, Ward LD, Birney E, Crawford GE, Dekker J, Dunham I, Elnitski LL, Farnham PJ, Feingold EA, Gerstein M, Giddings MC, Gilbert DM, Gingeras TR, Green ED, Guigo R, Hubbard T, Kent J, Lieb JD, Myers RM, Pazin MJ, Ren B, Stamatoyannopoulos JA, Weng Z, White KP, Hardison RC (2014) Defining functional DNA elements in the human genome. Proc Natl Acad Sci 111:6131–6138CrossRef
Miller OJ, Therman E (2000) Human chromosomes, 4. Aufl. Springer, Heidelberg/Berlin/New York
Murken J, Grimm T, Holinski-Feder E, Zerres K (Hrsg) (2011) Taschenlehrbuch Humangenetik. Thieme, Stuttgart
Passarge E (2008) Taschenatlas Humangenetik. Thieme, StuttgartCrossRef
Read A, Donnai D (2008) Angewandte Humangenetik. deGruyter, Berlin/New York
Rimoin DL, Connor JM, Pyeritz RE, Korf BK (Hrsg) (2007) Emery and Rimoin’s principles and practice of medical genetics, 5. Aufl. Churchill-Livingstone-Elsevier, Philadelphia