Bioinformatik der Infektionsforschung

Die Gruppe konzentriert sich in ihrer Forschung auf die Daten-getriebene Analyse von biologischen Fragestellungen aus der Infektionsforschung sowie auf die Entwicklung von neuen Methoden für die Analyse von großen biologischen Datensätzen.

Metagenomik

Als Metagenomik wird eine junge Forschungsdisziplin bezeichnet, deren Zielsetzung es ist, die DNA einer mikrobiellen Gemeinschaft im Ganzen zu untersuchen. Dies steht im Gegensatz zur klassischen Sequenzierung der Genome einzelner Organismen, die in Reinkultur vorliegen. Schätzungen zufolge können weniger als 1% der existierenden Mikroorganismen mittels gängiger Kulturverfahren im Labor gezüchtet werden, was zur Folge hat, dass über die Biologie vieler Prokaryoten wenig bekannt ist.

Die bisher sequenzierten Genome stammen vorwiegend aus einigen wenigen, gut charakterisierten, taxonomischen Klassen, deren Mitglieder sich mit Standardverfahren kultivieren lassen. Hingegen weiß man wenig über die Mehrheit der mikrobiellen Welt.

Die Metagenomik ermöglicht es, Einsicht in die Genome solcher unkultivierten Organismen zu erhalten und hat bereits einen enormen Erkenntnisgewinn zu vielen biologischen Fragestellungen erbracht. Dies drückt sich auch durch die Wahl der Metagenomik zu einem der zehn bedeutendsten Durchbrüche des Jahres durch die Fachzeitschrift „Science“ im Jahre 2004 aus:

Taxonomische Klassifizierung von DNA-Fragmenten variabler Länge

Ein Metagenom entspricht einer Mischung von DNA-Fragmenten aus den Genomen der verschiedenen Organismen einer mikrobiellen Gemeinschaft. Eine der größten Herausforderungen bei der Metagenom-Analyse ist es, die DNA-Fragmente in Klassen einzuordnen, welche den taxonomischen Ursprung der Fragmente widerspiegeln. Die Schwierigkeit dieses Schrittes erhöht sich mit zunehmender taxonomischer Vielfalt und Komplexität der untersuchten Metagenome und wird zusätzlich erschwert, wenn bei der Sequenzierung nur eine unzureichende Abdeckung der in der Probe enthaltenen DNA erreicht werden kann.

Die Programme „PhyloPythia“ und das anschließend entwickelte „PhyloPythiaS“ stellen eine Neuentwicklung in diesem Bereich dar, welche eine phylogenetische Klassifizierung von Fragmenten, basierend auf ihrer DNA-Zusammensetzung, ermöglicht. Mittels „PhyloPythia“ können kurze Fragmente ab ca. 1 kb Länge für alle betrachteten Hierarchiestufen der Taxonomie und die dominanten Spezies des Metagenomes akkurat klassifiziert werden. Dies konnte durch eine umfangreiche Evaluierung gezeigt werden, wobei sowohl Experimente auf realen wie auch auf synthetischen Metagenomdaten durchgeführt wurden.

Die Vorzüge der Methode wurden zudem in einer Vergleichsstudie etablierter Metagenom-Analyse-Verfahren bestätigt. In Zusammenarbeit mit experimentellen Forschungsgruppen entwickeln wir dieses Verfahren weiter und arbeiten an taxonomischen Modellen für Metagenome verschiedener mikrobieller Gemeinschaften, wie z. B. dem Metagenom einer Phosphat-entfernenden mikrobiellen Gemeinschaft aus industriell verwendetem Klärschlamm, dem Metagenom aus dem Dickdarm holzabbauender Termiten, von aktiv-methylotrophen Bakterien aus dem Lake Washington, aus dem Dickdarm des Australischen Tammar Wallabies sowie dem Dickdarm von eineiigen, übergewichtigen menschlichen Zwillingen.

Inferenz von Phänotypbestimmenden funktionellen Modulen von Proteinfamilien

Die Sequenzierung und Auswertung von Metagenom-Daten hat zur Identifizierung zahlreicher neuartiger Gene in nicht kultivierbaren Organismen geführt, die von großem Interesse für Anwendungen in der Biotechnologie, den Agrarwissenschaften oder der Medizin sind. Beispielsweise wurden in einer einzigen Forschungsstudie über das Plankton 1,700 neue Proteinfamilien in oberflächennahen ozeanischen Wasserschichten entdeckt. Für den überwiegenden Anteil dieser Familien ist ihre Rolle in biologischen Prozessen unbekannt, da sie keine oder nur geringe Sequenzähnlichkeit zu experimentell charakterisierten Proteinen aufweisen.

Wir haben eine probabilistische Methode entwickelt, die aus grossen Metagenomdatensetzen und den darin kodierten Proteinfamilien, Mengen von miteinander Proteinfamilien, sogenannte 'funktionelle Module' inferriert, die einem biologischen Stoffwechselweg oder einen Proteinkomplex entsprechen können. Diese Methode und deren Erweiterungen können verwendet werden, um die in einem (Meta-)genom kodierten funktionellen Module zu beschreiben, neue Proteinfamilien eines Stoffwechselweges oder Proteinkomplexes zu entdecken und um funktionelle Module, die für das Vorhandensein eines bestimmten Phänotyps essentiell sind, zu identifizieren.

Aktuelle und frühere Kooperationspartner

  • Andreas Brune, Research Group Leader, Department of Biogeochemistry, Max-Planck Institute for Terrestrial Microbiology, Marburg, Germany
  • Mila Chistoserdova, Department of Chemical Engineering, University of Washington,Seattle, WA, USA
  • Jeffrey Gordon and Peter Turnbaugh, Center for Genome Sciences, Washington University, St. Louis, MO, USA
  • Phil Hugenholtz, Australian Center for Ecogenomics, Queensland, Australia
  • Karl-Erich Jäger, Institute of Molecular Enzyme Technology, Research Center Jülich, Jülich, Germany
  • Mark Morrison, CSIRO Livestock Industries, Queensland, Australia
  • Phil Pope, Vincent Eijsink, Norwegian University of Life Sciences, Aas, Norway
  • Isidore Rigoutsos, Computational Medicine Center, Thomas Jefferson University, Philadelphia, PA, USA
  • Paul Schulze-Lefert, Davide Bulgarelli, Max-Planck Institute for Plant Breeding Research, Cologne, Germany

Weitere Ergebnisse finden Sie auf der englischen Seite.

Leitung

  • Prof. Dr. Alice McHardy

    Alice Mc Hardy

    Leiterin der Abteilung Bioinformatik der Infektionsforschung

    0531 391-55271

    Kontakt