Bioinformatik der Infektionsforschung

Die Abteilung “Bioinformatik der Infektionsforschung” erforscht mit computergestützten Techniken das menschliche Mikrobiom, virale und bakterielle Pathogene sowie menschliche Zelllinien anhand von großen biologischen und epidemiologischen Datensätzen. Durch die Analyse von Metaom-, Populationsgenom- und Einzelzellgenomdaten erzeugen wir experimentell überprüfbare Hypothesen,  wie z.b. welche Veränderungen an Proteinen oder welche Gene assoziiert sind mit dem Auftreten einer Krankheit, von Antibiotikaresistenzen oder dem Ausweichen des Immunschutzes durch Pathogene. Wir arbeiten mit experimentellen Kollaborationspartnern zusammen, um unsere Erkenntnisse zu verifizieren und deren Translation in die medizinische Diagnostik und Behandlung zu fördern. Um die Forschungsziele zu erreichen, entwickelt die Abteilung auch neue Algorithmen und Bioinformatik-Software.

Leitung

Machine Learning

Die Hochdurchsatz-Sequenzierung in Kombination mit Metagenomik hat Tausende neuer Bakterienarten direkt aus Proben ohne Isolierung oder Kultivierung aufgedeckt. Dies ermöglicht detaillierte Analysen der Funktionen von Vertretern mikrobieller Gemeinschaften sowie Studien über Mikroevolutionsprozesse, wie etwa die Anpassungen der Mikroorganismen an veränderte Umweltbedingungen. Auch können die Daten genutzt werden um die Diversität und Ausprägung bakterieller Phänotypen im Zusammenhang mit der Umwelt zu studieren. Diese Sequenzierungen haben zu einer riesigen Datenmenge geführt, die neuartige Methoden benötigen um Zusammenhänge zwischen bakterieller Gemeinschaften sowie menschlicher Gesundheit  aufzudecken.

In diesem Forschungsschwerpunkt arbeiten wir an:

  • Entwicklung neuartiger Methoden des maschinellen Lernens in Form von Softwarebibliotheken, die von der Forschung genutzt werden können.
  • Entwicklung effizienter maschineller Lernmodelle, die die große Menge an unstrukturierten biologischen Sequenzdaten nutzen kann.
  • Anwendung von Methoden des maschinellen Lernens auf mikrobielle Datensätze, um die Interaktion zwischen Bakterien und dem Wirtsorganismus zu analysieren (siehe Computational microbiome research).
  • Entwicklung von maschinellen und Deep-Learning-Modellen zur Vorhersage der Eigenschaften von Molekülen und zur Identifizierung ihrer wichtigsten strukturellen Merkmale.
  • Entwicklung von Methoden des maschinellen Lernens zur Vorhersage von B-Zell-Epitopen für die Epitopkartierung und die Entwicklung neuer Impfstoffe.

Laufende projekte sind unter anderem:

  • GenomeNet - Ein tiefes neuronales Netzwerk für genomische Modellierung, halbüberwachte Klassifizierung und Imputation: Das GenomeNet-Projekt ist ein vom BMBF gefördertes gemeinsames Forschungsvorhaben des Helmholtz-Zentrums für Infektionsforschung und der Universität München in enger Zusammenarbeit mit der Harvard T.H. Chan School of Public Health. In diesem Projekt sollen maßgeschneiderte Deep-Learning-Netzwerkarchitekturen entwickelt werden, die sich besonders für die Modellierung von großen Nukleotidsequenzen eignen. Diese Netzwerke sollen dann auf bakterielle, virale und menschliche Genome angewendet werden, um die komplexen Strukturen, die dem Code des Lebens zugrunde liegen, zu verstehen. Diese Arbeit wird vom Bundesministerium für Bildung und Forschung gefördert (031L0199A)
  • Lernen von Strukturen im CRISPR-Cas-System mit Hilfe von Deep-Learning-Architekturen: In diesem Projekt wenden wir statistische Modelle an, um strukturelle Eigenschaften von CRISPR-Kassetten zu spezifizieren. Diese Eigenschaften werden genutzt, um potenzielle Funktionen und deren Klassifizierung weiter zu beschreiben. Diese Arbeit wird von der Deutschen Forschungsgemeinschaft gefördert (405892038)

Ausgewählte Publikationen

  1. Asgari, E., McHardy, A. C., & Mofrad, M. R. (2019). Probabilistic variable-length segmentation of protein sequences for discriminative motif discovery (DiMotif) and sequence embedding (ProtVecX). Scientific reports, 9(1), 1-16.
     
  2. Asgari, Ehsaneddin, et al. "MicroPheno: predicting environments and host phenotypes from 16S rRNA gene sequencing using a k-mer based representation of shallow sub-samples." Bioinformatics 34.13 (2018): i32-i42.
     
  3. Khaledi, A., Weimann, A., Schniederjans, M., Asgari, E., Kuo, T. H., Oliver, A., ... & Häussler, S. (2020). Predicting antimicrobial resistance in Pseudomonas aeruginosa with machine learning‐enabled molecular diagnostics. EMBO molecular medicine, 12(3), e10264.
     
  4. Asgari, E., Münch, P. C., Lesker, T. R., McHardy, A. C., & Mofrad, M. R. (2019). DiTaxa: nucleotide-pair encoding of 16S rRNA for host phenotype and biomarker detection. Bioinformatics, 35(14), 2498-2500.
     
  5. Deng, Z. L., Münch, P. C., Mreches, R., & McHardy, A. C. (2022). Rapid and accurate identification of ribosomal RNA sequences via deep learning. Nucleic Acids Research.
     
  6. René Mreches, Alice C. McHardy, Bernd Bischl, Julia Moosbauer, Hüseyin Anil Gündüz, Sandra Klawitter, Zhi-Luo Deng, Eric Franzosa, Curtis Huttenhower, Gary Robertson, Ehsaneddin Asgari, Xiao-Yin To, Martin Binder, & Philipp C. Münch. (2021). GenomeNet/deepG: DeepG pre-release version (v0.1.0-alpha). Zenodo. 
     
  7. Asgari, E., Poerner, N., McHardy, A. C., & Mofrad, M. R. (2019). DeepPrime2Sec: deep learning for protein secondary structure prediction from the primary sequences. bioRxiv, 705426.

Wissenschaftliche Mitarbeiter

  • Philipp C. Münch
  • René Mreches
  • Dr. Ehsan Asgari
  • Akash Bahai
  • Kaixin Hu
  • Giorgos Kallergis

In Zusammenarbeit mit

  • Prof. Bernd Bischl, Ludwig Maximilian University of Munich
  • Prof. Bärbel Stecher, Ludwig Maximilian University of Munich
  • Prof. Curtis Huttenhower, Harvard School of Public Health 
  • Dr. Eric Franzosa, Harvard School of Public Health
  • Volkswagen Lab

Video

  • Kann man die nächste Grippe-Epidemie vorhersagen?

    Es antwortet Dr. Andreas Bremges, stellv. Abteilungsleiter Bioinformatik der Infektionsforschung am HZI in Braunschweig.

DruckenPer Mail versendenTeilen