Bioinformatik der Infektionsforschung
Unsere Forschung
Die Abteilung “Bioinformatik der Infektionsforschung” erforscht das menschliche Mikrobiom, virale und bakterielle Krankheitserreger und die Entwicklung einzelner Zelllinien innerhalb von Patienten durch die Analyse von großen biologischen und epidemiologischen Datensätzen mit rechnergestützten Verfahren. Basierend auf MetaOmik-, Populationsgenomischen und Einzellzell-Sequenzdaten erzeugen wir so Hypothesen zu Genen oder genetischen Veränderungen, die für das Entstehen einer Erkrankung, einer effektiven Immunantwort oder der Entwicklung von Antibiotikaresistenzen verantwortlich sind. Wir arbeiten mit experimentellen Partnern um diese Vorhersagen zu überprüfen und deren Translation in die medizinische Therapie oder Diagnostik zu fördern. Um unsere Forschungsziele zu erreichen, entwickeln wir auch neue Algorithmen und Software.
Unsere Forschung
Die Abteilung “Bioinformatik der Infektionsforschung” erforscht das menschliche Mikrobiom, virale und bakterielle Krankheitserreger und die Entwicklung einzelner Zelllinien innerhalb von Patienten durch die Analyse von großen biologischen und epidemiologischen Datensätzen mit rechnergestützten Verfahren. Basierend auf MetaOmik-, Populationsgenomischen und Einzellzell-Sequenzdaten erzeugen wir so Hypothesen zu Genen oder genetischen Veränderungen, die für das Entstehen einer Erkrankung, einer effektiven Immunantwort oder der Entwicklung von Antibiotikaresistenzen verantwortlich sind. Wir arbeiten mit experimentellen Partnern um diese Vorhersagen zu überprüfen und deren Translation in die medizinische Therapie oder Diagnostik zu fördern. Um unsere Forschungsziele zu erreichen, entwickeln wir auch neue Algorithmen und Software.
Prof. Dr. Alice McHardy
Alice Carolyn McHardy besitzt ein Diplom in Biochemie und einen Doktortitel (Dr. rer. nat.) in Bioinformatik, beides von der Universität Bielefeld in Deutschland. Von 2005 bis 2007 arbeitete sie zunächst als Postdoc und dann als festangestellte Mitarbeiterin in der Gruppe “Bioinformatics and Pattern Discovery” am IBM T.J. Watson Research Center in Yorktown Heights, USA.
Danach wurde sie Leiterin der unabhängigen Forschungsgruppe für "Computational Genomics and Epidemiology" am Max-Planck-Institut für Informatik in Saarbrücken. Im Jahr 2010 wurde sie auf den Lehrstuhl für Algorithmische Bioinformatik an der Heinrich-Heine-Universität in Düsseldorf berufen. Im Jahr 2014 übernahm sie die Leitung der Abteilung Bioinformatik der Infektionsforschung am Helmholtz-Zentrum für Infektionsforschung in Braunschweig und wurde als Professorin an die TU Braunschweig berufen.
Team
Software
Web Applications
Traitar is a web service for phenotyping bacteria based on their genome sequences.
PhyloPythiaS+ - a self-training method for the rapid reconstruction of low-ranking taxonomic bins from metagenomes
PhyloPythiaS - the PhyloPythiaS Web Server for Taxonomic Assignment of Metagenome Sequences.
Taxator-tk performs taxonomic sequence assignment by fast approximate determination of evolutionary neighbors from sequence similarities.
AdaPatch is a method for detecting positively selected patches of sites on the surface of viral proteins, which are likely candidates for being relevant for adaptive evolution.
Software Downloads
Software implementing the group’s research can be downloaded here or on GitHub at github.com/hzi-bifo, such as
SDplots: software for the detection of selective sweeps to monitor the adaptation of influenza A viruses
SDplots VaccineUpdates: results of the bi-annual vaccine strain prediction for influenza A viruses
PatchDetection: software for the detection of protein patches under positive selection
Phylogeography: software for phylogeographical reconstruction to infer origin and spread routes of viral pathogen outbreaks
FrechetTreeDistances: distances between phylogeographic reconstructions across tree topologies.
DiTaxa: nucleotide-pair encoding of 16S rRNA sequences for host phenotype and biomarker detection
CAMISIM: Simulating metagenomes and microbial communities
AMBER: Assessment of Metagenome BinnERs
OPAL: Open-community Profiling Assessment tooL
CAMITAX: Taxon labels for microbial genomes
Ausgewählte Publikationen
- Meyer, F., Fritz, A., Deng, Z. L., Koslicki, D., Lesker, T. R., Gurevich, A., Robertson, G., Alser, M., Antipov, D., Beghini, F., Bertrand, D., Brito, J. J., Brown, C. T., Buchmann, J., Buluç, A., Chen, B., Chikhi, R., Clausen, P., Cristian, A., Dabrowski, P. W., Darling, A. E., Egan, R., Eskin, E., Georganas, E., Goltsman, E., Gray, M. A., Hansen, L. H., Hofmeyr, S., Huang, P., Irber, L., Jia, H., Jørgensen, T. S., Kieser, S. D., Klemetsen, T., Kola, A., Kolmogorov, M., Korobeynikov, A., Kwan, J., LaPierre, N., Lemaitre, C., Li, C., Limasset, A., Malcher-Miranda, F., Mangul, S., Marcelino, V. R., Marchet, C., Marijon, P., Meleshko, D., Mende, D. R., Milanese, A., Nagarajan, N., Nissen, J., Nurk, S., Oliker, L., Paoli, L., Peterlongo, P., Piro, V. C., Porter, J. S., Rasmussen, S., Rees, E. R., Reinert, K., Renard, B., Robertsen, E. M., Rosen, G. L., Ruscheweyh, H. J., Sarwal, V., Segata, N., Seiler, E., Shi, L., Sun, F., Sunagawa, S., Sørensen, S. J., Thomas, A., Tong, C., Trajkovski, M., Tremblay, J., Uritskiy, G., Vicedomini, R., Wang, Z., Wang, Z., Wang, Z., Warren, A., Willassen, N. P., Yelick, K., You, R., Zeller, G., Zhao, Z., Zhu, S., Zhu, J., Garrido-Oter, R., Gastmeier, P., Hacquard, S., Häußler, S., Khaledi, A., Maechler, F., Mesny, F., Radutoiu, S., Schulze-Lefert, P., Smit, N., Strowig, T., Bremges, A., Sczyrba, A. & McHardy, A. C. Critical Assessment of Metagenome Interpretation: the second round of challenges. Nat Methods (2022) 19, 429, doi:10.1038/s41592-022-01431-4.
- Asgari, E., Münch, P. C., Lesker, T. R., McHardy, A. C.* & Mofrad, M. R. K.* (*shared last authors) DiTaxa: nucleotide-pair encoding of 16S rRNA for host phenotype and biomarker detection. Bioinformatics (2019) 35, 2498, doi:10.1093/bioinformatics/bty954.
- Bankwitz, D.*, Bahai, A.*, Labuhn, M., Doepke, M., Ginkel, C., Khera, T., Todt, D., Ströh, L. J., Dold, L., Klein, F., Klawonn, F., Krey, T., Behrendt, P., Cornberg, M., McHardy, A. C.* & Pietschmann, T*. (*shared first and last authors) Hepatitis C reference viruses highlight potent antibody responses and diverse viral functional interactions with neutralising antibodies. Gut (2021) 70, 1734, doi:10.1136/gutjnl-2020-321190.
- Fritz, A.*, Hofmann, P.*, Majda, S., Dahms, E., Dröge, J., Fiedler, J., Lesker, T. R., Belmann, P., DeMaere, M. Z., Darling, A. E., Sczyrba, A., Bremges, A. & McHardy, A. C. (*shared first authors) CAMISIM: simulating metagenomes and microbial communities. Microbiome (2019) 7, 17, doi:10.1186/s40168-019-0633-6.
- Münch, P. C., Franzosa, E. A., Stecher, B., McHardy, A. C.* & Huttenhower, C.* (*shared last authors) Identification of Natural CRISPR Systems and Targets in the Human Microbiome. Cell Host Microbe (2021) 29, 94, doi:10.1016/j.chom.2020.10.010.
Publikationen
Computergestützte Biologie viraler Erreger
Computergestützte Biologie viraler Erreger
Die Forschungsabteilung „Bioinformatik der Infektionsforschung“ am HZI untersucht sich rasch entwickelnde virale Erreger mit computergestützten und datengetriebenen Ansätzen. Ein aktueller Schwerpunkt ist die computergestützte genomische Überwachung und evolutionäre Analyse von SARS-CoV-2. Auf Basis umfangreicher internationaler Genomsequenzdaten untersuchen wir, wie virale Linien entstehen, sich ausbreiten und Mutationen erwerben, die Übertragbarkeit, Immunflucht oder virale Fitness beeinflussen können. Dazu entwickeln wir Ansätze zur frühzeitigen Vorhersage und Charakterisierung neu auftretender Varianten, unter anderem über die Plattform CoVerage (www.sarscoverage.org), sowie zur Rekonstruktion viraler Ausbreitungs- und Eintragsdynamiken mithilfe von Phylogenetik, Phylogeographie und epidemiologischen Daten.
Über SARS-CoV-2 hinaus verfügt die Abteilung über langjährige Expertise in der computergestützten Analyse sich rasch entwickelnder viraler Erreger, einschließlich Influenzaviren und chronischer Virusinfektionen. Diese Studien untersuchen virale Anpassung, Immunflucht und Erreger-Wirt-Koevolution mit dem Ziel, translational relevante Ansätze für Surveillance, Diagnostik und Impfstoffentwicklung zu identifizieren.
Wir konzentrieren uns auf
- Computergestützte genomische Überwachung von SARS-CoV-2 und frühzeitige Erkennung neu auftretender Varianten
- Vorhersage und Charakterisierung von Eigenschaften von SARS-CoV-2-Varianten, einschließlich Liniendynamiken, antigenischer Veränderungen und Immunfluchtpotenzial
- Phylogenetische und phylogeographische Rekonstruktion der Ausbreitung von SARS-CoV-2 und der Eintragsdynamiken von Linien sowie deren zeitlicher Zusammenhang mit nicht-pharmazeutischen Maßnahmen während der Pandemie
- Analyse viraler Evolution aus umfangreichen Genomsequenzdaten
- Computergestützte Vorhersage von Impfstoffstämmen
- Analyse viraler Anpassung, Immunflucht und Erreger-Wirt-Koevolution bei akuten und chronischen Virusinfektionen
Wissenschaftlerinnen und Wissenschaftler
- Dr. Sama Goliaei
- Dr. Zhi-Luo Deng
- Dr. Mohammad Hadi Fouroghmand
Alumni
- Dr. Katrina Norwood
- Dr. Akash Bahai
- Dr. Adrian Fritz
- Dr. Thorsten Klingen
- Dr. Susanne Reimering
- Dr. Lars Steinbrück
Kooperationspartnerinnen und -partner
- Thomas Pietschmann, Institute for Experimental Virology, TWINCORE Centre for Experimental and Clinical Infection Research, Hannover, Germany (DZIF collaboration)
- Denise Kühnert, Robert Koch Institute, Berlin, Germany, and Max Planck Institute of Geoanthropology, Jena, Germany
- Martin Hölzer, Genome Competence Center, Robert Koch Institute, Berlin, Germany
- Frank Klawonn, Biostatistics, Helmholtz Centre for Infection Research, Braunschweig, Germany, and Department of Computer Science, Ostfalia University of Applied Sciences, Wolfenbüttel, Germany
- Nick Goldman, Nicola De Maio, EMBL-EBI, Hinxton, United Kingdom
- Sebastian Duchene, Anna Zhukova, Frédéric Lemoine, Institut Pasteur, Paris, France
Ehemalige Kooperationspartnerinnen und -partner
- Gülsah Gabriel, Heinrich-Pette-Institut, Leibniz-Institut für Experimentelle Virologie, Hamburg, Deutschland
- Carlos Guzmán, Department of Vaccinology and Applied Microbiology, Helmholtz-Zentrum für Infektionsforschung (HZI), Braunschweig, Deutschland
- Thomas Schulz, Institut für Virologie, Medizinische Hochschule Hannover (MHH), Hannover, Deutschland
- Klaus Schughart, Infection Genetics, Helmholtz-Zentrum für Infektionsforschung (HZI), Braunschweig, Deutschland
- Thomas Krey, Institut für Virologie, Medizinische Hochschule Hannover (MHH), Hannover, Deutschland
- Wulf Blankenfeldt, Abteilung Struktur und Funktion von Proteinen, Helmholtz-Zentrum für Infektionsforschung (HZI), Braunschweig, Deutschland
- Mohammad Mofrad, Departments of Bioengineering and Mechanical Engineering, University of California, Berkeley, USA
Ausgewählte Publikationen
*K. Norwood, *Z.-L. Deng, S. Reimering, G. Robertson, M.-H. Foroughmand-Araabi, S. Goliaei, M. Hölzer, F. Klawonn, A.C. McHardy. In silico genomic surveillance by CoVerage predicts and characterizes SARS-CoV-2 variants of interest (*shared first authors). doi: 10.1038/s41467-025-60231-4. Nature Communications 2025, 16(1): 6281.
*S. Goliaei, *M.-H. Foroughmand-Araabi, A. Roddy, A. Weber, S. Översti, …, D. Kühnert, A.C. McHardy. Importations of SARS-CoV-2 lineages decline after nonpharmaceutical interventions in phylogeographic analyses (*shared first authors). doi: 10.1038/s41467-024-48641-2. Nature Communications 2024, 15(1): 5267.
*D. Bankwitz, *A. Bahai, M. Labuhn, M. Doepke, C. Ginkel, T. Khera, D. Todt, L. J. Ströh, L. Dold, F. Klein, F. Klawonn, T. Krey, P. Behrendt, M. Cornberg, *A.C. McHardy, *T. Pietschmann. Hepatitis C reference viruses highlight potent antibody responses and diverse viral functional interactions with neutralising antibodies (*shared first and last authors). doi: 10.1136/gutjnl-2020-321190. Gut 2021, 70(9): 1734–1745.
S. Reimering, S. Muñoz, A.C. McHardy. Phylogeographic reconstruction using air transportation data and its application to the 2009 H1N1 influenza A pandemic doi: 10.1371/journal.pcbi.1007101. PLoS Computational Biology 2020, 16(2): e1007101.
Computergestützte Mikrobiom- und mikrobielle Erregerforschung
BIFO erforscht mikrobielle Gemeinschaften, einschließlich Bakterien, Viren und eukaryotischer Gemeinschaftsmitglieder, sowie deren Bedeutung für die menschliche Gesundheit und Krankheit. Die humane Mikrobiota wird mit einer Vielzahl von Erkrankungen in Verbindung gebracht und ist Gegenstand experimenteller Studien am HZI. Die direkte Sequenzierung des Metagenoms, Metatranskriptoms oder Metaproteoms mikrobieller Gemeinschaftsproben ermöglicht die Untersuchung der Mehrheit der Mikroorganismen, die nicht in Reinkultur gewonnen werden können und die den überwiegenden Teil der mikrobiellen Welt ausmachen.
Unsere Forschung konzentriert sich auf die Etablierung datengetriebener computergestützter Ansätze, die die individualisierte Infektionsmedizin in der Klinik weiter voranbringen. Dazu gehören die rechnergestützte Entdeckung von Biomarkern aus mikrobiellen Omics-Daten, d. h. Genotyp-Phänotyp- und Genotyp-Umwelt-Inferenz, sowie die datengetriebene Entdeckung molekularer Prädiktoren für den Krankheitsstatus des Wirts und für Erregerphänotypen. Darüber hinaus entwickeln wir Methoden für gängige Meta’omics-Datentypen und fördern über die Initiative for the Critical Assessment of Metagenome Interpretation (CAMI) die Entwicklung von Standards und Best Practices.
BIFO konzentriert sich auf die folgenden Probleme und Fragestellungen:
- Können wir mithilfe von Ansätzen der künstlichen Intelligenz Biomarker für klinisch relevante Phänotypen aus Mikrobiomdaten identifizieren und diese Phänotypen zuverlässig vorhersagen?
- Welche Software mit welchen Einstellungen eignet sich besonders gut für die Verarbeitung verschiedener Arten von Metagenomproben? A. McHardy gründete und organisiert gemeinsam mit A. Sczyrba CAMI, die Initiative for the Critical Assessment of Metagenome Interpretation. Ziel von CAMI ist es, Standards und Best Practices in der Metagenomanalyse zu etablieren, indem Benchmarking-Challenges für Methodenentwickler organisiert werden.
- Können wir die Genome einzelner Stämme aus Metagenomdaten rekonstruieren? Diese Fragestellung hat große klinische Relevanz, da einzelne Stämme derselben Spezies sehr unterschiedliche Phänotypen aufweisen können, z. B. der probiotische E. coli Nissle im Vergleich zu EHEC-Stämmen.
- Welche Spuren hinterlässt die Anpassung mikrobieller Gemeinschaften und Erreger an eine bestimmte Umgebung im Mikrobiom und in ihren Genomen? Besonders interessiert uns diese Fragestellung im Zusammenhang mit der Ausbreitung von Antibiotikaresistenzen.
- Was können wir durch systematische Metagenomanalysen in Kombination mit Deep-Learning-Techniken über die Rolle des mikrobiellen CRISPR-Cas-Systems im menschlichen Mikrobiom lernen?
Wissenschaftlerinnen und Wissenschaftler
- Dr. Zhiluo Deng
- Dr. Fernando Meyer
- Dr. Philipp Münch
- Dr. Nasim Safaei
- Steven Medina
- Dr. Ehsaneddin Asgari (assoziiert)
Kooperationspartnerinnen und -partner
- Benjamin Maasoumy, Anke Kraft, Markus Cornberg, Medizinische Hochschule Hannover, Hannover, Deutschland
- Curtis Huttenhower, Harvard T.H. Chan School of Public Health, Boston, MA, USA
- Barbara Stecher, Medizinische Mikrobiologie und Krankenhaushygiene, Max von Pettenkofer-Institut, Ludwig-Maximilians-Universität München, München, Deutschland
- die CAMI-Initiative
- Till Strowig, Helmholtz-Zentrum für Infektionsforschung (HZI), Braunschweig, Deutschland
Ehemalige Kooperationspartnerinnen und -partner
- Justin O’Grady und Gemma Kay, Quadram Institute, Norwich, Vereinigtes Königreich
- Thomas Schulz, Medizinische Hochschule Hannover, Hannover, Deutschland
- Paul Schulze-Lefert, Max-Planck-Institut für Pflanzenzüchtungsforschung, Köln, Deutschland
- Phil Pope und Vincent Eijsink, Norwegian University of Life Sciences, Ås, Norwegen
- Johannes Gescher, Institut für Angewandte Biowissenschaften (IAB), Karlsruher Institut für Technologie (KIT), Karlsruhe, Deutschland
- Mark Morrison, CSIRO Livestock Industries, Queensland, Australien
- Jeffrey Gordon und Peter Turnbaugh, Center for Genome Sciences, Washington University, St. Louis, Missouri, USA
- Phil Hugenholtz, Australian Centre for Ecogenomics, Queensland, Australien
- Isidore Rigoutsos, Computational Medicine Center, Thomas Jefferson University, Philadelphia, Pennsylvania, USA
- Andreas Brune, Forschungsgruppenleiter, Abteilung Biogeochemie, Max-Planck-Institut für terrestrische Mikrobiologie, Marburg, Deutschland
- Mila Chistoserdova, Department of Chemical Engineering, University of Washington, Seattle, Washington, USA
Ausgewählte Publikationen
*Z.-L. Deng, *N. Safaei, S. *L. Schütte, V. Ohlendorf, *B. Maasoumy, *A. C. McHardy. High Prevalence and Local Dissemination of Daptomycin-Resistance Mutations for Enterococcus faecium in Cirrhotic Patients (*shared first and senior authors). doi: 10.1053/j.gastro.2025.08.046. Gastroenterology 2026, 170(1): 228–230.
K. Hu, F. Meyer, Z.-L. Deng, E. Asgari, T. H. Kuo, P. C. Münch, A. C. McHardy. Assessing computational predictions of antimicrobial resistance phenotypes from microbial genomes. doi: 10.1093/bib/bbae206. Briefings in Bioinformatics 2024, 25(3): bbae206.
C. Huttenhower, R. D. Finn, A. C. McHardy. Challenges and opportunities in sharing microbiome data and analyses. doi: 10.1038/s41564-023-01484-x. Nature Microbiology 2023, 8(11): 1960–1970.
P. C. Münch, C. Eberl, S. Woelfel, …, C. Huttenhower, *A. C. McHardy, *B. Stecher. Pulsed antibiotic treatments of gnotobiotic mice manifest in complex bacterial community dynamics and resistance effects (*shared last authors). doi: 10.1016/j.chom.2023.05.013. Cell Host & Microbe 2023, 31(6): 1007–1020.e4.
F. Meyer, A. Fritz, Z.-L. Deng, …, A. C. McHardy. Critical Assessment of Metagenome Interpretation: the second round of challenges. doi: 10.1038/s41592-022-01431-4. Nature Methods 2022, 19(4): 429–440.
Z.-L. Deng, P. C. Münch, R. Mreches, A. C. McHardy. Rapid and accurate identification of ribosomal RNA sequences via deep learning. doi: 10.1093/nar/gkac112. Nucleic Acids Research 2022, 50(10): e60.
P. C. Münch, E. A. Franzosa, B. Stecher, *A. C. McHardy, *C. Huttenhower. Identification of Natural CRISPR Systems and Targets in the Human Microbiome (*shared last authors). doi: 10.1016/j.chom.2020.10.010. Cell Host & Microbe 2021, 29(1): 94–106.e4.
A. Khaledi, A. Weimann, M. Schniederjans, E. Asgari, T. H. Kuo, A. Oliver, G. Cabot, A. Kola, P. Gastmeier, M. Hogardt, D. Jonas, M. R. Mofrad, A. Bremges, *A. C. McHardy, *S. Häussler. Predicting antimicrobial resistance in Pseudomonas aeruginosa with machine learning-enabled molecular diagnostics (*shared last authors). doi: 10.15252/emmm.201910264. EMBO Molecular Medicine 2020, 12(3): e10264.
A. Sczyrba, P. Hofmann, P. Belmann, …, A. C. McHardy. Critical Assessment of Metagenome Interpretation—a benchmark of metagenomics software. doi: 10.1038/nmeth.4458. Nature Methods 2017, 14(11): 1063–1071.
K. Patil, P. Haider, P. B. Pope, P. J. Turnbaugh, M. Morrison, T. Scheffer, A. C. McHardy. Taxonomic metagenome sequence assignment with structured output models. doi: 10.1038/nmeth0311-191. Nature Methods 2011, 8(3): 191–192.
Machine Learning
Die Hochdurchsatz-Sequenzierung in Kombination mit Metagenomik hat Tausende neuer Bakterienarten direkt aus Proben ohne Isolierung oder Kultivierung aufgedeckt. Dies ermöglicht detaillierte Analysen der Funktionen von Vertretern mikrobieller Gemeinschaften sowie Studien über Mikroevolutionsprozesse, wie etwa die Anpassungen der Mikroorganismen an veränderte Umweltbedingungen. Auch können die Daten genutzt werden um die Diversität und Ausprägung bakterieller Phänotypen im Zusammenhang mit der Umwelt zu studieren. Diese Sequenzierungen haben zu einer riesigen Datenmenge geführt, die neuartige Methoden benötigen um Zusammenhänge zwischen bakterieller Gemeinschaften sowie menschlicher Gesundheit aufzudecken.
In diesem Forschungsschwerpunkt arbeiten wir an:
- Entwicklung neuartiger Methoden des maschinellen Lernens in Form von Softwarebibliotheken, die von der Forschung genutzt werden können.
- Entwicklung effizienter maschineller Lernmodelle, die die große Menge an unstrukturierten biologischen Sequenzdaten nutzen kann.
- Anwendung von Methoden des maschinellen Lernens auf mikrobielle Datensätze, um die Interaktion zwischen Bakterien und dem Wirtsorganismus zu analysieren (siehe Computational microbiome research).
- Entwicklung von maschinellen und Deep-Learning-Modellen zur Vorhersage der Eigenschaften von Molekülen und zur Identifizierung ihrer wichtigsten strukturellen Merkmale.
- Entwicklung von Methoden des maschinellen Lernens zur Vorhersage von B-Zell-Epitopen für die Epitopkartierung und die Entwicklung neuer Impfstoffe.
Laufende projekte sind unter anderem:
- GenomeNet - Ein tiefes neuronales Netzwerk für genomische Modellierung, halbüberwachte Klassifizierung und Imputation: Das GenomeNet-Projekt ist ein vom BMBF gefördertes gemeinsames Forschungsvorhaben des Helmholtz-Zentrums für Infektionsforschung und der Universität München in enger Zusammenarbeit mit der Harvard T.H. Chan School of Public Health. In diesem Projekt sollen maßgeschneiderte Deep-Learning-Netzwerkarchitekturen entwickelt werden, die sich besonders für die Modellierung von großen Nukleotidsequenzen eignen. Diese Netzwerke sollen dann auf bakterielle, virale und menschliche Genome angewendet werden, um die komplexen Strukturen, die dem Code des Lebens zugrunde liegen, zu verstehen. Diese Arbeit wird vom Bundesministerium für Bildung und Forschung gefördert (031L0199A)
- Lernen von Strukturen im CRISPR-Cas-System mit Hilfe von Deep-Learning-Architekturen: In diesem Projekt wenden wir statistische Modelle an, um strukturelle Eigenschaften von CRISPR-Kassetten zu spezifizieren. Diese Eigenschaften werden genutzt, um potenzielle Funktionen und deren Klassifizierung weiter zu beschreiben. Diese Arbeit wird von der Deutschen Forschungsgemeinschaft gefördert (405892038)
Ausgewählte Publikationen
Wissenschaftliche Mitarbeiter
- Philipp C. Münch
- René Mreches
- Dr. Ehsan Asgari
- Akash Bahai
- Kaixin Hu
- Giorgos Kallergis
In Zusammenarbeit mit
- Prof. Bernd Bischl, Ludwig Maximilian University of Munich
- Prof. Bärbel Stecher, Ludwig Maximilian University of Munich
- Prof. Curtis Huttenhower, Harvard School of Public Health
- Dr. Eric Franzosa, Harvard School of Public Health
- Volkswagen Lab
Laufende Projekte
2026 “Advancing Research Infrastructures to Support Infection Research at DZIF” (DZIF - BMFTR)
2026 “Design of an optimized HCV vaccine candidate” (DZIF - BMFTR)
2025 “Computational Tools and Resources for PAIS Data Analysis (ACT-PDA)” (BMFTR)
2025 “Individualized prevention and treatment of infections in patients with liver cirrhosis (INDIVO)” (zukunft.niedersachsen - Lower Saxony Ministry of Science and Culture and the Volkswagen Foundation)
2025 “Deep Learning Integration of Genomic Sequences, Transcriptomics and Interaction Networks for Phenotype Prediction in Eukaryotes” (Helmholtz AI)
2024 “Randomized trial assessing individualized microbiota-based prevention of healthcare-associated infections with multidrug-resistant Enterobacteriaceae (RESET-MDR)” (DZIF - BMFTR)
2021 “NFDI4Microbiota - National Research Data Infrastructure for Microbiota Research” (DFG)
2019 “RESIST - Resolving Infection Susceptibility“ – Exzellenzcluster 2155, Deutsche Forschungsgemeinschaft (DFG)
Abgeschlossene Projekte
2023 “Establishing data broker functionalities at HZI for optimizing omics data submissions to public repositories” (NFDI4Microbiota Strategy Funds Project – DFG)
2022 “DZIF-IT Plattform“ (DZIF - BMFTR)
2021 “GHGA-Microbiota: Increasing the multimodal use of human and microbiome-related omics data” (GHGA Flex Funds Project - DFG)
2021 “Hepatitis C Control: Towards prophylaxis and identification of those in need of treatment” (DZIF - BMFTR)
2020 “DZIF Bioinformatics Platform“ (DZIF - BMFTR)
2020 “Proof of concept study of a SARS-COV-2 vaccine based on recombinant spike protein“ (Lower Saxony Ministry of Science and Culture (MWK))
2019 “Paving the way towards individualized vaccination (i.Vacc) - Exploring multi-omics Big Data in the general population based on a digital mHealth cohort” (Volkswagen Foundation)
2019 “Drug discovery and cheminformatics for new anti-infectives (iCA)” (Lower Saxony Doctoral Program)
2019 “Rational design of a universal flu vaccine using recombinant neuraminidase” (Global Grand Challenges of the Bill & Melinda Gates Foundation)
2019 “GenomeNet: A deep neural network for genomic modelling, semi-supervised classification and imputation” (BMFTR)
2018 “Learning structures in the CRISPR-Cas system using deep learning architectures” – SPP2141 Deutsche Forschungsgemeinschaft (DFG)
2017 “HiGHmed (Heidelberg-Göttingen-Hannover Medizininformatik)“ (BMFTR)
2017 “Sparse2Big: Data fusion and imputation from massive sparse data consortium” (Information and Data Science Initiative, Helmholtz Society)
2017 “Bioinformatics support for the development of a prophylactic HCV vaccine candidate” (Deutsches Zentrum für Infektionsforschung (DZIF - BMFTR)
2017 “Communities Allied in Infection coalition" (Volkswagen Foundation)
2016 “A Method for Tracking CRISPR/Plasmidome Dynamics in Complex Bacterial Communities“ (DFG)
2014 “Isolation and characterization of novel azidophilic archaea (with J. Gescher)” (DFG)
2014 “DZIF Bioinformatics” (DZIF - BMFTR)
Weitere Gruppen der Abteilung Bioinformatik in der Infektionsforschung
Agentische KI in der datengetriebenen Infektionsforschung – Dr. Philipp C. Münch
Dr. Philipp C. Münch arbeitet an der Schnittstelle von künstlicher Intelligenz, Bioinformatik und Infektionsforschung. Er hat einen interdisziplinären Hintergrund in Bioinformatik und Epidemiologie, mit einem B.Sc. in Bioinformatik und einem M.Sc. in Epidemiologie, und promovierte 2022 an der LMU München. Er ist permanenter Wissenschaftler am Helmholtz-Zentrum für Infektionsforschung und zusätzlich mit dem Huttenhower Lab an der Harvard T.H. Chan School of Public Health affiliiert.
Aktuelle Entwicklungen im Bereich großer Sprachmodelle und agentischer KI-Systeme eröffnen neue Möglichkeiten für die datengetriebene Infektionsforschung. Gleichzeitig werfen sie grundlegende Fragen zu Verlässlichkeit, Reproduzierbarkeit, Transparenz, biologischer Validität und Vertrauenswürdigkeit auf. Unser Ziel ist es, die Fähigkeiten und Grenzen dieser Methoden systematisch zu evaluieren und Einstellungen, Workflows und Benchmarks zu definieren, die ihren Nutzen für Bioinformatik und Infektionsforschung maximieren.
Wir untersuchen diese Fragen im Kontext mehrerer angewandter Problemstellungen: der Interpretation mikrobieller Genome, der Phänotypvorhersage, metagenomischer Analysen, automatisierter literaturbasierter Wissensextraktion, reproduzierbarer computergestützter Workflows und FAIRer Datenerfassung. In diesen Bereichen benchmarken, evaluieren, adaptieren und wenden wir Methoden des maschinellen Lernens, Deep Learnings, große Sprachmodelle und KI-Agentensysteme auf konkrete biologische Fragestellungen an.
Wir interessieren uns dafür, wie agentische KI-Systeme zukünftige datengetriebene Infektionsforschung unterstützen können, indem sie Daten, Modelle, Literatur, Workflows und biologische Interpretation miteinander verbinden. Solche Systeme können Forschende dabei unterstützen, aus Rohdaten der Sequenzierung und publizierter Evidenz strukturierte Wissensbestände, reproduzierbare Analysen, interpretierbare Vorhersagen und verbesserte biologische Datenbanken zu erzeugen.
Ein zentraler Anwendungsbereich ist die Vorhersage von Phänotypen aus genomischen Daten. Wir untersuchen, wie Informationen aus vollständigen Genomen mit literaturbasiertem Wissen, Phänotypdatenbanken, molekularen Profilen und biologischen Netzwerken kombiniert werden können, um biologisch relevante Eigenschaften vorherzusagen. Diese Ansätze sind relevant für antimikrobielle Resistenzen, mikrobielle Physiologie, Wirt-Pathogen-Interaktionen, biotechnologische Anwendungen und die allgemeine Interpretation genomischer Variation.
Ein besonderer Schwerpunkt liegt darauf, Deep-Learning-Modelle für genomische Daten robuster, interpretierbarer und reproduzierbarer zu machen. Dazu gehören Modell-Benchmarking, Modellvergleich, Dokumentation, Fehleranalyse, Interpretation und die Übertragung zwischen Datensätzen, Organismen und experimentellen Kontexten. Ziel ist es, besser zu verstehen, wann genomische Modelle generalisieren, wo sie versagen und wie ihre Vorhersagen mit biologischer Evidenz verbunden werden können.
Ein Teil unserer Arbeit wird durch einen Helmholtz AI Call gefördert und unterstützt die Entwicklung und Anwendung multimodaler Deep-Learning-Ansätze zur Phänotypvorhersage aus genomischen und molekularen Daten. In diesem Kontext untersuchen wir, wie Modelle, die auf umfangreichen experimentellen Datensätzen trainiert werden, unser Verständnis von Genotyp-Phänotyp-Beziehungen verbessern und eine Grundlage für die Übertragung auf andere biologische Systeme schaffen können.
Im Rahmen der DZIF-TI BBD und verwandter Aktivitäten in NFDI4Microbiota arbeiten wir gemeinsam mit BacDive daran, fehlende Phänotypinformationen durch hochwertige KI-inferierte Vorhersagen zu ergänzen. Ziel ist es, mikrobielle Phänotypinformationen vollständiger, zugänglicher, FAIRer und nutzbarer für Infektionsforschung, Mikrobiologie und nachgelagerte computergestützte Analysen zu machen.
Über prädiktive Modellierung hinaus arbeitet unser Team auch an Meta-Science und Infrastruktur für bioinformatische Workflows. Wir entwickeln Werkzeuge und Konzepte, die verbessern, wie Sequenzierstudien geplant, dokumentiert, ausgeführt und reproduziert werden. Ein Beispiel ist SeqDesk.com, eine Plattform für Proben- und Studienmanagement in Sequenzierzentren. SeqDesk ist darauf ausgelegt, strukturierte Datenerfassung bereits an dem Punkt zu verbessern, an dem Proben und Studien in Sequenzierworkflows eingebracht werden. Dadurch sollen Forschungsdaten FAIRer, besser wiederverwendbar und geeigneter für nachgelagerte computergestützte Analysen werden.
Wir haben außerdem laufende Projekte zur Automatisierung von Reproduzierbarkeit in der Bioinformatik, unter anderem im Zusammenhang mit der Critical Assessment of Metagenome Interpretation (CAMI) Challenge. Dabei untersuchen wir, wie KI-Agenten reproduzierbares computergestütztes Benchmarking, Workflow-Ausführung, Methodenvergleich und die Interpretation komplexer metagenomischer Analyseaufgaben unterstützen können.
Ein weiterer Forschungsbereich ist die Nutzung von KI zur Verarbeitung wissenschaftlicher Literatur und zur Extraktion strukturierten biologischen Wissens. Wir untersuchen, wie Forschungsartikel mit KI-Methoden analysiert werden können, um relevante Modelle, Datensätze, biologische Entitäten, Phänotypen, experimentelle Evidenz und methodische Aussagen zu identifizieren. Dies unterstützt die Wissensextraktion, die Erweiterung von Deep-Learning-Modellen und die Entwicklung prädiktiver Systeme, die publizierte Evidenz mit computergestützter Biologie verbinden.
Unsere Forschung
- Wie können agentische KI-Systeme zuverlässig in der datengetriebenen Infektionsforschung evaluiert und eingesetzt werden?
- Wie können KI-Agenten Datenerfassung, Literaturauswertung, Modelltraining, Vorhersage, Validierung und Datenbankerweiterung miteinander verbinden?
- Wie können große Sprachmodelle mikrobielle Phänotypannotation, biologische Interpretation und strukturierte Wissensextraktion unterstützen?
- Wie können Deep-Learning-Modelle für genomische Daten robuster, interpretierbarer, reproduzierbarer und besser zwischen Datensätzen und Organismen übertragbar gemacht werden?
- Wie kann multimodale KI Genomsequenzen, molekulare Profile, biologische Netzwerke, Phänotypdatenbanken und literaturbasierte Evidenz integrieren?
- Wie können KI-Agenten reproduzierbare bioinformatische Workflows, Benchmarking und die Interpretation metagenomischer Analysen verbessern?
- Wie können Sequenzierzentren Proben- und Studiendaten strukturierter und FAIRer erfassen?
Ausgewählte Publikationen
Jordan S. L. Jensen, Sagun Maharjan, Philipp C. Münch, Jiaxian Shen, Bailey Bowcutt, Jack T. Sumner, Xochitl C. Morgan, Kelsey N. Thompson, Long H. Nguyen, Eric A. Franzosa, Curtis Huttenhower. Enhanced multi-omic viral profiling from microbial community sequencing with BAQLaVa. bioRxiv, 2026.
Philipp C. Münch, Nasim Safaei, René Mreches, Martin Binder, Yichen Han, Gary Robertson, Eric A. Franzosa, Curtis Huttenhower, Alice C. McHardy. Comparative Assessment of Large Language Models for Microbial Phenotype Annotation. bioRxiv, 2025.
Kaixin Hu, Fernando Meyer, Zhi-Luo Deng, Ehsaneddin Asgari, Tzu-Hao Kuo, Philipp C. Münch, Alice C. McHardy.
Assessing computational predictions of antimicrobial resistance phenotypes from microbial genomes. Briefings in Bioinformatics, 2024.
Hüseyin Anil Gündüz, Martin Binder, Xiao-Yin To, René Mreches, Bernd Bischl, Alice C. McHardy, Philipp C. Münch, Mina Rezaei.
A self-supervised deep learning method for data-efficient training in genomics. Briefings in Bioinformatics, 2023.
Amadeu Scheppach, Hüseyin Anil Gündüz, Emilio Dorigatti, Philipp C. Münch, Alice C. McHardy, Bernd Bischl, Mina Rezaei, Martin Binder.
Neural architecture search for genomic sequence data. IEEE Conference on Computational Intelligence in Bioinformatics and Computational Biology, 2023.
Philipp Münch, Hüseyin Anil Gündüz, René Mreches, Julia Moosbauer, Gary Robertson, Xiao-Yin To, Eric Franzosa, Curtis Huttenhower, Mina Rezaei, Alice McHardy, Bernd Bischl, Martin Binder. Optimized model architectures for deep learning on genomic data. 2023.
Team
- Dr. Philipp C. Münch
- Tim Tjalma
- Yichen Han
Alumni
- Xiao-Yin To
- René Mreches
Kollaborationen und Förderung
Unsere Arbeit wird teilweise durch einen Helmholtz AI Call gefördert und ist in kollaborative Aktivitäten der Infektionsforschung eingebettet, unter anderem im Rahmen der DZIF-TI BBD gemeinsam mit BacDive. Das Team trägt außerdem zu Reproduzierbarkeits- und Benchmarking-Aktivitäten im Zusammenhang mit der Critical Assessment of Metagenome Interpretation (CAMI) Challenge bei. Dr. Philipp C. Münch ist zusätzlich mit dem Huttenhower Lab an der Harvard T.H. Chan School of Public Health affiliiert.
Stellenangebote
Die Forschungsgruppe “Bioinformatik der Infektionsforschung” freut sich über Bewerbungen auf allen Karrierestufen mit Abschlüssen oder Qualifikationen in den Fachgebieten:
- Bioinformatik
- Informatik
- Statistik
- Biomathematik
Wir suchen motivierte Bewerberinnen und Bewerber mit einem starken Hintergrund in den oben genannten Bereichen, guten Programmierkenntnissen und Interesse an interdisziplinärer Forschung in der Biologie und Infektionsforschung.
Methoden, die wir entwickeln oder mit denen wir arbeiten, sind aus den folgenden Fachbereichen:
- Bioinformatik
- Maschinelles Lernen und deep learning
- Phylogenetik und Populationsgenetik
Das Ziel unserer Projekte ist die Entwicklung von Algorithmen und computergestützten Methoden um das menschliche Mikrobiom, virale und bakterielle Pathogene sowie menschliche Zelllinien zu analysieren.
Unsere aktuell offenen Stellen sind unten gelistet. Initiativbewerbungen sind immer willkommen. Bitte senden Sie Ihre Bewerbung an
Bewerbung.
Unsere aktuellen Stellenangebote:
momentan keine
Deep Learning for Molecular Biology
Das Fachseminar "Deep Learning for Molecular Biology" ist eine Veranstaltung der Abteilung "Bioinformatik der Infektionsforschung" am HZI unter der Leitung von Prof. Alice McHardy.
- Kick-off Meeting: 15.04.2026, 9.30h
- Raum Kick-off Meeting: BRICS, Raum 01 (Ground floor)
- Seminar Datum: TBA
- Raumseminar: TBA
- Max. Anzahl an Teilnehmer: 10
- Sprache: Englisch
- Modus: 30 Minuten Vortrag (mit Diskussion) + 3-5 Seiten schriftliche Ausarbeitung
- Für Bachelor- und Master-Studierende der Informatik und Data Science
- Voraussetzungen: Vertrautheit mit der Programmierung in Python und linearer Algebra (Matrix-/Vektor Multiplikationen)
Bei Fragen zum Seminar kontaktieren Sie bitte Mohammad Hadi Foroughmand Araabi.
Beschreibung:
Tiefe neuronale Netzwerke haben kürzlich maschinelles Lernen revolutioniert und erreichen state-of-the-art Ergebnisse in fast allen zugehörigen Forschungsbereichen, einschließlich Computer Vision, maschinelle Sprachverarbeitung und Bioinformatik. Das Ziel dieses Seminars ist es, grundlegende Prinzipien von Deep Learning zusammen mit Implementierungen im Pytorch Framework zu behandeln. Wir werden die wichtigsten neuronalen Konstruktionen untersuchen, einschließlich Convolutional Neural Networks, rekurrente Neural Networks und Autoencoder, genauso wie Sprachmodell-basierte Methoden zum Lernen von Repräsentationen.
Themen:
- Tiefe neuronale Netze und Backpropagation
- Convolutional Neural Networks (CNN)
- Rekurrente neuronale Netze (RNN)
- Transformermodelle
Technologieangebote
Folgende Technologien wurden von der Abteilung "Bioinformatik der Infektionsforschung" entwickelt und zum Patent angemeldet: