Research Engineer für GenAI mit Fokus auf Post-Training und Agentic AI (all genders) (Wissenschaftliche/r Mitarbeiter/in)

Fraunhofer-Gesellschaft e.V. Zentrale München – Dresden

Kurzbeschreibung der Position

Das Fraunhofer IAIS in der Abteilung NetMedia forscht an multimodalen Deep-Learning-Verfahren zur Künstlichen Intelligenz (KI), einschließlich Spracherkennung, Bilderkennung, NLP, Foundation Models und Conversational AI. Gesucht werden Research Engineers für GenAI mit Fokus auf Post-Training und Agentic AI, um Forschungsergebnisse in skalierbare und cloudfähige Anwendungssysteme für Industrieprojekte zu überführen.

Hauptaufgaben

  • Konzeption und Implementierung von (multimodalen) Agenten- und Multi-Agentensystemen sowie deren Überführung von der Forschung in produktionsnahe Lösungen für Industrieprojekte.
  • Entwicklung und Optimierung von Post-Training-Pipelines für Foundation-Modelle (von Supervised Fine-Tuning (SFT) über Preference Optimization (DPO) bis hin zu Reasoning-Training mit Reinforcement-Learning-basierten Methoden wie GRPO) und Evaluierung deren Einsatz in konkreten Anwendungsszenarien.
  • Gezielte Anpassung von Foundation-Modellen an spezifische Industriesektoren (z. B. Public Sector, Medien oder Mikroelektronik) durch Continual Pre-Training (CPT).
  • Identifikation und Integration effizienter Training-Frameworks und -Infrastrukturen (z. B. NeMo-RL, Megatron), um Post-Training-Workflows auf großen GPU-Clustern performant und skalierbar zu gestalten.
  • Enge Zusammenarbeit mit Forschungs- und Anwendungsteams, um KI-Methoden in die Technologie-Stacks von Industriepartnern zu integrieren.
  • Entwicklung und Pflege systematischer Evaluierungs- und Benchmarking-Pipelines für trainierte Modelle zur Qualitätssicherung.

Qualifikationen und Fähigkeiten

  • Abgeschlossenes wissenschaftliches Hochschulstudium (Master, Diplom) in Informatik, Mathematik, Physik oder einer ähnlichen Fachrichtung mit ausgezeichnetem Abschluss, gerne mit Promotion.
  • Sehr gute Programmierkenntnisse, insbesondere in Python und PyTorch.
  • Vorkenntnisse in den Bereichen Data Science, Maschinelles Lernen und Künstliche Intelligenz, insbesondere ein tiefes Verständnis im Bereich des Maschinellen Lernens.
  • Exzellente analytische Fähigkeiten und Freude an abstraktem Denken und konzeptionellem Arbeiten.
  • Hohe Einsatzfreude sowie die Bereitschaft, zu lernen und sich schnell in neue Sachverhalte einzuarbeiten.
  • Strukturiertes Arbeiten und professionelles Auftreten.
  • Sehr gute Deutschkenntnisse (mindestens auf Niveau C1).
  • Idealerweise Kenntnisse in einer oder mehreren LLM-Post-Training-Methoden sowie in Agentic-AI-Methoden und Frameworks.

Arbeitsort / Rahmenbedingungen

  • Arbeitsort: Dresden.
  • Spannende Industrieprojekte an der Schnittstelle von KI-Forschung und Anwendung.
  • Zugang zu leistungsstarker GPU-Infrastruktur (Multi-GPU-Maschinen sowie ein institutseigenes SLURM-Cluster).
  • Förderung der individuellen fachlichen und persönlichen Entwicklung.
  • Möglichkeit, Forschungsergebnisse auf internationalen Konferenzen und in Journals zu veröffentlichen.
  • Kollaboratives Teamumfeld in einer führenden KI-Forschungseinrichtung mit Fokus auf Diversity und Chancengleichheit.
  • Vermögenswirksame Leistungen und eine betriebliche Altersvorsorge.
  • Vergünstigungen beim Deutschlandticket.
  • Wöchentliche Arbeitszeit von 39 Stunden, Teilzeit möglich.
  • Anstellung, Vergütung und Sozialleistungen basieren auf dem Tarifvertrag für den öffentlichen Dienst (TVöD), ergänzt durch mögliche leistungs- und erfolgsabhängige variable Vergütungsbestandteile.
  • Die Stelle ist zunächst auf 2 Jahre befristet, mit der Möglichkeit der Verlängerung.