Research Engineer für GenAI mit Fokus auf Post-Training und Agentic AI (all genders) (Wissenschaftliche/r Mitarbeiter/in)
Fraunhofer-Gesellschaft e.V. Zentrale München – Dresden
Kurzbeschreibung der Position
Das Fraunhofer IAIS in der Abteilung NetMedia forscht an multimodalen Deep-Learning-Verfahren zur Künstlichen Intelligenz (KI), einschließlich Spracherkennung, Bilderkennung, NLP, Foundation Models und Conversational AI. Gesucht werden Research Engineers für GenAI mit Fokus auf Post-Training und Agentic AI, um Forschungsergebnisse in skalierbare und cloudfähige Anwendungssysteme für Industrieprojekte zu überführen.
Hauptaufgaben
- Konzeption und Implementierung von (multimodalen) Agenten- und Multi-Agentensystemen sowie deren Überführung von der Forschung in produktionsnahe Lösungen für Industrieprojekte.
- Entwicklung und Optimierung von Post-Training-Pipelines für Foundation-Modelle (von Supervised Fine-Tuning (SFT) über Preference Optimization (DPO) bis hin zu Reasoning-Training mit Reinforcement-Learning-basierten Methoden wie GRPO) und Evaluierung deren Einsatz in konkreten Anwendungsszenarien.
- Gezielte Anpassung von Foundation-Modellen an spezifische Industriesektoren (z. B. Public Sector, Medien oder Mikroelektronik) durch Continual Pre-Training (CPT).
- Identifikation und Integration effizienter Training-Frameworks und -Infrastrukturen (z. B. NeMo-RL, Megatron), um Post-Training-Workflows auf großen GPU-Clustern performant und skalierbar zu gestalten.
- Enge Zusammenarbeit mit Forschungs- und Anwendungsteams, um KI-Methoden in die Technologie-Stacks von Industriepartnern zu integrieren.
- Entwicklung und Pflege systematischer Evaluierungs- und Benchmarking-Pipelines für trainierte Modelle zur Qualitätssicherung.
Qualifikationen und Fähigkeiten
- Abgeschlossenes wissenschaftliches Hochschulstudium (Master, Diplom) in Informatik, Mathematik, Physik oder einer ähnlichen Fachrichtung mit ausgezeichnetem Abschluss, gerne mit Promotion.
- Sehr gute Programmierkenntnisse, insbesondere in Python und PyTorch.
- Vorkenntnisse in den Bereichen Data Science, Maschinelles Lernen und Künstliche Intelligenz, insbesondere ein tiefes Verständnis im Bereich des Maschinellen Lernens.
- Exzellente analytische Fähigkeiten und Freude an abstraktem Denken und konzeptionellem Arbeiten.
- Hohe Einsatzfreude sowie die Bereitschaft, zu lernen und sich schnell in neue Sachverhalte einzuarbeiten.
- Strukturiertes Arbeiten und professionelles Auftreten.
- Sehr gute Deutschkenntnisse (mindestens auf Niveau C1).
- Idealerweise Kenntnisse in einer oder mehreren LLM-Post-Training-Methoden sowie in Agentic-AI-Methoden und Frameworks.
Arbeitsort / Rahmenbedingungen
- Arbeitsort: Dresden.
- Spannende Industrieprojekte an der Schnittstelle von KI-Forschung und Anwendung.
- Zugang zu leistungsstarker GPU-Infrastruktur (Multi-GPU-Maschinen sowie ein institutseigenes SLURM-Cluster).
- Förderung der individuellen fachlichen und persönlichen Entwicklung.
- Möglichkeit, Forschungsergebnisse auf internationalen Konferenzen und in Journals zu veröffentlichen.
- Kollaboratives Teamumfeld in einer führenden KI-Forschungseinrichtung mit Fokus auf Diversity und Chancengleichheit.
- Vermögenswirksame Leistungen und eine betriebliche Altersvorsorge.
- Vergünstigungen beim Deutschlandticket.
- Wöchentliche Arbeitszeit von 39 Stunden, Teilzeit möglich.
- Anstellung, Vergütung und Sozialleistungen basieren auf dem Tarifvertrag für den öffentlichen Dienst (TVöD), ergänzt durch mögliche leistungs- und erfolgsabhängige variable Vergütungsbestandteile.
- Die Stelle ist zunächst auf 2 Jahre befristet, mit der Möglichkeit der Verlängerung.