Wissenschaftliche*r Mitarbeiter*in zur Promotion für den Arbeitsbereich Educational Technologies
DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation – Frankfurt am Main
Kurzbeschreibung der Position
Vollzeit, befristet bis 31.12.2029. Vergütung nach EG 13 Tarifvertrag für den öffentlichen Dienst des Landes Hessen (TV-H)
Hauptaufgaben
- Entwicklung, Training und Kalibrierung eines Educational-AI Agents zur automatisierten Annotation, Kodierung und Labeling-Unterstützung für transkribierte Interviews und weitere qualitative Textdaten.
- Operationalisierung und Umsetzung komplexer Kodierschemata (z.B. participation & belonging, inclusion, recognition, justice) in NLP-Pipelines: von Guidelines/Definitionen über Label-Formate bis hin zu Modell- und Evaluationsdesign.
- Aufbau und Pflege von Annotation-Workflows (z.B. mit INCEpTION/WebAnno o.ä.): Projektsetup, Schema-Management, Guideline-Versionierung, Quality Assurance, Export/Import, Konsistenzchecks.
- Entwicklung von KI-gestützten Coding-Assistenzfunktionen (z.B. Vorschlagsmodelle, Highlighting relevanter Textpassagen, Active-Learning-Strategien) zur Beschleunigung der Codierung bei gleichzeitiger Sicherung hoher Qualität.
- Systematische Evaluation der Labeling-Genauigkeit im Vergleich zu traditionellen qualitativen Verfahren: Gold-Standard-Design, Inter-Rater-Agreement, Fehleranalysen, Robustheits- und Bias-Checks über unterschiedliche Textsorten hinweg.
- Analyse und Optimierung des Trade-offs zwischen Genauigkeit und Geschwindigkeit: Messung von Durchsatz (Labels/Stunde), Unsicherheits-/Konfidenzschwellen, Human-in-the-Loop-Strategien, Kosten-/Nutzen-Abwägungen für unterschiedliche Datenquellen und Kodieraufgaben.
- Aufbau einer reproduzierbaren Infrastruktur für Datenaufbereitung, Training/Fine-Tuning, Experimenttracking und Dokumentation (inkl. Unterstützung durch studentische Hilfskräfte bei Implementierung, Testing und Doku).
- Eigenständige Anfertigung einer Dissertation zu KI-gestützter Textkodierung sowie aktive Mitwirkung an Publikationen, Workshops, Tagungen und dem Forschungs- und Studienprogramm des SFB.
Qualifikationen und Fähigkeiten
- Sehr guter Masterabschluss in Informatik, Data Science, Mathematik oder verwandter Disziplin; einschlägige Forschungserfahrung (z.B. Masterarbeit) im Bereich NLP/ML/Text Mining.
- Fundierte Kenntnisse im Entwurf, der Analyse und Implementierung von Algorithmen für große Textkorpora, inkl. effizienter Datenpipelines und sauberer Experimentführung.
- Starke NLP-Kompetenz für semantische Textanalyse und (semi-)automatisches Labeling, z.B. Text-/Segmentklassifikation, Sequenzlabeling, span-based labeling, Information Extraction (NER/Relationen, falls relevant fürs Coding), Transformer-/Embedding-basierte Modelle, Prompting vs. Fine-Tuning.
- Praktische Erfahrung mit Fine-Tuning und Evaluation moderner Sprachmodelle für Annotation (z.B. Adapter/LoRA, weak supervision, distillation), inkl. reproduzierbarer Setups (Seeds, Splits, Ablationen).
- Erfahrung mit Annotation & Coding-Workflows (idealerweise INCEpTION) und Qualitätssicherung: Guideline-Entwicklung, Konsistenzprüfungen, Konfliktlösung, Metriken wie Precision/Recall/F1, Kalibration, Agreement (z.B. κ/α), systematische Error Analysis (Label-Verwechslungen, Domänenartefakte).
- Fähigkeit, Human-in-the-Loop-Strategien zu entwickeln, die Genauigkeit und Geschwindigkeit balancieren: Active Learning (unsichere Fälle zuerst), Smart Sampling, Konfidenzschwellen, Abstufungen (auto-label / review / manual), Mess- und Entscheidungslogik für Throughput vs. Quality.
- Sicheres Programmieren (v.a. Python) und Umgang mit ML/NLP-Tooling (z.B. PyTorch/Transformers, spaCy), plus Grundlagen in MLOps/Experimenttracking (z.B. DVC/MLflow/Git).
- Sehr gute Deutsch- und Englischkenntnisse in Word und Schrift.
Arbeitsort / Rahmenbedingungen
Wir erwarten ein hohes Maß an Eigeninitiative und intrinsischer Motivation sowie große Freude an der kreativen Problemlösung unter Anwendung neuster Technologien im Bildungsumfeld. Persönliches Engagement, Teamfähigkeit und Befähigung zum selbständigen wissenschaftlichen Arbeiten in einem interdisziplinären Umfeld setzen wir voraus.
Wir bieten Ihnen ein anspruchsvolles und herausforderndes Arbeitsumfeld und ein breites Netzwerk in Forschung und Praxis, sowie Anschluss an das Weiterbildungsprogramm GRADE der Goethe Universität. Ebenso bieten wir Ihnen eine abwechslungsreiche und kreative Tätigkeit in einem interdisziplinären Team mit angenehmer Arbeitsatmosphäre mit vielen Möglichkeiten, eigene innovative Ideen einzubringen und zu verwirklichen. Sie haben die Möglichkeit, sich auf eine praxisnahe Umsetzung und Erforschung neuer Technologien und Möglichkeiten des digital gestützten Lehrens und Lernens in großen und kleinen Projekten zu fokussieren.
Flexible Arbeitszeiten und die „Kita im DIPF“ ermöglichen gute Voraussetzungen für die Vereinbarkeit von Beruf und Familie. Es besteht die Möglichkeit, ein vergünstigtes Jobticket Deutschland zu erwerben.
Das DIPF ist zertifiziert mit dem Siegel audit berufundfamilie+vielfalt, fördert die Gleichstellung aller Mitarbeiter*innen und begrüßt Bewerbungen unabhängig von ethnischer, kultureller oder sozialer Herkunft, Alter, Religion, Weltanschauung, Behinderung, Geschlecht und sexueller Identität. Schwerbehinderte Menschen werden bei gleicher Eignung besonders berücksichtigt. Die Reduzierung der Arbeitszeit ist unter Berücksichtigung dienstlicher Belange grundsätzlich möglich.