Ein KI-Bild zeigt zwei identische Personen, die sich auf dem Papier unterscheiden: ein Lebenslauf im kreativen Stil und einer im klassischen Format, bewertet von verschiedenen KI-Systemen mit unterschiedlichen Ergebnissen.
Ein KI-Bild zeigt zwei identische Personen, die sich auf dem Papier unterscheiden: ein Lebenslauf im kreativen Stil und einer im klassischen Format, bewertet von verschiedenen KI-Systemen mit unterschiedlichen Ergebnissen.

Die Art, wie ein Lebenslauf formuliert ist, beeinflusst die KI-Bewertung stärker als die Qualifikation selbst – ein wichtiger Kontext für Kollegen im HR-Bereich, die faire Auswahlverfahren gestalten.

KI sortiert identische Kandidaten unterschiedlich aus Handlungsfluss und Kernfakten

Eine Untersuchung des KI-Anbieters i10x.ai zeigt, dass KI-gestützte Bewerbungsscreenings identische Kandidatenprofile unterschiedlich bewerten – allein aufgrund des Lebenslaufstils. Obwohl Qualifikationen, Berufserfahrung und Inhalte exakt gleich blieben, lag die Abweichung in der „Hire Rate“ bei bis zu 42 Prozentpunkten, je nachdem, ob der Lebenslauf von GPT, Claude, Gemini oder Grok verfasst wurde. Die Studie analysierte 100 realistische Profile aus 12 Branchen, jeweils in vier stilistischen Varianten, und ließ verschiedene KI-Modelle im Blindtest bewerten.

Das Ergebnis offenbart eine kritische Schwachstelle: KI-Systeme reagieren sensibel auf sprachliche Muster und Struktur, nicht nur auf fachliche Eignung. Besonders problematisch ist die Grenze zwischen „Maybe“ und „Hire“, da viele automatisierte Prozesse „Maybe“-Bewertungen faktisch als Absage behandeln. So kann ein qualifizierter Backend-Engineer mit einem von Claude verfassten Lebenslauf aussortiert werden, während dieselbe Person mit einem Gemini-Stil klar als „Hire“ bewertet wird.

Die Studie unterstreicht, dass KI-basierte Vorauswahlverfahren nicht per se objektiv sind. Unterschiedliche Modelle zeigen systematische Präferenzen – Gemini verzeichnete höhere Hire Rates, während Claude strenger bewertete. Für Unternehmen ergibt sich die Gefahr, dass talentierte Kandidaten unsichtbar aussortiert werden, nicht wegen fehlender Eignung, sondern aufgrund stilistischer Nuancen. Ohne Bias-Tests und menschliche Kontrolle könnte die Talent-Pipeline systematisch verzerrt werden.

Fakten

  • Eine Studie von i10x.ai zeigt bis zu 42 Prozent Abweichung in der Hire Rate bei identischen Kandidaten, je nach Lebenslaufstil.
  • 100 Bewerberprofile wurden in vier Varianten (GPT, Claude, Gemini, Grok) mit gleichbleibenden Fakten, aber unterschiedlichem Stil getestet.
  • Gemini-generierte Lebensläufe erzielten im Durchschnitt höhere Hire Rates, während Claude strenger bewertete.
  • Die Grenze zwischen „Maybe“ und „Hire“ ist kritisch, da „Maybe“ oft wie eine Absage behandelt wird.
  • Die Studie warnt vor unsichtbaren Verzerrungen in KI-gestützten Auswahlverfahren, die qualifizierte Kandidaten aussortieren können.

Visuelle Nachrichtenerklärung von Canto. KI-Werkzeuge können die Produktion unterstützen. Redaktionelle Richtlinien