top of page

KI-Einblicks-Benchmarks

Die AI Insight Benchmarks untersuchen Bereiche, in denen menschliche Interpretation, logisches Denken und ethische Urteilsfähigkeit nach wie vor schwer zu formalisieren sind.

 

Jeder Benchmark übersetzt eine spezifische Kapazität in ein reproduzierbares Bewertungsformat, ohne dabei die Struktur zu entfernen, die die Kapazität aussagekräftig macht.

Das Programm schlägt eine Brücke zwischen wissenschaftlicher Forschung und kultivierter menschlicher Kognition, indem es festlegt, was getestet wird, wie es getestet wird und wie Fehlermodi aussehen – nicht nur, was Maschinen leisten können, sondern auch, was Tiefe, Stabilität und Verantwortung im menschlichen Verständnis auszeichnet.

„Reversible Scholastic Verse“ ist eine erste Gedichtreihe von Lama Tenzin Rahula Rinpoche, die beim Vorwärts- und Rückwärtslesen zwei unterschiedliche, textgetreue Interpretationen zulässt. Jedes Gedicht wird von einer wissenschaftlichen Analyse mit expliziten Quellenangaben und nachvollziehbaren Argumentationsschritten begleitet.

​

Die Serie dient als Maßstab und testet, ob ein KI-System Folgendes leisten kann:

  • semantische Beschränkungen bei Umkehrung beibehalten,

  • eine gültige Schlusskette reproduzieren

  • und die Interpretation von der Erfindung unterscheiden.

​

Durch die Präsentation kontemplativer Argumentation in einem zitierfähigen, strukturierten Format unterstützt die Reihe vergleichende Bewertungen über verschiedene Systeme hinweg und lädt zur Zusammenarbeit zwischen KI- und geisteswissenschaftlicher Forschung ein.

Der Layered Perception Benchmark (LPB) bewertet, ob ein KI-System ein einzelnes visuelles Feld interpretieren kann, das mehrere kohärente Lesarten gleichzeitig unterstützt, und ob es diese Lesarten mit Beweisen (Konturbeziehungen, Ausrichtung, Negativraum, Kopplungsmarken) begründen kann.

​

LPB testet darüber hinaus, ob das Modell Folgendes kann:

  • stellen Abhängigkeitsbeziehungen zwischen Messwerten dar

  • Interpretationsänderungen unter kontrollierten Störungen vorhersagen

  • und die Stabilität ohne halluzinatorische Erzählungen aufrechterhalten.

Spiral-Recursive Narration Benchmark

Der Spiral-Recursive Narration Benchmark (SRNB) bewertet, ob ein KI-System eine geführte Narration erzeugen kann, die wiederholt in dasselbe knappe Gedicht in aufeinanderfolgenden Zyklen zurückkehrt, die Bedeutung durch Rückkehr vertieft (statt durch zeilenweise Paraphrase) und jede Vertiefung mit den eigenen Worten des Gedichts begründet (Bildlogik, Schwellenhinweise, Spur-/Fußabdruck-Dynamiken, Kontur-/Verhüllungsspannungen).

SRNB prüft darüber hinaus, ob das Modell:

  • einen gewichteten Anker (z. B. „allmählich“) auswählt und über die gesamte Narration hinweg trägt,

  • ein meditatives Tempo aufrechterhält, ohne vage, moralisierend oder akademisch zu werden,

  • die Offenheit des Gedichts bewahrt und dennoch zu ethischer Klarheit gelangt (Sprache, Verantwortung, Mitgefühl),

  • eng am gegebenen Text bleibt, ohne nicht gestützte narrative Elemente oder Bildvorstellungen zu erfinden.

spiral narration poetry .jpg
bottom of page