Marin T. Kael
DE / EN

Research · Methodologie-Lab

Wie liest die Maschine einen Autor?

Phase 1 läuft seit T+0 — aktive Pre-Launch-Interventionen Q0–Q5 PARALLEL zur Instrument-Validierung. Acht Mess-Flächen — Wissensgraphen, klassische Suchindizes, KI-Antwortbereiche und Antwortmaschinen — werden täglich beprobt; Reliabilität, Drift-Verhalten und Abdeckung je Identitäts-Cluster gemessen. Phase 2 ab 22. September 2026 mit dem Buch-Launch als zentraler Intervention. Phase 3 ab Q3 / 2027 trägt Long-Term-Kontrollexperimente auf der validierten Apparatur.

Methoden werden vor-registriert, Quellcode und Roh-Daten sind offen, Failure-Logs zählen gleichgewichtig mit Befunden. Adressiert sind Autorinnen und Autoren mit Sichtbarkeits-Frage — und Praktiker:innen der Such- und Antwort-Maschinen-Optimierung (SEO, AEO, GEO), die nach einer validierten Mess-Grundlage statt Anekdoten suchen.

Aktueller Methodologie-Stand · 20. Mai 2026 (T+9) · v2.9 · Details aufklappen

Construct-Validity-Audit (v2.8) trennte Primary- und Control-Channel; v2.9 ergänzt Claude-Web als fünfte Primary-Mess-Stelle (Opus 4.7 · Sonnet 4.6 · Haiku 4.5). Headline-Metrik = Combined-Primary über alle 5 web-augmentierten LLMs. Methoden-Notiz 01 v2.9 (DOI 10.5281/zenodo.20308495) · drei Pre-Reg-relevante Befunde in Herausforderungen.

H₀ = 0,42 MODELL-UPDATE (T+0) Drift +0,36 Re-Equilibrium ≈ 14 d 0 0,25 0,50 0,75 1,0 Trefferrate H T−7 T+0 T+7 T+14 T+21 T+28 Tage seit Modell-Update
Methoden-Schema Schematisches Drift-Profil: Hit-Rate H einer KI-Antwortmaschine auf eine kanonische Autor-Aussage, gemessen vor und nach einem Modell-Update. Phase 1 mappt diese Drift-Profile pro Mess-Fläche — Voraussetzung dafür, dass spätere Wirkungs-Aussagen nicht mit Instrument-Drift verwechselt werden.
Programmleitung
Marin T. Kael
Aktiv seit
2026-05-11
Kadenz
Quartalsweise
Lizenz
CC BY 4.0 · MIT · CC0
Untersuchungslinien · Aktives 3-Phasen-Design

Aktives Programm in drei zeitlich überlappenden Phasen.

Marin T. Kael’s Forschungsprogramm operiert in drei zeitlich überlappenden Phasen. Phase 1 (Mai → Sep 2026) verschachtelt sieben aktive Pre-Registrationen Q0–Q6 mit paralleler Instrument-Validierung. Phase 2 (Sep 2026 → Q3 2027) misst Post-Launch-Effekt nach dem Buch-Launch 22. September. Phase 3 (ab Q3 2027) führt Long-Term-Kontrollexperimente auf der validierten Apparatur.

Linie 01

Zitations-Inventur

Was zeigt jedes Mess-Instrument heute überhaupt? Acht Mess-Flächen werden täglich beprobt und die Sichtbarkeit der Autor-Identität pro Identitäts-Cluster — Person, Werk, Genre, Welt-Mechanik — als Abdeckungs-Matrix dokumentiert. In Phase 1 ohne Wirkungs-Interpretation: zuerst zählen, was die Instrumente überhaupt abbilden.

Beobachtet werden 8 Mess-Flächen (Wikidata, Google Knowledge Graph, Bing Webmaster KI-Indexing, Goodreads, Hardcover, Reddit, Google Search Console, Google AI-Overviews) plus eine kleine, niedrig-frequente Sprachmodell-Probe (Gemini, ChatGPT) × N = 12 vor-registrierte Query-Sets. Schnappschuss-Kadenz 24 h für API-Endpunkte, wöchentlich für Browser-Schnappschüsse. Primäre Größe: Hit-Rate H = korrekte Citations ÷ Queries (deskriptiv, nicht inferenz-orientiert in Phase 1).

Linie 02

Mess-Instrument-Validierung

Reliabel ist ein Instrument, wenn es bei wiederholter Messung gleicher Realität gleiche Werte liefert. Phase 1 prüft jedes Mess-Fläche auf Wiederhol-Reliabilität, intra-Set-Konsistenz und Modell-Drift — und stellt fest, welche Mess-Flächen überhaupt für spätere Wirkungs-Mess­ungen geeignet sind.

Wiederhol-Korrelation r über 24-h-Wiederholungs-Proben (Schwelle r ≥ 0,9 für API-Quellen, ≥ 0,7 für Sprachmodell-Proben). Cronbach’s α intra-Query-Set ≥ 0,7 als Vorbedingung. CUSUM-Karten auf Hit-Rate über 90-Tage-Fenster mit Alarm-Schwelle h = 5. Modell-Versions-Logs werden separat protokolliert; Drift­ereignisse werden mit Drift-Profilen pro Mess-Fläche ausgewiesen.

Linie 03

Codebuch-Iteration

Was zählt überhaupt als „korrekte Citation"? Welche Antwort gilt als Halluzination, welche als korrekt-aber-unvollständig? Phase 1 versioniert das Annotations-Schema öffentlich, dokumentiert Grenzfälle und holt öffentliche Rückmeldungen ein — als Voraussetzung dafür, dass spätere Wirkungs-Aussagen auf einem eindeutigen Mess-Schema beruhen.

Codebuch v0.x → v1.0 als publizierter Meilenstein vor Phase 2-Aktivierung. Jede neue Schema-Version erscheint mit Beispiel-Annotationen, Grenzfall-Diskussion und Differenz zur Vorgänger-Version. Inter-Rater-Übereinstimmung (Cohen’s κ) wird ab Q4 / 2026 mit externen Annotator:innen erhoben; Schwelle κ ≥ 0,7 als Bedingung für die Codebuch-Versions-Freigabe.

Linie 04

Offene Materialien

Alles, was das Programm produziert, ist offen: Methoden-Notizen, Vor-Registrierungen, Mess-Quellcode, Roh-Daten, Quartalsberichte, Fehlschlag-Logs, Codebuch-Versionen. Methodik-Reviewer:innen mit Python-Umgebung und Internet-Zugang können jede Auswertung nachvollziehen — das ist der einzige Audit-Mechanismus, den eine Einzelfall-Studie hat.

Methoden-Notizen und Quartalsberichte unter CC BY 4.0, Quellcode auf GitHub unter MIT, Roh-Daten unter CC0 (sofern Plattform-AGB konform). Ab Q3 / 2026 jede Veröffentlichung mit Zenodo-DOI. Pro Quartal ein Replikations-Archiv mit eingefrorenen Versions-Pins, environment.yml, User-Agent-Strings und Endpunkt-Schnappschüsse.

Beispiel-Auswertung · Phase 1

So sieht ein Validierungs-Befund aus.

Phase 1 misst nicht Wirkungen, sondern Mess-Eigenschaften. Wiederhol-Reliabilität r sagt, ob ein Mess-Fläche bei wiederholter Probe gleicher Realität gleiche Werte liefert. Schwelle r ≥ 0,9 wird für API-Quellen angesetzt, r ≥ 0,7 für sprachmodell­basierte Browser-Schnappschüsse. Die nachstehende Abbildung ist eine schematische Vorausschau auf den Q3 / 2026-Validierungsbericht.

r = 0,7 r = 0,9 0 0,25 0,5 0,75 1,0 Wiederhol-Reliabilität r (24-h-Wiederholung) Wikidata · SPARQL Reddit · public JSON Google Search Console Google Knowledge Graph Goodreads / Hardcover Bing Webmaster KI Gemini (Browser-Probe) ChatGPT (Browser-Probe)
Abbildung 3 · Q3-2026-Vorausschau (hypothetisch) Forest-Plot der Wiederhol-Reliabilität pro Mess-Fläche über 24-h-Wiederholungs-Proben. Klassifikation: r < 0,7 unzureichend; 0,7 ≤ r < 0,9 akzeptabel; r ≥ 0,9 hoch. Gefüllte wax-Marker: r ≥ 0,9; gefüllte ink-Marker im akzeptablen Bereich; offene Marker: Konfidenzintervall berührt die Schwelle 0,7 — Mess-Fläche noch nicht validiert. Hypothetische Daten zur Methoden-Vorschau; reale Werte erscheinen im Aktivitäts-Bericht Q3 / 2026. → Aktuelle Live-Messwerte im Forschungs-Dashboard
T+12 d T+21 d T+0 T+10 T+20 T+30 T+40 Tage seit Aktion Peak 50 % 0 % Verbleibender Effekt Wikidata-Edit · τ½ ≈ 21 d ORCID Profil-Erweiterung · τ½ ≈ 18 d IndexNow Bulk-Push · τ½ ≈ 12 d Newsletter-Versand · τ½ ≈ 7 d Reddit-Beitrag · τ½ ≈ 4 d Manuskript-Indexierung · klein, aber persistent
Abbildung 4 · Phase-2-Vorausschau Erwartete Zerfalls-Profile sechs Autor-Aktions-Klassen, wie sie ab Q3 / 2027 auf einer validierten Mess-Apparatur ausgewiesen würden. Halbwertszeit τ½ misst die Tage, nach denen ein Aktions-Effekt auf 50 % seines Peaks abgefallen ist. Phase 1 (aktuell) baut die Apparatur, mit der diese Profile in Phase 2 zuverlässig erhoben werden können — ohne Verwechslung mit Instrument-Drift.
Publikationen

Veröffentlicht und in Vorbereitung.

Methodenpapiere, Pre-Registrierungen, Quartalsberichte und gelegentliche Feld-Berichte. Jede Publikation erhält eine stabile URL und ein Zitierschema; ab Quartalsbericht Q3 / 2026 zusätzlich eine Zenodo-DOI.

Feld-Bericht · T+23 DOI 10.5281/zenodo.20549020

Von Null zu zitiert in sechs Tagen — eine 23-Tage-Messung der KI-Sichtbarkeit

Feld-Bericht über die ersten 23 Tage: Wie schnell beginnen KI-Suchsysteme und Sprachmodelle, einen brandneuen Autor zu lesen, zu verstehen und zu zitieren? Mit Tempo-, Provider-, Kategorie- und Grounding-Auswertung. Offene Daten, Code und der vollständige bilinguale Bericht verlinkt.

Projekt-Journal · Living

Projekt-Herausforderungen und Lösungen

Offenes Engineering-Journal: jede Pipeline-Hürde, methodologische Drift und Reichweiten-Bremse dokumentiert mit Symptom, Root-Cause, Lösung und methodologischer Implikation. Acht Pipeline-Herausforderungen, zwei Reichweiten-Befunde, fünf Erfolgs-Faktoren. Wird bei jedem neuen Befund erweitert.

Methoden-Notiz · 01 DOI 10.5281/zenodo.20170615

Baseline-Messung: Autor-Identität im Zitations-Verhalten von Sprachmodellen (Aktives Pre-Launch-Design)

v2.0 revidiert das Phasen-Modell: Das Programm operiert nicht in „erst Validierung, dann Aktion“, sondern in drei zeitlich überlappenden Phasen mit kontinuierlich pre-registrierten Interventionen. Sieben aktive Pre-Registrationen (Q0–Q6) auf elf Mess-Flächen — incl. Cross-LLM-Trust-Graph, Common-Crawl-Snapshot-Probe, machine-readable Identity-Surfaces.

Vor-Registrierung · Q0 DOI 10.5281/zenodo.20125967

Pre-Launch-Instrument-Validierung · Pre-Launch-Aktivitäts-Fenster 2026-05 → 2026-09

Lockt vor Datenerfassung den vollen Phase-1-Mess­plan: sechs Instrument-Hypothesen H-Q0-INST-01 bis 06 (Wiederhol-Reliabilität, Multi-Schnappschuss-Aggregation, CUSUM-Drift-Sensitivität, Cronbach’s α, Wikidata-Ankerstabilität, Inter-Mess-Flächen-Übereinstimmung), Stichprobenplan, Stop-Kriterien, Kontingenz-Plan und Reproduzierbarkeits-Spezifikation. CC BY 4.0.

Codebuch · v0.1 DOI 10.5281/zenodo.20125976

Annotations-Schema für KI-Zitations-Verhalten

Operationalisiert vor jeder Mess-Probe was als „korrekte Citation“ zu zählen ist: vier binäre Dimensionen (Hit, Korrekt, Halluzination, Vollständigkeit), Anti-Pattern-Katalog, vier dokumentierte Grenzfall-Klassen, Versions-Plan v0.1 → v1.0 mit Inter-Rater-Schwelle Cohen’s κ ≥ 0,7. CC BY 4.0.

Software-Release · v0.3 DOI 10.5281/zenodo.20262669

marin-research-tools — Phase-1 Tooling

Quellcode-Veröffentlichung der Phase-1-Instrument-Validierungs-Werkzeuge: style_lint.py (Style-Sheet-Linter für Outbound), source_attribution_parser.py (Cross-LLM-Trust-Graph), Pre-Registrations Q0–Q6, Operator-Policy-Dokumentation. MIT-Lizenz. GitHub-Tag v0.3. Vorgänger v0.1 (10.5281/zenodo.20126017) und v0.2 (10.5281/zenodo.20189714) bleiben permanent zitierbar; v0.3 supersedes v0.2 by design refactor (siehe CHANGELOG).

Datensatz · T+0 DOI 10.5281/zenodo.20126038

Wikidata Identitäts-Snapshot · Nullpunkt

Wikidata-Items Q139720807 (Autor) und Q139720798 (Buch) zum Stichtag 11.05.2026 als Vollständiger EntityData-Export und SPARQL-Property-Listing. Dient als Ground-Truth-Anker für H-Q0-INST-05 (Coverage-Stabilität > 0,85 über das Pre-Launch-Aktivitäts-Fenster). CC0 1.0.

Aktivitäts-Bericht · Q3 / 2026

Aktive Pre-Launch-Phase — Erste 90 Tage Q0–Q5 + parallele Mess-Apparatur

Reliabilität pro Mess-Fläche (Wiederhol-Reliabilität r über 24-h-Wiederholungen), Drift-Beobachtungen (CUSUM-Karten auf Hit-Rate), Abdeckungs-Quoten pro Identitäts-Cluster und erste Codebuch-Beobachtungen. Vorschau-Layout mit hypothetischen Daten bereits verfügbar; echte Veröffentlichung am 15. Oktober 2026 mit Roh-Daten und Replikations-Archiv.

Validierungs-Bericht · Q4 / 2026 Forthcoming

Inter-Rater-Übereinstimmung & Codebuch v0.2

Zweiter Validierungs-Bericht: Inter-Rater-Übereinstimmung (Cohen’s κ) mit externen Annotator:innen, Codebuch-Versions-Differenz von v0.1 zu v0.2, fortschreibende Drift-Statistiken pro Mess-Fläche, erste Aussagen zu Inter-Mess-Flächen-Übereinstimmung (welche Mess-Flächen sind redundant, welche orthogonal?).

Validierungs-Bericht · Q1 / 2027 Forthcoming

Konsolidierung der Mess-Apparatur

Dritter Validierungs-Bericht: zusammengeführte Reliabilitäts-, Drift- und Inter-Rater-Befunde aus drei Quartalen. Entscheidung über Codebuch v1.0 als Voraussetzung für Phase 2-Aktivierung. Falls einzelne Mess-Flächen die Validierungs-Schwellen nicht erreichen, werden sie für Phase 2 ausgeschlossen oder durch Alternativen ersetzt.

Übergangs-Notiz Forthcoming

Phase-1-Abschluss · Phase-2-Vor-Registrierungen

Methoden-Notiz mit dem Validierungs-Schluss der Phase 1 und den ersten vor-registrierten Hypothesen für Phase-3-Long-Term-Kontrollexperimente ab Q3 / 2027 auf der validierten Apparatur.

Offene Materialien

Replikation und Auditierbarkeit.

Style-Sheet (kanonische Wahrheit)
Das gegen jede Erhebung verglichene Referenz­dokument wird versioniert gepflegt und nach jeder Quartals­veröffentlichung auch in Auszügen publiziert. Aktueller Stand auf Anfrage; ab Q3 / 2026 öffentlich.
Mess-Pipeline (Quellcode)
Erhebungs- und Linter-Skripte sind öffentlich auf GitHub: github.com/marintkael/marin-research-tools (Python, MIT-Lizenz). Mit jedem Quartalsbericht erscheint zusätzlich ein Replikations-Archiv mit eingefrorenen Versions-Pins.
Pre-Registrierungen
Jede Erhebung wird vor Datenerfassung mit Hypothese, Mess-Operationalisierung und Stopp-Kriterium veröffentlicht. Spätere Änderungen werden kenntlich gemacht.
Fehlschlag-Protokoll
Jedes durch den Linter blockierte Material wird mit Grund und Datum geloggt. Aggregierte Auszüge sind Teil der Quartals­berichte. Die Politik-Grenze der Pipeline bleibt von außen prüfbar.

Über das Programm

Marin T. Kael ist Autor — und führt parallel ein offen dokumentiertes Feldlabor zur Frage, wie Sprachmodell-basierte Suchsysteme und KI-Antwort­maschinen eine literarische Autor-Identität aufnehmen, verstehen und zitieren. Phase 1 (aktiv, Mai → Sep 2026): aktive Pre-Launch-Interventionen Q0–Q5 + Instrument-Validierung parallel. Phase 2 (ab Sep 2026): Post-Launch-Effekt-Detection nach dem Buch-Launch 22. September. Phase 3 (ab Q3 / 2027): Long-Term-Kontrollexperimente auf der validierten Apparatur.

Adressiert sind Autor:innen, die ihre Sichtbarkeit in der KI-Suche verstehen wollen, sowie Praktiker:innen der Such- und Antwort- Maschinen-Optimierung (SEO / AEO / GEO), die nach einer reproduzierbaren Mess-Grundlage statt anekdotischer Behauptungen suchen. Die Arbeit ist eigenfinanziert und nicht an eine akademische Einrichtung angebunden.

Eine ausführliche Beschreibung — Mission, Methodik, Ethik, Veröffentlichungs­plan — steht unter /research/programme.

Kontakt

Anfragen zu Methodik, Replikation oder Auditierung: research@marin-t-kael.de. Quellcode und Replikations-Archive auf GitHub.