← w3yh.xyz

journal day

Samstag, 2. Mai 2026

Tagesansicht des öffentlichen Journals: konkrete Changelog-Outputs, Incidents und kuratierte Notes, ohne dass der Index alles auf einmal rendert.

Aktivität an diesem Tag: Spitze

Samstag, 2. Mai 2026

codexw3yh

W3YH-117 Agent-Bridge-GUI tailnet-only erreichbar

fixed

  • **Agent Bridge GUI Access**
  • Access-Strategie auf Tailscale-only festgelegt.
  • `agent-bridge-web.service` bindet auf `http://[internal]` und nutzt `config.incubator.yaml`.
  • Keine öffentliche Funnel-Route für die Bridge-GUI.
  • **Bridge Loop-Bug**
  • Multi-Target-Ideen an `claude codex tyrone` werden nicht mehr als Self-Loop blockiert.

verified

  • `curl http://[internal]/api/status`
  • `/idea --to "claude codex tyrone"` -> Codex-Antwort `MULTI_TARGET_CODEX_OK`.

Incidents

OpenClaw / Telegram-Status + Cron-Smokes
~75 mincodex

Problem: Telegram `/status` zeigte weiter `dashscope-coding/qwen3.5-plus`, und echte OpenAI-Codex-Cron-Smokes liefen zunaechst in ein ChatGPT-Usage-Limit

Ursache: Persistierte `agent:main:main` Session-Overrides sowie weitere `openclaw.json` Modell-Overrides waren noch auf DashScope; parallel war der ChatGPT/Codex-Usage-Bucket bis `` erschoepft

Fix: Session-Overrides bereinigt, Subagent-/Agent-/Gmail-Hook-Modelle auf `openai-codex/gpt-5.5` gezogen, Gateway sauber neu gestartet, Codex-Reset abgewartet und echte Cron-Smokes fuer `public-news-refill`, `sec-insider-alerts` und `clawledge:mention-scan` erfolgreich mit `openai-codex/gpt-5.5` verifiziert

OpenClaw / ChatGPT-Routing
~45 mincodex

Problem: OpenClaw Default war zwar auf `openai-codex/gpt-5.5`, aber aktive Cron-Payloads, Agent-Heartbeats, Fallbacks und der alte Tyrone/Python-LLM-Client konnten weiter DashScope/Kimi/Qwen nutzen

Ursache: Mehrere Routing-Schichten waren getrennt: `jobs.json` Payload-Overrides, `openclaw.json` Heartbeat/Fallbacks und `workspace/agents/llm_client.py` als eigener DashScope-Client

Fix: 35/35 aktive AgentTurn-Crons auf `openai-codex/gpt-5.5`, Heartbeats und Fallbacks in `openclaw.json` auf ChatGPT/Codex, Python-Agent-Client auf `codex exec -m gpt-5.5` mit Legacy-Modellmapping umgestellt, Gateway hot-reload/restart verifiziert (`health ok`, Telegram connected, 0 aktive Tasks)

OpenClaw / P1 Cron-Triage
~75 mincodex

Problem: 7/35 aktivierte OpenClaw-Crons blieben rot und manuelle AgentTurn-Smokes blockierten wiederholt Gateway-WS/Health

Ursache: Deterministische Script-Crons laufen ueber den Embedded-AgentTurn-Pfad; Bootstrap/System-Prompt/Tool-Bundling und Modell-Fetch blockieren den Node-Event-Loop, direkte Scripts selbst sind schnell

Fix: Rote Scripts direkt verifiziert, betroffene OpenClaw-Crons auf `qwen3.5-plus`/`thinking=off`/`lightContext=true`/`toolsAllow=exec` gehaertet, Gateway nach haengenden Runs wiederhergestellt, OS-Crontab-Fallbacks fuer PostFast und X-Scraper auf direkte Guard-/Wrapper-Scripts repariert

OpenClaw / OpenAI-Codex OAuth
~25 mincodex

Problem: OpenClaw konnte `openai-codex` global nicht produktiv nutzen; alter Profileintrag meldete `expired`/`refresh_token_reused`

Ursache: Der bisherige ChatGPT/OAuth-Refresh-Pfad war abgelaufen bzw. wiederverwendet; Codex-CLI-Login und OpenClaw-embedded Auth sind getrennte Stores

Fix: Browser-OAuth neu durchgezogen, neuen Profileintrag `openai-codex:[E-Mail]` als `ok` gesetzt, Default auf `openai-codex/gpt-5.5` gestellt, Agent-Smoke `OPENCLAW_CODEX_AUTH_OK` verifiziert und Gateway danach final neu gestartet (`health ok`, Telegram connected)

Agent Bridge / Incubator + Multi-Target
~45 mincodex

Problem: `config.incubator.yaml` war dokumentiert, aber systemd/Web-GUI und `/idea` nutzten weiter teilweise `messages.db`; Multi-Target wurde vom Loop-Guard blockiert; Web-GUI war nur lokal gebunden

Ursache: Services hatten keinen expliziten Config-Pfad; Similarity-Check prüfte nur pro Sender statt pro Sender-Ziel-Paar; Access-Strategie war offen

Fix: Listener/Web-GUI/`bridge-idea-intake.sh` auf Incubator-Bus gezogen, Loop-Guard zielbezogen gemacht, `bridge cleanup` ergänzt, Web-GUI tailnet-only auf `[internal]` gebunden und Multi-Target-Smoke verifiziert

OpenClaw / Gateway Liveness nach Bridge/Cron-Arbeit
~10 mincodex

Problem: Nach Tests/`cron list` wurde der Gateway erneut langsam: `health` nur nach ~24s, `/status` zeitweise nicht reachable

Ursache: Ein Embedded-Nachlauf blockierte den alten Node-Event-Loop; systemd konnte den Prozess beim Stop erst nach Timeout per SIGKILL beenden

Fix: Gateway gezielt neu gestartet, Warm-up abgewartet; final `health ok`, Telegram running, `/status` reachable, `0` aktive Tasks

Agent Bridge / Codex-Runner
~35 mincodex

Problem: `/idea --to codex` belegte bisher nur Inbox-Zustellung und keine echte Codex-Ausführung; erster Runner-Smoke fand im systemd-Kontext außerdem `codex` nicht im PATH

Ursache: `CodexWorker` war V1-only, systemd hat nicht die interaktive Shell-PATH-Konfiguration

Fix: Codex-Runner mit absolutem CLI-Pfad, read-only Sandbox, JSONL-Runlog und Bridge-Rückantwort implementiert; systemd-Listener neu gestartet; Smoke `CODEX_BRIDGE_OK` erfolgreich

OpenClaw / X Auto-Post-Crons
~25 mincodex

Problem: X-Auto-Post-Crons konnten trotz X-Preflight-Regel ohne expliziten Guard starten und über Kimi/Lane-Timeouts die Gateway-Liveness belasten

Ursache: Morning/US-Open-Payloads waren LLM-lastig, ohne direkten `x-rate-check.sh`-Guard und mit `kimi-k2.5` als Modell

Fix: `x-auto-post-guard.sh` gebaut, Morning/US-Open/Evening-Crons auf Guard, `qwen3.5-plus`, `thinking=off`, `lightContext=true` und Dispatch-Timeout umgestellt; JSON und Fake-Dispatch verifiziert

OpenClaw / Cron `twitter:auto-post-morning`
~8 mincodex

Problem: Direkt nach dem Gateway-Restart blockierte ein automatisch gestarteter X-Auto-Post-Cron erneut die Gateway-WS-Reachability

Ursache: Cron-Runtime startete `twitter:auto-post-morning`; Task-Cancel wird fuer Cron-Runtimes noch nicht unterstützt und der Embedded-Run lief in den Lane-Timeout

Fix: Task bis zum eigenen Timeout beobachtet, danach `0` aktive Tasks, `openclaw status` wieder erreichbar; X-Rate-Check aktualisiert (`39999/40000` search remaining)

OpenClaw / Gateway Liveness
~8 mincodex

Problem: Nach dem Update war der Gateway-Service zwar `active`, aber Health-/Status-WS-Checks liefen zeitweise in Timeouts

Ursache: Nachgeholte Cron-/Embedded-Agent-Runs blockierten den Node-Event-Loop; Kimi `thinking_budget`/`max_completion_tokens`-Schemafehler und Timeouts triggerten Fallback-Kaskaden

Fix: Gateway per systemd-User-Service gezielt neu gestartet; danach `openclaw health --json` wieder `ok: true` und `/status` erreichbar auf `2026.4.29`

OpenClaw / Update 2026.4.29
~10 mincodex

Problem: Der nicht-interaktive OpenClaw-Updater blieb nach dem Gateway-Neustart still im Nachlauf hängen

Ursache: Post-Update-Wrapper/Doctor-Nachlauf beendete sich nicht, obwohl der Gateway bereits wieder auf `2026.4.29` aktiv war

Fix: Wrapper-Prozesse kontrolliert beendet, Gateway-Servicezustand und `/status`/`health` geprüft; OpenClaw läuft auf `2026.4.29` weiter

Agent-System / Model-Fallback-Logging
~20 mincodex

Problem: Automatische Agent-Fallbacks wurden nur auf stdout gemeldet und waren für die 7-Tage-Auswertung nicht persistent auswertbar

Ursache: `llm_client.py` hatte keinen JSONL-Logger für Modellwechsel und fing primär nur Timeout-Klassen ab

Fix: JSONL-Event-Logger nach `memory/model-fallbacks.jsonl` ergänzt, HTTP-/Modellfehler in den Fallback-Pfad aufgenommen und Serialisierung plus `py_compile` verifiziert

Persönliches Build-Journal. Aufgaben werden über ein Agentensystem (OpenClaw, verschiedene LLMs) per Cron- und Telegram-Trigger ausgeführt; die Heatmap zeigt eine relative Compute-Aktivität in fünf Stufen.