OpenClaw + Kimi K2.5: Ich habe meine OpenClaw Kosten um 90% reduziert!

Alex Sprogis

1 Mar 202613:17

Summary

TLDRIn diesem Video zeigt der Creator, wie man die Betriebskosten von OpenCloud (OpenCla) drastisch senken kann – bis zu 90% – durch die Nutzung des kostengünstigen Open-Source-Modells Kimi K2.5 von Moonshot AI und weitere Optimierungen. Dazu gehören ein günstigeres Modell für die Hardbeat-Funktion, das Vermeiden von Session-Bloat und die Konfiguration auf einem flexiblen VPS-Server über Hostinger. Schritt für Schritt wird erklärt, wie API-Keys eingerichtet, Modelle gewechselt und Docker-Container konfiguriert werden, um ein effizientes, leistungsstarkes Setup zu erhalten. Die Lösung bietet eine nachhaltige Alternative zu teuren Cloud-Modellen wie Anthropic Opus 4.6 und spart massiv bei Token-Kosten.

Takeaways

💰 OpenCloud (OpenCla) kann sehr teuer werden, besonders wenn teure Modelle wie Anthropic Opus 4.6 genutzt werden.
🤖 Jede Aktion in OpenCla wird an die API gesendet, inklusive Gesprächsverlauf, Dateien und Tool-Ergebnissen, was die Kosten stark erhöht.
⏱️ Die Hardbeat-Funktion prüft standardmäßig alle 30 Minuten den Status und verursacht dadurch zusätzliche Token-Kosten.
🛠️ Durch den Einsatz des Open-Source-Modells Kimi K2.5 lassen sich Kosten erheblich reduzieren: Input-Token ca. 0,60 USD/Mio, Output deutlich günstiger als Opus 4.6.
⚡ Kimi K2.5 hat ein großes Kontextfenster von 262.000 Token und ist besonders geeignet für agentische Aufgaben und Tool-Aufrufe.
💡 Die Hardbeat-Funktion sollte auf ein günstigeres Modell wie Google Gemini 2.0 Flash Light umgestellt werden, um Kosten fast vollständig zu eliminieren.
🧹 Der Safeguard-Modus in OpenCla verhindert Session Bloat, fasst alte Nachrichten zusammen und spart so Token in langen Konversationen.
🖥️ Ein VPS (z. B. Hostinger KVM2 mit 2 vCPU und 8 GB RAM) eignet sich gut für den Betrieb von OpenCla mit Kimi K2.5.
🔑 Für die Konfiguration werden API-Keys benötigt: Moonshot AI für Kimi K2.5 und Google AI Studio für Gemini 2.0.
📉 Durch Kombination von Modellaustausch, Heartbeat-Optimierung und Session-Safeguard kann die OpenCla-Kostenreduktion bis zu 90% betragen.
📊 Lokale Modelle sind möglich, benötigen jedoch extrem leistungsfähige Hardware; ansonsten ist die Cloud-Nutzung die praktischere Option.
🛡️ Es ist ratsam, monatliche API-Limits einzurichten, um unerwartete Kosten durch rund-um-die-Uhr laufende Agenten zu vermeiden.

Q & A

Warum verursacht OpenCloud hohe Kosten bei der Nutzung von KI-Modellen?
-OpenCloud sendet bei jeder Aktion den gesamten bisherigen Gesprächsverlauf, alle geladenen Workspace-Dateien, Toolaufrufe und deren Ergebnisse an die API des Modellbetreibers. Dazu kommt die Hardbeat-Funktion, die alle 30 Minuten einen Statuscheck durchführt, was ebenfalls Token verbraucht. Zusammen summieren sich diese Kosten sehr schnell, insbesondere bei teuren Modellen wie Anthropic Opus 4.6.
Welche Lösung schlägt das Video vor, um die Kosten von OpenCloud deutlich zu reduzieren?
-Die Lösung besteht aus zwei Teilen: 1) Auswahl und Konfiguration eines kostengünstigen, aber leistungsstarken Open-Source-Modells (Kimi K2.5), 2) weitere Optimierungen wie die Verwendung eines günstigeren Modells für die Hardbeat-Funktion und die Aktivierung des Safeguard-Modus zur Vermeidung von Session-Bloat.
Was ist das Modell Kimi K2.5 und warum ist es relevant für OpenCloud?
-Kimi K2.5 ist ein Modell der chinesischen Firma Moonshot AI, das besonders in agentischen Aufgaben wie Toolaufrufen, parallelen Subagents und Codierung sehr leistungsfähig ist. Es ist deutlich günstiger als Cloud Opus 4.6 (nur 0,60 USD pro 1 Million Input-Token) und bietet gleichzeitig eine große Kontextfensterkapazität.
Wie kann man OpenCloud auf einem eigenen Server betreiben?
-Man kann OpenCloud auf einem VPS oder über Anbieter wie Hostinger installieren. Hostinger bietet einen Einklick-Installationsservice, flexible Skalierung und die Möglichkeit, mehrere OpenCloud-Instanzen gleichzeitig laufen zu lassen. So behält man die Daten lokal und kann Ressourcen je nach Bedarf anpassen.
Welche Rolle spielt die Hardbeat-Funktion und wie kann man hier Kosten sparen?
-Die Hardbeat-Funktion prüft automatisch alle 30 Minuten, ob zeitgesteuerte Aufgaben ausgeführt werden müssen. Standardmäßig verwendet sie das primäre Modell, was teuer sein kann. Kosten lassen sich sparen, indem man für diese Funktion ein günstigeres Modell wie Google Gemini 2.0 Flashlight einsetzt, das nur sehr geringe Token-Kosten verursacht.
Was versteht man unter Session Bloat und wie wird es optimiert?
-Session Bloat entsteht, wenn OpenCloud bei jeder neuen Anfrage den gesamten bisherigen Verlauf sendet, was die Tokenkosten exponentiell erhöht. Zur Optimierung gibt es den Safeguard-Modus, der ältere Nachrichten zusammenfasst und den Kontext komprimiert, ohne die Qualität der aktuellen Konversation zu beeinträchtigen.
Welche Vorteile bietet die Nutzung von Hostinger für OpenCloud?
-Hostinger bietet: 1) lokale Datenhaltung, 2) flexible Skalierung von Serverressourcen, 3) Möglichkeit mehrere OpenCloud-Instanzen zu betreiben, 4) vorkonfigurierte KI-Optionen und 5) über den Partnercode 10 % Rabatt auf Jahrespläne.
Wie wird das Kimi K2.5 Modell in OpenCloud konfiguriert?
-Man erstellt einen API-Key bei Moonshot AI, wechselt im OpenCloud-Menü in den RAW-Modus, fügt ein Konfigurationssnippet mit dem API-Key ein und setzt Kimi K2.5 als primäres Modell. Danach muss der Docker-Container neu gestartet werden, damit das Modell aktiv ist.
Welche Einsparungen kann man durch die vorgeschlagenen Maßnahmen erzielen?
-Durch den Wechsel auf Kimi K2.5, die Nutzung von Google Gemini Flashlight für Hardbeat und den Safeguard-Modus kann man die OpenCloud-Kosten um bis zu 90 % reduzieren.
Gibt es noch günstigere Alternativen zur weiteren Kostenreduktion von OpenCloud?
-Die einzige weitere Möglichkeit wäre ein lokales Modell über Oama einzurichten, jedoch benötigt man dafür extrem leistungsfähige Hardware, da große Modelle sehr viel Rechenleistung und Speicher benötigen. Kleinere Modelle liefern oft unzufriedenstellende Performance und Antwortzeiten.
Warum sollte man beim Moonshot API-Key ein monatliches Limit setzen?
-Da der OpenCloud-Agent rund um die Uhr läuft, können auch bei günstigen Preisen unerwartet hohe Kosten entstehen. Ein monatliches Limit schützt vor unkontrollierten Ausgaben.