Welche KI-Modelle führt BlockVault on-device aus?

BlockVault liefert Gemma 4 E2B (2 Milliarden Parameter) und Gemma 4 E4B (4 Milliarden Parameter) mit, beide für Mobile optimiert per LiteRT-Quantisierung. Du kannst auch eine lokale LM-Studio-Instanz für größere Modelle verbinden.

Schickt BlockVault meine Daten an eine Cloud-KI?

Nein. On-Device-Inferenz läuft komplett auf der CPU/GPU deines Handys. Deine Prompts, Wallet-Guthaben und Transaktionshistorie verlassen das Gerät nie. Wenn du den Delegate-GPU-Modus aktivierst, wird nur der spezifische Prompt gesendet – deine Keys und Guthaben bleiben lokal.

Kann ich KI-Features ohne Internet nutzen?

Ja. On-Device-Inferenz funktioniert komplett offline. Du kannst Transaktionen prüfen, Phishing-Links erkennen, Adressen validieren und dein Portfolio abfragen – alles ohne Netzwerkverbindung.

Wie schneiden On-Device-KI-Modelle im Vergleich zu ChatGPT oder Cloud-APIs ab?

On-Device-Modelle sind kleiner (2–4B Parameter vs. 100B+), laufen aber mit null Latenz und kompletter Privacy. Für die meisten Wallet-Tasks – Transaktionsprüfung, Scam-Erkennung, schnelle Q&A – performen sie vergleichbar. Für komplexes Multi-Step-Reasoning kannst du bei BlockVault an einen GPU-Server per x402 delegieren und zahlst nur für die tatsächliche Nutzung.

Was ist Delegate GPU und wie zahle ich dafür?

Delegate GPU sendet deinen Prompt an 402.blockvault.ai, einen Server mit größeren Modellen auf dedizierten GPUs. Du zahlst per Token in USDC on Base über das x402-Protokoll – typischerweise 0,001–0,01 $ pro Antwort. Kein Abo, kein API-Key nötig.

/ On-Device-KI · LiteRT

KI, die direkt auf deinem Handy läuft.

BlockVault bringt Gemma-4-Modelle mit, die komplett auf deinem Gerät laufen. Deine Prompts, Transaktionen und Private Keys verlassen nie dein Handy. Wenn du mehr Power brauchst, delegierst du an eine GPU per x402 – und zahlst nur für die tatsächliche Nutzung.

Verfügbar beiGoogle Play Verfügbar beiApp Store

/ Was ist On-Device-KI

Deine KI, deine Hardware.

On-Device-KI bedeutet: Large Language Models laufen direkt auf dem Prozessor deines Handys – kein Internet, keine Cloud-API, keine Drittanbieter-Server. BlockVault nutzt LiteRT (die Weiterentwicklung von TensorFlow Lite), um quantisierte Gemma-4-Modelle mit Hardware-Beschleunigung auszuführen. Jede Inferenz passiert lokal: Deine Daten bleiben privat – by design, nicht by policy.

Mitgelieferte Modelle

Gemma 4 E2B — Ultra-schnell für Transaktionsprüfung, Adressvalidierung und schnelle Q&A. Läuft auf jedem Handy mit 4 GB RAM.
Gemma 4 E4B — Volle Agenten-Fähigkeiten: Multi-Step-Reasoning, Scam-Erkennung, Skill-Ausführung. Benötigt 6 GB RAM.
LM Studio — Verbinde dich mit einer lokalen LM-Studio-Instanz in deinem LAN für Desktop-Modelle ohne Cloud-Latenz.

/ Privacy by Architecture

Null Daten verlassen dein Gerät.

Die meisten KI-Wallets schicken deine Transaktionshistorie, Guthaben und Prompts an eine Cloud-API. BlockVault macht das Gegenteil: Inferenz läuft auf deiner Hardware, Private Keys liegen in Hardware-gestütztem Speicher, und das Netzwerk sieht nur signierte Transaktionen, die du explizit freigibst.

Keine Cloud-Prompts

Deine Fragen und Wallet-Kontexte bleiben auf dem Gerät. Nichts wird an OpenAI, Google oder eine Drittanbieter-Inferenz-API gesendet.

Hardware-gestützte Keys

Private Keys werden im Android Keystore (TEE/StrongBox) gespeichert. Das KI-Modell kann nicht auf rohe Keys zugreifen – nur auf Signatur-Requests, die du freigibst.

Funktioniert offline

On-Device-Inferenz läuft ohne Internet. Transaktionen prüfen, Phishing erkennen und Guthaben abfragen – auch im Flugmodus.

/ Lokale Inferenz

Drei Runtimes, ein Wallet.

BlockVault unterstützt drei Inferenz-Modi, damit du immer die richtige Balance aus Speed, Privacy und Leistung hast – vom 2B-Modell, das in Millisekunden antwortet, bis zum vollen GPU-Server für komplexe Multi-Step-Agenten-Tasks.

→ On-Device (LiteRT): null Latenz, komplett offline, maximale Privacy
→ LM Studio (LAN): Desktop-Modelle, keine Cloud, unter 100 ms
→ Delegate GPU (x402): Server-Power, Pay-per-Token in USDC

/ Delegierte GPU per x402

Wenn du mehr Power brauchst.

Für komplexe Agenten-Tasks – Multi-Hop-Reasoning, große Kontextfenster oder Batch-Operationen – kann BlockVault Inferenz an 402.blockvault.ai delegieren. Du zahlst per Token in USDC on Base über das x402-Protokoll. Kein Abo, kein API-Key, kein Account nötig.

So funktioniert Delegate GPU →

/ On-Device vs. Cloud

Warum lokale Inferenz gewinnt.

Dimension	On-Device (BlockVault)	Cloud-KI (typisch)
Datenschutz	Prompts verlassen das Handy nie	An Drittanbieter-Server gesendet
Kosten	Kostenlos (deine Hardware)	API-Gebühren pro Token
Latenz	< 50 ms erstes Token	200–800 ms Netzwerk-Round-Trip
Offline-fähig	Ja, voll funktionsfähig	Nein, Internet erforderlich
Datenkontrolle	Self-Custody, du besitzt alle Daten	AGB des Anbieters gelten

/ FAQ

Fragen zu On-Device-KI.

Welche KI-Modelle führt BlockVault on-device aus?: BlockVault liefert Gemma 4 E2B (2 Milliarden Parameter) und Gemma 4 E4B (4 Milliarden Parameter) mit, beide für Mobile optimiert per LiteRT-Quantisierung. Du kannst auch eine lokale LM-Studio-Instanz für größere Modelle verbinden.
Schickt BlockVault meine Daten an eine Cloud-KI?: Nein. On-Device-Inferenz läuft komplett auf der CPU/GPU deines Handys. Deine Prompts, Wallet-Guthaben und Transaktionshistorie verlassen das Gerät nie. Wenn du den Delegate-GPU-Modus aktivierst, wird nur der spezifische Prompt gesendet – deine Keys und Guthaben bleiben lokal.
Kann ich KI-Features ohne Internet nutzen?: Ja. On-Device-Inferenz funktioniert komplett offline. Du kannst Transaktionen prüfen, Phishing-Links erkennen, Adressen validieren und dein Portfolio abfragen – alles ohne Netzwerkverbindung.
Wie schneiden On-Device-KI-Modelle im Vergleich zu ChatGPT oder Cloud-APIs ab?: On-Device-Modelle sind kleiner (2–4B Parameter vs. 100B+), laufen aber mit null Latenz und kompletter Privacy. Für die meisten Wallet-Tasks – Transaktionsprüfung, Scam-Erkennung, schnelle Q&A – performen sie vergleichbar. Für komplexes Multi-Step-Reasoning kannst du bei BlockVault an einen GPU-Server per x402 delegieren und zahlst nur für die tatsächliche Nutzung.
Was ist Delegate GPU und wie zahle ich dafür?: Delegate GPU sendet deinen Prompt an 402.blockvault.ai, einen Server mit größeren Modellen auf dedizierten GPUs. Du zahlst per Token in USDC on Base über das x402-Protokoll – typischerweise 0,001–0,01 $ pro Antwort. Kein Abo, kein API-Key nötig.

/ Jetzt starten

KI, die deine Privacy respektiert.

Lade BlockVault herunter und führe KI auf deinem Handy aus – keine Cloud, keine Abos, keine Datenlecks. Kostenlos für Android.

Verfügbar beiGoogle Play Verfügbar beiApp Store