/ On-Device-KI · LiteRT
KI, die direkt auf deinem Handy läuft.
BlockVault bringt Gemma-4-Modelle mit, die komplett auf deinem Gerät laufen. Deine Prompts, Transaktionen und Private Keys verlassen nie dein Handy. Wenn du mehr Power brauchst, delegierst du an eine GPU per x402 – und zahlst nur für die tatsächliche Nutzung.
/ Was ist On-Device-KI
Deine KI, deine Hardware.
On-Device-KI bedeutet: Large Language Models laufen direkt auf dem Prozessor deines Handys – kein Internet, keine Cloud-API, keine Drittanbieter-Server. BlockVault nutzt LiteRT (die Weiterentwicklung von TensorFlow Lite), um quantisierte Gemma-4-Modelle mit Hardware-Beschleunigung auszuführen. Jede Inferenz passiert lokal: Deine Daten bleiben privat – by design, nicht by policy.
Mitgelieferte Modelle
- Gemma 4 E2B — Ultra-schnell für Transaktionsprüfung, Adressvalidierung und schnelle Q&A. Läuft auf jedem Handy mit 4 GB RAM.
- Gemma 4 E4B — Volle Agenten-Fähigkeiten: Multi-Step-Reasoning, Scam-Erkennung, Skill-Ausführung. Benötigt 6 GB RAM.
- LM Studio — Verbinde dich mit einer lokalen LM-Studio-Instanz in deinem LAN für Desktop-Modelle ohne Cloud-Latenz.
/ Privacy by Architecture
Null Daten verlassen dein Gerät.
Die meisten KI-Wallets schicken deine Transaktionshistorie, Guthaben und Prompts an eine Cloud-API. BlockVault macht das Gegenteil: Inferenz läuft auf deiner Hardware, Private Keys liegen in Hardware-gestütztem Speicher, und das Netzwerk sieht nur signierte Transaktionen, die du explizit freigibst.
Keine Cloud-Prompts
Deine Fragen und Wallet-Kontexte bleiben auf dem Gerät. Nichts wird an OpenAI, Google oder eine Drittanbieter-Inferenz-API gesendet.
Hardware-gestützte Keys
Private Keys werden im Android Keystore (TEE/StrongBox) gespeichert. Das KI-Modell kann nicht auf rohe Keys zugreifen – nur auf Signatur-Requests, die du freigibst.
Funktioniert offline
On-Device-Inferenz läuft ohne Internet. Transaktionen prüfen, Phishing erkennen und Guthaben abfragen – auch im Flugmodus.
/ Lokale Inferenz
Drei Runtimes, ein Wallet.
BlockVault unterstützt drei Inferenz-Modi, damit du immer die richtige Balance aus Speed, Privacy und Leistung hast – vom 2B-Modell, das in Millisekunden antwortet, bis zum vollen GPU-Server für komplexe Multi-Step-Agenten-Tasks.
- → On-Device (LiteRT): null Latenz, komplett offline, maximale Privacy
- → LM Studio (LAN): Desktop-Modelle, keine Cloud, unter 100 ms
- → Delegate GPU (x402): Server-Power, Pay-per-Token in USDC
/ Delegierte GPU per x402
Wenn du mehr Power brauchst.
Für komplexe Agenten-Tasks – Multi-Hop-Reasoning, große Kontextfenster oder Batch-Operationen – kann BlockVault Inferenz an 402.blockvault.ai delegieren. Du zahlst per Token in USDC on Base über das x402-Protokoll. Kein Abo, kein API-Key, kein Account nötig.
So funktioniert Delegate GPU →/ On-Device vs. Cloud
Warum lokale Inferenz gewinnt.
| Dimension | On-Device (BlockVault) | Cloud-KI (typisch) |
|---|---|---|
| Datenschutz | Prompts verlassen das Handy nie | An Drittanbieter-Server gesendet |
| Kosten | Kostenlos (deine Hardware) | API-Gebühren pro Token |
| Latenz | < 50 ms erstes Token | 200–800 ms Netzwerk-Round-Trip |
| Offline-fähig | Ja, voll funktionsfähig | Nein, Internet erforderlich |
| Datenkontrolle | Self-Custody, du besitzt alle Daten | AGB des Anbieters gelten |
/ FAQ
Fragen zu On-Device-KI.
- Welche KI-Modelle führt BlockVault on-device aus?
- BlockVault liefert Gemma 4 E2B (2 Milliarden Parameter) und Gemma 4 E4B (4 Milliarden Parameter) mit, beide für Mobile optimiert per LiteRT-Quantisierung. Du kannst auch eine lokale LM-Studio-Instanz für größere Modelle verbinden.
- Schickt BlockVault meine Daten an eine Cloud-KI?
- Nein. On-Device-Inferenz läuft komplett auf der CPU/GPU deines Handys. Deine Prompts, Wallet-Guthaben und Transaktionshistorie verlassen das Gerät nie. Wenn du den Delegate-GPU-Modus aktivierst, wird nur der spezifische Prompt gesendet – deine Keys und Guthaben bleiben lokal.
- Kann ich KI-Features ohne Internet nutzen?
- Ja. On-Device-Inferenz funktioniert komplett offline. Du kannst Transaktionen prüfen, Phishing-Links erkennen, Adressen validieren und dein Portfolio abfragen – alles ohne Netzwerkverbindung.
- Wie schneiden On-Device-KI-Modelle im Vergleich zu ChatGPT oder Cloud-APIs ab?
- On-Device-Modelle sind kleiner (2–4B Parameter vs. 100B+), laufen aber mit null Latenz und kompletter Privacy. Für die meisten Wallet-Tasks – Transaktionsprüfung, Scam-Erkennung, schnelle Q&A – performen sie vergleichbar. Für komplexes Multi-Step-Reasoning kannst du bei BlockVault an einen GPU-Server per x402 delegieren und zahlst nur für die tatsächliche Nutzung.
- Was ist Delegate GPU und wie zahle ich dafür?
- Delegate GPU sendet deinen Prompt an 402.blockvault.ai, einen Server mit größeren Modellen auf dedizierten GPUs. Du zahlst per Token in USDC on Base über das x402-Protokoll – typischerweise 0,001–0,01 $ pro Antwort. Kein Abo, kein API-Key nötig.
/ Jetzt starten
KI, die deine Privacy respektiert.
Lade BlockVault herunter und führe KI auf deinem Handy aus – keine Cloud, keine Abos, keine Datenlecks. Kostenlos für Android.