/ IA en el dispositivo · LiteRT
IA que funciona en tu teléfono.
BlockVault incluye modelos Gemma 4 que se ejecutan completamente en tu dispositivo. Tus prompts, transacciones y claves privadas nunca salen de tu teléfono. Cuando necesitas más potencia, delega a un GPU con x402 y paga solo por lo que usas.
/ Qué es la IA en el dispositivo
Tu IA, tu hardware.
IA en el dispositivo significa ejecutar modelos de lenguaje grandes directamente en el procesador de tu teléfono: sin internet, sin API en la nube, sin servidores de terceros. BlockVault usa LiteRT (la evolución de TensorFlow Lite) para ejecutar modelos Gemma 4 cuantizados con aceleración por hardware. Cada inferencia sucede localmente: tus datos permanecen privados por diseño, no por política.
Modelos incluidos
- Gemma 4 E2B — Ultra rápido para revisión de transacciones, validación de direcciones y Q&A rápidas. Funciona en cualquier teléfono con 4 GB de RAM.
- Gemma 4 E4B — Capacidades completas de agente: razonamiento multi-paso, detección de scams, ejecución de habilidades. Requiere 6 GB de RAM.
- LM Studio — Conéctate a una instancia local de LM Studio en tu LAN para modelos de nivel desktop sin latencia de nube.
/ Privacidad por arquitectura
Cero datos salen de tu dispositivo.
La mayoría de wallets IA envían tu historial de transacciones, saldos y prompts a una API en la nube. BlockVault hace lo contrario: la inferencia corre en tu hardware, las claves privadas viven en almacenamiento respaldado por hardware y la red solo ve transacciones firmadas que apruebas de forma explícita.
Sin prompts en la nube
Tus preguntas y el contexto de tu wallet permanecen en el dispositivo. Nada se envía a OpenAI, Google o ninguna API de inferencia de terceros.
Claves respaldadas por hardware
Las claves privadas se almacenan en el Android Keystore (TEE/StrongBox). El modelo IA no puede acceder a las claves en bruto, solo a solicitudes de firma que apruebas.
Funciona sin conexión
La inferencia local funciona sin internet. Revisa transacciones, detecta phishing y consulta tus saldos incluso en modo avión.
/ Inferencia local
Tres modos de ejecución, una wallet.
BlockVault soporta tres modos de inferencia para que siempre tengas el balance correcto entre velocidad, privacidad y capacidad, desde un modelo 2B que responde en milisegundos hasta un servidor GPU completo que maneja tareas complejas de agentes multi-paso.
- → En el dispositivo (LiteRT): cero latencia, totalmente offline, máxima privacidad
- → LM Studio (LAN): modelos de nivel desktop, sin nube, sub-100ms
- → Delegar GPU (x402): potencia de servidor, pago por token en USDC
/ GPU delegado con x402
Cuando necesitas más potencia.
Para tareas complejas de agentes (razonamiento multi-hop, ventanas de contexto grandes u operaciones por lotes), BlockVault puede delegar la inferencia a 402.blockvault.ai. Pagas por token en USDC en Base con el protocolo x402. Sin suscripción, sin API key, sin cuenta requerida.
Cómo funciona Delegar GPU →/ Local vs nube
Por qué gana la inferencia local.
| Dimensión | En el dispositivo (BlockVault) | IA en la nube (típico) |
|---|---|---|
| Privacidad de datos | Los prompts nunca salen del teléfono | Enviados a servidores de terceros |
| Costo | Gratis (hardware que ya tienes) | Tarifas API por token |
| Latencia | < 50ms primer token | 200–800ms ida y vuelta de red |
| Capacidad offline | Sí, totalmente funcional | No, requiere internet |
| Control de datos | Autocustodia, tú controlas todos los datos | Aplican términos de servicio del proveedor |
/ FAQ
Preguntas sobre IA en el dispositivo.
- ¿Qué modelos IA ejecuta BlockVault en el dispositivo?
- BlockVault incluye Gemma 4 E2B (2 mil millones de parámetros) y Gemma 4 E4B (4 mil millones de parámetros), ambos optimizados para móviles con cuantización LiteRT. También puedes conectar una instancia local de LM Studio para modelos más grandes.
- ¿BlockVault envía mis datos a una IA en la nube?
- No. La inferencia local se ejecuta completamente en el CPU/GPU de tu teléfono. Tus prompts, saldos de wallet e historial de transacciones nunca salen del dispositivo. Si activas el modo Delegar GPU, solo se envía el prompt específico. Tus claves y saldos permanecen locales.
- ¿Puedo usar las funciones IA sin internet?
- Sí. La inferencia local funciona completamente offline. Puedes revisar transacciones, detectar enlaces de phishing, validar direcciones y consultar tu portafolio sin conexión de red.
- ¿Cómo se compara la IA local con ChatGPT o APIs en la nube?
- Los modelos locales son más pequeños (2-4B parámetros vs 100B+) pero funcionan con cero latencia y privacidad completa. Para la mayoría de tareas de wallet (revisión de transacciones, detección de scams, Q&A rápidas) rinden de forma comparable. Para razonamiento complejo multi-paso, BlockVault te permite delegar a un servidor GPU con x402, pagando solo por lo que usas.
- ¿Qué es Delegar GPU y cómo pago por ello?
- Delegar GPU envía tu prompt a 402.blockvault.ai, un servidor con modelos más grandes en GPUs dedicados. Pagas por token en USDC en Base con el protocolo x402, típicamente $0.001–$0.01 por respuesta. Sin suscripción, sin API key necesaria.
/ Comienza ahora
IA que respeta tu privacidad.
Descarga BlockVault y ejecuta IA en tu teléfono. Sin nube, sin suscripciones, sin filtraciones de datos. Gratis en Android.