/ IA en el dispositivo · LiteRT

IA que funciona en tu teléfono.

BlockVault incluye modelos Gemma 4 que se ejecutan completamente en tu dispositivo. Tus prompts, transacciones y claves privadas nunca salen de tu teléfono. Cuando necesitas más potencia, delega a un GPU con x402 y paga solo por lo que usas.

/ Qué es la IA en el dispositivo

Tu IA, tu hardware.

IA en el dispositivo significa ejecutar modelos de lenguaje grandes directamente en el procesador de tu teléfono: sin internet, sin API en la nube, sin servidores de terceros. BlockVault usa LiteRT (la evolución de TensorFlow Lite) para ejecutar modelos Gemma 4 cuantizados con aceleración por hardware. Cada inferencia sucede localmente: tus datos permanecen privados por diseño, no por política.

Modelos incluidos

  • Gemma 4 E2B — Ultra rápido para revisión de transacciones, validación de direcciones y Q&A rápidas. Funciona en cualquier teléfono con 4 GB de RAM.
  • Gemma 4 E4B — Capacidades completas de agente: razonamiento multi-paso, detección de scams, ejecución de habilidades. Requiere 6 GB de RAM.
  • LM Studio — Conéctate a una instancia local de LM Studio en tu LAN para modelos de nivel desktop sin latencia de nube.

/ Privacidad por arquitectura

Cero datos salen de tu dispositivo.

La mayoría de wallets IA envían tu historial de transacciones, saldos y prompts a una API en la nube. BlockVault hace lo contrario: la inferencia corre en tu hardware, las claves privadas viven en almacenamiento respaldado por hardware y la red solo ve transacciones firmadas que apruebas de forma explícita.

Sin prompts en la nube

Tus preguntas y el contexto de tu wallet permanecen en el dispositivo. Nada se envía a OpenAI, Google o ninguna API de inferencia de terceros.

Claves respaldadas por hardware

Las claves privadas se almacenan en el Android Keystore (TEE/StrongBox). El modelo IA no puede acceder a las claves en bruto, solo a solicitudes de firma que apruebas.

Funciona sin conexión

La inferencia local funciona sin internet. Revisa transacciones, detecta phishing y consulta tus saldos incluso en modo avión.

/ Inferencia local

Tres modos de ejecución, una wallet.

BlockVault soporta tres modos de inferencia para que siempre tengas el balance correcto entre velocidad, privacidad y capacidad, desde un modelo 2B que responde en milisegundos hasta un servidor GPU completo que maneja tareas complejas de agentes multi-paso.

  • → En el dispositivo (LiteRT): cero latencia, totalmente offline, máxima privacidad
  • → LM Studio (LAN): modelos de nivel desktop, sin nube, sub-100ms
  • → Delegar GPU (x402): potencia de servidor, pago por token en USDC

/ GPU delegado con x402

Cuando necesitas más potencia.

Para tareas complejas de agentes (razonamiento multi-hop, ventanas de contexto grandes u operaciones por lotes), BlockVault puede delegar la inferencia a 402.blockvault.ai. Pagas por token en USDC en Base con el protocolo x402. Sin suscripción, sin API key, sin cuenta requerida.

Cómo funciona Delegar GPU →

/ Local vs nube

Por qué gana la inferencia local.

DimensiónEn el dispositivo (BlockVault)IA en la nube (típico)
Privacidad de datosLos prompts nunca salen del teléfonoEnviados a servidores de terceros
CostoGratis (hardware que ya tienes)Tarifas API por token
Latencia< 50ms primer token200–800ms ida y vuelta de red
Capacidad offlineSí, totalmente funcionalNo, requiere internet
Control de datosAutocustodia, tú controlas todos los datosAplican términos de servicio del proveedor

/ FAQ

Preguntas sobre IA en el dispositivo.

¿Qué modelos IA ejecuta BlockVault en el dispositivo?
BlockVault incluye Gemma 4 E2B (2 mil millones de parámetros) y Gemma 4 E4B (4 mil millones de parámetros), ambos optimizados para móviles con cuantización LiteRT. También puedes conectar una instancia local de LM Studio para modelos más grandes.
¿BlockVault envía mis datos a una IA en la nube?
No. La inferencia local se ejecuta completamente en el CPU/GPU de tu teléfono. Tus prompts, saldos de wallet e historial de transacciones nunca salen del dispositivo. Si activas el modo Delegar GPU, solo se envía el prompt específico. Tus claves y saldos permanecen locales.
¿Puedo usar las funciones IA sin internet?
Sí. La inferencia local funciona completamente offline. Puedes revisar transacciones, detectar enlaces de phishing, validar direcciones y consultar tu portafolio sin conexión de red.
¿Cómo se compara la IA local con ChatGPT o APIs en la nube?
Los modelos locales son más pequeños (2-4B parámetros vs 100B+) pero funcionan con cero latencia y privacidad completa. Para la mayoría de tareas de wallet (revisión de transacciones, detección de scams, Q&A rápidas) rinden de forma comparable. Para razonamiento complejo multi-paso, BlockVault te permite delegar a un servidor GPU con x402, pagando solo por lo que usas.
¿Qué es Delegar GPU y cómo pago por ello?
Delegar GPU envía tu prompt a 402.blockvault.ai, un servidor con modelos más grandes en GPUs dedicados. Pagas por token en USDC en Base con el protocolo x402, típicamente $0.001–$0.01 por respuesta. Sin suscripción, sin API key necesaria.

/ Comienza ahora

IA que respeta tu privacidad.

Descarga BlockVault y ejecuta IA en tu teléfono. Sin nube, sin suscripciones, sin filtraciones de datos. Gratis en Android.