/ Локальный AI · LiteRT

AI, который работает на вашем телефоне.

BlockVault поставляется с моделями Gemma 4, которые работают полностью на вашем устройстве. Ваши промпты, транзакции и приватные ключи не покидают телефон. Когда нужна большая мощность, делегируйте на GPU через x402 — платите только за то, что используете.

/ Что такое локальный AI

Ваш AI, ваше железо.

Локальный AI — это запуск больших языковых моделей прямо на процессоре телефона, без интернета, без облачных API, без сторонних серверов. BlockVault использует LiteRT (эволюция TensorFlow Lite) для выполнения квантованных моделей Gemma 4 с аппаратным ускорением. Каждый вывод происходит локально: ваши данные остаются приватными по архитектуре, а не по политике.

Встроенные модели

  • Gemma 4 E2B — Ультрабыстрая для проверки транзакций, валидации адресов, быстрых ответов. Работает на любом телефоне с 4 ГБ RAM.
  • Gemma 4 E4B — Полные возможности агента: многошаговое рассуждение, детекция скама, выполнение навыков. Требует 6 ГБ RAM.
  • LM Studio — Подключение к локальному экземпляру LM Studio в вашей LAN для десктопных моделей без облачной задержки.

/ Приватность по архитектуре

Ноль данных покидает устройство.

Большинство AI-кошельков отправляют историю транзакций, балансы и промпты в облачный API. BlockVault делает наоборот: вывод происходит на вашем железе, приватные ключи хранятся в аппаратном хранилище, а сеть видит только подписанные транзакции, которые вы явно подтверждаете.

Без облачных промптов

Ваши вопросы и контекст кошелька остаются на устройстве. Ничего не отправляется в OpenAI, Google или любой сторонний API вывода.

Аппаратное хранение ключей

Приватные ключи хранятся в Android Keystore (TEE/StrongBox). AI-модель не может получить доступ к сырым ключам — только подписывать запросы, которые вы одобряете.

Работает офлайн

Локальный вывод работает без интернета. Проверяйте транзакции, детектируйте фишинг и запрашивайте балансы даже в режиме полёта.

/ Локальный вывод

Три runtime, один кошелёк.

BlockVault поддерживает три режима вывода, чтобы у вас всегда был правильный баланс скорости, приватности и возможностей — от модели 2B, отвечающей за миллисекунды, до полного GPU-сервера для сложных многошаговых агентских задач.

  • → На устройстве (LiteRT): нулевая задержка, полный офлайн, максимум приватности
  • → LM Studio (LAN): десктопные модели, без облака, менее 100 мс
  • → Делегация GPU (x402): серверная мощность, оплата за токен в USDC

/ Делегированный GPU через x402

Когда нужна большая мощность.

Для сложных агентских задач — многоступенчатое рассуждение, большие контекстные окна, пакетные операции — BlockVault может делегировать вывод на 402.blockvault.ai. Вы платите за токен в USDC на Base через протокол x402. Без подписок, без API-ключей, без регистрации.

Как работает делегация GPU →

/ Локальный vs облачный

Почему локальный вывод выигрывает.

ПараметрЛокальный (BlockVault)Облачный AI (типичный)
Приватность данныхПромпты не покидают телефонОтправляются на сторонние серверы
СтоимостьБесплатно (ваше железо)Оплата API за токен
Задержка< 50 мс до первого токена200–800 мс на сетевой round-trip
Работа офлайнДа, полностью функционаленНет, требуется интернет
Контроль данныхСамохранение, все данные вашиПрименяются условия провайдера

/ FAQ

Вопросы про локальный AI.

Какие AI-модели BlockVault запускает на устройстве?
BlockVault поставляется с Gemma 4 E2B (2 миллиарда параметров) и Gemma 4 E4B (4 миллиарда параметров), обе оптимизированы для мобильных через квантизацию LiteRT. Вы также можете подключить локальный экземпляр LM Studio для больших моделей.
Отправляет ли BlockVault мои данные в облачный AI?
Нет. Локальный вывод происходит полностью на CPU/GPU вашего телефона. Ваши промпты, балансы кошелька и история транзакций не покидают устройство. Если включить режим делегации GPU, отправляется только конкретный промпт — ключи и балансы остаются локальными.
Могу ли я использовать AI-функции без интернета?
Да. Локальный вывод работает полностью офлайн. Вы можете проверять транзакции, детектировать фишинговые ссылки, валидировать адреса и запрашивать портфолио без сетевого подключения.
Как локальный AI сравнивается с ChatGPT или облачными API?
Локальные модели меньше (2–4B параметров против 100B+), но работают с нулевой задержкой и полной приватностью. Для большинства кошельковых задач — проверка транзакций, детекция скама, быстрые ответы — они сопоставимы по качеству. Для сложного многошагового рассуждения BlockVault позволяет делегировать на GPU-сервер через x402, платя только за использование.
Что такое делегация GPU и как за неё платить?
Делегация GPU отправляет ваш промпт на 402.blockvault.ai — сервер с большими моделями на выделенных GPU. Вы платите за токен в USDC на Base через протокол x402 — обычно $0.001–$0.01 за ответ. Без подписок, без API-ключей.

/ Начать

AI, который уважает вашу приватность.

Скачайте BlockVault и запускайте AI на своём телефоне — без облака, без подписок, без утечек данных. Бесплатно на Android.