/ Локальный AI · LiteRT
AI, который работает на вашем телефоне.
BlockVault поставляется с моделями Gemma 4, которые работают полностью на вашем устройстве. Ваши промпты, транзакции и приватные ключи не покидают телефон. Когда нужна большая мощность, делегируйте на GPU через x402 — платите только за то, что используете.
/ Что такое локальный AI
Ваш AI, ваше железо.
Локальный AI — это запуск больших языковых моделей прямо на процессоре телефона, без интернета, без облачных API, без сторонних серверов. BlockVault использует LiteRT (эволюция TensorFlow Lite) для выполнения квантованных моделей Gemma 4 с аппаратным ускорением. Каждый вывод происходит локально: ваши данные остаются приватными по архитектуре, а не по политике.
Встроенные модели
- Gemma 4 E2B — Ультрабыстрая для проверки транзакций, валидации адресов, быстрых ответов. Работает на любом телефоне с 4 ГБ RAM.
- Gemma 4 E4B — Полные возможности агента: многошаговое рассуждение, детекция скама, выполнение навыков. Требует 6 ГБ RAM.
- LM Studio — Подключение к локальному экземпляру LM Studio в вашей LAN для десктопных моделей без облачной задержки.
/ Приватность по архитектуре
Ноль данных покидает устройство.
Большинство AI-кошельков отправляют историю транзакций, балансы и промпты в облачный API. BlockVault делает наоборот: вывод происходит на вашем железе, приватные ключи хранятся в аппаратном хранилище, а сеть видит только подписанные транзакции, которые вы явно подтверждаете.
Без облачных промптов
Ваши вопросы и контекст кошелька остаются на устройстве. Ничего не отправляется в OpenAI, Google или любой сторонний API вывода.
Аппаратное хранение ключей
Приватные ключи хранятся в Android Keystore (TEE/StrongBox). AI-модель не может получить доступ к сырым ключам — только подписывать запросы, которые вы одобряете.
Работает офлайн
Локальный вывод работает без интернета. Проверяйте транзакции, детектируйте фишинг и запрашивайте балансы даже в режиме полёта.
/ Локальный вывод
Три runtime, один кошелёк.
BlockVault поддерживает три режима вывода, чтобы у вас всегда был правильный баланс скорости, приватности и возможностей — от модели 2B, отвечающей за миллисекунды, до полного GPU-сервера для сложных многошаговых агентских задач.
- → На устройстве (LiteRT): нулевая задержка, полный офлайн, максимум приватности
- → LM Studio (LAN): десктопные модели, без облака, менее 100 мс
- → Делегация GPU (x402): серверная мощность, оплата за токен в USDC
/ Делегированный GPU через x402
Когда нужна большая мощность.
Для сложных агентских задач — многоступенчатое рассуждение, большие контекстные окна, пакетные операции — BlockVault может делегировать вывод на 402.blockvault.ai. Вы платите за токен в USDC на Base через протокол x402. Без подписок, без API-ключей, без регистрации.
Как работает делегация GPU →/ Локальный vs облачный
Почему локальный вывод выигрывает.
| Параметр | Локальный (BlockVault) | Облачный AI (типичный) |
|---|---|---|
| Приватность данных | Промпты не покидают телефон | Отправляются на сторонние серверы |
| Стоимость | Бесплатно (ваше железо) | Оплата API за токен |
| Задержка | < 50 мс до первого токена | 200–800 мс на сетевой round-trip |
| Работа офлайн | Да, полностью функционален | Нет, требуется интернет |
| Контроль данных | Самохранение, все данные ваши | Применяются условия провайдера |
/ FAQ
Вопросы про локальный AI.
- Какие AI-модели BlockVault запускает на устройстве?
- BlockVault поставляется с Gemma 4 E2B (2 миллиарда параметров) и Gemma 4 E4B (4 миллиарда параметров), обе оптимизированы для мобильных через квантизацию LiteRT. Вы также можете подключить локальный экземпляр LM Studio для больших моделей.
- Отправляет ли BlockVault мои данные в облачный AI?
- Нет. Локальный вывод происходит полностью на CPU/GPU вашего телефона. Ваши промпты, балансы кошелька и история транзакций не покидают устройство. Если включить режим делегации GPU, отправляется только конкретный промпт — ключи и балансы остаются локальными.
- Могу ли я использовать AI-функции без интернета?
- Да. Локальный вывод работает полностью офлайн. Вы можете проверять транзакции, детектировать фишинговые ссылки, валидировать адреса и запрашивать портфолио без сетевого подключения.
- Как локальный AI сравнивается с ChatGPT или облачными API?
- Локальные модели меньше (2–4B параметров против 100B+), но работают с нулевой задержкой и полной приватностью. Для большинства кошельковых задач — проверка транзакций, детекция скама, быстрые ответы — они сопоставимы по качеству. Для сложного многошагового рассуждения BlockVault позволяет делегировать на GPU-сервер через x402, платя только за использование.
- Что такое делегация GPU и как за неё платить?
- Делегация GPU отправляет ваш промпт на 402.blockvault.ai — сервер с большими моделями на выделенных GPU. Вы платите за токен в USDC на Base через протокол x402 — обычно $0.001–$0.01 за ответ. Без подписок, без API-ключей.
/ Начать
AI, который уважает вашу приватность.
Скачайте BlockVault и запускайте AI на своём телефоне — без облака, без подписок, без утечек данных. Бесплатно на Android.