Первый в своем роде ИИ-помощник на вашем телефоне

Первый в своем роде ИИ-помощник на вашем телефоне

Мы с братом создали Sova AI — ИИ-агента для Android, который умеет управлять приложениями и выполнять ваши повседневные задачи на телефоне. Это первый ассистент, которому не нужны ADB, USB, компьютер или root-доступ. Просто обычное приложение, которое устанавливается на Android (iOS пока в разработке) и всегда с вами — куда бы вы ни пошли (звучит немного жутковато? 😁).

Зачем ещё один ИИ-ассистент?

Потому что он действительно уникален. Все остальные решения для мобильных устройств требуют подключения к ПК — что неудобно и противоречит самой идее мобильности. Если уж нужен компьютер, зачем нагружать телефон? На ПК прекрасно работают решения для управления компьютером (computer-use) и браузером (browser-use).

Нам хотелся ассистент, который всегда под рукой — не только когда вы сидите у компьютера с кабелем. Нам нужен был помощник, способный делать на телефоне всё, что может обычный пользователь. А не просто ещё один умный браузер вроде Perplexity, которому нужны API-ключи для любой задачи. И не кастрированный Gemini, который только и твердит, что «я — ИИ-модель, я ничего не могу».

Большинство так называемых «ИИ-ассистентов» — это просто чатботы. Полезные, но не более. Мы решили сделать по-другому.

Что он умеет?

Как и desktop-решения, Sova AI делает клики, скроллит, открывает приложения и имитирует любые действия пользователя. Под капотом — работа с Accessibility API Android. Мы используем дерево интерфейса (UI tree) и скриншоты экрана.

Одних скриншотов недостаточно: модели нестабильно их интерпретируют, а производители оптимизируют изображения по-разному. Поэтому мы разработали комбинацию дерева и скриншотов, минимизируя использование токенов. Чтобы вы не оказались в долговой яме из-за одного заказа еды.

Можно назначить Sova ассистентом по умолчанию. Он будет реагировать на голосовые команды и выполнять задачи — без нытья в стиле «я ИИ-модель и ничего не могу».

BYOK: привнеси свой ключ

Мы работаем в режиме BYOK (Bring Your Own Key). Вы сами добавляете API-ключи от своего любимого провайдера ИИ. Поддерживаются: Google, Anthropic, OpenAI, Grok, Alibaba (Qwen), Deepseek и другие.

Если вашего провайдера нет — напишите, добавим. Ключи хранятся только на вашем устройстве. Мы их не видим и не сохраняем.

В планах — поддержка локальных моделей через Ollama, LM Studio и аналоги. Это будет полезно тем, кто не хочет зависеть от облачных сервисов. Как вам такая идея?

Примеры использования

Мы уже тестировали Sova в реальных сценариях:

  • вызов Uber;
  • заказ еды и бронирование столиков в ресторанах;
  • автоматизация действий в Tinder;
  • работа с камерой и приложениями астрономии;
  • написание сообщений в Telegram и X (бывший Twitter);
  • поиск и создание плейлистов в Spotify и YouTube.

Границы возможностей пока неизвестны. Надеемся, пользователи помогут их расширить.

Где он НЕ будет работать?

В играх с реальным временем, где важна мгновенная реакция. Каждый запрос к ИИ занимает время, и это слишком медленно для рилтайм-приложений.

Но если игра пошаговая — возможно, получится. Планируем проверить на преферансе.

Как установить?

К сожалению, Google Play недоступен 😥. Accessibility API мгновенно сработало у модераторов, и приложение отклонили. Возможно, подумали: «Gemini так не умеет, зачем нам конкурент?». По слухам, Google работает над чем-то подобным, но это будет только на новых флагманах.

Поэтому мы распространяем APK с сайта, ориентируясь на гиков и энтузиастов ИИ. Хотя пользоваться может даже ваша бабушка.

Приложение доступно в магазинах Samsung и Xiaomi — если у вас такие устройства. Если нет — устанавливайте APK с сайта. Пока что всё бесплатно. Мы только в начале пути.

Страница приложения: https://ayconic.io/sova

Видео с примером: https://www.youtube.com/watch?v=r-x6hRmtBy0

Отвечаем на вопросы в Telegram и Discord (МАХа не будет, сорян). Будем рады вашему фидбеку!

Читать оригинал