Мы с братом создали Sova AI — ИИ-агента для Android, который умеет управлять приложениями и выполнять ваши повседневные задачи на телефоне. Это первый ассистент, которому не нужны ADB, USB, компьютер или root-доступ. Просто обычное приложение, которое устанавливается на Android (iOS пока в разработке) и всегда с вами — куда бы вы ни пошли (звучит немного жутковато? 😁).
Зачем ещё один ИИ-ассистент?
Потому что он действительно уникален. Все остальные решения для мобильных устройств требуют подключения к ПК — что неудобно и противоречит самой идее мобильности. Если уж нужен компьютер, зачем нагружать телефон? На ПК прекрасно работают решения для управления компьютером (computer-use) и браузером (browser-use).
Нам хотелся ассистент, который всегда под рукой — не только когда вы сидите у компьютера с кабелем. Нам нужен был помощник, способный делать на телефоне всё, что может обычный пользователь. А не просто ещё один умный браузер вроде Perplexity, которому нужны API-ключи для любой задачи. И не кастрированный Gemini, который только и твердит, что «я — ИИ-модель, я ничего не могу».
Большинство так называемых «ИИ-ассистентов» — это просто чатботы. Полезные, но не более. Мы решили сделать по-другому.
Что он умеет?
Как и desktop-решения, Sova AI делает клики, скроллит, открывает приложения и имитирует любые действия пользователя. Под капотом — работа с Accessibility API Android. Мы используем дерево интерфейса (UI tree) и скриншоты экрана.
Одних скриншотов недостаточно: модели нестабильно их интерпретируют, а производители оптимизируют изображения по-разному. Поэтому мы разработали комбинацию дерева и скриншотов, минимизируя использование токенов. Чтобы вы не оказались в долговой яме из-за одного заказа еды.
Можно назначить Sova ассистентом по умолчанию. Он будет реагировать на голосовые команды и выполнять задачи — без нытья в стиле «я ИИ-модель и ничего не могу».
BYOK: привнеси свой ключ
Мы работаем в режиме BYOK (Bring Your Own Key). Вы сами добавляете API-ключи от своего любимого провайдера ИИ. Поддерживаются: Google, Anthropic, OpenAI, Grok, Alibaba (Qwen), Deepseek и другие.
Если вашего провайдера нет — напишите, добавим. Ключи хранятся только на вашем устройстве. Мы их не видим и не сохраняем.
В планах — поддержка локальных моделей через Ollama, LM Studio и аналоги. Это будет полезно тем, кто не хочет зависеть от облачных сервисов. Как вам такая идея?
Примеры использования
Мы уже тестировали Sova в реальных сценариях:
- вызов Uber;
- заказ еды и бронирование столиков в ресторанах;
- автоматизация действий в Tinder;
- работа с камерой и приложениями астрономии;
- написание сообщений в Telegram и X (бывший Twitter);
- поиск и создание плейлистов в Spotify и YouTube.
Границы возможностей пока неизвестны. Надеемся, пользователи помогут их расширить.
Где он НЕ будет работать?
В играх с реальным временем, где важна мгновенная реакция. Каждый запрос к ИИ занимает время, и это слишком медленно для рилтайм-приложений.
Но если игра пошаговая — возможно, получится. Планируем проверить на преферансе.
Как установить?
К сожалению, Google Play недоступен 😥. Accessibility API мгновенно сработало у модераторов, и приложение отклонили. Возможно, подумали: «Gemini так не умеет, зачем нам конкурент?». По слухам, Google работает над чем-то подобным, но это будет только на новых флагманах.
Поэтому мы распространяем APK с сайта, ориентируясь на гиков и энтузиастов ИИ. Хотя пользоваться может даже ваша бабушка.
Приложение доступно в магазинах Samsung и Xiaomi — если у вас такие устройства. Если нет — устанавливайте APK с сайта. Пока что всё бесплатно. Мы только в начале пути.
Страница приложения: https://ayconic.io/sova
Видео с примером: https://www.youtube.com/watch?v=r-x6hRmtBy0
Отвечаем на вопросы в Telegram и Discord (МАХа не будет, сорян). Будем рады вашему фидбеку!