Единый API для всех моделей
OpenAI-совместимый протокол, оплата в BYN по договору, данные не уходят к зарубежным посредникам.
Кто такая Аня?
Аня — ваш AI-ассистент в FlyAI. Единое лицо платформы: вы пишете ей, она сама подбирает нужную модель (Claude, GPT, Gemini, локальные), защищает ваши данные и возвращает ответ. Не нужно знать, какая модель лучше для задачи — Аня знает.
Пакеты для команды
Тариф на одного сотрудника. Аня + готовый портфель моделей + генерации картинок, музыки и видео. Закончился лимит — пополняешь одной кнопкой.
Открытый
Для тех, кто хочет попробовать без обязательств
- Доступ ко всем моделям шлюза
- Кредиты в BYN, биллинг по факту использования
- PII-фильтр опционально
- История 7 дней
- Поддержка через тикет
Команда
Базовый рабочий комплект: Аня + сложные задачи + генерация
- Аня для повседневных задач
- 500K токенов на сложные задачи
- 200 картинок · 30 треков · 60 сек видео
- Резерв быстрых моделей
- PII-фильтр включён
- История 30 дней
Расширенный
Аня премиум-класса, больше токенов и генераций
- Аня премиум-уровня (качественные ответы)
- 1,5M токенов на сложные задачи
- 500 картинок · 80 треков · 180 сек видео
- Полный набор премиум-моделей
- Маршрутизация Cost/Quality
- Контекст-на-ключе (beta)
- Email-поддержка
Корпоративный
Для тех, кому нужна модель высшего класса под рукой
- Аня максимального качества
- Модель высшего класса для разработки и аналитики
- 1500 картинок · 200 треков · 600 сек видео
- Полный набор премиум-моделей
- Полный контекст-на-ключе
- Приоритетная поддержка
- История без ограничений
Цены указаны с НДС 20% по курсу НБРБ на дату оплаты. Для ИП и юр. лиц. Физ. лицам без статуса ИП — индивидуально без НДС.
Всё, что нужно разработчику
API, совместимый с OpenAI
Используйте официальные SDK от OpenAI, LangChain, LlamaIndex. Просто укажите другой базовый URL.
Мультимодальность
Текст, изображения, код, эмбеддинги — всё через одну конечную точку. Автоматическая маршрутизация к нужной модели.
Потоковая и асинхронная передача
Server-Sent Events для ответов в реальном времени. Вебхуки для длительных задач.
Встроенная санитизация
Обнаружение персональных данных на лету. Логирование и версионирование промптов для соответствия требованиям.
Аня — архитектура экономного потребления токенов
Не «ещё одна модель», а инфра-слой экономии. Сжимаем запросы до того, как они уйдут к провайдеру; держим контекст-память на ключе; маршрутизируем по сложности; кешируем близкое. Шесть механизмов работают вместе.
Токен-ориентированные форматы
Преобразуем входные данные из громоздкого JSON в компактные форматы передачи. Экономия до 40–60% контекстного окна без потери смысла.
Компрессия промптов и истории
Автоматическое сжатие диалогов и RAG-контекста. Убираем повторы, служебный синтаксис и избыточные инструкции.
Каскадная маршрутизация
Сначала запрос уходит в дешёвую модель. Эскалация к премиум происходит только тогда, когда задача реально этого требует.
Семантический кэш
Похожие запросы не уходят в модель повторно — ответы достаются из кэша при сохранении качества.
Отчёт по каждому запросу
Токены на входе и выходе, стоимость задачи, сколько сэкономили против наивного вызова — всё прозрачно и проверяемо.
Значительно дешевле железо
Для локального развёртывания: токен-оптимизированные промпты позволяют запускать агентов на существенно менее мощной инфраструктуре без потери качества.
Топ популярных моделей в моменте
Когда разные сборки заполнят интернет — наш дашборд встанет рейтинговым агентством. Сейчас — что на слуху прямо сегодня.
Начните за 5 минут
import OpenAI from 'openai';
const client = new OpenAI({
apiKey: process.env.FLYAI_API_KEY,
baseURL: 'https://api.flyai.by/v1'
});
const response = await client.chat.completions.create({
model: 'gpt-4-turbo',
messages: [{ role: 'user', content: 'Привет!' }]
});Услуги, чтобы Аня начала работать у вас
API в руки — это полдела. Чтобы Аня правда «приняла» бизнес, обычно нужен аудит того, что есть, и тёплая передача в коллектив. Делаем шахматкой: берёте только то, что нужно.
Аудит инфраструктуры
Что у вас уже есть, что годится под Аню, что докупить или переделать. Реалистичная карта решения за неделю.
Сбор контекста
Регламенты, договоры, FAQ, типовые задачи. Загружаем в её контекст-память — она «знает» компанию с первого дня.
Работа с людьми
Интервью с коллективом, выявление узких мест, согласование сценариев. Аня заходит туда, где её ждут, а не там, где её спустили сверху.
Установка на компы
Развёртывание на рабочих местах — Claude Code, OpenAI SDK, прямой клиент Ани. Безопасные ключи, локальные политики.
Обучение персонала
Серия живых занятий с разбором их же задач. После — у каждого свой набор готовых сценариев под клавиатурой.
Поддержка
Канал в Telegram/email, ответ за сутки. Подкручиваем сценарии, чиним контекст, добавляем новые навыки.
Цены ориентировочные — точное предложение зависит от количества рабочих мест и размера команды. Для одного-двух человек — пакеты меньше; для коллектива 5–7 человек на 3 компа — обычно выходит около 5 760 BYN разово + поддержка.