📋 Обзор запроса предложений
🎯 Цель закупки
Заказчик осуществляет выбор подрядчика для внедрения локальной LLM-платформы на базе модели Google Gemma 4 с целью автоматизации ключевых финансовых процессов при соблюдении требований регуляторов РФ.
- Развёртывание Gemma 4 на собственной инфраструктуре (on-premise / private cloud)
- Интеграция с АБС, CRM и системами риск-менеджмента
- Обеспечение соответствия 382-П, 152-ФЗ, ГОСТ Р 57580
- Передача компетенций внутренней ML-команде заказчика
- SLA ≥ 99.5% uptime в production-окружении
🏦 О заказчике
Финансовая организация с активами от 50 млрд ₽, обслуживающая более 500 000 клиентов. Имеет лицензию ЦБ РФ, внутренний ИТ-департамент и SOC.
- Текущий стек: Oracle, 1С, собственная АБС
- Инфраструктура: VMware vSphere + частное облако
- GPU-ресурсы: 8× NVIDIA A100 (доступны для проекта)
- Команда: 5 ML-инженеров, 3 DevOps, 2 ИБ-специалиста
- Опыт с ИИ: пилотные проекты с OpenAI API (2024–2025)
📦 Объём работ (Scope of Work)
🔧
Фаза 1: Пилот (8 нед.)
Развёртывание, базовая интеграция, 2 use case, оценка ROI
🚀
Фаза 2: Масштаб (12 нед.)
Fine-tuning, 5+ use case, интеграция с АБС, нагрузочное тестирование
🏭
Фаза 3: Production (8 нед.)
Prod-запуск, мониторинг, обучение команды, документация
🛡️
ИБ и Compliance
Пентест, аудит, подготовка документации для ЦБ РФ
📚
Обучение и передача
Обучение 10+ сотрудников, runbook, knowledge base
🔄
Поддержка (12 мес.)
SLA-поддержка, обновления модели, мониторинг качества
🎯 Ключевые use cases для автоматизации
| # | Use Case | Приоритет | Ожидаемый эффект | Метрика успеха |
|---|---|---|---|---|
| UC-01 | Скоринг кредитных заявок | P0 — Критично | −40% времени обработки | Accuracy ≥ 92%, latency ≤ 2 сек |
| UC-02 | Детекция мошенничества (фрод) | P0 — Критично | −60% ложных срабатываний | Precision ≥ 95%, Recall ≥ 90% |
| UC-03 | Генерация финансовых отчётов | P1 — Высокий | −70% ручного труда | Качество ≥ 4.5/5 по оценке экспертов |
| UC-04 | Клиентский чат-бот (24/7) | P1 — Высокий | −50% нагрузки на КЦ | CSAT ≥ 4.2/5, resolution rate ≥ 80% |
| UC-05 | Анализ договоров и документов | P2 — Средний | −80% времени на review | Точность извлечения ≥ 95% |
| UC-06 | Регуляторная отчётность (ЦБ) | P2 — Средний | −60% ошибок в отчётах | 0 критических ошибок в форматах ЦБ |
📌 Требования к предложению
📋 Функциональные требования
| ID | Требование | Тип | Критерий приёмки |
|---|---|---|---|
| FR-01 | Развёртывание Gemma 4 on-premise без передачи данных во внешние сети | MUST | Подтверждённый air-gap режим |
| FR-02 | Fine-tuning на финансовых данных заказчика | MUST | Улучшение базовых метрик на ≥15% |
| FR-03 | REST API для интеграции с АБС и CRM | MUST | Документация OpenAPI 3.0 |
| FR-04 | Мультиязычность: русский, английский | MUST | Качество ≥ 90% на русском языке |
| FR-05 | Обработка структурированных и неструктурированных данных | MUST | PDF, Excel, JSON, SQL-запросы |
| FR-06 | RAG (Retrieval-Augmented Generation) для корпоративной базы знаний | SHOULD | Latency RAG-запроса ≤ 5 сек |
| FR-07 | Мультимодальность: анализ документов с изображениями | SHOULD | Точность OCR+LLM ≥ 92% |
| FR-08 | Потоковая обработка (streaming inference) | MAY | Time-to-first-token ≤ 500 мс |
| FR-09 | A/B тестирование версий модели | MAY | Встроенный фреймворк экспериментов |
🔒 Требования к безопасности и соответствию
| ID | Требование | Тип | Регулятор |
|---|---|---|---|
| SR-01 | Все данные обрабатываются только на территории РФ | MUST | 152-ФЗ, ЦБ РФ |
| SR-02 | Шифрование данных AES-256 at-rest и TLS 1.3 in-transit | MUST | ГОСТ Р 57580 |
| SR-03 | Аудит-лог всех обращений к модели (retention 5 лет) | MUST | 382-П ЦБ РФ |
| SR-04 | Пентест перед вводом в эксплуатацию | MUST | ГОСТ Р 57580 |
| SR-05 | Маскирование ПДн в логах и ответах модели | MUST | 152-ФЗ |
| SR-06 | RBAC для управления доступом к ML-сервисам | MUST | 382-П |
| SR-07 | Сертификация ФСТЭК или аттестация объекта информатизации | SHOULD | ФСТЭК России |
| SR-08 | Использование ГОСТ-криптографии (КриптоПро) | SHOULD | ФСБ России |
⚙️ Технические требования
🖥️ Требования к инфраструктуре
- GPU: NVIDIA A100 80GB или H100 (минимум 4 карты для inference)
- CPU: AMD EPYC / Intel Xeon, 64+ ядер
- RAM: 512 GB+ для inference-сервера
- Хранилище: NVMe SSD 20TB+ для весов и данных
- Сеть: 25 GbE между узлами кластера
- ОС: Ubuntu 22.04 LTS / RHEL 9
- Контейнеризация: Kubernetes 1.28+ / Docker
- Резервирование: Active-Active HA конфигурация
📊 Требования к производительности
- Throughput: ≥ 500 токенов/сек на inference
- Latency P95: ≤ 3 секунды для стандартных запросов
- Concurrency: ≥ 100 одновременных пользователей
- Uptime SLA: ≥ 99.5% в рабочее время (9:00–21:00)
- RTO: ≤ 4 часа при аварии
- RPO: ≤ 1 час (резервное копирование)
- Масштабирование: горизонтальное до 10 узлов
- Нагрузочное тестирование: обязательно перед prod
🔗 Требования к интеграции
- Протоколы: REST API, gRPC, WebSocket (streaming)
- Форматы: JSON, XML, CSV, PDF, DOCX, XLSX
- АБС: интеграция через SOAP/REST с банковскими системами
- LDAP/AD: SSO через корпоративный каталог
- SIEM: экспорт логов в Splunk / ELK Stack
- Мониторинг: Prometheus + Grafana метрики
- CI/CD: GitLab CI / Jenkins для деплоя моделей
- Векторная БД: Milvus / Weaviate для RAG
📦 Требования к поставке
- Документация: архитектурная, операционная, API-документация
- Исходный код: передача в репозиторий заказчика
- Runbook: пошаговые инструкции для ops-команды
- Обучение: 40 академических часов для команды
- Тестирование: unit, integration, load test отчёты
- Безопасность: отчёт о пентесте, модель угроз
- Compliance: пакет документов для ЦБ РФ
- Гарантия: 12 месяцев поддержки после сдачи
🏆 Критерии оценки предложений
📊 Веса критериев оценки (итого: 100 баллов)
Технический опыт и компетенции
30
Стоимость и финансовые условия
25
Опыт в финансовом секторе
20
Безопасность и соответствие требованиям
15
Качество предложенного решения
10
✅ Обязательные квалификационные требования
Опыт ML-проектов в финансах ≥ 3 летОБЯЗАТЕЛЬНО
Реализованные проекты с LLM ≥ 2 кейсовОБЯЗАТЕЛЬНО
Сертификаты ФСТЭК / ФСБ у специалистов ИБОБЯЗАТЕЛЬНО
Штат ML-инженеров ≥ 5 человекОБЯЗАТЕЛЬНО
Опыт работы с Kubernetes и GPU-кластерамиОБЯЗАТЕЛЬНО
Страхование профессиональной ответственностиЖЕЛАТЕЛЬНО
📋 Детальная система оценки технических компетенций
| Критерий | Макс. баллов | Описание оценки | Подтверждение |
|---|---|---|---|
| Опыт с Gemma / открытыми LLM | 10 | 10 — production-опыт; 7 — пилоты; 4 — только изучение | Кейсы, демо, референсы |
| Fine-tuning и адаптация моделей | 8 | 8 — LoRA/QLoRA опыт; 5 — базовый fine-tuning; 2 — теория | Технический тест |
| MLOps и CI/CD для ML | 7 | 7 — зрелый MLOps; 4 — базовый pipeline; 2 — ручной деплой | Демо CI/CD |
| Опыт в финансовом секторе | 10 | 10 — банки ТОП-50; 7 — финтех; 4 — смежные отрасли | Рекомендательные письма |
| Знание регуляторики ЦБ РФ | 5 | 5 — глубокое знание 382-П, 57580; 3 — базовое; 1 — общее | Тест на знание нормативов |
| Качество предложенной архитектуры | 5 | Оценка экспертной комиссией по 5-балльной шкале | Архитектурный документ |
📅 Процедура и сроки отбора
🗓️ Ключевые даты
07 мая 2026
📢 Публикация RFP
Размещение на сайте заказчика и в реестре закупок. Рассылка приглашений квалифицированным вендорам.
14 мая 2026
❓ Дедлайн вопросов
Последний день для направления вопросов по RFP. Ответы публикуются для всех участников.
21 мая 2026
📋 Ответы на вопросы
Публикация разъяснений и уточнений к требованиям RFP.
07 июня 2026
📩 Дедлайн подачи предложений
Приём предложений до 18:00 МСК. Опоздавшие заявки не рассматриваются.
08–20 июня 2026
🔍 Оценка предложений
Техническая и коммерческая оценка комиссией заказчика. Запрос дополнительных материалов.
21–25 июня 2026
🎤 Презентации финалистов
ТОП-3 вендора проводят 2-часовые презентации с демонстрацией решения.
30 июня 2026
🏆 Объявление победителя
Уведомление всех участников. Начало переговоров по договору.
14 июля 2026
✍️ Подписание договора
Старт проекта. Kick-off встреча с командой подрядчика.
📁 Состав предложения
- Том 1 — Техническое предложение (архитектура, методология, план)
- Том 2 — Коммерческое предложение (смета, этапы оплаты, гарантии)
- Том 3 — Квалификация (кейсы, команда, сертификаты)
- Том 4 — Безопасность (модель угроз, план compliance)
- Приложение А — Заполненная анкета вендора
- Приложение Б — Рекомендательные письма (≥ 2 шт.)
- Приложение В — Резюме ключевых специалистов
📬 Контакты для подачи
- Email: rfp-ai@bank.ru (зашифрованный канал)
- Формат: PDF + исходные файлы в ZIP-архиве
- Объём: не более 100 страниц основного текста
- Язык: русский (технические термины — допустим EN)
- Конфиденциальность: NDA подписывается до получения RFP
🏢 Анкета вендора (обязательна к заполнению)
🏢 Раздел 1: Общая информация о компании
- Полное наименование юридического лица
- ИНН / ОГРН / дата регистрации
- Юридический и фактический адрес
- Год основания и история компании
- Количество сотрудников (общее / ML-специалисты)
- Годовой оборот за последние 3 года (с подтверждением)
- Структура собственности (бенефициары)
- Наличие иностранного участия (критично для ИБ)
🎓 Раздел 2: Технические компетенции
- Список реализованных LLM-проектов (с описанием и результатами)
- Опыт работы с Gemma, LLaMA, Mistral и другими открытыми моделями
- Методология fine-tuning (LoRA, QLoRA, full fine-tuning)
- Используемые MLOps-инструменты (MLflow, Kubeflow, Airflow)
- Опыт работы с GPU-кластерами (NVIDIA A100/H100)
- Сертификации команды (NVIDIA DLI, Google Cloud, AWS ML)
- Наличие собственных IP/патентов в области ML
🏦 Раздел 3: Опыт в финансовом секторе
- Количество реализованных проектов в банках / страховании
- Наименования клиентов (с разрешения) или обезличенные кейсы
- Знание регуляторной базы: 382-П, 152-ФЗ, ГОСТ Р 57580
- Опыт прохождения аудитов ЦБ РФ и ФСТЭК
- Наличие допуска к работе с банковской тайной
- Рекомендательные письма от финансовых организаций
🛡️ Раздел 4: Безопасность и соответствие
- Наличие СУИБ (ISO 27001 или аналог)
- Сертификаты ФСТЭК у специалистов ИБ
- Опыт проведения пентестов ML-систем
- Политика обработки конфиденциальных данных заказчика
- Процедуры реагирования на инциденты ИБ
- Страхование киберрисков и профессиональной ответственности
- Субподрядчики: перечень и условия допуска к данным
📊 Раздел 5: Сравнительная таблица предлагаемых решений
Заполните таблицу для предлагаемого решения:
| Параметр | Требование заказчика | Ваше решение | Соответствие | Комментарий |
|---|---|---|---|---|
| Модель | Gemma 4 (27B+) | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| Развёртывание | On-premise, РФ | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| Latency P95 | ≤ 3 секунды | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| Throughput | ≥ 500 токенов/сек | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| SLA Uptime | ≥ 99.5% | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| Шифрование | AES-256 + TLS 1.3 | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| Аудит-лог | 5 лет retention | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| Fine-tuning | LoRA/QLoRA | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
| RAG | Поддержка RAG | [заполнить] | ☐ Да / ☐ Нет | [комментарий] |
📝 Условия договора и SLA
💰 Финансовые условия
- Структура оплаты: 20% аванс → 40% по завершении Фазы 2 → 40% при сдаче
- Гарантийное удержание: 10% в течение 6 месяцев после сдачи
- Штрафы за просрочку: 0.1% от стоимости этапа за каждый день
- Штрафы за нарушение SLA: по шкале согласно приложению
- Индексация: не допускается в течение срока договора
- НДС: включён в стоимость предложения
- Валюта: российский рубль (₽)
📋 SLA — уровни обслуживания
- P1 (Критично): реакция ≤ 1 час, решение ≤ 4 часа
- P2 (Высокий): реакция ≤ 4 часа, решение ≤ 24 часа
- P3 (Средний): реакция ≤ 8 часов, решение ≤ 72 часа
- P4 (Низкий): реакция ≤ 24 часа, решение ≤ 5 рабочих дней
- Uptime: ≥ 99.5% в рабочее время (9:00–21:00 МСК)
- Плановые работы: только в согласованные окна обслуживания
- Мониторинг: дашборд доступности в реальном времени
⚖️ Права интеллектуальной собственности
- Исходный код разработанных интеграций — передаётся заказчику
- Fine-tuned веса модели — исключительные права у заказчика
- Обучающие данные заказчика — остаются собственностью заказчика
- Методология и фреймворки подрядчика — лицензия для заказчика
- Документация — передаётся заказчику в полном объёме
- Запрет на использование данных заказчика для обучения других моделей
🔐 Конфиденциальность и ИБ
- NDA на 5 лет с момента подписания договора
- Проверка сотрудников подрядчика службой безопасности заказчика
- Запрет на привлечение субподрядчиков без согласования
- Уведомление об инцидентах ИБ в течение 2 часов
- Право заказчика на аудит ИБ у подрядчика
- Уничтожение данных заказчика после завершения проекта
- Ответственность за утечку данных — полное возмещение ущерба