📄 RFP / RFI — Gemma 4 в финансовом секторе

Запрос предложений на внедрение локальной LLM-платформы на базе Google Gemma 4 для автоматизации финансовых процессов в банке/страховой компании

Номер RFPRFP-2026-AI-001
Дата выпуска07.05.2026
Дедлайн подачи07.06.2026
Бюджет (ориентир)₽ 15–80 млн
Срок проекта6–12 месяцев
Тип закупкиКонкурентный отбор
📋 Обзор запроса предложений

🎯 Цель закупки

Заказчик осуществляет выбор подрядчика для внедрения локальной LLM-платформы на базе модели Google Gemma 4 с целью автоматизации ключевых финансовых процессов при соблюдении требований регуляторов РФ.

  • Развёртывание Gemma 4 на собственной инфраструктуре (on-premise / private cloud)
  • Интеграция с АБС, CRM и системами риск-менеджмента
  • Обеспечение соответствия 382-П, 152-ФЗ, ГОСТ Р 57580
  • Передача компетенций внутренней ML-команде заказчика
  • SLA ≥ 99.5% uptime в production-окружении

🏦 О заказчике

Финансовая организация с активами от 50 млрд ₽, обслуживающая более 500 000 клиентов. Имеет лицензию ЦБ РФ, внутренний ИТ-департамент и SOC.

  • Текущий стек: Oracle, 1С, собственная АБС
  • Инфраструктура: VMware vSphere + частное облако
  • GPU-ресурсы: 8× NVIDIA A100 (доступны для проекта)
  • Команда: 5 ML-инженеров, 3 DevOps, 2 ИБ-специалиста
  • Опыт с ИИ: пилотные проекты с OpenAI API (2024–2025)

📦 Объём работ (Scope of Work)

🔧
Фаза 1: Пилот (8 нед.)
Развёртывание, базовая интеграция, 2 use case, оценка ROI
🚀
Фаза 2: Масштаб (12 нед.)
Fine-tuning, 5+ use case, интеграция с АБС, нагрузочное тестирование
🏭
Фаза 3: Production (8 нед.)
Prod-запуск, мониторинг, обучение команды, документация
🛡️
ИБ и Compliance
Пентест, аудит, подготовка документации для ЦБ РФ
📚
Обучение и передача
Обучение 10+ сотрудников, runbook, knowledge base
🔄
Поддержка (12 мес.)
SLA-поддержка, обновления модели, мониторинг качества

🎯 Ключевые use cases для автоматизации

#Use CaseПриоритетОжидаемый эффектМетрика успеха
UC-01Скоринг кредитных заявокP0 — Критично−40% времени обработкиAccuracy ≥ 92%, latency ≤ 2 сек
UC-02Детекция мошенничества (фрод)P0 — Критично−60% ложных срабатыванийPrecision ≥ 95%, Recall ≥ 90%
UC-03Генерация финансовых отчётовP1 — Высокий−70% ручного трудаКачество ≥ 4.5/5 по оценке экспертов
UC-04Клиентский чат-бот (24/7)P1 — Высокий−50% нагрузки на КЦCSAT ≥ 4.2/5, resolution rate ≥ 80%
UC-05Анализ договоров и документовP2 — Средний−80% времени на reviewТочность извлечения ≥ 95%
UC-06Регуляторная отчётность (ЦБ)P2 — Средний−60% ошибок в отчётах0 критических ошибок в форматах ЦБ
📌 Требования к предложению

📋 Функциональные требования

IDТребованиеТипКритерий приёмки
FR-01Развёртывание Gemma 4 on-premise без передачи данных во внешние сетиMUSTПодтверждённый air-gap режим
FR-02Fine-tuning на финансовых данных заказчикаMUSTУлучшение базовых метрик на ≥15%
FR-03REST API для интеграции с АБС и CRMMUSTДокументация OpenAPI 3.0
FR-04Мультиязычность: русский, английскийMUSTКачество ≥ 90% на русском языке
FR-05Обработка структурированных и неструктурированных данныхMUSTPDF, Excel, JSON, SQL-запросы
FR-06RAG (Retrieval-Augmented Generation) для корпоративной базы знанийSHOULDLatency RAG-запроса ≤ 5 сек
FR-07Мультимодальность: анализ документов с изображениямиSHOULDТочность OCR+LLM ≥ 92%
FR-08Потоковая обработка (streaming inference)MAYTime-to-first-token ≤ 500 мс
FR-09A/B тестирование версий моделиMAYВстроенный фреймворк экспериментов

🔒 Требования к безопасности и соответствию

IDТребованиеТипРегулятор
SR-01Все данные обрабатываются только на территории РФMUST152-ФЗ, ЦБ РФ
SR-02Шифрование данных AES-256 at-rest и TLS 1.3 in-transitMUSTГОСТ Р 57580
SR-03Аудит-лог всех обращений к модели (retention 5 лет)MUST382-П ЦБ РФ
SR-04Пентест перед вводом в эксплуатациюMUSTГОСТ Р 57580
SR-05Маскирование ПДн в логах и ответах моделиMUST152-ФЗ
SR-06RBAC для управления доступом к ML-сервисамMUST382-П
SR-07Сертификация ФСТЭК или аттестация объекта информатизацииSHOULDФСТЭК России
SR-08Использование ГОСТ-криптографии (КриптоПро)SHOULDФСБ России
⚙️ Технические требования

🖥️ Требования к инфраструктуре

  • GPU: NVIDIA A100 80GB или H100 (минимум 4 карты для inference)
  • CPU: AMD EPYC / Intel Xeon, 64+ ядер
  • RAM: 512 GB+ для inference-сервера
  • Хранилище: NVMe SSD 20TB+ для весов и данных
  • Сеть: 25 GbE между узлами кластера
  • ОС: Ubuntu 22.04 LTS / RHEL 9
  • Контейнеризация: Kubernetes 1.28+ / Docker
  • Резервирование: Active-Active HA конфигурация

📊 Требования к производительности

  • Throughput: ≥ 500 токенов/сек на inference
  • Latency P95: ≤ 3 секунды для стандартных запросов
  • Concurrency: ≥ 100 одновременных пользователей
  • Uptime SLA: ≥ 99.5% в рабочее время (9:00–21:00)
  • RTO: ≤ 4 часа при аварии
  • RPO: ≤ 1 час (резервное копирование)
  • Масштабирование: горизонтальное до 10 узлов
  • Нагрузочное тестирование: обязательно перед prod

🔗 Требования к интеграции

  • Протоколы: REST API, gRPC, WebSocket (streaming)
  • Форматы: JSON, XML, CSV, PDF, DOCX, XLSX
  • АБС: интеграция через SOAP/REST с банковскими системами
  • LDAP/AD: SSO через корпоративный каталог
  • SIEM: экспорт логов в Splunk / ELK Stack
  • Мониторинг: Prometheus + Grafana метрики
  • CI/CD: GitLab CI / Jenkins для деплоя моделей
  • Векторная БД: Milvus / Weaviate для RAG

📦 Требования к поставке

  • Документация: архитектурная, операционная, API-документация
  • Исходный код: передача в репозиторий заказчика
  • Runbook: пошаговые инструкции для ops-команды
  • Обучение: 40 академических часов для команды
  • Тестирование: unit, integration, load test отчёты
  • Безопасность: отчёт о пентесте, модель угроз
  • Compliance: пакет документов для ЦБ РФ
  • Гарантия: 12 месяцев поддержки после сдачи
🏆 Критерии оценки предложений

📊 Веса критериев оценки (итого: 100 баллов)

Технический опыт и компетенции
30
Стоимость и финансовые условия
25
Опыт в финансовом секторе
20
Безопасность и соответствие требованиям
15
Качество предложенного решения
10

✅ Обязательные квалификационные требования

Опыт ML-проектов в финансах ≥ 3 летОБЯЗАТЕЛЬНО
Реализованные проекты с LLM ≥ 2 кейсовОБЯЗАТЕЛЬНО
Сертификаты ФСТЭК / ФСБ у специалистов ИБОБЯЗАТЕЛЬНО
Штат ML-инженеров ≥ 5 человекОБЯЗАТЕЛЬНО
Опыт работы с Kubernetes и GPU-кластерамиОБЯЗАТЕЛЬНО
Страхование профессиональной ответственностиЖЕЛАТЕЛЬНО

📋 Детальная система оценки технических компетенций

КритерийМакс. балловОписание оценкиПодтверждение
Опыт с Gemma / открытыми LLM1010 — production-опыт; 7 — пилоты; 4 — только изучениеКейсы, демо, референсы
Fine-tuning и адаптация моделей88 — LoRA/QLoRA опыт; 5 — базовый fine-tuning; 2 — теорияТехнический тест
MLOps и CI/CD для ML77 — зрелый MLOps; 4 — базовый pipeline; 2 — ручной деплойДемо CI/CD
Опыт в финансовом секторе1010 — банки ТОП-50; 7 — финтех; 4 — смежные отраслиРекомендательные письма
Знание регуляторики ЦБ РФ55 — глубокое знание 382-П, 57580; 3 — базовое; 1 — общееТест на знание нормативов
Качество предложенной архитектуры5Оценка экспертной комиссией по 5-балльной шкалеАрхитектурный документ
📅 Процедура и сроки отбора

🗓️ Ключевые даты

07 мая 2026
📢 Публикация RFP
Размещение на сайте заказчика и в реестре закупок. Рассылка приглашений квалифицированным вендорам.
14 мая 2026
❓ Дедлайн вопросов
Последний день для направления вопросов по RFP. Ответы публикуются для всех участников.
21 мая 2026
📋 Ответы на вопросы
Публикация разъяснений и уточнений к требованиям RFP.
07 июня 2026
📩 Дедлайн подачи предложений
Приём предложений до 18:00 МСК. Опоздавшие заявки не рассматриваются.
08–20 июня 2026
🔍 Оценка предложений
Техническая и коммерческая оценка комиссией заказчика. Запрос дополнительных материалов.
21–25 июня 2026
🎤 Презентации финалистов
ТОП-3 вендора проводят 2-часовые презентации с демонстрацией решения.
30 июня 2026
🏆 Объявление победителя
Уведомление всех участников. Начало переговоров по договору.
14 июля 2026
✍️ Подписание договора
Старт проекта. Kick-off встреча с командой подрядчика.

📁 Состав предложения

  • Том 1 — Техническое предложение (архитектура, методология, план)
  • Том 2 — Коммерческое предложение (смета, этапы оплаты, гарантии)
  • Том 3 — Квалификация (кейсы, команда, сертификаты)
  • Том 4 — Безопасность (модель угроз, план compliance)
  • Приложение А — Заполненная анкета вендора
  • Приложение Б — Рекомендательные письма (≥ 2 шт.)
  • Приложение В — Резюме ключевых специалистов

📬 Контакты для подачи

  • Email: rfp-ai@bank.ru (зашифрованный канал)
  • Формат: PDF + исходные файлы в ZIP-архиве
  • Объём: не более 100 страниц основного текста
  • Язык: русский (технические термины — допустим EN)
  • Конфиденциальность: NDA подписывается до получения RFP
🏢 Анкета вендора (обязательна к заполнению)

🏢 Раздел 1: Общая информация о компании

  • Полное наименование юридического лица
  • ИНН / ОГРН / дата регистрации
  • Юридический и фактический адрес
  • Год основания и история компании
  • Количество сотрудников (общее / ML-специалисты)
  • Годовой оборот за последние 3 года (с подтверждением)
  • Структура собственности (бенефициары)
  • Наличие иностранного участия (критично для ИБ)

🎓 Раздел 2: Технические компетенции

  • Список реализованных LLM-проектов (с описанием и результатами)
  • Опыт работы с Gemma, LLaMA, Mistral и другими открытыми моделями
  • Методология fine-tuning (LoRA, QLoRA, full fine-tuning)
  • Используемые MLOps-инструменты (MLflow, Kubeflow, Airflow)
  • Опыт работы с GPU-кластерами (NVIDIA A100/H100)
  • Сертификации команды (NVIDIA DLI, Google Cloud, AWS ML)
  • Наличие собственных IP/патентов в области ML

🏦 Раздел 3: Опыт в финансовом секторе

  • Количество реализованных проектов в банках / страховании
  • Наименования клиентов (с разрешения) или обезличенные кейсы
  • Знание регуляторной базы: 382-П, 152-ФЗ, ГОСТ Р 57580
  • Опыт прохождения аудитов ЦБ РФ и ФСТЭК
  • Наличие допуска к работе с банковской тайной
  • Рекомендательные письма от финансовых организаций

🛡️ Раздел 4: Безопасность и соответствие

  • Наличие СУИБ (ISO 27001 или аналог)
  • Сертификаты ФСТЭК у специалистов ИБ
  • Опыт проведения пентестов ML-систем
  • Политика обработки конфиденциальных данных заказчика
  • Процедуры реагирования на инциденты ИБ
  • Страхование киберрисков и профессиональной ответственности
  • Субподрядчики: перечень и условия допуска к данным

📊 Раздел 5: Сравнительная таблица предлагаемых решений

Заполните таблицу для предлагаемого решения:

Параметр Требование заказчика Ваше решение Соответствие Комментарий
МодельGemma 4 (27B+)[заполнить]☐ Да / ☐ Нет[комментарий]
РазвёртываниеOn-premise, РФ[заполнить]☐ Да / ☐ Нет[комментарий]
Latency P95≤ 3 секунды[заполнить]☐ Да / ☐ Нет[комментарий]
Throughput≥ 500 токенов/сек[заполнить]☐ Да / ☐ Нет[комментарий]
SLA Uptime≥ 99.5%[заполнить]☐ Да / ☐ Нет[комментарий]
ШифрованиеAES-256 + TLS 1.3[заполнить]☐ Да / ☐ Нет[комментарий]
Аудит-лог5 лет retention[заполнить]☐ Да / ☐ Нет[комментарий]
Fine-tuningLoRA/QLoRA[заполнить]☐ Да / ☐ Нет[комментарий]
RAGПоддержка RAG[заполнить]☐ Да / ☐ Нет[комментарий]
📝 Условия договора и SLA

💰 Финансовые условия

  • Структура оплаты: 20% аванс → 40% по завершении Фазы 2 → 40% при сдаче
  • Гарантийное удержание: 10% в течение 6 месяцев после сдачи
  • Штрафы за просрочку: 0.1% от стоимости этапа за каждый день
  • Штрафы за нарушение SLA: по шкале согласно приложению
  • Индексация: не допускается в течение срока договора
  • НДС: включён в стоимость предложения
  • Валюта: российский рубль (₽)

📋 SLA — уровни обслуживания

  • P1 (Критично): реакция ≤ 1 час, решение ≤ 4 часа
  • P2 (Высокий): реакция ≤ 4 часа, решение ≤ 24 часа
  • P3 (Средний): реакция ≤ 8 часов, решение ≤ 72 часа
  • P4 (Низкий): реакция ≤ 24 часа, решение ≤ 5 рабочих дней
  • Uptime: ≥ 99.5% в рабочее время (9:00–21:00 МСК)
  • Плановые работы: только в согласованные окна обслуживания
  • Мониторинг: дашборд доступности в реальном времени

⚖️ Права интеллектуальной собственности

  • Исходный код разработанных интеграций — передаётся заказчику
  • Fine-tuned веса модели — исключительные права у заказчика
  • Обучающие данные заказчика — остаются собственностью заказчика
  • Методология и фреймворки подрядчика — лицензия для заказчика
  • Документация — передаётся заказчику в полном объёме
  • Запрет на использование данных заказчика для обучения других моделей

🔐 Конфиденциальность и ИБ

  • NDA на 5 лет с момента подписания договора
  • Проверка сотрудников подрядчика службой безопасности заказчика
  • Запрет на привлечение субподрядчиков без согласования
  • Уведомление об инцидентах ИБ в течение 2 часов
  • Право заказчика на аудит ИБ у подрядчика
  • Уничтожение данных заказчика после завершения проекта
  • Ответственность за утечку данных — полное возмещение ущерба