From b86877b6486cb6e9f2d03ac1ef2269813452bdbc Mon Sep 17 00:00:00 2001 From: admin Date: Tue, 13 Jan 2026 07:52:52 +0000 Subject: [PATCH] Update docs/gitops-cicd/11-ollama-comprehensive-enterprise-guide.md --- ...1-ollama-comprehensive-enterprise-guide.md | 123 ------------------ 1 file changed, 123 deletions(-) diff --git a/docs/gitops-cicd/11-ollama-comprehensive-enterprise-guide.md b/docs/gitops-cicd/11-ollama-comprehensive-enterprise-guide.md index 1abc834..8664a76 100644 --- a/docs/gitops-cicd/11-ollama-comprehensive-enterprise-guide.md +++ b/docs/gitops-cicd/11-ollama-comprehensive-enterprise-guide.md @@ -1,128 +1,5 @@ # Корпоративная AI-инфраструктура: Комплексное руководство по развертыванию Ollama с интеграцией MCP, RAG и управлением историей диалогов -## Оглавление - -- [Введение](#введение) -- [Стратегическое обоснование для FinTech](#стратегическое-обоснование-для-fintech) - - [Ключевые вызовы](#ключевые-вызовы) - - [Проблемы традиционного подхода](#проблемы-традиционного-подхода) - - [Решение через self-hosted AI](#решение-через-self-hosted-ai) - - [Преимущества для FinTech](#преимущества-для-fintech) - - [Измеримые бизнес-результаты](#измеримые-бизнес-результаты) -- [Архитектура корпоративного AI-решения](#архитектура-корпоративного-ai-решения) - - [Многоуровневая архитектура](#многоуровневая-архитектура) - - [Уровень 1: User Access Layer](#уровень-1-user-access-layer) - - [Уровень 2: API Gateway](#уровень-2-api-gateway) - - [Уровень 3: Ollama Inference Layer](#уровень-3-ollama-inference-layer) - - [Уровень 4: MCP Layer](#уровень-4-mcp-layer) - - [Уровень 5: Knowledge Base Layer](#уровень-5-knowledge-base-layer) -- [Инфраструктурные требования](#инфраструктурные-требования) - - [Рекомендуемая конфигурация сервера](#рекомендуемая-конфигурация-сервера) - - [Выбор GPU по сценарию использования](#выбор-gpu-по-сценарию-использования) - - [Распределение VRAM](#распределение-vram) - - [Распределение системной памяти](#распределение-системной-памяти) - - [Распределение хранилища](#распределение-хранилища) -- [Выбор и оптимизация AI-моделей](#выбор-и-оптимизация-ai-моделей) - - [Философия специализации](#философия-специализации) - - [Qwen2.5-coder:32b - Специалист по коду](#qwen25-coder32b---специалист-по-коду) - - [DeepSeek-R1:32b - Движок рассуждений](#deepseek-r132b---движок-рассуждений) - - [Llama3.3:70b - Универсальный ассистент](#llama3370b---универсальный-ассистент) - - [Производительность в реальных сценариях](#производительность-в-реальных-сценариях) -- [Model Context Protocol: интеграция с корпоративными системами](#model-context-protocol-интеграция-с-корпоративными-системами) - - [Революция в доступе к данным](#революция-в-доступе-к-данным) - - [Архитектурные принципы MCP](#архитектурные-принципы-mcp) - - [MCP Orchestrator](#mcp-orchestrator) - - [MCP для Gitea: доступ к коду](#mcp-для-gitea-доступ-к-коду) - - [MCP для Docker Swarm](#mcp-для-docker-swarm) - - [MCP для Kubernetes](#mcp-для-kubernetes) - - [MCP для Loki: анализ логов](#mcp-для-loki-анализ-логов) - - [Таблица возможностей MCP-серверов](#таблица-возможностей-mcp-серверов) -- [Организация Knowledge Base через RAG](#организация-knowledge-base-через-rag) - - [Концепция RAG](#концепция-rag) - - [Векторные представления](#векторные-представления) - - [Архитектура векторной базы Qdrant](#архитектура-векторной-базы-qdrant) - - [Организация коллекций](#организация-коллекций) - - [Стратегия chunking](#стратегия-chunking) - - [Процесс индексации](#процесс-индексации) - - [Процесс поиска](#процесс-поиска) - - [Continuous learning](#continuous-learning) - - [Поддержание актуальности](#поддержание-актуальности) - - [Таблица конфигурации коллекций](#таблица-конфигурации-коллекций) - - [Таблица метрик RAG](#таблица-метрик-rag) -- [Управление историей диалогов](#управление-историей-диалогов) - - [Важность истории](#важность-истории) - - [Структура сессии](#структура-сессии) - - [Стратегии управления контекстом](#стратегии-управления-контекстом) - - [Persistent storage](#persistent-storage) - - [Конфиденциальность и retention](#конфиденциальность-и-retention) - - [Search и navigation](#search-и-navigation) - - [Export и sharing](#export-и-sharing) - - [Analytics](#analytics) - - [Таблица session management](#таблица-session-management) - - [Таблица retention policy](#таблица-retention-policy) -- [Стратегия хранения данных](#стратегия-хранения-данных) - - [Многоуровневая архитектура хранения](#многоуровневая-архитектура-хранения) - - [Hot Storage: NVMe SSD RAID](#hot-storage-nvme-ssd-raid) - - [Warm Storage: SATA SSD](#warm-storage-sata-ssd) - - [Cold Storage: Object Storage](#cold-storage-object-storage) - - [Lifecycle Management](#lifecycle-management) - - [Backup Strategy](#backup-strategy) - - [Таблица Storage Tier Allocation](#таблица-storage-tier-allocation) - - [Таблица Backup Strategy](#таблица-backup-strategy) -- [Безопасность и Compliance](#безопасность-и-compliance) - - [Network Isolation](#network-isolation) - - [Authentication и Authorization](#authentication-и-authorization) - - [Secrets Masking](#secrets-masking) - - [Audit Logging](#audit-logging) - - [Data Protection](#data-protection) - - [Compliance](#compliance) - - [Security Monitoring](#security-monitoring) - - [Таблица Security Controls](#таблица-security-controls) -- [Мониторинг и Observability](#мониторинг-и-observability) - - [Key Metrics](#key-metrics) - - [Grafana Dashboards](#grafana-dashboards) - - [Alerting Strategy](#alerting-strategy) - - [Logging Strategy](#logging-strategy) - - [Distributed Tracing](#distributed-tracing) - - [Health Checks](#health-checks) - - [Capacity Planning](#capacity-planning) - - [Таблица мониторинга](#таблица-мониторинга) -- [Экономическое обоснование](#экономическое-обоснование) - - [Капитальные затраты (CapEx)](#капитальные-затраты-capex) - - [Операционные затраты (OpEx)](#операционные-затраты-opex) - - [Софт (бесплатно)](#софт-бесплатно) - - [ROI Analysis](#roi-analysis) - - [Сравнение с облачными AI API](#сравнение-с-облачными-ai-api) - - [Таблица TCO 3 года](#таблица-tco-3-года) -- [Deployment Roadmap](#deployment-roadmap) - - [Phase 1: Foundation](#phase-1-foundation-weeks-1-2) - - [Phase 2: Core Services](#phase-2-core-services-weeks-3-4) - - [Phase 3: MCP Integration](#phase-3-mcp-integration-weeks-5-6) - - [Phase 4: RAG Implementation](#phase-4-rag-implementation-weeks-7-8) - - [Phase 5: Production Readiness](#phase-5-production-readiness-weeks-9-10) - - [Phase 6: Rollout](#phase-6-rollout-week-11-12) -- [Operational Excellence](#operational-excellence) - - [Daily Operations](#daily-operations) - - [Weekly Tasks](#weekly-tasks) - - [Monthly Tasks](#monthly-tasks) - - [Quarterly Tasks](#quarterly-tasks) -- [Best Practices](#best-practices) - - [Model Selection](#model-selection) - - [MCP Integration](#mcp-integration) - - [RAG Optimization](#rag-optimization) - - [Security](#security) - - [Operational](#operational) -- [Troubleshooting Guide](#troubleshooting-guide) - - [GPU Issues](#gpu-issues) - - [MCP Service Issues](#mcp-service-issues) - - [RAG Issues](#rag-issues) - - [Storage Issues](#storage-issues) -- [Заключение](#заключение) - - [Ключевые выводы](#ключевые-выводы) - - [Путь вперед](#путь-вперед) - - [Следующие шаги](#следующие-шаги) - ---- ## Введение