Appearance
Vector Storage: Движок для ваших RAG-приложений
Vector Storage — это высокопроизводительный бэкенд-сервис, разработанный как комплексное решение для создания сложных приложений с технологией Retrieval-Augmented Generation (RAG). Он предоставляет базовую инфраструктуру для семантического поиска, позволяя вашим AI-моделям работать с вашими частными документами и данными, обеспечивая точность, релевантность и контекстную осведомленность ответов.
Как это работает: современная, масштабируемая архитектура
Vector Storage построен с учетом производительности и простоты эксплуатации. Его архитектура предназначена для эффективной обработки всего жизненного цикла индексации документов и семантического извлечения.
Конвейер индексации: от исходного документа до векторов для поиска
Наш надежный, асинхронный конвейер индексации гарантирует, что ваше приложение останется отзывчивым, пока документы обрабатываются в фоновом режиме.
- Прием документов: Ваше приложение отправляет документы (PDF, DOCX, TXT, MD, HTML) через API.
- Парсинг контента: Документ безопасно направляется на внешний сервис для парсинга, который извлекает чистый, структурированный текст.
- Асинхронная очередь: Задание на индексацию помещается в высокоэффективную очередь на базе PostgreSQL. Этот легковесный подход позволяет избежать тяжелых брокеров сообщений и идеально подходит для развертывания в контейнерных средах, таких как Kubernetes.
- Чанкинг и эмбеддинг: Фоновый воркер забирает задание и разделяет текст документа на части (чанки) в соответствии с вашей стратегией. Каждый чанк затем отправляется на внешний, совместимый с OpenAI API для преобразования в вектор.
- Хранение: Сгенерированный вектор вместе с соответствующим текстовым чанком и метаданными сохраняется и индексируется в базе данных PostgreSQL с расширением
pgvectorдля эффективного поиска по сходству.
Поиск и извлечение: мгновенный поиск нужного контекста
- API-запрос: Ваше приложение отправляет запрос на естественном языке на эндпоинт поиска Vector Storage.
- Преобразование в вектор: Запрос преобразуется в вектор с использованием той же модели, что и в конвейере индексации.
- Поиск по сходству:
pgvectorвыполняет высокоскоростной поиск для нахождения чанков документов с наиболее близким семантическим значением к вашему запросу. - Фильтрация и ранжирование: Начальные результаты фильтруются по метаданным (например, ID пользователя, теги документа), а затем проходят через алгоритм начального ранжирования.
- Доставка контекста: Наиболее релевантные чанки документов с самым высоким рангом возвращаются вашему приложению.
Ключевые особенности
Полная совместимость с OpenAI
- OpenAI-Compatible API: Создан как полная замена OpenAI Vector Store API. Вы можете использовать существующую экосистему OpenAI и клиентские библиотеки для интеграции Vector Storage за минуты, а не недели.
Продвинутая обработка данных
- Гибкая обработка документов: Поддерживает широкий спектр популярных форматов документов.
- Асинхронная индексация: Надежный фоновый процесс индексации гарантирует, что производительность вашего приложения никогда не снизится из-за приема документов.
- Настраиваемый чанкинг: Адаптируйте стратегию разделения документов под ваши конкретные нужды.
Мощный поиск и извлечение
- Высокоскоростной векторный поиск: Использует всю мощь PostgreSQL и
pgvectorдля предоставления быстрых и точных результатов семантического поиска. - Гибридный поиск: Комбинируйте поиск по векторному сходству с точной фильтрацией по метаданным.
Архитектура и безопасность корпоративного уровня
- Производительность и масштабируемость: Бэкенд на Go, веб-фреймворк Gin и sqlc для типобезопасного доступа к базе данных. Архитектура оптимизирована для высокой пропускной способности и низкой задержки.
- Строгая изоляция данных: Безопасность превыше всего. Vector Storage обеспечивает строгую изоляцию данных на уровне схемы между разными пользователями и проектами.
Технический стек
- Бэкенд: Go
- API Framework: Gin
- База данных: PostgreSQL с расширением
pgvector - Доступ к БД:
sqlc - Развертывание: Оптимизировано для Docker и Kubernetes.