ClickHouse — это колоночная система управления базами данных, предназначенная для интерактивного анализа больших объемов данных, а также интеграции в ML-пайплайны, благодаря поддержке векторного поиска. Это позволяет эффективно обрабатывать запросы для задач поиска семантического сходства, кластеризации и RAG.
Кластеры ClickHouse в Selectel развернуты на серверах с процессорами Intel Xeon Gold и AMD EPYC, оперативной памятью DDR5 ECC и локальными SSD NVMe-дисками. Такая конфигурация обеспечивает высокую производительность при обработке аналитических запросов к большим массивам данных. Для отказоустойчивости доступны Multi-AZ кластеры с гарантированным размещением нод кластера в разных дата-центрах геораспределенного региона облака.
Решение поддерживает нативную интеграцию с облачным объектным хранилищем S3, в том числе с использованием локальных сетей (без доступа в интернет). Пользователи могут использовать S3 как целевое хранилище для экспорта данных в формате Iceberg, интеграции архитектур Data Lakehouse и выполнения запросов к данным, хранящимся в S3. Это сокращает расходы более чем в два раза по сравнению с использованием классического DWH подхода. В число возможностей ClickHouse в Selectel также входят отказоустойчивость, репликация, шардирование, встроенный мониторинг, aудит-логи и группы безопасности. Все это позволяет надежно обрабатывать тяжелые аналитические запросы и обеспечить промышленный уровень хранения даже петабайтов данных.
«Добавление ClickHouse усиливает портфель PaaS-сервисов хранения и обработки данных в Selectel. Теперь пользователи смогут запускать высоконагруженные решения промышленного уровня, передав управление инфраструктурой сервису. Нативная интеграция с S3 и высокопроизводительные внутренние сети в ЦОДе до 400 Гбит/с позволяют нашим клиентам использовать DLH подход, который значительно снижает затраты на хранение данных. Например, рыночная стоимость хранения в РФ для S3 составляет 1-2 рубля против хранения на дисках в районе 10-30 рублей за каждый ГБ/мес. А мощная поддержка векторного поиска делает ClickHouse предпочтительным в индустрии AI/ML-инструментов для задач RAG и векторного поиска для искусственного интеллекта», — отметил Александр Гришин, руководитель по развитию продуктов хранения данных Selectel.