Superset+Airflow для аналитиков от Бегета – это готовое решение для аналитиков, которое помогает хранить, обрабатывать и визуализировать любые данные, а также автоматизировать эти процессы.

В сборку входит сразу несколько полезных инструментов для аналитики данных:

  • Superset – открытое программное обеспечение для исследования и визуализации, ориентированное на большие данные.
  • Airflow – открытое программное обеспечение для создания, выполнения, мониторинга и оркестровки потоков операций по обработке данных.
  • Clickhouse – СУБД, специально разработанная для OLAP и агрегации данных.

Благодаря современному железу и гибкому конфигуратору характеристик сервера, на котором будет развернута сборка аналитических инструментов, с Superset+Airflow для аналитиков можно обрабатывать любой объем данных без затрат на установку и настройку необходимого ПО.

Состав приложения

  • Ubuntu 22.04
  • Superset
  • Airflow
  • ClickHouse
  • Docker

Установка Superset+Airflow для аналитиков

Для установки готового решения для анализа данных вместе с созданием сервера потребуется указать следующие дополнительные параметры:

  • Доменное имя, по которому будут доступны инструменты для аналитиков Superset и Airflow. Вы можете как выбрать свой собственный домен, так и зарегистрировать новый. Помимо этого вы можете воспользоваться бесплатным доменом в зоне .beget.app. На указанный домен будет установлен бесплатный SSL-сертификат.
  • Пароль для пользователя root. Этот пароль будет использоваться для доступа к Superset, Airflow и Clickhouse.

После создания виртуального сервера мы автоматически подготовим  инструменты веб-аналитики к первому запуску. Обычно это занимает до 5 минут. Вы получите уведомление после завершения развертывания.

Начало работы

Superset

Для доступа к веб-интерфейсу и дальнейшей визуализации данных с помощью Superset необходимо перейти по ссылке вида https://my_domain.com:8088/, где my_domain.com – это ранее выбранный домен для установки.

Для авторизации используйте логин root и пароль, который вы указали при установке ПО. Данные для авторизации доступны в панели управления, а также отправляются на вашу электронную почту по завершении установки.

Airflow

Для доступа к веб-интерфейсу Airflow необходимо перейти по ссылке вида https://my_domain.com:8080/, где my_domain.com – это ранее выбранный домен для установки.

Для авторизации используйте логин root и пароль, который вы указали при установке ПО. Данные для авторизации доступны в панели управления, а также отправляются на вашу электронную почту по завершении установки.

ClickHouse

Для работы с ClickHouse вы можете воспользоваться “SQL Labs” внутри Superset или функционалом Airflow.

Если необходим прямой доступ к ClickHouse, то внутри контейнера доступен cli, для подключения к нему:

  • Подключитесь к серверу по SSH.
  • Подключитесь к контейнеру ClickHouse командой: docker exec -it clickhouse bash.
  • Запустите cli командой: clickhouse-client -u admin.
  • Введите пароль от пользователя root, который вы указывали при создании сервера.

Желаем удачной аналитики с Superset+Airflow!

FAQ

Где расположены файлы конфигурации Superset, Airflow и Clickhouse?

Все конфигурационные файлы сборки для веб-аналитики находятся в директории /opt/beget/:

  • ClickHouse – /opt/beget/clickhouse/
  • Airflow – /opt/beget/airflow/
  • Superset – /opt/beget/superset/
Superset + Airflow

Бесплатно с каждым сервером:


Автоматический бэкап данных
Круглосуточный мониторинг
Почтовая система
DNS-хостинг
Приватные сети
Быстрая установка ПО
Сервер будет создан автоматически сразу после регистрации аккаунта
Категории
Для разработчиков