Тег: IT

Книга: Основы Инженерии данных. Глава 1. Описание дата-инженерии.

Главная идея книги — жизненный цикл работы с данными: создание, хранение, сбор, преобразование и предоставление данных...

Apache Airflow

В 2014 году компания Airbnb стремительно развивалась, что привело к увеличению объема данных и усложнению рабочих процессов обработки данных

Apache Kafka

Message broker — это тип построения архитектуры, при котором элементы системы «общаются» друг с другом с помощью посредника

Apache Spark

Apache Spark — это универсальный, высокопроизводительный, отказоустойчивый движок, написанный на Scala, для распределенной обработки данных

Apache Hadoop

Из-за значительного роста обрабатываемых данных (терабайты, петабайты) действующие на тот момент системы уже эффективно не справлялись с обработкой такого потока данных

Реляционные и нереляционные БД

SQL подход — это семейство реляционных баз данных, основанное на отношениях (связях) таблиц друг с другом

Традиционная БД против MPP БД

В данной статье разберу чем традиционные БД отличаются от MPP, в каких задачах достаточно иметь традиционную, а в каких MPP значительно лучше

kolesa conf’23

07.10.2023 в Алмате состоялась ежегодная конференция Kolesa Conf’23. Kolesa Conf’23 — это масштабная конференция, объединяющая IT-сообщество Казахстана

Python for Data Analysis Course

На днях презентовал внутри своей компании тренажер/курс по Python для анализа данных. Если вы когда-нибудь хотели начать программировать на Python или вам надоел Excel