Моделирование данных: от иерархической, сетевой до реляционной модели
С бурным развитием AI стало понятно, что код мы будем писать всё меньше. Тогда чем же будем заниматься?
Если говорить про дата-инженеров — моделирование данных останется зоной их ответственности. AI с этим пока справляется плохо, а значит, это именно то, во что стоит вкладываться. Кроме этого становится всё яснее, что мы — люди будем выступать в роли операторов по сбору и управлению контекстом для AI.
Поэтому я запускаю серию роликов, где мы пройдёмся по всем основным концепциям моделирования данных: от иерархических моделей до реляционных, разберём нормализацию и денормализацию, посмотрим на проектирование хранилищ по Kimball и Inmon и дойдём до Data Vault и Anchor моделирования.
Главная идея, которой хочу придерживаться: каждый новый подход появился не просто так, а как ответ на проблемы предыдущего, так происходит эволюция. Универсального решения нет — важно понимать плюсы и минусы каждого инструмента, концепции и знать, когда и в каких случаях их применять.
В первом ролике разберём истоки: как IBM создала первую иерархическую модель данных в программе Аполлон, какие у нее были существенные недостатки, чем была хороша сетевая модель и почему мы все же пришли к реляционной модели Эдгара Кодда, которая изменила всё.