Що почитати Data Engineer
Завжди підтримуємо тебе в літературних пошуках, тож не можемо не порадити якісні фахові посібники! Якщо ти цікавишся інженерією даних, прагнеш зазирнути під капот відомих додатків і дослідити їхню архітектуру — переглядай нашу добірку і поповнюй лист бажань крутою літературою. А ще — надсилай добірку друзям! Тепер вони матимуть аж п’ять ідей тобі на подарунок ;)
Fundamentals of Data Engineering: Plan and Build Robust Data Systems by Joe Reis and Matt Housley
Ця книга розкаже тобі:
- про ландшафт інженерії даних;
- як ігнорувати маркетинговий хайп при виборі технологій, архітектури та процесів роботи з даними;
- як використовувати data engineering lifecycle для проєктування та побудови надійної архітектури.
У книги чудові відгуки відповідно до рейтингу Amazon Best Sellers Rank: #1 in Cloud Computing (Books), #2 in Data Processing, #3 in Data Modeling & Design (Books), тож дуже радимо!
Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems by Martin Kleppmann
Якщо шукаєш фундаментальну працю про перфоманс, скейлабіліті й інструменти Data — ця книга для тебе!
Знову ж таки, згідно з рейтингом Amazon Best Sellers Rank, книга визнана найкращою в номінаціях:
#1 in Data Modeling & Design (Books)
#1 in MySQL Guides
#1 in Desktop Database Books
Spark: The Definitive Guide: Big Data Processing Made Simple by Bill Chambers, Matei Zaharia
Мастхев-посібник для тих, хто прагне зануритися в Apache Spark.
Автори зібрали усе: від основних операцій API Spark до сценаріїв використання MLlib і масштабованої бібліотеки машинного навчання Spark.
Data Engineering With Python by Paul Crickard
Хоча книга видана у 2020 році, вона не втратила актуальності. У практичній частині автор звертає увагу на створення конвеєра даних.
Опрацювавши матеріал, ти не лише отримаєш чітке уявлення про методи моделювання, а й зможеш впевнено будувати конвеєри для відстеження даних, перевірки якості та внесення необхідних змін у продакшн.
Звертаємо увагу, книга ще й на пітоні — скарб!
The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling by Ralph Kimball
І найсмачніше наостанок!
Найавторитетніший автор Data-галузі у цій книзі зібрав бібліотеку оновлених методів розмірного моделювання — найповнішу колекцію за всю історію! Крім цього, посібник містить додаткові розділи про методи ETL та нові й розширені бізнес-матриці. Знахідка!