Потоковая обработка данных с Apache Flink
Начните работу с Apache Flink, фреймворком с открытым исходным кодом, на котором основаны многие крупнейшие в мире системы для обработки потоковых данных. В данной книге вы изучите фундаментальные понятия параллельной потоковой обработки и узнаете, чем эта технология отличается от традиционной пакетной обработки данных.
Ф. Уэске и В. Калаври, занятые в проекте Apache Flink с первых дней, покажут вам, как создавать масштабируемые потоковые приложения с помощью API Flink DataStream, а также непрерывно выполнять и поддерживать эти приложения в операционных средах.
Потоковая обработка идеально подходит для многих задач: подготовка данных с малой задержкой, потоковая аналитика и информационные панели в реальном времени, раннее оповещение и обнаружение мошенничества. Вы можете обрабатывать потоковые данные любого типа, включая взаимодействия с пользователем, финансовые транзакции и данные интернета вещей, немедленно после получения.
- Концепции и проблемы распределенной потоковой обработки данных с учетом состояния.
- Системная архитектура Flink, включая режим обработки по времени событий и принципы отказоустойчивости.
- Идеология и стандартные компоненты API DataStream, включая операторы с привязкой ко времени и с учетом состояния.
- Чтение и запись данных во внешние системы с гарантией согласованности «ровно один раз».
- Развертывание и настройка кластеров Flink.
- Обслуживание непрерывно работающих потоковых приложений.
«Отличная книга для всех, от старожилов до начинающих программистов и инженеров по обработке данных, выполняющих свои первые задания по потоковой обработке. В книге не только рассматривается Flink, в ней также преподаются основы потоковой обработки, которые помогут читателям повысить уровень знаний и развить навыки технического мышления. Рекомендую всем читателям».
Тед Маласка, директор по 1Т-архитектуре предприятия в Capital One
Об авторах:
Фабиан Уэске — член консультативного совета проекта Apache Flink. Он вносит свой вклад в развитие Flink с первого дня. Фабиан является соучредителем Data Artisans (ныне Ververica) и имеет докторскую степень в области компьютерных наук Берлинского технического университета.
Василики Калаври — научный сотрудник Systems Group при Федеральной технической школе Цюриха. Она является одним из подрядчиков проекта Apache Flink. Будучи одним из первых разработчиков Flink, она работала над его библиотекой обработки графов Geliy, а также над ранними версиями Fable API и потоковым SQL.
Автор(ы) | Фабиан Уэске, Василики Калаври |
Переводчик | В. С. Яценков |
Издательство | ДМК Пресс |
Год издания | 2021 |
ISBN | 978-5-97060-880-7 |
Кол-во страниц | 298 |
Формат страниц | 70x100/16 (170x240 мм) |
Размеры товара | 242 × 172 × 22 мм |
Язык | Русский |
Переплёт | Твердый |
Иллюстрации | цветные |
Тираж | 200 экз. |
Вес | 590 г |