Разработка конвейеров машинного обучения. Автоматизация жизненных циклов модели с помощью TensorFlow
В настоящее время компании тратят миллиарды долларов на проекты машинного обучения (МО), но эти средства могут быть потрачены впустую, если при этом не используется эффективное развертывание моделей МО. Перед вами практическое руководство, написанное X. Хапке и К. Нельсон, с которым вы смело можете отправляться в путь по всем этапам автоматизации конвейера МО, построенного на основе экосистемы Tensor Flow. Вы познакомитесь с методами и инструментами, которые существенно сократят время развертывания (с нескольких дней до нескольких минут), чтобы вы могли сосредоточиться на разработке новых моделей, а не на поддержке устаревших систем. Специалисты по анализу данных, инженеры по МО и инженеры DevOps узнают, как выйти за рамки простой разработки моделей и успешно реализовать свои проекты в области науки о данных, а менеджеры лучше поймут, как можно существенно сократить сроки, необходимые для реализации подобных проектов.
С помощью этой книги вы:
- поймете, как построить конвейер машинного обучения;
- создадите свой конвейер, используя компоненты TensorFlow Extended;
- сможете управлять конвейером машинного обучения с помощью Apache Bearn, Apache Airflow и Kubeflow Pipelines;
- освоите работу с данными с помощью TensorFlow Data Validation и TensorFlow Transform;
- проведете анализ модели с помощью TensorFlow Model Analysis;
- определите такие параметры своей модели, как точность предсказаний и смещение;
- сможете выполнить развертывание модели с помощью TensorFlow Serving или TensorFlow Lite для мобильных устройств;
- познакомитесь с методами, обеспечивающими конфиденциальность данных в машинном обучении.
«Эта книга — выдающийся ресурс и исчерпывающий обзор систем машинного обучения в целом и TFX в частности. Она содержит самую точную информацию, сопровождаемую ясными краткими пояснениями и примерами».
Роберт Кроу, популяризатор современных практик разработки TensorFlow, Google
Об авторе:
Ханнес Хапке и Кэтрин Нельсон — старшие специалисты по анализу данных в Concur Labs (одно из подразделений SAP Concur), где они исследуют инновационные способы использования машинного обучения для повышения качества обслуживания путешественников, совершающих деловые поездки. Область интересов Ханнес — программная инженерия в области машинного обучения (развертывание масштабируемых моделей) и задачи обработки естественного языка, а Кэтрин специализируется на анализе моделей и сохранении конфиденциальности данных в приложениях МО.