Troyka Online
416-535-6693
info@troykaonline.com
4400 Dufferin Street (A4), Toronto, ON M3H 6A8

Расширенная аналитика с PySpark

Серия:O'REILLY

Автор:Ласерсон У., Тандон А., Райза С.

Издательство:BHV

Страниц:224

Год:2023

Обложка:Мягкий переплет

SKU:RU1905691

ISBN:9785977517706

Наша цена:US $49.00

Отправляется через 16-24 дня

Описание

Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP

©2024 Troyka Online All rights reserved.