Расширенная аналитика с PySpark
Оформить заказ
Серия:O'REILLY
Автор:Ласерсон У., Тандон А., Райза С.
Издательство:BHV
Страниц:224
Год:2023
Обложка:Мягкий переплет
SKU:RU1905691
ISBN:9785977517706
Наша цена:US $49.00
Пункты выдачи магазин ТРОЙКА
Отправка почтой: August 15th от US $12.00, бесплатно при заказе от US $100.00.
Точная стоимость доставки будет рассчитана при оформлении заказа.
Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP