Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном вр.
В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализации всех уровней этой архитектуры с помощью инструментальных средств вроде Hadoop, Cassandra и Storm. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных. Книга рассчитана на читателей, стремящихся освоить принципы построения систем больших данных и внедрить их на практике. В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры машин для хранения и обработки данных любого объема и с любой скоростью. Правда, масштабируемость и простота не являются взаимоисключающими свойствами подобных архитектур. Эта книга поможет читателю научиться строить системы больших данных, используя архитектуру, специально предназначенную для фиксации и анализа данных в масштабе веб. В ней представлена простая для понимания и масштабируемая лямбда-архитектура, позволяющая разрабатывать информационные системы усилиями небольших команд. В книге даются теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. Помимо общей инфраструктуры для обработки больших данных, читатель может ознакомиться с конкретными технологическими и инструментальными средствами вроде Hadoop, Storm и баз данных типа NoSQL. В этой книге рассматриваются следующие темы. Введение в системы больших данных. Описание особенностей обработки данных масштаба веб в реальном времени. Применение инструментальных средств вроде Hadoop, Cassandra и Storm. Возможность расширить свои знания и навыки за пределы традиционных баз данных. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных. Об авторах Натан Марц - создатель системы Apache Storm и инициатор применения лямбда-архитектуры для построения систем больших данных. Джеймс Уоррен - архитектор-аналитик с квалификацией в области машинного обучения и научных расчетов. Отзывы о книге "Эта книга выходит за рамки отдельных инструментальных средств или платформ. Обязательна к прочтению всем, кто работает системами больших данных". -Джонатан Эстерхази, компания Groupon "Эта книга - подробный, снабженный примерами экскурс в лямбда-архитектуру под руководством ее изобретателя". -Марк Фишер, компания Pivotal "Книга содержит мудрость, которую можно приобрести только после выполнения многих проектов с большими данными. Обязательна для чтения". -Педро Феррера Бертран, компания Datasalt "Это фактическое руководство по рационализации обработки конвейера данных пакетами и почти в реальном времени". -Алекс Холмс, автор книги Hadoop in Practice
Печатное издание имеет сертификаты качества и безопасности и соответствует нормам санитарной гигиены. Прилагается гарантийное обязательство. Имеется дисконтная накопительная система, а также корпоративная скидка 10% на заказ от 20 шт. На странице офомления заказа будет преставлена более исчерпывающая информация о стоимости доставки в ваш регион и о вашей личной скидке.
Позвольте Вам предложить
-
Методы и модели исследования сложных систем и обработки больших данных
Создание, накопление, обработка и использование информации в мире составляют мощную информационную среду. Она занимает ведущее значение в различных областях человеческой деятельности.…
-
Потоковая обработка данных. Конвейер реального времени
Конвейер реального времени Правильный способ сбора данных в реальном времени Авторитетное руководство по освоению архитектурного проектирования потоковых приложений корпоративного уровня Подробное объяснение различных систем,…
-
Передача, хранение и обработка больших объемов научных данных
В учебном пособии рассматриваются крупные научные проекты и объемы генерируемых ими данных, дается обзор научных компьютерных сетей, позволяющих производить высокоскоростную передачу…
-
Интерпретация и применение больших данных в юриспруденции и юридической практике. Монография
Работа посвящена проблемам применения в юридической профессии информационных технологий, основанных на использовании больших данных. В первом разделе рассматриваются теоретические вопросы интерпретации…
-
Данные: хранение и обработка. Учебник
В учебнике рассмотрены и проанализированы: базы данных и СУБД, данные и ЭВМ, концепция баз данных, архитектура СУБД, инфологическая, даталогическая и физическая…
-
Метрический анализ и обработка данных
Главная цель монографии - познакомить читателя с наиболее действенными и апробированными классическими и новыми стохастическими и детерминированными методами оценки и прогнозирования,…
-
Структуры и алгоритмы обработки многомерных данных
Книга посвящена описанию структур и алгоритмов для индексирования и обработки многомерных данных. В ней систематизированы наиболее важные подходы, описаны их математические…
-
Обработка экспериментальных данных на ЭВМ. Учебник
В учебнике представлена информация об основных методах и средствах автоматизации вычислительных процессов, используемых при обработке данных; о способах представления и модели…
-
Анализ и обработка социологических данных. Учебник
Основное внимание уделено количественной и качественной методологии, фундаментальному и эмпирическому исследованию, конструированию теоретического языка социологии и теоретической модели предмета исследования, концептуализации,…