Apache Hadoop быстро превращается в предпочтительное решение для аналитики больших данных при работе с неструктурированной информацией. Организации, которые ищут способ эффективнее работать на быстро изменяющемся рынке, поняли, что анализ больших данных дает конкурентное преимущество. Обработка больших массивов неструктурированных и структурированных данных на основе Hadoop с использованием стандартного оборудования кардинально изменила аналитику. Извлекая знания из генерируемых компьютерами неструктурированных данных, компании могут принимать правильные решения для увеличения прибыли, улучшения сервиса и сокращения расходов.
Семейство продуктов EMC Greenplum HD позволяет организациям получить преимущества аналитики больших данных без накладных издержек и сложности доступных сегодня на рынке неудобных инструментов. Программное обеспечение Greenplum HD, которое выпускается в редакциях Community и Enterprise, обеспечивает законченную платформу, включающую услуги инсталляции, обучения, глобальной поддержки и сервисы с добавленной стоимостью, дополняющие дистрибуцию Apache.
Уникальный дополнительный функционал EMC для Hadoop:
- EMC Greenplum HD Data Computing Appliance — Apache Hadoop «бесшовно» интегрируется с базой данных Greenplum в Greenplum HD Data Computing Appliance. Решение поддерживает внешние таблицы Hadoop, что позволяет пользователям обращаться к данным, хранящимся в Hadoop Distributed File System (HDFS) без извлечения их из файловой системы. Администраторы могут читать и записывать файлы параллельно из Greenplum на HDFS, что обеспечивает быстрое и простое совместное использование информации. Кросс-платформенный анализ можно выполнять, используя мощь Greenplum SQL и расширенные функции аналитики для доступа к данным в HDFS. Комбинированное решение реализует единственную в индустрии законченную платформу для аналитики больших данных.
- EMC Greenplum HD Enterprise Edition — Enterprise Edition на 100% совместима по интерфейсам со стеком Apache Hadoop. Будучи совместимой с интерфейсами Hadoop, Enterprise Edition обеспечивает «бесшовную» переносимость приложений и в то же время реализует расширенные функции, востребованные в больших организациях, в том числе:
- функции управления данными, включая мгновенные снимки и репликацию на большие расстояния;
- простую загрузку и доступ к данным с помощью «родного» интерфейса network file system (NFS);
- полную управляемость, в том числе простое развертывание кластера, автоматическое распознавание сбоев и оповещение о них, управление несколькими площадками и функцию rolling upgrades.
Наряду с реализацией этих функций производительность улучшается в 2–5 раз по сравнению со стандартной версией Apache Hadoop.
- EMC Greenplum HD Community Edition — Community Edition полностью сертифицирована на совместимость с open source и поддерживает стек Apache Hadoop, который состоит из HDFS, MapReduce, Zookeeper, Hive и HBase. EMC Greenplum обеспечивает отказоустойчивость для Name Node и Job Tracker. Оба этих компонента являются единичными точками отказа стандартных внедрений Hadoop.
В дополнение к своему предложению для Hadoop EMC построила мощную и динамичную экосистему с 12 компаниями – Concurrent, CSC, Datameer, Informatica, Jaspersoft, Karmasphere, Microstrategy, Pentaho, SAS, SnapLogic, Talend и VMware, специализирующимися на business intelligence, data transfer и других технологиях. Широкая поддержка свидетельствует о том, насколько EMC расширяет возможности Hadoop. Разработчики технологий и предприятия, которые привыкли доверять решениям EMC, теперь могут уверенно пользоваться аналитическим инструментом на основе open source.
EMC Global Services разработала интегрированное семейство профессиональных сервисов, поддержки и обучения, чтобы помочь клиентам ускорить внедрение хранилищ данных и бизнес-аналитики с помощью EMC Greenplum Data Computing Appliance. Среди этих сервисов – новый Enterprise Business Analytics Assessment Service, который помогает заказчикам идентифицировать, развернуть, оптимизировать и использовать расширенные функции аналитики для поддержки ключевых инициатив развития бизнеса. Кроме того, EMC будет помогать заказчикам проводить миграцию и консолидацию данных в EMC Greenplum DCA из их существующих хранилищ данных Oracle, Teradata и др.
Мнения о Hadoop
«Hadoop сыграл ключевую роль в переходе от традиционных хранилищ данных к аналитике “больших данных”. Стратегия EMC по коммерциализации Hadoop упрощает его внедрение в корпоративном секторе и делает отказоустойчивым, превращая Hadoop в лучший инструмент аналитики в реальном времени для предприятий».
Джон Вебстер (John Webster), старший партнер, компания Evaluator Group
«Все чаще Hadoop применяется в коммерческих организациях. Мы уверены, что многие внедрения сегодня выполняются как “засекреченные” проекты, о которых не знают группы бизнес-аналитики, и практически без поддержки ИТ-отделов. По мере роста использования Hadoop в организациях и его превращения в критически важное приложение возникает потребность в поддержке и других сервисов».
Отчет Gartner, Inc.: Cool Vendors in Data Management and Integration, 2010 (авторы: Eric Thoo, Donald Feinberg, Ted Friedman и Andreas Bitterer).
«EMC стремится помочь нашим заказчикам получить максимальную отдачу от больших данных, как структурированных, так и неструктурированных. В определенных ситуациях имеет смысл использовать реляционные базы данных для хранения структурированных данных, а в других – Hadoop для хранения неструктурированных данных. Многие наши корпоративные заказчики сталкиваются с обеими ситуациями, и с помощью наших партнеров мы сможем помочь им, а также обеспечить для них высокую доступность, защиту от сбоев и поддержку и сервис корпоративного класса».
Билл Кук (Bill Cook), президент и генеральный менеджер отделения Data Computing корпорации EMC
Доступность
Планируется, что EMC Greenplum HD Community Edition, EMC Greenplum HD Enterprise Edition и EMC Greenplum HD Data Computing Appliance будут доступны в III квартале 2011 года.
Редактор раздела: Алена Журавлева (info@mskit.ru)
Рубрики: Интеграция, Оборудование