Dremio, стартап, предлагающий инструменты для рационализации и обработки данных, объявил о привлечении 135 млн долларов (10,1 млрд рублей) в рамках серии D при пост-денежной оценке в 1 млрд долларов (75,1 млрд рублей). Компания заявляет, что будет использовать средства, которые поступят через девять месяцев после раунда в размере 70 млн долларов (5,3 млрд рублей), для инвестирования в технологии облачных озёр данных — полезному инструменту для компаний, которые хотят подключаться, анализировать и обрабатывать данные, ускоряя запросы к базе данных. В частности, Dremio планирует расширять свои инженерные центры передового опыта и развивать организации, ориентированные на клиентов, чтобы держать темп по привлечению новых клиентов.

Благодаря своей масштабируемости, низкой стоимости и простоте управления облачное озеро данных стало предпочтительным местом хранения больших объёмов информации. Согласно недавнему отчёту Allied Market Research, объём мирового рынка хранилищ данных в 2017 году оценивался в 18,61 млрд долларов (1,4 трлн рублей), а в период с 2018 по 2025 год составной среднегодовой рост — 8,2%. Однако для аудита этих данных их необходимо перемещать и копировать в собственные хранилища, что может стать дорогостоящим и сложным занятием.

Чтобы решить эту задачу, ветераны MapR Жак Надо (Jacques Nadeau) и Томер Ширан (Tomer Shiran) в 2015 году основали компанию Dremio в Санта-Кларе, штат Калифорния. Генеральный директор Билли Босуорт (Billy Bosworth) рассказал VentureBeat, что Томер, бывший продакт-менеджер в Microsoft, который занимал инженерные и исследовательские должности в IBM и HP, воспринял рост публичных облаков, таких как Amazon Web Services, Microsoft Azure и Google Cloud Platform, как возможность заново изобрести технологию больших данных и разработать механизм облачного озера данных, позволяющий компаниям с большими хранилищами быстро анализировать свою информацию.

«Клиенты Dremio запускают миллионы запросов в день для бизнес-аналитики с высоким уровнем параллелизма с помощью таких инструментов, как Tableau и Power BI, для специальной обработки данных и критически важных информационных панелей. Это стало возможным благодаря фундаментальному упрощению рабочего процесса инженеров по обработке данных, которые уже централизуют информацию из многих источников в облачных хранилищах, таких как AWS S3 и Microsoft ADLS, — сообщил Босуорт в электронном интервью VentureBeat. — С Dremio эти данные больше не нужно перемещать или копировать в хранилища для аналитики; вместо этого полный набор данных доступен непосредственно в собственном облаке».

Dremio предлагает набор инструментов для виртуализации, который устраняет пробелы между реляционными базами данных, Hadoop, NoSQL, ElasticSearch и другими хранилищами, подключаясь к программному обеспечению бизнес-аналитики, как если бы оно было основным источником данных, и запрашивая его через SQL. (SQL — это предметно-ориентированный язык, разработанный для потоковой обработки и управления данными, хранящимися в системе управления реляционными базами данных.) Одноимённая платформа стартапа поддерживает каталог источников, физических и виртуальных наборов данных, а также происхождение этих наборов, что позволяет легче находить наборы и смотреть, как данные преобразуются.

Некоторые источники данных, поддерживаемые платформой Dremio

Dremio доступен как в версии Community с открытым исходным кодом, так и в коммерческой версии Enterprise. Он работает в облаке через Kubernetes или в кластере Hadoop, а цены на подписку масштабируются в зависимости от количества узлов, на которых развернут Dremio.

Объединение встроенных в Dremio возможностей позволяет озёрам данных извлекать выгоду из других хранилищ, включая базы данных Oracle, SQL Server и PostgreSQL. Компания утверждает, что Dremio автоматически обнаруживает схемы и поддерживает озёра данных в облаке в Amazon S3 и других поставщиках облачных хранилищ, используя структуру данных Apache Arrow для повышения производительности в 1000 раз.

Благодаря таким функциям, как автопереключение при отказе, Dremio может автоматически выбирать новые узлы в случае сбоев узлов и экземпляров кластера. Более того, динамический доступ платформы обеспечивает программный контроль безопасности за счёт интеграции с Kerberos, LDAP и другими централизованными поставщиками.

Что касается ИИ, Dremio использует машинное обучение, чтобы рекомендовать наборы данных пользователям и адаптировать каталоги в ответ на изменения в схеме и выполнении. Он также алгоритмически кэширует и индексирует метаданные по мере необходимости в реальном времени и на лету.

На вопрос, повлияла ли пандемия на бизнес, Босуорт ответил отрицательно, указав на 60%-ный рост численности персонала Dremio с марта. Помимо отложенного цикла продаж, когда клиенты стартапа перешли на работу из дома, Dremio хорошо пережил «шторм», увеличив свою клиентскую базу до 100 компаний, большинство из которых относятся к Forbes Global 2000, с более чем 75 000 пользователей.

«Аналитика данных всегда была важна для наших клиентов. В этом году, когда мы справляемся с пандемией, это стало ещё более настоятельной необходимостью, — сказал Босуорт. — Dremio уже была распределённой компанией, поэтому мы не испытали потери производительности».

Объявленный раунд Dremio серии D проводился Sapphire Ventures и включал в себя участие существующих инвесторов Dremio: Insight Partners, Lightspeed Ventures, Norwest Venture Partners, Redpoint Ventures и Cisco Investments. На сегодняшний день в компании работает около 160 сотрудников — ожидается, что к концу 2021 года их число удвоится, — и она привлекла 247 млн долларов (18,5 млрд рублей) венчурного капитала.

Источник: https://venturebeat.com/2021/01/06/dremio-raises-100-million-to-help-companies-rapidly-analyze-data/

от AI_NEWS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *