Dremio, стартап, предлагающий инструменты для рационализации и обработки данных, объявил о привлечении 135 млн долларов (10,1 млрд рублей) в рамках серии D при пост-денежной оценке в 1 млрд долларов (75,1 млрд рублей). Компания заявляет, что будет использовать средства, которые поступят через девять месяцев после раунда в размере 70 млн долларов (5,3 млрд рублей), для инвестирования в технологии облачных озёр данных — полезному инструменту для компаний, которые хотят подключаться, анализировать и обрабатывать данные, ускоряя запросы к базе данных. В частности, Dremio планирует расширять свои инженерные центры передового опыта и развивать организации, ориентированные на клиентов, чтобы держать темп по привлечению новых клиентов.
Благодаря своей масштабируемости, низкой стоимости и простоте управления облачное озеро данных стало предпочтительным местом хранения больших объёмов информации. Согласно недавнему отчёту Allied Market Research, объём мирового рынка хранилищ данных в 2017 году оценивался в 18,61 млрд долларов (1,4 трлн рублей), а в период с 2018 по 2025 год составной среднегодовой рост — 8,2%. Однако для аудита этих данных их необходимо перемещать и копировать в собственные хранилища, что может стать дорогостоящим и сложным занятием.
Чтобы решить эту задачу, ветераны MapR Жак Надо (Jacques Nadeau) и Томер Ширан (Tomer Shiran) в 2015 году основали компанию Dremio в Санта-Кларе, штат Калифорния. Генеральный директор Билли Босуорт (Billy Bosworth) рассказал VentureBeat, что Томер, бывший продакт-менеджер в Microsoft, который занимал инженерные и исследовательские должности в IBM и HP, воспринял рост публичных облаков, таких как Amazon Web Services, Microsoft Azure и Google Cloud Platform, как возможность заново изобрести технологию больших данных и разработать механизм облачного озера данных, позволяющий компаниям с большими хранилищами быстро анализировать свою информацию.
«Клиенты Dremio запускают миллионы запросов в день для бизнес-аналитики с высоким уровнем параллелизма с помощью таких инструментов, как Tableau и Power BI, для специальной обработки данных и критически важных информационных панелей. Это стало возможным благодаря фундаментальному упрощению рабочего процесса инженеров по обработке данных, которые уже централизуют информацию из многих источников в облачных хранилищах, таких как AWS S3 и Microsoft ADLS, — сообщил Босуорт в электронном интервью VentureBeat. — С Dremio эти данные больше не нужно перемещать или копировать в хранилища для аналитики; вместо этого полный набор данных доступен непосредственно в собственном облаке».
Dremio предлагает набор инструментов для виртуализации, который устраняет пробелы между реляционными базами данных, Hadoop, NoSQL, ElasticSearch и другими хранилищами, подключаясь к программному обеспечению бизнес-аналитики, как если бы оно было основным источником данных, и запрашивая его через SQL. (SQL — это предметно-ориентированный язык, разработанный для потоковой обработки и управления данными, хранящимися в системе управления реляционными базами данных.) Одноимённая платформа стартапа поддерживает каталог источников, физических и виртуальных наборов данных, а также происхождение этих наборов, что позволяет легче находить наборы и смотреть, как данные преобразуются.

Dremio доступен как в версии Community с открытым исходным кодом, так и в коммерческой версии Enterprise. Он работает в облаке через Kubernetes или в кластере Hadoop, а цены на подписку масштабируются в зависимости от количества узлов, на которых развернут Dremio.
Объединение встроенных в Dremio возможностей позволяет озёрам данных извлекать выгоду из других хранилищ, включая базы данных Oracle, SQL Server и PostgreSQL. Компания утверждает, что Dremio автоматически обнаруживает схемы и поддерживает озёра данных в облаке в Amazon S3 и других поставщиках облачных хранилищ, используя структуру данных Apache Arrow для повышения производительности в 1000 раз.
Благодаря таким функциям, как автопереключение при отказе, Dremio может автоматически выбирать новые узлы в случае сбоев узлов и экземпляров кластера. Более того, динамический доступ платформы обеспечивает программный контроль безопасности за счёт интеграции с Kerberos, LDAP и другими централизованными поставщиками.
Что касается ИИ, Dremio использует машинное обучение, чтобы рекомендовать наборы данных пользователям и адаптировать каталоги в ответ на изменения в схеме и выполнении. Он также алгоритмически кэширует и индексирует метаданные по мере необходимости в реальном времени и на лету.
На вопрос, повлияла ли пандемия на бизнес, Босуорт ответил отрицательно, указав на 60%-ный рост численности персонала Dremio с марта. Помимо отложенного цикла продаж, когда клиенты стартапа перешли на работу из дома, Dremio хорошо пережил «шторм», увеличив свою клиентскую базу до 100 компаний, большинство из которых относятся к Forbes Global 2000, с более чем 75 000 пользователей.
«Аналитика данных всегда была важна для наших клиентов. В этом году, когда мы справляемся с пандемией, это стало ещё более настоятельной необходимостью, — сказал Босуорт. — Dremio уже была распределённой компанией, поэтому мы не испытали потери производительности».
Объявленный раунд Dremio серии D проводился Sapphire Ventures и включал в себя участие существующих инвесторов Dremio: Insight Partners, Lightspeed Ventures, Norwest Venture Partners, Redpoint Ventures и Cisco Investments. На сегодняшний день в компании работает около 160 сотрудников — ожидается, что к концу 2021 года их число удвоится, — и она привлекла 247 млн долларов (18,5 млрд рублей) венчурного капитала.
Источник: https://venturebeat.com/2021/01/06/dremio-raises-100-million-to-help-companies-rapidly-analyze-data/