LinkedIn выложила для свободного пользования Greykite с открытым исходным кодом, библиотеку Python для долгосрочной и краткосрочной прогнозной аналитики. Основной алгоритм Greykite, Silverkite, обеспечивает автоматическое прогнозирование, которое, по словам менеджеров LinkedIn, он использует для планирования ресурсов, управления производительностью, оптимизации и генерации экосистемных инсайтов.

Для предприятий, использующих прогностические модели для прогнозирования потребительского поведения, дрейф данных был серьезной проблемой в 2020 году из-за невиданных ранее обстоятельств, связанных с пандемией. В этом случае точное знание о будущем остается полезным для любого бизнеса. Автоматизация, которая обеспечивает воспроизводимость, повышает точность и может быть использована алгоритмами ниже по потоку для принятия решений.

Например, LinkedIn сообщает, что Silverkite улучшил прогнозы доходов на 1 день вперед и на 7 дней вперед, а также еженедельные прогнозы активных пользователей на 2 недели вперед. Средний абсолютный процент ошибок для прогнозов доходов и еженедельных активных пользователей снизился более чем на 50% и 30% соответственно.

Библиотека Greykite

Greykite предоставляет инструменты временных рядов для трендов, сезонности, праздников и многого другого, чтобы пользователи могли следовать моделям ИИ по своему выбору. Библиотека предоставляет исследовательские графики и шаблоны для настройки, которые определяют регрессоры на основе характеристик данных и требований к прогнозу, таких как почасовой краткосрочный прогноз и ежедневный долгосрочный прогноз. Настройки, предоставляемые шаблонами, убыстряют поиск удовлетворительного прогноза. И библиотека Greykite обладает гибкостью для настройки шаблона модели для алгоритмов, позволяя пользователям помечать (и указывать, игнорировать или корректировать) известные аномалии.

Greykite, который обеспечивает обнаружение пиковых значений, также может выбрать оптимальную модель из нескольких кандидатов, используя прошлые данные о производительности. Вместо того чтобы настраивать каждый прогноз отдельно, пользователи могут определить набор возможных конфигураций прогнозов, которые фиксируют различные типы паттернов. Наконец, библиотека предоставляет сводку, которая может быть использована для оценки влияния отдельных точек данных. Например, Greykite может проверить продолжительность праздника, посмотреть, насколько точка изменения повлияла на тренд, или показать, насколько определенная функция может быть полезной для модели.

Greykite Silverkite

С Greykite недельный прогноз, обученный на более чем 8-летних ежедневных данных, занимает всего несколько секунд. Представитель LinkedIn говорит, что весь его конвейер, включая автоматическое обнаружение точек изменения, перекрестную проверку, тестирование и оценку, завершается менее чем за 45 секунд.

“Библиотека Greykite предоставляет быстрый, точный и легко настраиваемый алгоритм — Silverkite — для прогнозирования. Greykite также предоставляет интуитивно понятные параметры настройки и диагностики для интерпретации модели. Он расширяется до нескольких алгоритмов и облегчает их бенчмаркинг через единый интерфейс, — пишут ученые из исследовательской группы LinkedIn в своем блоге. — Мы успешно применили Greykite в LinkedIn для нескольких вариантов использования бизнес-метрик и инфраструктурных показателей”.

Библиотека Greykite доступна на GitHub и PyPI, и она присоединяется ко многим другим инструментам LinkedIn с открытым исходным кодом на сегодняшний день. Они включают в себя Iris для управления отключениями веб-сайтов; PalDB, хранилище низких значений для обработки побочных данных; Ambry, хранилище объектов для медиафайлов; GDMix, фреймворк для обучения моделей персонализации ИИ; LiFT, инструментарий для измерения справедливости модели ИИ; и Dagli, библиотеку машинного обучения для Java.

Источник: https://venturebeat.com/2021/05/13/linkedin-open-sources-greykite-a-library-for-time-series-forecasting/

от AI_NEWS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *