Python meetup (Online)

Программа митапа формируется, подать заявку на участие спикера можно до 10 июня.
Спикеры
Программа
Предметом доклада является один из этапов обработки входных данных при построении моделей машинного обучения (хотя применение вовсе не ограничено этой областью) - понижение размерности. Доклад будет полезен всем, кто хочет лучше понять что кроется за fit_transform() у, например, неотрицательного матричного разложения и почему это работает (иногда). Я постараюсь дать наиболее полный обзор методов, привести ссылки на реализации, провести сравнение (производительности, качества) и погрузить слушателей в математические детали.

Для подготовки качественной модели машинного обучения вам могут потребоваться признаки из мира гео-данных. Таких признаков существует огромное количество, а добывать их можно самыми разными способами. При помощи гео-данных можно обогатить исходный датасет, получить новые интересные зависимости и улучшить метрики ваших моделей. Ну, и конечно же, отобразить исходную информацию на карте :)
Однако, при работе с географической информации перед вами наверняка встанет целый ряд вопросов, а именно - как не запутаться в свойствах геометрий, какой формат данных лучше всего подойдет для комфортной работы, как правильно объединять гео-данные, какие значимые признаки можно добыть из географических данных и многие другие.
Итак, в этом видео мы обсудим все эти насущные вопросы и расскажем о том как получить по-настоящему полезные и достоверные гео-данные.

- обсудим премущества, которые дает изучение алгоритмов, и какие навыки это помогает развить
- полезные советы для тех кто хочет начать или как наиболее оптимально и эффективно изучать эту отрасль

Монетизация в моб. играх строится на внутриигровых продажах. Обычно платят не более 10% пользователей. Очень важно удерживать платящих игроков и стимулировать их платить как можно больше. Именно поэтому мы построили систему предсказания платежей.
Мы храним и обрабатываем данные в Clickhouse. Для оркестрации пайплайнов используем Apache Airflow. Обучаем модели с помощью CatBoost, а в качестве MLOps решения выступает Clear.ml поверх AWS S3, там мы храним конфиги, модели и прочие артифакты экспериментов. Для мониторинга в продакшене используем Apache Superset.
Описанная архитектура позволяет проводить воспроизводимые ML-эксперименты, масштабировать процесс и оперативно катить в продакшен.
