Машинное обучение — это очень мощный инструмент. Но в нём есть большая рутинная подготовительная часть, которая сильно отталкивает. К счастью, есть множество автоматических инструментов, которые совершают все операции самостоятельно.
Всё что нужно сделать для использования таких автоматических систем машинного обучения — это передать данные в виде pd.DataFrame и указать название колонки с целью. Всё остальное они сделают сами: подготовят данные, заполнят пропуски, разберутся с выбросами, используют различные приёмы для уменьшения оверфиттинга модели и т.п.
Результатом работы этих алгоритмов является готовая обученная предсказательная модель. Остаётся лишь сохранить её в файл и использовать по назначению.
Список инструментов по убыванию количества звёзд на GitHub (на май 2023):
Конечно, эти автоматические системы работают хуже, чем созданные человеком-профессионалом в машинном обучении. У созданных ими моделей процент верных предсказаний ниже. Но для первичной оценки целесообразности использования машинного обучения они подойдут.