Новости

Статистический кризис? Нет, не сейчас

Любые методы обработки данных так или иначе используются для структурирования и анализа существующей информации. Большинство этих методов составляют основу такой научной дисциплины, как статистика. 

Между наукой статистикой и практикой имеется тесная взаимосвязь: статистика использует данные практики, обобщает и разрабатывает методы проведения статистических исследований. В свою очередь в практической деятельности применяются теоретические положения статистической науки для решения конкретных задач. Например, для более эффективного продвижения товаров массового потребления на рынок имеет смысл сегментировать потребителей на группы по определенным параметрам: пол, возраст, семейное положение, доход семьи и так далее. Для этого существует набор математических методов, которые позволяют установить закономерности в представленных данных.

Знание статистики необходимо современному специалисту для принятия решений в условиях стохастики (когда анализируемые явления подвержены влиянию случайностей), для анализа элементов рыночной экономики и социальных процессов, в сборе информации, аудите, финансовом менеджменте, прогнозировании.

Для изучения предмета статистики разработаны и применяются специфические приемы, совокупность которых образует методологию статистики (методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод и т.д.). Большинство этих инструментов реализовано в виде специализированных математических пакетов SPSS, Statistica, Matlab и др. Подавляющее количество из них выпускаются зарубежными компаниями. В Российском сегменте были попытки создания аналогичного программного обеспечения, но они не получили должного развития. Между тем, необходимость в разработке подобного ПО проявляется как никогда остро. Дело в том, что без изучения и проведения статистических экспериментов не может обойтись ни одна отрасль знаний, не говоря о таких приоритетных областях как искусственный интеллект и анализ больших данных. 

При реализации долгосрочных научно-исследовательских проектов и формирования образовательных программ нецелесообразно опираться на зарубежные коммерческие программные продукты. Но выход из данной ситуации есть - можно задействовать возможности современных языков программирования (например, Python) для формирования необходимой базы статистических методов. Конечно этот подход требует больше времени, по сравнению с использованием готовых инструментов. Но здесь проявляется несомненный выигрыш, заключающийся в открытом представлении алгоритмической составляющей любого используемого метода. 

Компания ООО "Студия цифровых решений" разрабатывает курс "Статистическая обработка данных на Python", чтобы познакомить школьников, студентов и преподавателей с основными принципами использования статистических методов и процедур анализа данных. 

Курс направлен на получение практических знаний по важнейшим темам статистики, включая сбор данных, их обобщение с использованием описательной статистики, отображение и визуализацию данных, изучение взаимосвязей между переменными, распределения вероятностей, проверку гипотез, введение в ANOVA (дисперсионный анализ), регрессионный и корреляционный анализ. И самое главное - получение практического опыта по статистическому анализу данных с использованием Python и его библиотек с которыми работают специалисты по обработке и анализу данных. Имея такой начальный багаж знаний, можно более эффективно изучать методы машинного обучения, работать в различных направлениях технологий искусственного интеллекта и обработки больших данных.

Курс "Статистическая обработка данных на Python" преподается на образовательной платформе Stepik. Курс будет доступен по ссылке https://stepik.org/108176. Для начала обучения не требуется каких-либо специальных знаний в области статистики и теории вероятностей. Но настоятельно рекомендуется пройти курс по основам программирования на Python, чтобы на практике познакомиться с языком. Следует упомянуть, что начальный курс по основам владения Python можно пройти совершенно бесплатно на платформе Stepik

Компания ООО "Студия цифровых решений" будет и дальше формировать образовательный контент по тем направлениям, которые востребованы российскими специалистами в сфере IT технологий и предлагать образовательные треки, необходимые для специалистов по разработке и сопровождению программного обеспечения.

Автор текста: Валерия Сидорова
Образование