Наука о данных - это изучение извлечения знаний из данных. В ней используются различные методы из многих областей, включая обработку сигналов, математику, вероятность, машинное обучение, компьютерное программирование, статистику, инженерию данных, сопоставление шаблонов и визуализацию данных, с целью извлечения полезных знаний из данных. Поскольку компьютерные системы способны обрабатывать все больше данных, большие данные являются важным аспектом науки о данных.
Человек, который занимается наукой о данных, называется специалистом по данным. Специалисты по науке о данных решают сложные проблемы, связанные с данными, используя математику, статистику и информатику, хотя очень хорошие знания по этим предметам не требуются. Однако специалист по науке о данных, скорее всего, будет экспертом только в одной или двух из этих дисциплин, что означает, что междисциплинарные команды могут быть ключевым компонентом науки о данных.
Хорошие специалисты по исследованию данных способны применять свои навыки для достижения самых разных целей. Их навыки и компетенции широко варьируются.