随着数字经济时代的来临,基于互联网、移动互联网以及人工智能技术的经济活动每时每刻产生了海量大数据,这些海量大数据又反过来驱动各种经济活动.大数据来源不一,形式多样,种类繁杂,既有结构化数据,也有非结构化数据,如文本、图像、音频、视频等,即使是结构化数据,也有新型数据,如函数数据、区间数据与符号数据等.大数据大多拥有巨大的样本容量,也有潜在解释变量维数超过样本容量的高维大数据.大数据的产生以及基于大数据的机器学习的广泛使用,对统计学产生了深刻影响.本文从大数据的特点和机器学习的本质出发,讨论了大数据和机器学习对统计建模与统计推断的挑战与机遇,包括由抽样推断总体分布性质、充分性原则、数据归约、变量选择、模型设定、样本外预测、因果分析等重要方面,同时也探讨了机器学习的理论与方法论基础以及统计学和机器学习的交叉融合.