我们有很多数据预测的方法,但我现在觉得这些方法在现实预测中非常不靠谱。
举个例子,某公司用历史销售数据来预测下一季度的销售额,用了线性回归、时间序列模型、甚至LSTM神经网络,模型效果看起来很不错,R²也高,但真正到了下个季度,结果大跌眼镜:销量不升反降,偏差达到了30%以上。
因为竞争对手的大量进入以及营销策略变化,消费者行为发生了转移,而这些变量在模型中根本没有体现。模型预测看起来精致,实际却失真严重。这不是模型公式的问题,而是它只基于历史数据,却忽略了未来的结构变化。
历史数据很容易骗人。我们自以为从中看到了“趋势”,其实往往只是过去某些稳定条件下的偶然延续。一旦外部环境发生突变,历史就不再“可参考”。很多预测模型,不过是在玩一个错误精确化的游戏。
历史数据为何被滥用?
首先我们要承认:历史数据确实是一种宝贵的资源。它记录了事物发展的轨迹,让我们得以量化分析。但问题出在:我们太迷信它了。
大多数数据预测方法,包括移动平均、指数平滑、ARIMA、自回归模型、神经网络等,归根结底都是在“拉一条线”,告诉我们:看,过去是这样,所以未来也会差不多。
但这是假设了一个关键前提:未来的机制和过去一致。
现实中呢?政策可以变、技术会突破、用户会流失、世界会疫情。
比如你用2015–2019年的出境游数据来预测2020年的旅游市场,那只能是灾难;
你用过去五年特斯拉销量的增长率来预测2030年的电动车市场,结果可能也会完全错误,甚至2025年都差距很大,因为政策、电池技术、全球竞争格局都可能颠覆一切。
历史数据描绘的是过去的地图,而未来很可能是一片新大陆。
趋势≠逻辑:预测不能只看“线”
我们常说“大数据预测”,但它的本质是“用过去的相关性去拟合未来的可能性”,本质上是统计学,而不是因果推理。
拿一个简单的例子:一个城市房价连续5年上涨,你回归分析会发现“上涨”趋势非常明显。但你有没有想过:
-
是不是炒房资金推动的? -
是不是土地政策放松了? -
是不是当地人口真的在流入? -
是不是央行放水、利率降低了?
如果只是看到“涨”,而不理解“为什么涨”,那么你的预测,就是盲人摸象。

真正靠谱的预测模型,必须从变量之间的因果结构出发,而不是简单的数据拟合。
变量的“缺席”,才是最大风险
回到我最开始提到的预测失败经历,问题的关键不在模型形式,而在于变量的缺失。换句话说,我们基于历史数据建立的模型,只能看到过去能“看到的东西”。
但未来很多关键的变量,是:
-
没发生过的(政策突变、技术革命) -
没记录下来的(竞争对手行为、用户情绪) -
没意识到的(“黑天鹅”变量、间接因果路径)
因此,即使你有最复杂的深度学习模型,只要输入变量错了、漏了、缺了,输出结果必然南辕北辙。
预测不是比谁公式多、拟合准,而是比谁洞察深、结构全。
真实世界的几个失败案例
(1)诺基亚的崩塌
在2007年前,诺基亚手机在全球销量连续增长,其市场数据如果用于趋势预测,几乎每个模型都会得出“明年会更好”的结论。但2007年,iPhone发布,重新定义了智能手机。从那以后,诺基亚的市值与市场份额一路崩塌。它不是没数据,而是没看到未来变量。
(2)2020年新冠疫情
不管你有多强的销售预测模型,它都不会预测到“突然封城”这种政策,因为历史中没有这种先例。因此,所有基于过去行为建模的供应链预测、消费者行为分析,在疫情初期统统失效。
(3)2008年金融危机
很多金融机构使用基于历史房价数据的信用评级模型,认为房贷风险很低。但模型没有考虑到次贷结构性问题与系统性连锁反应,因此在危机爆发时,数据“看起来好”,模型“跑得快”,但最后“摔得惨”。
从趋势到机制
如果不靠单纯趋势,我们还能怎么预测未来?
(1)机制建模
通过构建因果图谱、系统动力学模型、博弈模型等方式,明确变量之间的关系和作用机制,不仅是“会不会涨”,而是“为什么涨”、“涨到哪儿会触发反馈”、“哪些变量一变会逆转趋势”。
(2)情景模拟
预测不应该只输出一个数字,而应该是多个可能性范围。比如在商业分析中,通常设定“基准情景、乐观情景、悲观情景”三个版本,用来反映不同变量组合下的结果。
(3)“现在进行时”的指标补充
历史数据重要,但我们更需要“实时信号”——比如社会情绪(网络评论、热搜)、流量趋势、政策风向等,它们比过去五年的数据更能反映未来走向。
我们生活在一个看似数据无所不在的时代,但也更容易陷入“数据幻觉”。历史数据看起来严谨、科学、客观,模型运行得再复杂、图表画得再美,也掩盖不了一个事实:
历史只能告诉你曾经发生过什么,但不能告诉你即将发生什么。
它就像后视镜——可以帮你回顾,但不能帮你躲开前方的坑。
未来永远比历史复杂。真正有价值的预测,必须是数据+逻辑+机制+判断的组合。否则,一切只不过是“趋势而已”。(作者:王海华)
下面是我的数学建模新书《巧用ChatGPT进行数学建模》(结合AI前沿技术对数学建模提质增效)及《模型,就是数学化的思维》(创新性提出DEED框架,以新的视角理解数学建模)推荐。