前言

起了个吸睛的标题,主要是这个想法确实有够炸裂的,如果今天的青年真的工作到死亡还没有退休,那么从工资中自动扣除的用于缴纳社保的那一部分,自己就是完全用不上,这是很恐怖的事情的,那就相当于有人收了你24%(个人8% 企业代缴16%)收入的税款(而且是人头税),而这24%的收入本来可以用于让你提升生活品质,更好的生活品质你反而可以活得更久。所以我个人认为这么炸裂的标题确实配得上接下来需要研讨的话题的。我粗略的分析了一下,主要有两个方面的趋势支持上面那个炸裂的标题:

  1. 社保资金池枯竭,年轻人变少,老年人变多,所以法定退休年龄也在不断的向后推迟。

  2. 年轻人现在面临各种食品安全问题同时生活压力剧增,猝死的新闻时常刷到,年轻人是否能够活到退休年龄已经难说。

但是这样的粗浅分析显然是不具备说服力的,所以我打算拿数据或者公式来验证一下可信度。

正文

人均预期寿命增加

人均预期寿命增加,没错,这就是这是延迟退休的依据之一,如果你问人工智能,它通常会告诉你,这是由于医疗的发展,生活水平的提高导致的人口寿命提升,我要告诉你的是,人工智能说的十分的严谨,甚至极其的准确,但是当你了解这个人均预期寿命如何计算的时候,你恐怕笑不出来了,下边是具体的计算方式(下边公式由人工智能输出)

e0=T0l0=x=0ωLxl0e_0 = \frac{T_0}{l_0} = \frac{\sum_{x=0}^{\omega} L_x}{l_0}

下边是展开式

e0=x=0ω[lx+1+ax(lxlx+1)]l0e_0 = \frac{\sum_{x=0}^{\omega} \left[ l_{x+1} + a_x \cdot (l_x - l_{x+1}) \right]}{l_0}

想要解读这个公式我们先抛开复杂的各类参数不管,一个人的预期寿命逻辑上应该如何计算?这是一个困难的问题,因为一个人极有可能因为各种突发事件然后死亡,由于这些不确定发生的突发事件的存在,你很难确认这个人正常老死的实际年龄,为了规避这种突发事件的影响,你需要将同一年出生的人全部纳入统计,因为他们分布在全国各地,突发事件极难同时影响到他们之间的所有有人,并且突发事件作为小概率事件,即使群体中的某些个体因为突发事件影响没有撑到老死,对于群体的状态的改变也是也可以忽略不计的。如果某一年出生了100万人,当这一百万人全部死亡的时候,统计他们总共活得年数,然后除以最开始的100万,就可以得到他们的平均生存年龄了(这个值小于正确的老死年龄,但是会十分逼近正确的结果(在病死率还有突发事件影响范围不大的情况下)。对于社保而言,这样的误差是属于能够接受的范围。

这种方法最为科学严谨,任何一个具有基本逻辑能力的人都能轻而易举的想到这种计算方法,但是我们需要考虑的现实是,2026年出生的人,可能还需要再过100年才可以完全死亡,难道我们必须等待100年才知道他们合理的老死年龄是多少吗?没错,但是这并不代表我们不能估计出来一个具有一定采纳度的可信值,我们十分的清楚一件事情,群体的正确老死年龄应该只取决于他们出生之后的医疗水平和生活水平,也就是100年后出生的人,会因为自己所处时代科技和生活水平的进步而活得更久(统计学是这样假设的),如果体现在概率上,就是后出生的人相较于更早出生的人,在各个年龄上的死亡概率是要偏小的,但是同时由于科学不会在一年中大幅发展,所以相邻年出生的小孩在各年龄死亡的概率上应该不会有较大出入。也就是想要估计2026年能够活多久,我们完全可以这样做,首先假设2026这一年出生了100万人,然后以2025年出生的小孩的死亡率作为2026年出生小孩的一岁死亡率,2024年出生的小孩的死亡率作为2岁死亡率,1926年出生的小孩的死亡率作为100岁死亡率。数据离得越远,误差越大,很显然,2126年100岁老头的死亡概率是显然小于1926年100岁老头的死亡概率的,那个时候,中国不仅深陷战争泥潭,还吃不饱穿不暖,甚至,在这个时期,突发事件才应该是决定人的生命的主要因素。我们之前的推演这个时期应该是失效的。

当然我已经预判了你可能对我的统计方式有所疑惑,为什么必须拿2024年出生的小孩的死亡率作为2026年出生的小孩的预期两岁死亡概率,这是因为这就是最新的,处于2岁的死亡率,2025年的小孩刚满1周岁,没有到2岁,无法统计两岁死亡概率。所以这已经是误差最小的两岁死亡率。你可能会有疑惑,为什么不能复用2025年出生的1岁小孩死亡的概率作为2026年出生的2岁小孩死亡的概率,这个就需要看历史数据是否支持这种近似了,但是我个人凭感觉,应该不支持这种近似,首先就是统计学的正规公式就不是以这种近似计算的,其次就是人在各年龄的死亡概率受基因影响可能比较大,科技水平对于一岁小孩的帮助程度也许不能复用到对二岁小孩的帮助程度上。

好的,我们现在可以看看这种计算的特点,我们假设dnd_n 表示的是当前nn岁的年龄的群体的死亡率,为了简化表示,我们设qn=1dnq_n=1-d_n ,显然 qnq_n 表示的就是存活率,考虑到现实中, dnd_n十分逼近于0,所以存活率 qnq_n 应当十分逼近于1,那么,假设今年出生了aa人,那么一年后剩下 S1=aq1S_1=a*q_1,两年后剩下 S2=aq1q2S_2=a*q_1*q_2, nn年后剩下 Sn=aq1q2...qnS_n = a*q_1*q_2*...*q_n人,并且 qnq_n始终小于1,但是在年龄比较大的情况下,这个规律会失效,但是青年和中年时期,这个规律应该始终满足,也就是10个人活到了100岁,可能其中只剩下1个人可以活到101岁,但是10个人活到了40岁,可能还有9个人可以活到41岁,这是人的生理规律决定的。并且我们有合法理由推测,人群中死亡年龄应该符合正态分布,即使不符合正态分布,按照经验,绘制成直方图应该也呈现纺锤状。

所以所有人获得总年数为 Yn=S1+S2+...+SnY_n = S_1 + S_2+...+S_n,而由 SnS_n的表达式,不难看出, SnS_n会随着n的增加而,每一项的权重会依次降低,并且当n趋近于极大值100时,基本可以忽略不记了,我们以 Yn/a=q1+q1q2+...+q1q2...qnY_n /a = q_1 + q_1*q_2 +...+q_1*q_2*...*q_n,这个表达式即为可以估计的人均预期寿命。可以看出来,由于后续每一加项自身乘项的增多,并且随着 nn的增加 qnq_n不再逼近于1,而是逼近于0,100岁的极大值中,可能相当一部分年龄的老龄人对人均预期寿命毫无影响了。并且随着nn的增加,qnq_n也会渐渐与合理值拉开差距,逐渐偏小。统计学家一般会引入修正的参数,从而让估计寿命不至于过小,偏离实际。

我们今天计算人均预期寿命就是从人口普查数据中提取了当前(2026)各个年龄的死亡率,然后假设一个2026年刚出生的人口基数,在此基础上利用各年龄的死亡率,依次计算出来估计的2026年出生的人在各年龄的幸存人数,最后计算出来预期寿命。按照我们之前的预期,我们的估计值应该偏小,实际上人群应该活得更久才对,但是这其实是一种幻觉。这批2026年出生的小孩40岁的死亡概率使用的是当前40岁大叔的死亡率,50岁死亡的概率是采用当前50岁死亡的概率。但是也必须注意到,今天的40岁大叔是没有在青年时期吃重油重盐高糖的食物的,所以40岁时的死亡率是可以维持一个不错的值的,但是2026年出生的小孩,他可能从小就开始吃各种添加剂喝各种奶茶,同样是40岁,健康程度恐怕已经大幅下降了。所以看起来40年后科技水准进步,死亡率会更低,但是青年时期的食品摄入和压力问题可能也会引起 “死亡率”大幅增加。只是当前使用不健康方式的年轻人仍然年轻,没有到中老年,所以这个死亡率骤变的过程还没有暴露出来,并且越是靠前的项目的较大误差,越会波及到后续的所有加项,所以这里其实是有一个寿命估计值偏大的因素的。

因为生活方式的变化,但是这种变化对于寿命的影响暂时不能体现在数据中,所以我们如果以当前的数据作为基准估算,是会遗漏这一部分,虽然我们之前计算的值是偏小值,但是这偏小的部分多,还是没有办法计算的偏多的部分多,并不好判断,而我个人认为,生活方式对于个人寿命的影响应该是高于科技水平进步带来的影响的。因为前者是增加患病的概率,后者只是增加了缓解疾病的概率,两者相乘,人群仍然会以更快的速度迈入不健康的状态。但是这只是我个人猜测,具体影响是不是颠覆性的,也需要时间去检验。

与其他国家的横向对比

事实上,我们还可以有另一种可行的视角,就是从其他的国家进行切入,但是我找不到公开的数据,可能这些数据在其他国家的统计局,美国上升时期的数据我认为对现在的中国就具有一定的参考价值,只不过中国人由于更多的劳动量和生活压力,以及更严重的食品安全问题,导致数据可能会更差一些。这部分数据我找不到,所以也只能提供思路了,按照我的预想,这种数据应当是有的,毕竟统计局也不是吃白饭的,但是美国资本是否可以就不健康生活方式对寿命的直接影响刻意隐瞒,或者采用隐晦参数,例如风险,可能,让人们淡化这种方式的影响也不是不可能,毕竟美国之前就有一个例子,好像是鼓吹香烟有益于健康的。居然当时还得到了社会的广泛认同!