Jaison's ink

Back

原标题:对本科期间能谈上恋爱的概率进行费米估算

This piece is totally for fun. 其中所有的人物、数据均为虚构,切勿当真。🐶

给你瞄一眼结论:如果你现在单身且大一,毕业前你能谈上恋爱的概率大约为79.4%;若你单身且大二,则为69.4%;若你单身且大三,则为54.6%;若你单身且大四,则为32.6%。这是粗略分析,对于每个人其实有更为精确的估算方式(见下面针对虚构人物“书苏”的费米分析),你也可以自己试着算一算。

我平均回两次家,我爸都会问我一次:“怎么还没谈恋爱?”
对于这个问题,我可以选择简要回答:

  • “有合适的就谈。”
  • 或“要谈你自己谈。”
  • 或“是我不想吗?”

但如果给我一篇博客文章的篇幅,回答这个问题,我就会作出如下回答:

为什么要计算概率而不是回答“能”/“不能”?#

对于在本科期间能否谈上恋爱这个问题,大多数人的回答都会是“能” / “不能” / “也许能吧”,但其实这个回答中省略了大量的信息,我们其实可以通过定量的方法(以贝叶斯定理为核心的费米分析),大致估算出本科期间能谈上恋爱的概率,并对其中的概率组成部分进行分析,找到瓶颈部分并针对其提出相应的应对方案。
%% 这就类似于,为什么我们要使用Logistic Function将R上的值映射到(0,1)(0, 1)而不是映射到{0,1}\{0, 1\}。能找到的概率和不能找到的概率,其实能为我们的行为提供强贝叶斯证据(简单来说就是说这个概率的大小很重要)%%

假如使用归纳法。#

假如我们用归纳法来分析这个问题,以虚构角色书苏为例,ta在来到珠海的这一个月认识了0个异性,那么通过归纳法,第二月ta也将认识0个异性,一直归纳下去,ta在本科的剩余3年将不会认识任何异性,其谈上恋爱的概率为0。(此处假设书苏是一个异性恋者)

这样分析显然是错误的,因为“没谈上恋爱”这件事和“谈上恋爱“这件事都是反归纳的。这个月没有认识异性不代表下个月就不会认识异性。而且通过对该虚构角色大一经历的分析,我们可以得到一个先验事实:书苏有不为0的概率认识异性。

虽然归纳法显然是错误的,但是大多数人(包括书苏)在一开始都会采用归纳法,因为这是符合直觉的。这样的思考方式,就会带来二元认知:“我感觉整个本科都谈不上恋爱了”(假如这个人当前毫无恋爱希望)/“谈恋爱这事不是很简单吗?”(假如这个人正在谈恋爱)。

这种思考方式完全无助于问题解决,并且会带来焦虑/盲目。接下来我们就引出大名鼎鼎的“费米分析”。

费米分析#

“费米分析”:因费米在三位一体核试验中,仅通过一张纸片飞落的距离,就估算出原子弹爆炸的大致TNT当量而闻名。

前提假设#

1、当A喜欢B,B喜欢A的概率会变大。即P(A喜欢B)P(A\text{喜欢}B)P(B喜欢A)P(B\text{喜欢}A)不是独立的。
假设合理性:假如说这两个概率是独立的,似乎会更映衬”爱情是人与人之间不期遇的偶合”这一言论,但是假如拿P(你喜欢这个人这个人是人类中的某个人)P(\text{你喜欢这个人} | \text{这个人是人类中的某个人})计算两个人类同时喜欢上对方的概率,那么恋爱将几乎不可能发生。
罗密欧喜欢上朱丽叶通常情况下是因为罗密欧和朱丽叶共同经历了一些故事,或者朱丽叶因为一些原因喜欢上罗密欧,然后通过一些举动导致罗密欧喜欢上朱丽叶。

2、每个人能谈上恋爱的概率是不一样的,所以下文中将先以“书苏”这一虚构角色为例,进行费米分析。然后再通过整体的统计,分析能谈上恋爱概率的平均数。

3、仅分析能谈上和不能谈上,不分析谈上几段。(仅为了简化问题)

4、4年中新相识的异性人数分布均匀。

5、喜欢的人从当年新相识的人中出现。
假设合理性:朋友当久了就不会想谈了。就算存在少量朋友->恋人,由于其数量较少,不会大幅度影响估算。

6、相识一个人不影响相识另一个人的概率。

公式#

理论公式:
P(恋爱,相识)=P(恋爱喜欢)P(喜欢相识)P(相识)P(\text{恋爱}, \text{相识}) = P(\text{恋爱}|\text{喜欢}) * P(\text{喜欢}|\text{相识}) * P(\text{相识})
实际运算:(伯努利试验)
P(恋爱)=1(1P(恋爱,相识))相识异性人数P(\text{恋爱}) = 1 - (1 - P(\text{恋爱}, \text{相识}))^{\text{相识异性人数}}
其中,在计算P(恋爱,相识)P(\text{恋爱}, \text{相识})时,我们令P(相识)=1P(\text{相识}) = 1,因为我们是在相识异性中进行运算(意味着这人你一定相识)。

各部分概率分析#

对于相识异性人数P(喜欢相识)P(\text{喜欢}|\text{相识})#

拿虚构人物书苏大一一年进行分析:
书苏大一一年认识并加微信了31个异性(其实熟的人数要比这少的多,但很难定义什么是”熟”。)对其中的2个有明确的好感。(其实还有1个是高中时喜欢大一才加微信的,扔出去不算)
所以我们可以估算出:
大二到大四相识异性人数=大一相识异性人数3=313=93\text{大二到大四相识异性人数} = \text{大一相识异性人数} * 3 = 31 * 3 = 93
P(喜欢相识)=231P(\text{喜欢}|\text{相识}) = \frac{2}{31}

对于P(恋爱喜欢)P(\text{恋爱}|\text{喜欢})#

这就不能只拿大一的算了(因为书苏大一根本没谈恋爱)。
只能拿虚构人物书苏20年的经历来计算。
在该虚构人物的印象中,ta有好感过7个异性,和其中的2个谈了恋爱。
所以
P(恋爱喜欢)=27P(\text{恋爱}|\text{喜欢}) = \frac{2}{7}

算一下哈#

书苏剩下这三年本科中谈上恋爱的概率是多少呢?(我也好好奇)

P(恋爱)=1(1231×27×1)9384%\begin{align*} P(\text{恋爱}) &= 1 - \left(1 - \frac{2}{31} \times \frac{2}{7} \times 1 \right)^{93} \\ &\approx 84\% \end{align*}

天呐,,,,居然这么高吗,,,,好开森,,,,

用先验概率计算恋爱概率平均数#

由于我没有除了虚构人物“书苏”以外的同学的数据(其实各位同学可以给自己算一算),所以要计算平均数是非常捉襟见肘的。

我不得不通过一些刻意装作不经意的聊天,了解班内当前在恋爱状态的人数,然后上网搜索调查大学期间恋爱持续的平均时间。(不要开盒我🙉)

我们可以将这个过程建模成有两个状态的马尔可夫模型:

  • 每个同学在两态间转变:单身(S) ↔ 恋爱中(R)

  • 恋爱持续平均 D 年 ⇒ 离开率 μ=1/D\mu = 1/D

  • 进入恋爱的速率 α\alpha(对单身者)由稳态平衡假设估算:
    α=pD(1p)\alpha = \frac{p}{D(1-p)}

  • 未来 T 年内,每个单身同学进入恋爱的概率(指数等待时间假设):
    P单身→恋爱=1eαTP_\text{单身→恋爱} = 1 - e^{-\alpha T}

  • 随机选一个同学的未来 T 年内谈恋爱的概率:
    PT=p+(1p)(1eαT)=1(1p)eαT\boxed{P_T = p + (1-p)(1 - e^{-\alpha T}) = 1 - (1-p)e^{-\alpha T}}

PT年恋爱=1(1p)exp(pD(1p)T){\displaystyle P_\text{T年恋爱} = 1 - (1-p)\exp\Big(-\frac{p}{D(1-p)} \, T\Big)}

  • p = N恋爱/NN_\text{恋爱}/N
  • D = 平均恋爱持续年限

经过我的身边人统计学分析,N恋爱6N_\text{恋爱} \approx 6 ,而这是在N25N \approx 25的情况下进行分析的(比我想象中多好多)。
那么
p625p \approx \frac {6}{25}
估算D(平均恋爱持续年限)是很难的,因为这涉及到隐私,网络上我也没看到现成的数据(其实是没太认真找)。

根据某个不保真研究,
分布大致为:
2年以上:占17.78%
1年至2年:占12.59%
7至12个月:占10.37%
4至6个月:占12.59%
1至3个月:占14.81%

加权平均值约为0.8年
好了,那么
D0.8D\approx 0.8

经过一通计算(本文所有计算由Deepseek-R1、GeminiPro和GPT5三座大佛代理)。

随机一名同学在未来 3 年内谈恋爱的概率为
P377.8%P_3 \approx 77.8\%
但其实这并不是我们想要的,我们想要的是随机一名现在单身的同学未来三年内谈恋爱的概率(我相信现在正在谈恋爱的同学不会关心这个问题)。即P3(恋爱现在单身)P_3(\text{恋爱}|\text{现在单身}),又是一通算,得到

P3(恋爱现在单身)69.4%P_3(\text{恋爱}|\text{现在单身}) \approx 69.4\%

顺便的,我还帮大一大三大四单身的同学计算了从现在开始到毕业,谈至少1次恋爱的概率。
(从上到下是大一大二大三大四)

P4(恋爱现在单身)79.4%P3(恋爱现在单身)69.4%P2(恋爱现在单身)54.6%P1(恋爱现在单身)32.6%\begin{aligned} P_4(\text{恋爱}|\text{现在单身}) \approx 79.4\% \\ P_3(\text{恋爱}|\text{现在单身}) \approx 69.4\% \\ P_2(\text{恋爱}|\text{现在单身}) \approx 54.6\% \\ P_1(\text{恋爱}|\text{现在单身}) \approx 32.6\% \\ \end{aligned}

哦天呐,看来大家都有美好的前途。

总结#

建模过程有大量的粗糙近似,以及很多改进的点,比如数据来源混用(费米分析)无记忆性假设(马尔可夫模型) 就是两个最核心、最严重的逻辑缺陷。它们是为简化计算而做出的巨大妥协,与现实情况有显著差异。(懒得搞了hhh)大家也可以在评论区指出来并加以改进。

对爱情这么感性的东西用理性主义的方法进行建模,属实有点反差萌hh,笔者也只是写个好玩,平时其实不太较真,希望能让你会心一笑😄。

也希望以上内容能缓解大家的焦虑。祝大家都能遇见美好的爱情。嘻嘻✌️

毕竟,在本就静谧清逸的大学生活中寻找爱情这件事,就像繁花为春天所做的努力……

延伸阅读#

如何成为一个贝叶斯主义者?
LessWrong: An Intuitive Explanation of Bayes’s Theorem
费米估算
Rough calculations: Fermi and the art of guessing
费米估算实际利用案例(能发论文那种)
Fermi Problem: Power developed at the eruption of the Puyehue-Cordón Caulle volcanic system in June 2011
关于恋爱问题的定性分析(来自虚构人物“书苏”,奇奇怪怪的文章居然会有2w+的校内观看量,呃呃呃呃)
校园集市:部分大学生的恋爱困境

我到底能谈上恋爱不?(费米估算)
https://jaison.ink/blog/fermi-estimate_love-before-graduation/article
Author Jaison
Published at October 11, 2025
Loading comments…