先有鸡还是先有蛋,这是个老问题了。
随便指定一只鸡或者一个蛋,不妨指定一只鸡,记作H1,这只鸡是由一个蛋孵化而来,这个蛋记作E1. 这个蛋E1又是由某一只鸡生下来,这只鸡记作H2.于是我们得到一个鸡和蛋的序列:
H1,E1,H2,E2,...
越大的下标,表示时间越久远,表示更早期的鸡或者蛋。
可以合理地假定,n越大,Hn越不像鸡,En越不像蛋。
进一步给出一个合理的假定,存在某个m,使得,若n>m,则Hn不是鸡;若n<=m,则Hn为鸡。另一方面也存在一个k,使得,若n>k,则En不是蛋;若n<=k,则En为蛋。给出这个假定是因为鸡和蛋不是精确定义的,而且鸡和蛋的历史都是有限的,序列一定会在某处终止。
另一方面:鸡下的是蛋,且蛋孵出的是鸡。由此可以推出m=k,或者m=k+1.
若m=k,则鸡蛋序列为H1,E1,...,H(m-1),E(m-1),Hm,Em.再往后,既不是鸡,也不是蛋。这种情形下先有蛋后有鸡。
若m=k+1,则鸡蛋序列为H1,E1,...,H(m-1),E(m-1),Hm.同样,再往后,既不是鸡,也不是蛋。这种情形下,先有鸡后有蛋。
注意我们并不假定:下蛋的是鸡,孵出鸡的是蛋。否则就会导致任意Hn都是鸡,任意En都是蛋。
但是我们并不知道,到底是m=k呢,还是m=k+1,于是也就不知道到底是先有鸡呢,还是先有蛋。
一个简化的,类似的问题:袋子里有红白两色的球,从袋子里取球。若取到红球,则下一次取白球;若取出白球,则下一次取出红球。假设现在取出的是红球,问题就是:第一次取出的球是红色还是白色?
显然,如果我们知道一共取了比如100次,那么我们立即可以推出第一次取的是白球。如果我们只知道取球的大概次数,比如介于500次到600次之间,此时显然我们不可能推出第一次取出的球的颜色,那么能得到一些什么样的结果呢?不能得到确定性的结论,那么或许我们能得到一个描述不确定的结果,即概率,即第一次取出红球的概率。结论是:容易估计出最初取红球的概率是一个很接近于1/2的数字。
我们换一个角度,提一个弱一点的问题:先有鸡的概率是多少?
记:蛋En从产下到孵化为鸡Hn经过的时间为xn, 鸡Hn从孵化出来到产下蛋E(n-1)的时间yn.
假定经过考古学研究,确定了鸡起源的大致时间,比如距今1万年,误差500年。
考虑一个最简单的模型。设xn, yn都是固定的,比如xn=a年,yn=b年,即每只鸡都刚好在a岁大时产下将要孵化的蛋,而每个蛋经过约b 年后孵化为鸡。注意b可能很小。由此,根据概率论中的中心极限定理,容易算出先有鸡的和先有蛋的概率之比为a:b. 由此可知先有鸡的概率为a/(a+b).
一般来说,不妨假定:xn, yn 均为随机的,可以分别看做随机变量的总体X,Y的取值.
记X,Y的数学期望为a=EX, b=EY.同样,根据中心极限定理,可以算出,先有鸡的概率为a/(a+b),先有蛋的概率为b/(a+b).
对于a,b,我不知道具体的数字,我们很随意的给一个估计,不妨设置两个不算过于离谱的数值:a=2年=36个月,b=4个月。于是我们得到先有鸡的概率为36/40=90%,先有蛋的概率为10%.
考古学的结果只需要年代足够久远就可以了,这样就可以用上中心极限定理,因为此时鸡和蛋经历了很多代,而这个起源的大致年代是鸡蛋序列中所有的时间相加,即鸡或者蛋起源距今年代=x1+y1+x2+y2+…+xn+yn.当n很大时,就可以用中心极限定理。