形成时间最早的是吴语。主要是在三国、两晋之交、两宋之交有大批北方移民进入吴地,历代北方移民带来的方言逐步演化成为现代吴语。不过现有的吴语区在近现代过程中,经历了太平天国运动,使当地人口减少接近7000万,当地原有的社会结构与宗族文化被重新洗刷,主要由太平天国运动接受以后区域内部的移民所形成,因而其宗族聚居程度和宗族势力明显弱于华南的大部分地区[12]。
闽语。最早入闽的汉人大致是在汉末、三国、晋初的百年之间从吴地迁入,到了唐宋时代闽语作为一种具有明显特征的方言才明确起来,为人所注意。
湘语。湘语起源于古楚语,原先主要分布在湖南、湖北,但是因受历代尤其是中唐以后北方移民带来的北方话的冲击,以及两湖地区历代的战乱,目前具有古老湘语特征的主要保留在湘南地区。
赣语和客家话。赣方言和客家方言的核心地区在江西以及与之相邻接的闽东和粤北。唐初大量北方移民进入赣北,这些移民的方言和古江西方言接触形成最原始的赣语,中唐和晚唐陆续到来的北方移民,从赣北深入赣中和赣南,赣语进一步得到发展。北方来的客家人起初定居在赣语区,于宋元之际西移至闽西和粤北,他们原来所使用的赣语与赣东南、闽西和粤北土著方言相交融,形成客方言。
粤语。宋代因北方辽金的侵袭,大量汉人南下广东避难,这些人被成为客户,据《北宋元丰九域志》记载,当时来自北方的客户占广东总人口的39%,宋代的移民带来了北方方言并最后奠定现代粤语的基础[13]。
上面是狭义的汉语方言,可以不包括官话,从方言发生学的角度来看,这些古方言基本上是在两宋以前形成,也就是说通过明清以前的移民所形成,现有的人口格局繁衍的历史比较长,村庄的历史一般较长。两宋以前的移民一般是大家族、贵族的举族整体移民,原有的宗族结构与文化传统在迁入地得到保持,这十分有利于宗族发育;同时他们代表了最为传统的中原汉文化,在这些地区方言中保存了大量的古汉语,村庄的文化信仰也相对于中国北方保留了大量的传统宗族文化;另外这些讲汉方言的村庄大多形成时间早,村庄结构得到发育,保留了较深的宗族文化,目前宗族传统和宗族势力仍然较强,从宗族文化和宗族规范所具有的要求来讲,可能会导致南方方言区较强的男孩偏好和生育数量偏好。
下面我们再看看官话区。从图9可以发现,官话区的形成历史最短,主要由宋以后的移民所形成。整个中国官话地区,都是传统汉民族宗族文化比较弱、村庄社会发育比较晚。这也和中国的历史是高度相关的,因为在元明清以前,中国的移民都是从北方移向南方的,北方草原民族不断南下,而原来的中原汉人都被挤到了中国东南方,所以东南方保留了中国的很多秦汉唐宋文化。
以西南官话为例,西南官话是在宋朝形成的,但它的扩散主要是在明清时期伴随着西南的移民形成。目前讲西南官话的地区,大多是在明朝洪武年间、清朝时期迁移过去的。主要因为三个原因:一是蒙古攻打南宋是从四川打过去,在那里打了很多拉锯战,所以南宋到元朝初年中人口减了7000万,四川占了很多,所以明朝建立之后从南京、江西、安徽大量调军向西南屯军;二是明末张张献忠屠蜀、清军也在四川屠蜀,西南王吴三桂叛乱,几次战争持续了60年;三是明清时期国外的玉米、红薯等适合山区耕作产量高的作物传入中国,使中国人口暴涨,人口开始向山区迁移,同时大量的“湖广填四川”,“湖广填四川”主要以湖北为主。所以,西南地区村庄形成较晚,同时这些移民方式多为军屯和单家独户,压力型移民,而不像历史上宋朝以前的三大移民等战乱移民,一般是大家族、贵族的整体移民。这样西南官话区的移民很难保留原来的宗族结构和文化,同时所形成的多姓村也很难形成宗族结构村庄。西南官话的扩散推广和明清之际湖广地区向西南的移民是一致的,这就是西南官话区与宗族文化传统薄弱、男孩偏好程度低、出生性别比正常的西南地区高度重合的原因。另外,东北官话区、冀鲁官话区、胶辽官话区历史都比较短,都属于“平滑-均衡型生育转变”地区。
上文我们从方言发生学的角度,推测了各区域宗族发育时间的差异,并以宗族发育程度为中介变量解释汉语方言与生育转变模式空间分布之间的相似性。那么宗族发育程度的空间分布假设能否经得起检验?下面从不同区域姓氏分布集中程度的角度对宗族发育程度的空间分布进行检验,大致思路和假设如下:
从人口迁移史和不同区域宗族聚居的情况来看,各区域现有人口迁入和人口聚居的格局形成时间的早晚与宗族聚居程度高低和宗族势力强弱密切相关,这是因为人口繁衍和宗族形成需要时间,人口迁移年代早则意味着一个宗族定居在一地的持续时间长,便有可能通过人口繁衍形成较大的同族群体;反之,历史较短则无法形成庞大的同族群体,并发育出成熟的宗族。因而在一个地区内,现有人口的始迁祖迁入该地的时间越早,则该地区宗族聚居之势越强,反之,现有人口的始迁祖迁入该地时间越晚近,则宗族聚居之势越弱。
具体而言,南方方言区[14]一般是宋朝以前的移民所形成,而且一般是大家族、贵族的整体移民,原有的宗族结构与文化传统在迁入地得到保持,这十分有利于宗族的发育;原有的宗族文化与规范得到保持;另外这些讲汉方言的村庄大多形成时间早,有足够长的时间形成人口规模庞大的同族群体;而宋朝以后的移民所形成的区域主要是官话区,其历史比较短,包括东北官话、中原官话和西南官话区,华北主要是明初“洪武大移民”时来自山西珙桐的移民,四川形成于清前期,东北形成于晚清以后,而且宋以后的移民一般不再是如南方那样的整族迁移,而是个体性极强的移民,总之,与南方相比,北方人口不仅现有人口始迁祖迁入时间相对较晚,而且在人口最初迁移时,迁出地本身就不具备聚族而居的习俗,迁入方式以小家庭和个体为主,从而从人口迁入之始,就很少形成宗族聚居的格局,宗族文化明显弱于南方(王询,2007)。
要通过定量分析方法测量全国不同区域宗族的发育程度不是一件容易的事情。一个最直接的方法就是测量一个特定的空间范围内,同一个宗族的人口在总人口中所占比重。用这种方法测量宗族发育程度,空间范围越小,准确性就越高,空间范围越大,则失真的可能性就会越大,同姓群体不一定是共同的祖先所繁衍。
比如说测量一个行政村的范围内,几个主要姓氏的人口在总人口中所占比重基本上能非常准确地衡量该行政村内宗族的发育程度,因为行政村范围内同姓人群基本上是同一个祖先的后代[15],始迁祖在该村落基越早,则他的子孙就越多,同姓群体在该自然村的范围内所占比重越高。这样,现有人口迁入和人口聚居的格局形成时间的早晚与宗族聚居程度高低和宗族势力强弱密切相关,这是因为人口繁衍和宗族形成需要时间,人口迁移年代早则意味着一个宗族定居在一地的持续时间长,便有可能通过人口繁衍形成较大的同族群体,同一个姓氏的人口在自然村内所占比例就高,户数多;反之,历史较短则无法形成成熟的宗族。
CGSS2006年的数据库中有测量宗族聚居程度的变量,即全村最大的三个姓氏在总人口中所占比例及其户数、人口数。从宗族群体规模的大小看,CGSS2006年的数据表明:在微观的行政村层面,华南的广东、江西、福建、广西的村内宗族群体规模明显大于华北地区;而华北地区则远远大于东北、四川、以及西南地区。表3基本上能从村落的微观层面证明:华南的宗族聚居程度和宗族势力强于华北、华北强于东北、长江流域。但微观层面的抽样调查数据往往存在因为抽样而导致的偏差,依然难以从整体上反映中国农村宗族发育程度的区域差异。由于全国性的、行政村层面的、用于测量宗族发育程度的数据库目前还没有办法获得。我们为了从全国层面刻画宗族发育程度,只能将分析单位扩大。
当空间范围扩大的时候,用同姓群体在总人口中所占比重来测量宗族发育程度可能就会失真,比如说当空间范围扩大到县域的时候,同一个姓氏的人口可能是来自完全不同的祖先,在历史和现实生活中这是完全有可能的;另外在历史上存在小姓为寻求庇护而改为大姓的情况。而在全国层面测量宗族发育程度对于本研究意义重大,为此我们根据2005年1%人口普查原始抽样数据中有关姓氏的信息[16],从地级市的层面统计了各区域的姓氏集中程度。在具体的操作方面需要在此做几点说明。(1)由于我们所分析的2005年1%抽样数据库没有县以下的地址码信息,只能从地级市层面测量同姓群体占总人口比重来测量宗族发育程度。前面谈到,当空间范围越大时,用同姓群体测量宗族发育程度可能会失真,因而与县、乡为分析单位测量宗族发育程度相比,本研究的测量仍然有较大改进的空间。