1 引言
《中国科技论文与引文数据库》(CSTPCD)是由中国科技信息研究所、万方数据公司开发的具有多种检索功能的数据库,由论文统计和引文分析两部分组成,数据来源于1200多种科技类核心期刊,以及国家科技部年度发布的科技论文与引文的统计结果。CSTPCD自1989年始建,数据逐年追加,被引数据至2001年止,累积收录论文160万篇,被引281万次。数据库时间跨度逐年持续加宽,从中截取的1994~2001年引文数据完整、充分,且具备多种检索方式和功能,这些为按地区进行科技论文引文统计与分析提供了可能。按地区进行科技论文被引的统计与分析不仅可能而且是必要的:能客观地反映全国科技队伍和科技力量的地区分布情况;展现各地区科技发展的相对速度;展示各地区科技发展的历史进程和走势;为各级科技管理部门制定科技发展规划提供参考依据。
2 1994~2001年中国科技论文被引篇次地区分布数据和总排序表
2.1 数据统计、检索方式和说明
(1)在CSTPCD中,以“被引用年份”与“被引作者所在地区”检索方式为入口,检出的数据按年份的先后为序,排列如表1,表中还给出了:8年累积被引篇次、年平均被引篇次、年平均被引篇次总排序、年平均被引篇次占全国百分比。
(2)以“被引用年份”与“被引作者所在地区”检索方式为入口,数据检出量是稳定的。但是,受数据库中数据单元标引状态的限制,会有一定范围的数据单元盲区。8个年度全国各地区被检出的单元数据总量为1014792篇次,占同时期数据库中数据总量的36.10%。
(3)“被引用年份”是指引用人发表论文时所在的年份,同时又是被引论文被引证的年份,同一篇论文被引证的年份要滞后于该论文发表的年份,数据库的编制要占据一定的时间。因此,在数据库中按“被引用年份”能够检出的数据单元在时间上要比当前滞后一个阶段。
(4)自1999年起,重庆升格为直辖市,四川省不含重庆市,重庆市数据列于表1附注中。
2.2 分析本表数据时应注意的问题
CSTPCD的积极意义在于帮助我们用动态和发展的眼光认识和分析中国科技论文地区逐年被引篇次以及全国排序位次的地区分布状况。从表1可以看出,全国绝大多数地区科技论文被引篇次随年份呈上升态势,反映出中国科技论文在数量和质量上不断增多和提高,体现了中国科技论文整体学术水平和社会影响力正在不断提高和加大。但是,也应注意到CSTPCD统计源期刊数量和期刊中载文数量的逐年增多,这些客观因素的变动也会助长和加大各地区逐年科技论文被引篇次数据的增长。因此,对数据表中数据逐年增长态势的认识也应全面、客观、实事求是。
3 各地区科技论文被引篇次逐年全国排序位次分布及其特征分析
3.1 各地区逐年全国排序位次分布图
以某一地区为单位,将8个年度各年被引篇次全国排序位次作为数据值,按年份的先后为序画图,从图上可直观地看出某地区位次变化情况。依据图线变化特征将全国30个地区的8个年度各年被引篇次全国排序位次分布图划分为9个基本类型:
(详见附件)
注:重庆市自1999年升格为直辖市,检出重庆论文被引篇次1999年为103;2000年为714;2001年为1961。
(1)稳定型:排序位次始终保持在1个固定位次上的,定义为稳定型。
(2)基本稳定型:排序位次在2个相邻的位次间变动的,定义为基本稳定型。
(3)急升型:排序位次绝对上升4个位次以上的,定义为急升型。
(4)急降型:排序位次绝对下降3个位次以上的,定义为急降型。
(5)波动趋稳型:排序位次在3个位次之间波动,并趋于平稳态势的,定义为波动趋稳型。
(6)波动上升型:排序位次在3个位次之间波动,并趋于上升态势的,定义为波动上升型。
(7)波动下降型:排序位次在3个位次之间波动,并趋于下降态势的,定义为波动下降型。
(8)升稳型:排序位次连续上升2个位次以上后,保持平稳态势,定义为升稳型。
(9)降稳型:排序位次断续下降2个位次以上,基本保持平稳态势的,定义为降稳型。
3.2 影响排序位次及其产生变化的因素分析
造成中国科技论文地区被引篇次逐年全国排序位次及其变化态势上的差别,其影响因素是多方面的。
直接影响因素是科研实力的地区分布状况:统计结果显示出全国各地区科研实力的分布具有不平衡特点,位次居前四位的分别是北京、上海、江苏、湖北四省市,北京市遥遥领先,稳居第一;8年间位次变动较大的有广东、天津、四川、湖南四省市,其中前两省市处于急升态势,后两省处于急降态势(四川急降,自1999年起CSTPCD开始将重庆作为一个独立地区从四川省中分离出来,当年作为过渡期重庆市的论文被引篇次数据中有一部分已不在四川省数据中);位次居后的分别有西藏、宁夏、海南、青海、新疆、内蒙古六省区,除海南建省较晚这一历史影响因素外,其余五省区主要分布在西部地区,科研实力薄弱。
间接影响因素主要有两方面:一是地区经济发展水平因素。科技进步能促进经济的发展,经济的发展又会推动科技进步,两者相辅相成,密不可分。经济发达地区优于经济落后地区,如广东、山东两省近年经济发展迅速,科技论文被引篇次的全国排序位次一路攀升或一直处于领先位置,而西藏、青海、宁夏三省区经济发展相对缓慢其排序位次也一直居后。二是地域差异因素。直辖市优于省区,沿海优于内地,如北京、上海排序位次一直稳居前列,天津近年的排序位次处于急升态势,而湖南、黑龙江、江西三省的排序位次相对下降;广东、江苏两省在地域上处于沿海优势,其排序位次居于前列或处于急速上升态势,而湖南、吉林等省区地处内地其排序位次呈相对下降态势。
4 结语
利用CSTPCD对其中1994~2001年的中国科技论文被引数据进行提取、加工、整合,以特有的按“被引作者所在地区”检索方式,统计出中国各地区科技论文被引证篇次随年份分布的数据表,对数据表进行了多方位的统计分析,结果显示出中国各地区上世纪90年代中、末期和本世纪初8个年度科技论文被引证情况及其相对位次变化情况,展现了我国各地区科研发展的进程和不平衡特点,数据定量、详实、客观、权威,图表直观明了,可为各级科研机构、科研管理部门和科技期刊出版单位从一个侧面了解全国各地区科研发展动态提供宏观参考。
信息采集:朱莲音