1 引言
关键词是为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语。关键词分析是文献计量学的重要组成部分,通过对论文关键词的分析,研究文献的内在规律,对期刊、人才及科研成果进行科学评价,揭示学科特点、结构及内在相关性;反映科研的研究热点和发展动向,对情报学、科学学等诸多领域的研究有至关重要的作用。本文以《中国科技期刊研究》(以下简称《研究》)为样本,统计了1990~2002年间刊载论文的关键词,并对其数量、种类、频次、内容及标引质量进行了分析。
2 结果分析
2.1 关键词数量统计
1990~2002年《研究》共发表论文1911篇(含1996、1997、1999、2001、2002年增刊),其中有关键词的论文1104篇,关键词4399个次。历年关键词数量分布见表1。
(详见附件)
注:篇均关键词数=关键词个次/附关键词论文数,(不含未附关键词的论文)。
从表1可以看出,在1990年创刊年中,《研究》发表的61篇论文均未附有关键词。1991年附关键词的论文有3篇,只占当年发表论文篇数的5.1%。1992年至1998年间附关键词的论文数占该年段发文篇数的27.3%。1999年附有关键词的论文比例有了明显的增长,达到了79.7%,是1992~1998年平均值的3倍。2000年附有关键词的论文占当年论文总篇数的91.3%,与1999年相比增加了11.6%。到2002年附有关键词的论文比例达到了95.4%。1991~2002年间,《研究》年篇均关键词数最低为3.4个,最高为4.7个,平均为4个。笔者还统计了1999~2002年《编辑学报》的论文关键词,4年中该刊分别发表论文104篇、91篇、158篇、196篇,共发文549篇,其中附有关键词的论文分别为85篇、91篇、157篇、193篇,共有526篇,所占比例分别为81.7%、100.0%、99.4%、98.5%。共有关键词1844个,篇均关键词为3.5个。《研究》篇均关键词数比《编辑学报》多0.5个,但附关键词的论文比例都低于同年度的《编辑学报》。说明《研究》虽然从1999年就已重视论文关键词的标引工作,但其程度还不够。中科协规定“没有关键词的论文应列入非学术论文类”。《研究》对登载的所有学术论文应都标上关键词。标关键词论文的多少和关键词个数的多少虽然不能说明期刊论文水平的高低,但可以反映期刊论文规范化程度。
2.2 关键词种类统计
按一般规则,选取关键词首先从论文篇名中选取,如从论文篇名中选取的关键词,不能完全反映论文的主题内容,还需从论文摘要或正文中选取。只从论文篇名中选取的关键词称为篇名关键词,从摘要然后再从正文中补充选取的关键词分别称为摘要关键词和正文关键词。统计《研究》1991~2002年共有篇名关键词2212个次,摘要关键词1093个次,正文关键词1094个次,其各年分布见表2。
(详见附件)
由表2所示,篇名关键词即占全部论文关键词总数的50.28%,摘要关键词占论文关键词总数的24.85%,正文关键词占论文关键词总数的24.87%。这表明,从检索的角度考虑,仅从篇名和摘要中选取关键词作为检索入口,只能检索到全部论文的75.13%,这对于文献信息检索的检全率及检准率来说,是不可忽视的问题。因此,对论文所附关键词进行种类统计分析,对于文献信息检索、参考咨询工作以及论文关键词的标引工作等都具有很重要的指导意义。
2.3 不同数目关键词的论文分布
在撰写科技论文时一般要求每篇论文选取3~8个词作为关键词。关键词提供的多少对揭示论文主题的程度往往有直接的影响:过少,对论文内容揭示不全,检索时造成漏检,会降低检全率;过多,会降低检准率。因此,关键词的标引数量隐含着一个标引深度的概念,适当的标引深度应该是在文献的检全率与检准率之间达到某种平衡。本文对附论文关键词较多的1999~2002年间不同数目关键词的论文分布作了统计,见表3。
(详见附件)
由表3可以看出,有2个关键词的论文26篇,占有关键词论文总数的2.95%,与笔者统计的1999~2002年《编辑学报》的2个关键词的论文比例3.23%接近;有3~5个关键词的论文780篇,占总数的88.54%,低于《编辑学报》的94.3%;有6个及以上关键词的论文75篇,占总数的8.51%,高于《编辑学报》的2.47%;《编辑学报》无标引7个及以上关键词的论文。由此可以看出,标引3~5个关键词的论文无论是《研究》还是《编辑学报》都占了论文的绝大多数,说明一般情况下,3~5个关键词基本能够满足一篇论文对主题内容充分揭示的要求,符合论文关键词选取数量的一般规律。从表3中也看出,《研究》中的极少数论文存在不足标引和过度标引现象,有待进一步规范。
2.4 不同数目关键词频次分布
一个关键词出现的频次等于附有该关键词的学术论文数。因此,一个关键词出现的频次越高,相关的研究成果数越多,研究内容的集中性就越强。《研究》1991~2002年共有关键词1562个,出现4399个次,其分布见表4。
从表4可以看出,《研究》关键词频次的范围是1~449。频次大于25(含25)的有20个关键词,占关键词总数的1.3%,频次计1214次,占总频次的27.6%,词均60.7次。可以认为,这些关键词表述的研究内容是《研究》十几年来研究的核心内容,在很大程度上影响着研究的前沿动态,揭示了研究内容之间的主要内在关系,体现了《研究》办刊宗旨。这20个关键词是:科技期刊(449)、编辑(105)、高校学报(67)、学术期刊(59)、期刊(51)、科技论文(50)、期刊质量(38)、引文分析(37)、医学期刊(37)、规范化(34)、审稿(34)、科普期刊(33)、期刊数据库(33)、参考文献(29)、核心期刊(28)、影响因子(27)、发展对策(26)、统计分析(26)、学术质量(26)、质量(25)。从这20个关键词的频次可以看出:一个研究领域的少量高频次的关键词,拥有该学科明显大的信息密度与知识密度,成为信息与知识需求者检索文献的重点,它们可谓该刊的核心关键词。
(详见附件)
频次少于10(含10)的关键词共有1503个,频次计2578次,词均1.7次。有1077个关键词频次为1,206个关键词频次为2。这些关键词的频次极低,这从一个侧面反映《研究》的研究内容具有明显的分散性。分散性的研究内容拓宽了学术研究的选题视野,有助于形成更多的研究生长点,促进研究内容甚至学科间的交叉、渗透、互容、互用,推进学术研究向更广泛的领域发展,如“影响因子”这一关键词,1997年首次在《研究》中出现,到2002年就成了该刊的核心关键词。还应当指出,有些频次极低的关键词如“信息网络”、“电子出版技术”、“网页制作”等,有可能反映学科研究的前沿动态,具有鲜明的创新性。
2.5 关键词内容分析
在本文研究范围内,1562个关键词分布在科技期刊工作的各个环节,报道内容涉及期刊编辑学、各学科期刊的研究与管理工作、期刊质量与改革创新、新技术应用与现代化、信息与知识传播、研究方法、论文及引文研究、作者读者及地区机构等。其中涉及期刊编辑学的关键词有445个,占关键词总数的28.5%,也就是说近1/3的期刊论文主题内容涉及科技期刊编辑学,这与《研究》的论文作者主要来自编辑出版单位密切相关。《研究》在报道各学科期刊研究成果方面也起了不可低估的作用,有关键词263个,1182个次,占总个次的26.9%。涉及医学、生物学、化学、物理学、农业、工业、地质、地理、环境等各学科期刊。对各学科科技期刊的研究,是从不同的学科侧面揭示科技期刊,是科技期刊研究向多侧面、多学科发展的重要标志。质量评价是我国科技期刊工作的重要研究领域,改革创新是提高期刊质量的有效途径。该刊涉及这方面的关键词有245个,825个次,这对我国科技期刊的发展和走向国际化起到了促进作用。随着计算机技术、通讯技术和网络技术的发展,以及网络期刊的兴起,科技期刊研究领域也有了拓宽,《研究》设有“新技术应用与现代化”专栏,涉及这方面的关键词有147个,343个次,说明该刊在报道新技术应用与现代化方面成绩斐然。涉及信息与知识传播方面的关键词有101个,209个次; 研究方法方面的关键词有72个,160个次;论文及引文研究方面的关键词有67个,271个次;作者读者及地区机构方面的关键词有166个,451个次;其他方面的关键词76个,95个次。
2.6 关键词标引质量分析
关键词标引是对文献主题高度提炼和概括的创造过程。简洁、准确的关键词使论文主题突出,一目了然,起到“画龙点睛”的作用。《研究》论文关键词的质量从整体来说较高,但从关键词的规范化程度来看,还存在以下几方面问题:①通用词标引过多。所谓通用词,是指那些没有独立检索意义的泛指词,如:发展(22个次)、问题(14)、现状(9)、影响(6)、原因(5)等。②标引深度把握不当。一是不足标引,如“SGML/XML在学术期刊电子出版中的应用与发展”一文(2000年2期102~104页),关键词只标了“学术期刊、电子出版”,而将论述的主题“SGML/XML”漏标了。二是过度标引,如“科研论著学术价值评估体系亟待建立”一文(2000年5期322~324页),关键词标有10个,即“科研成果、学术论著、学术期刊、评估体系、职称评审、首创性、科学性、合理性、可操作性、透明度”。笔者认为标引“学术论著、学术期刊、学术价值、评估体系、职称评审”5个关键词较为确切。③标引缺乏一致性。如“勿轻视SCI勿滥用SCI”一文(2002年1期1~4页)和“对SCI的认识和思考”一文(2002年1期5~8页),两文题名中都是用“SCI”,可是一文标引为“《科学引文索引》”,另一文标引为“SCI”,应一致起来,都标引“SCI”。④组配不当或不够。如“我国农业科技期刊现状分析”一文,标有4个关键词,“科技期刊、农业期刊、沿革、现状”(2002年5期387~389页)。笔者认为前两个词组配不当,应标引为“农业科技期刊”一个词更准确些;后两个词太泛指,欠组配,应标引为“期刊沿革、期刊出版发行现状”。
总之,《研究》的关键词涉及到与科技期刊研究有关的各研究领域,说明该刊具有科技期刊工作的专业属性。该刊及时反映了广大科技期刊编辑、出版、发行和研究管理工作者以及作者和读者的心声,是综合报道我国科技期刊研究成果的重要刊种之一。但针对关键词标引中存在的问题,希望期刊编辑人员在繁忙的工作中抽出一定的时间检查和修改作者标引的关键词,保证关键词的标引质量。提高了关键词的质量,也就等于提高了期刊的质量。
信息采集:朱莲音