大数据里的唐宋诗词世界

大数据里的唐宋诗词世界

大数据里的唐宋诗词世界 字体: 小 中 大 分享到: 大数据里的唐宋诗词世界 2022-03-31 10:06:29 来源:光明日报

人们习惯用史料来描述文学史的***状态,但在今天的大数据时代,我们不妨尝试用大数据来展示和验证,看透数据背后的文学史意义,从而反思数据中存在的问题,展望未来努力的方向。唐诗世界繁华在华茂,大数据可以带我们领略它的新风貌。

唐诗中的许多“比较好”

它是唐诗在***诗歌史上的比较好个高峰。据统计,从东汉到隋末的近600年间,总共只有5000多首,而到了唐代,诗歌数量***突破1万首,直接达到5万多首,达到了前所未有的高峰。与前八代唐诗相比,诗人数量增加了7倍多,从600多人增加到3000多人,无论是诗人还是诗歌都达到了前所未有的水平。300多年后,唐诗在唐代达到顶峰。当时有500多位诗人,近8000首诗。一首诗的影响力,可以根据历代诗选中选诗的频率、历代诗人评价的诗的频率、后人追求的诗的频率、当代学者研究的频率、网站记录和评论的诗的频率等数据,通过加权计算,在一定程度上进行评价。通过这种可量化的计算,我们可以把影响力***的视为名篇。在100首唐诗中,盛唐占了59首。唐代十大名诗中,盛唐占了八首。按名诗数量,盛唐十大诗人占了六位:杜甫、李白、王维、王昌龄、孟浩然、岑参。

宋词是***词史上的比较好个高峰。近1500字,21000多字。与唐五代相比,宋词使用的声调有700多种,词人的词作数量增加了十几倍,呈现出词风的丰富和整体面貌的繁荣。唐代五代词中,传世的只有文、、李靖、李煜,而宋代流传下来的有三百多个。人家有代代相传的字库,说明作品多,知名度高,社会需求大。资料显示,宋词在唐五代以后达到高潮,元代达到顶峰。当时有词人近200人,词作约4000首,是宋初和李青词作总数的两倍多。在100首***宋词中,元佑时期占了27首,居宋词六个阶段之首。

人们习惯于把宋词作为宋代文学成就的代表。其实宋词也是很重要的一部分。资料显示,宋代诗人创作的诗歌数量超过唐诗,达到新的高度,诗人9000余人,诗歌25万余首,是唐诗数量的5倍多。值得注意的是,宋诗的高峰也是在元佑时期,当时有1600多位诗人,相当于前两个时期诗人的总和;5万多首,比前两期的诗加起来还多7000多首;宋代十大名诗,此时有五首;苏轼、黄庭坚、王安石等有影响的诗人都生活和创作于这一时期。挚友陈艳说,唐宋诗歌史上有三个辉煌的高峰期,所谓“上元开元、中原元和、夏媛元佑”。数据证实了他的判断。

从诗人个体来看,唐诗宋词谁的作品最多?数据显示,白居易唐诗量排名比较好,近3000首;杜甫和李白紧随其后,都超过了千***关。到了宋代,辛弃疾的词作数量居首位,有六百多首,其次是苏轼和刘辰翁。宋诗篇数以陆游为主,达九千余篇,刘克庄、杨万里次之。

作品多的诗人、作词人影响力大、知名度高吗?根据综合影响力指数排名,杜甫是唐代***影响力的诗人,其次是李白和王维,而作品排名比较好的白居易则排在了十位之外。从宋代词人的数量和影响来看,辛弃疾、苏轼和周邦彦分别排在第二和第三位。苏轼在宋诗影响力上排名比较好,陆游紧随其后,其作品高居榜首。

“比较好”背后的文学史意义

数据不仅表明谁先谁后,还蕴含着更深层次的文学史意义。我们可以探索隐藏在背后的历史过程和变化动机,揭示规律性的知识。例如,通过考察和分析唐代***诗人崔豪的《黄鹤楼》的各种资料,我们可以发现,比较好接受者李白的评价和创作竞争发挥了重要作用。可见,除了自身的艺术含量,故事传播和意见***的评价也是名篇产生的重要因素。

数据可以具体显示诗人和作词人的声望。说到唐诗宋词中的***诗人,人们通常称他们为“杜丽”和“苏信”。似乎李由优于杜甫,苏生优于辛。但综合影响指数显示,杜甫高于李白,辛弃疾强于苏轼。更让人惊讶的是,最抢手的作词人不是苏信,而是周邦彦。在宋代名诗100首和300首中,周邦彦分别占15首和40首,远远高于苏和辛。王国维说“老杜一定是他笔下的(周邦彦)先生”,堪称高明。周济《宋四家诗选》也将周邦彦推崇为学词的***典范,所谓“问路碧山,过梦窗,修轩,以还清真味”。数据证实了周济的眼力。

数据可以清晰地显示出***作家影响力的时代变迁。自宋代以来,崔豪的《黄鹤楼》和苏轼的《赤壁怀古》影响千古,分别成为唐、宋诗歌中的比较好首。而的《幽州城楼上》和张的《春江花月夜》在明清以前影响不大,但在近代受到广泛关注,综合影响力排名靠后。岳飞的《满江红》和陆游的《卜算子咏梅》都是近代才被发现的名著。周邦彦在明清时期的影响远远大于苏信,只是在近现代由于文学价值观的变化而落后。

数据也反映了诗人的影响力和作品量之间的关系。杜甫和李白是比较好的诗人,辛弃疾和苏轼是比较好和第二位诗人。可以说影响力大的诗人作品量大,但不能说作品量大就影响力大。白居易的诗在唐代诗人中排名比较好,但综合影响力并未进入前十。陆游的诗比苏轼多一倍,但他的综合影响力却在苏轼之后。可见,代表作数量是成为有影响力的诗人的决定性因素。宋代诗人赵如腾《石屏诗序》说:“诗之传,不在能多行,而在能多行。精致的人很少。唐诗几百首,提炼的只有十几个人。只有几十个人选择他们精致的诗歌。而少陵、黄仙可数而精,故为唐诗人之巨擘。”苏、辛的代表作数量也印证了赵如腾的判断。

数据的“不可”与“可”

虽然数据可以在一定程度上描述和展示文学史的发展,揭示隐藏在历史背后的真相和意义,但数据也有明显的局限性。一是效度有限,只能说明文学史中的一些问题,不能有效解决所有问题。第二,可靠性有限。无论是人工挖掘还是机器自动提取,由于人的认知水平和技术水平的制约,数据的可靠性都会有所不同。

由于指标类型较少,目前衡量名著的数据并不完整,尤其是内生数据,需要不断挖掘和丰富。数据挖掘的难点不仅在于从哪里找数据,还在于找哪些数据。文学史上从来没有数据意识和数据存量。什么样的数据对于衡量一个时代或一个时期的文学繁荣程度,评价作家作品的质量有用且有效?这不仅是实际操作的问题,也是理论认识的问题。

大数据时代的文学数据需要分类分层,建立文学史数据的指标体系,保证数据的可靠性和有效性。可以探讨和讨论:除了作家作品数量的增加,还有哪些量化指标,尤其是内在指标,可以反映一个时代或一个时期文学的繁荣程度?在创作主体维度上,文学团体和文学流派的数量和规模是否应该作为衡量文学繁荣的指标?如何衡量作家个人和文学团体或流派的艺术贡献和文学史地位?在作品的文本维度中,如何平衡其思想情感内容和艺术审美内容?或许应该考虑以下三个层面:形式的层面,体裁的创新和丰富;内容,表现主体内在精神世界和外在社会生活世界的深度和广度;艺术水平、表达技巧的难易程度、艺术表现的完美程度等。只有有了完整的指标体系,才能找到发现数据的目标和途径,才有可能利用人工智能技术让计算机自动分析提取数据,不断扩大数据的种类和数量。在此基础上,通过计算机自动提取海量数据,可以不断满足大数据时代学术研究的需求。(作者:王兆鹏,国家社科基金重大项目“唐宋文学年代学系信息平台建设”首席专家,四川大学文学与***学院讲座教授)

【纠错】
  • 姓名:
  • 专业:
  • 层次:
  • 电话:
  • 微信:
  • 备注:
文章标题:大数据里的唐宋诗词世界
本文地址:https://www.55jiaoyu.com/show-280232.html
本文由合作方发布,不代表展全思梦立场,转载联系作者并注明出处:展全思梦

热门文档

推荐文档