随着信息技术迅猛发(fā)展,新型信息分(fèn)析技术(shù)被应(yīng)用到政治学研究中来。许多政治(zhì)学(xué)研究者采用当前比较成熟的大数据(jù)爬取、大数据文本分析等技术,获取新的研究素材并进行分析整理。同时,以亿万(wàn)为(wéi)量级单位的大数据本身(shēn)就具有政治学研究价值(zhí)。可(kě)以说,大数据为政治学带来研究方法上(shàng)的创新(xīn),也进一(yī)步拓展了政治学研(yán)究领域。
基于大数据对网络民意进(jìn)行研究。网络上有许多现成数据可(kě)以用于对网络民意和政府部门(mén)回(huí)应进行研究。一(yī)些政治学研究(jiū)者常把两类网络大(dà)数据用作(zuò)分(fèn)析素材:一类是政府网络(luò)问(wèn)政平(píng)台上的群众留言及相关部门回复(fù)信息(xī),另一类是主流媒体网(wǎng)站以及(jí)微博、微信等社交媒体平台上的网民发帖信息(xī)。这些数据都可(kě)通(tōng)过数据爬取技术直接获取。第(dì)一类数(shù)据经过分析处理后(hòu),可以反映群众关注的议题类型分(fèn)布、政府(fǔ)相(xiàng)关部门回应的特点(diǎn)和(hé)问题解决程度(dù)。还可以进(jìn)一步(bù)分析特定类(lèi)型群体(tǐ)在什(shí)么时期大致提出(chū)哪(nǎ)些类型的诉(sù)求。第二类数(shù)据主要(yào)用于分析网民对某一具(jù)体事件的看法和态度。对(duì)微博(bó)等社交(jiāo)媒体的数据分析,不仅关注具体话题,还将话(huà)题和情感、偏好等因素分(fèn)析相结合,呈现网(wǎng)络民意对某个具(jù)体事件的态度演变(biàn)过程及影响网络民意变化的具体因(yīn)素。可以说,网络大数(shù)据的应用极大丰富(fù)了政治学对网络民(mín)意的研究方式。
对文本转换后的(de)大数据进行(háng)分析。在网络大数据之后,研究者(zhě)尝试挖掘(jué)其他非(fēi)现成的、更具独(dú)特性的大数据信息。这类信息(xī)主要有两种,一种是从(cóng)公开平台获取的大数据文本(běn)。这类数据通过数据爬(pá)取技术获得,但发(fā)布这些数据的(de)平台并非(fēi)人人皆知,需要研究者去搜寻。目前,政治学研究者较(jiào)多(duō)关注并取得研(yán)究进(jìn)展的大数据主要有:从裁判文书(shū)网获取的(de)司法大数据,从人大代表的议案建议库和(hé)政协委员(yuán)的提案库中获得的文本大数据等(děng)。随着政府信息公开力度加大,这类(lèi)可供研究的信息(xī)资(zī)源会越来越丰富(fù)。另一种数(shù)据需要先(xiān)进行文本(běn)转换才可使用,如对(duì)历史资料的研究。相当数量的历史资料是以图片形式(shì)而(ér)非文本形式存在的,这就需要通(tōng)过(guò)识(shí)别技术(shù)将图片信(xìn)息转换为文字文本,然后进行大数据分析。这类数据的获取难度较高,不过一旦形成(chéng)数(shù)据库,对政治学研(yán)究(jiū)则(zé)有较大帮助。
大数据为政治学提供新的研究素材和分析(xī)技术(shù),但并未改变政治学研究(jiū)的本质(zhì)。面对层(céng)出不(bú)穷的新素(sù)材(cái)和新(xīn)工具,政治(zhì)学研(yán)究者需要保持清醒头脑,不能陷入对数(shù)据和方法的盲目追求中。同时,应结合政治学研究本身(shēn)的(de)特点,发挥大数据技术优势,推动(dòng)信(xìn)息(xī)技术在政(zhèng)治学研(yán)究(jiū)应用中取得(dé)更(gèng)多突破。一是开发更多样化的大数据类型。目前,政治学研究分析的大多是文本形式的大数据。文本信(xìn)息只是浩瀚信(xìn)息世界中的一种(zhǒng),还有图片、音频、视频等大量信(xìn)息类(lèi)型有待开发利用。这(zhè)些类型的大(dà)数据有的在商业(yè)领域已有较成熟的(de)应用(yòng),研究者可考虑以合适方式将其应用(yòng)于政治学研究。二是探索(suǒ)更前沿的大数(shù)据分析技术。现(xiàn)有的分(fèn)析技术还离不开人工标注,需要政治学研究者从大数据中抽出很(hěn)小一部(bù)分(fèn),对这部分(fèn)数据(jù)进行人工阅(yuè)读和(hé)标注,然后利用机器学习的方法,让计(jì)算机基于人(rén)工标注的数据去分析剩下的大量(liàng)数据,尝(cháng)试(shì)得出相(xiàng)应结论。由于人工标注的(de)数量不等,分析的效果也参差不齐。在文本(běn)挖(wā)掘上,需(xū)要进一步开(kāi)发(fā)更先进的技(jì)术。三(sān)是实现更复杂(zá)的大数(shù)据分析目标。现有的大数(shù)据分析主要是对数据所(suǒ)体现的政治现象进行描(miáo)述,尚未具备解释政治现(xiàn)象(xiàng)、发(fā)现运行规律(lǜ)以及(jí)进行(háng)预测的功能,这需要更进一(yī)步的技术(shù)支(zhī)持和研(yán)究(jiū)突破。从(cóng)这个角度看,大(dà)数据(jù)的(de)开发利(lì)用在政治学(xué)研究领域还有更为广阔的发(fā)展前景(jǐng)。