一、项目实施情况:
(一)研究目标
本课题以“国际舆论中的中国扶贫故事”为研究对象,借助大数据信息获取与分析技术深入调查不同国家媒体、个体两方面的涉华扶贫文本,有助于对各国官方及舆论对中国扶贫攻坚的舆情做准确判断,分析各国不同的对华立场,具体目标如下。
1.学术目标
通过系统、科学的数据收集工作,打破传统的国际关系与公共外交研究与数据科学研究之间的学科壁垒,从学理上对美日韩涉华扶贫舆论进行理性、全面分析,并通过学术论文的形式考察美日韩民众针对扶贫议题不同态度背后的深层原因。
2.实践运用目标
通过建立给定时间内的涉华舆论数据库与语言文本情感分析体系,为未来与有关部门合作建立全天候的大数据舆情监控系统打下一定基础。同时课题研究将不止于亚太地区美日韩三国,在实践和技术方面的应用是带有未来前瞻性和延续性的,为后续在本课题的基础上针对不同语种、国家涉华舆论的研究提供路径建议。
3.服务决策目标
本课题的最重要目标之一是对接国家需求,为我国公共外交与舆论反馈提供有益见解。因此,课题通过专家深度访谈以及相关理论研究,构建“基于大数据的舆情与对公共关系精准决策理论模型”,尝试建立较为完整的决策制定与执行的闭合系统,以求充分发挥大数据技术的辅助性作用,推动整个外公共外交模式的完善与优化。
(二)研究过程
本课题的研究总体框架主要分为五个部分。
第一步,建立2020-2021年美日韩网络涉华扶贫舆论数据库并结合语言学、传播学知识进行批评性话语分析与归纳。
(1)舆论话语数据收集,梳理时间、事件、情感变化轨迹。
本研究基于LexisNexis学术数据库通过大数据爬虫技术爬取“中国扶贫故事”的相关报道,获取了《华尔街日报》《朝日新闻》《朝鲜日报》等美日韩媒体语料从2020年1月1日至2020年12月31日期间和2021年1月1日至12月31日之间报道字数在500字以上的有效语料共98万字符语料。并利用哈佛大学计算机社会科学中心加里·金(Gary King)创设的Crimson Hexagon(CH)平台结合国别进行Twitter、Instagram、YouTube等社交网络逾万亿份公开数据的可视化分析。
(2)分析不同时间阶段美日韩涉华扶贫舆论,综合大数据数据分析可视化、语言学、传播学,从多个角度研判美日韩对“中国扶贫故事”的不同立场。
针对媒体与个体在话语表达方式、内容、场景、情感、信息量等方面的差异,团队分别采用了不同侧重的分析方法。对于媒体,利用语料分割软件及数据可视化分析软件进行语料分析,通过索引分析、主题词共现分析、国际关系分析等方式,通过评价理论科学量化分析美国、日本、韩国主流媒体报导的“中国扶贫故事”,然后通过批评话语分析对国的报道进行分析。对于社交网络民众舆论,利用学术界公认批评性话语分析(CDA)领域最为系统、完善的FAIRCLOUGH社会文化分析法,进行文本层面、话语实践层面以及社会实践层面的探讨。
第二步,结合国际关系视角,探讨美日韩舆论中“中国扶贫故事”的不同立场成因,分析国际减贫合作及构建良好中国形象的机遇与挑战。
第三步,从扶贫地区入手,探究地方讲好扶贫故事模式,通过问卷调查、实地采访、数据分析等方式探讨以山东省临邑县前杨村为例的地方在扶贫故事讲述与传播的现状及现存问题,使地方扶贫故事保有特色,赢得更多受众的认同。最终在海内外得以推广,讲好全球治理中的中国扶贫故事。
(1)以山东省临邑县前扬村为例,客观分析国内扶贫宣传现状。
(2)为从内部讲好扶贫故事尝试提出建议。
第四步,分析中国当前对外舆论宣传、信息投放与公共外交的现状与不足。
为此,本部分将采用实地调研、访谈等研究方法,与工作在中国外宣、公共外交等领域一线的部门人员进行对话,了解国家最前沿的发展与最实际的需求,让课题研究成果能为国家发展做出贡献。
第五步,基于涉华扶贫美日韩舆论进行学理分析并对我国公共外交提出建议。
本课题基于在美日韩收集的信息与资料,从国际关系、国际政治语言学、公共外交理论等角度,形成针对数字背后的深层诱因的分析形成学术论文供学界讨论。同时,在对接国家需求的导向下针对不同部门的需要分别提出及时、有效的对策报告,帮助引导涉华舆论向着有利于我国的方向转变,推进对外关系的良性发展。
(三)研究成果
本课题共完成1篇结题报告,1次“挑战杯”竞赛省级一等奖,5次学术会议论文收录(4次国际学术会议,4篇EI检索,4次受邀作研究成果口头报告),1篇待发表智库报告(山东大学国际问题研究院),2篇调研报告,1次社会实践校级优秀团队(负责人因项目获省级先进个人)。详列如下:
结题报告1篇,《国际舆论中的中国扶贫故事——美日韩涉我扶贫政策的文本情感大数据分析》,将大数据技术与国际关系学、语言学、传播学结合,进行大数据技术下的美日韩涉我扶贫舆论分析并对构建国家形象、讲好“中国扶贫故事”、服务于公共外交提供建议。
竞赛1次(2个奖项),第十七届“挑战杯”学生课外学术科技作品竞赛,获山东省一等奖、校级一等奖,共青团山东省委等,团队成员吕紫烟为第二负责人,第一负责人姚寰宇参与指导本课题,2021.05。
社会实践获奖1次(5个奖项),调研报告1篇,其中,山东大学暑期社会实践“三农”专项“校级优秀团队”/“校级优秀指导教师”/“省级+校级先进个人”团队成员:张雯宇、吕紫烟、宋欣蔚、李星润,校级优秀指导教师:张景全老师,省级先进个人:张雯宇,共青团山东大学工作委员会/山东省教育厅等,2021.11。
待发表智库报告1篇,《日本“人权关切”制衡意图及我应对建议》,张雯宇、宋欣蔚,山东大学国际问题研究院,2022.05。
待EI检索论文4篇(获录用通知),Japanese Mainstream Media's Stance on
China's Efforts in Poverty Alleviation Based on Big Data(张雯宇,2022.02),A Comparative Study on the Evaluation Functions of Chinese and
Japanese Reported Speech Based on Big Data(张雯宇,2022.03),China's fight against poverty in the US Twitter perspective(宋欣蔚,2022.04),Analysis on the Image of China's
Poverty Alleviation Stories Reported by American Mainstream Media Based on Big
Data(宋欣蔚,2022.04)。
受邀国际学术会议口头报告4次,ICBDIE 2022(张雯宇,已进行),ISAIAM 2022(张雯宇、宋欣蔚,待举办),2nd International Conference on Digital Economy, Management and
Education(宋欣蔚,待举办)
四川省韩国学学术会议收录论文1篇,《韩国主流媒体的中国脱贫攻坚报道研究——以2020、2021年语料库批评话语对比分析为例》,李星润,2022.04。
案例调研报告1篇,《非国家行为体接力国际减贫事业的可持续发展之路——以国际农业发展基金广西农业综合发展项目为例》,张雯宇、吕紫烟,2021.11,在国际组织角度,探讨国际减贫合作的现状及未来困境与机遇,为推动中国走向国际中心,引领国际合作提供可行路径建议。
(四)研究心得
团队成员分别来自不同专业,涵盖文法工学,通过与团队成员的交流和磨合,每个人都能接触到很多本专业知识之外的宝贵知识。彼此之间想法的碰撞、思维的对话可以促使我们产生许多“顶尖”创意。经过彼此的交流学习到关于国际传播的背景知识和方法论,拓宽了国际视野;同时,借助“中国扶贫故事”这把钥匙,了解了许多关于我国对外国家形象构建的现状,意识到当前增强我国国际话语权的迫切需要;更加重要的是,我们可以为国家的对外传播提出自己的思考和对策,为国家的发展贡献青年力量。
诚然,学术的道路上也会遇到挫折。我们在方法运用、理论分析等方面仍然存在不足和缺陷,在深层次的问题研究过程中常常举步维艰。但是,在院校老师、前辈的帮助下,我们少走了许多弯路,也突破了许多瓶颈,我们的研究过程中也有数不尽的“巨人肩膀”助力我们“攀登”。
科研训练是一场学术的提升,也是一场心性的修炼。通过一年项目锻炼,我们收获满满,明白了不仅要坚守“创新”的宗旨、“训练”的初衷,还要不忘“严谨”的态度、“务实”的作风。我们会继续“修炼”,期待早日为国家的发展贡献一己之力。
二、项目创新点与特色:
(一)创新之处
1.问题选择方面
通过文献梳理可知,当前国内学术界对大数据的研究主要集中在大数据时代到来的意义、大数据对国家外交模式转变带来的影响以及大数据给国家和个人带来的风险问题。对于文本情感分析技术也多应用于产品评价、商业及文娱产品的分析之上,但很少有学者将有关技术手段运用到实际问题解决或案例分析,而国外已有大量学者将大数据预测、大数据信息抓取等应用到恐怖主义事件预测、对他国网络舆情的民意调查等具体案例当中。因此,本课题的选题以文本情感分析为基础将大数据与公共外交模式的优化真正相结合,通过对国外民间涉华信息跟踪与实时更新、分析和预测等方式,建立一个信息共享和处理平台,同时将大数据技术创新性嵌入到当前公共外交工作当中,在科学调查的基础上提出具有实操性的政策意见,极具现实意义。
2.学术观点方面
本课题在学术观点上也具有突破性。传统公共外交强调政府机关或者具有政府背景的组织或群体对他国民众进行本国政策解读和宣传,目的在于提高本国软实力,改善本国的国家形象。主要依托路径多为传统方式,例如领导人发言、传统大众媒体的宣传(报纸、电视、广播)、组织文化交流活动、孔子学院等,虽然随着互联网时代的发展,我国相关政府部门也顺应潮流采取了网络媒体外交等方式,但依然无法达到预期的效果。国外民众对中国总体印象以及与中国相关的国内外事件都存在不同程度的认知偏差或偏见。因此,本课题认为,在大数据时代,我们从科学视角看待我们面对的目标群体,通过数据收集,将不同的观点进行量化与分类,让我们可以在真正了解“他者”的基础上消除对方疑虑与偏见,提升我国的国家形象。
3.研究方法与分析工具方面
本课题采取大数据技术与文本情感分析的研究方法,具有鲜明的跨学科的特点。融合了国际关系、语言学、计算机科学等多个学科的研究方法和研究技术。传统的研究方法多采用定性分析、案例分析,在此基础上学者会基于历史规律或传统经验、一般性理论进行论证分析,具体的方法一般针对个别人群采取随机问卷调查等小数据方法,这种方法具有随机性或偏差性,不能完全反映出他国民众全部的观点或看法,因此本课题将其作为辅助手段。
但在大数据时代,本课题不采用随机分析法这样的捷径,而是囊括所有数据,通过R语言、Python、Stata等专业软件,利用感情词典等工具,力求通过最客观的方式呈现出给定时间网民的涉华
扶贫舆论动态,以此为基础探寻其背后的逻辑关联,为有关部门提供准确咨询建议。
4.话语体系方面
本课题尝试通过大数据改变传统公共外交的思维习惯以及优化工作方法。传统公共外交思维定势是一种传统假设驱动型范式,通过假设进行研究,强调线性的因果关系,只考虑少量变量的运动和互动,倾向于只收集对自己假设有利的证据,刻意回避对自己不利的证据,导致了最后得出与客观实际相背离的结论的可能,在一定程度上使得公共外交效果达不到预期目标。但本课题试图充分利用大数据的优长,在决策的每一个阶段均进行不同形式和不同内容的创新,以提高应对复杂多变的国际形势的能力,展现更为积极、主动的大国外交特色。具体途径为确立定性和定量相结合的综合决策模式,试图通过现有技术利用仿真实验室对外交决策方案全方位模拟。
(二)项目特色
1.研究视角方面的突破
经过对国内外文献的梳理可知,当前国内学术界对大数据技术的研究视角依然停留在国内政府治理模式、地方政府治理模式以及在政府治理过程中可能会遇到的一些瓶颈问题的研究。目前还缺少如何真正的将大数据技术应用到外交决策制定、国际事件预测与风险评估等问题领域。
因此,本课题的研究视角将着眼于文本情感分析对舆论进行分析的技术在公共外交领域的应用,切实将大数据技术运用在对外舆论管控与监测、对美日韩民众的涉华扶贫言论进行舆情监测、有针对性地进行公共外交等方面,以发挥大数据在对外舆论监测和公共外交科学决策方面的重要作用。而监测的根本目的是为了实现公共外交的决策精准。
2.研究内容方面的突破
目前国内学界对大数据与外交政策、公共外交方式改革相结合等方面的研究比较多,但都是基于一般性的讨论,而没有真正将大数据技术应用到目前的实际问题解决当中。本课题主要从四个方面的内容实现对大数据实际问题应用中的突破。
(1)以文本情感分析建立的大数据科学方法在推动我国公共外交决策模式改革领域的紧迫性。本课题首先分析当前在新的国际形势下我国公共外交决策模式的改革与转型势在必行,同时突出大数据在舆情监测、分析和预测方面的突出优势,大数据在提升公共外交政策精准施策与快速响应的重要性,同时也警惕大数据在外交领域存在的法律和政治的双重风险。
(2)以大数据技术的真实性、客观性改善以往外交决策较多主观色彩浓厚的特点。在当前十分严峻的国际舆论压力的情况之下,夯实民意基础,完善我国公共外交工作与方针政策的重要性。而充分利用大数据技术应用能够弥补当前传统公共外交工作的不足。
(3)以大数据技术的准确性、全面性完善在具体信息收集、分析与预测领域的核心性。本课题还集中探讨了文本情感分析的研究方法与实操路径,在了解具体技术是什么的基础上进行深入研究,对大数据技术的信息挖掘工具、大数据的模型建构等跨专业领域进行更深层的探讨,能够将大数据技术真正应用在实际问题的解决与探索之中。
(4)以大数据技术的科学性发挥其在公共外交实践中的全面辅助性作用。本课题将大数据技术内嵌到公共外交的模式创新中,包括公共外交的主体言论管控、路径选择、目标对象信息的全面把握、实现公共外交决策机制的优化等方面,实现公共外交的精准化与科学化,促进公共外交资源的合理配置,以达到高质量精准施策。
3.研究方法方面的突破
传统的公共外交研究方法多采取案例分析或者小样本分析,随着信息爆炸时代的来临和互联网世界的建立,网民数量不断增加,新的舆情时代正在出现。在此背景下,面对海量的信息,利用小样本随机抽查的研究方法已经远远不能满足现实需求。
(1)“大数据”与“文本情感分析”实现定性与定量的结合。
文本情感分析(sentiment analysis),又称意见挖掘、倾向性分析等,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分析作为分析文本的主要技术之一,可作为分析国际对于中国扶贫的必要手段及技术支持。面向涉华扶贫文本的情感分析主要包含情感信息检索、情感信息抽取、情感分类、情感归纳四大任务,实现对涉华扶贫文本倾向等主观性文本进行分析与挖掘,进而获取倾向性和话题等重要信息。大数据(big data)技术,即针对无法在一定时间内用常规方法进行、管理的处理的数据的技术。以文本情感分析技术对性质、特点的注重,与大数据技术对逻辑的分析和推断,实现定量与定性方法的结合,兼顾严谨性(rigor)与实用性(relevance),既反对过度数字化和模型化,也推动学术研究在研究方法上的阶段性探索。
(2)文本情感分析可实现国外涉华舆论给定时间内较为全面的样本收集。
大数据在最大范围上对全体数据进行研究,通过大数据关联对全部数据进行具体操作分析,能够处理复杂巨系统下的相关问题。它重视每一个数据,强调收集数据的全面性,重视非标准化数据,承认数据的模糊性、无限性、复杂性和不确定性。
(3)文本感情分析与网络爬虫程序的结合可实现国外涉华舆论的全天候监测。
大数据以一种全新的视角观察数据,通过追踪和记录事件全部过程的数据,发现变量之间的各种联系。在数据收集的基础上,建立专业性数据库,依托专业性设备和技术实现对舆论的全天候监测,
(4)通过大数据汇集整理出的结果,可实现对国外涉华舆论的全方位预测。
预测和决策是国际政治最重要的主题之一,也是大数据与国际政治结合的关键性层次。大数据可以通过建立预测模型,对国外涉华舆论趋势走向进行预测,为精准化决策提供分析支持。
(5)文本情感分析与网络爬虫技术可实现公共外交政策的高精度模拟实验。
基于美日韩社会的大数据舆情模型与大数据行为主体画像,可以高精度模拟出公共外交政策的施策效果与舆论反响,在事前促进政策不断完善,保障精准施策。
(6)将美国、日本、韩国三国综合对比研究,实现我国扶贫舆论的典型重点观测。
首先,美国作为能够引导全球涉华舆论的关键国家、西方世界文化阵营的领头羊,具有塑造对华扶贫舆论环境的较强能力和较大基础;日本、韩国作为美国在东亚地区的盟友,对华认知存在依赖美国但又逐渐靠近中国认同的两面性。针对不同类型且对中国改善国际舆论环境有重要代表性的国家舆论进行对比分析,有助于对我国对扶贫舆论进行较为立体、全面的把握,同时对于冲破西方主导的话语体系有重要意义。
三、项目成果:
项目申请书中的预期成果及成果提交形式
公开发表论文:2(篇),专利:0(项),调查报告:0(份),软件、著作:0(份)实物:0(件),竞赛获奖:1(次),其它:学术会议稿件收录
项目结题时取得的成果
公开发表论文:4(篇),专利:0(项),调查报告:2(份),软件、著作:0(份)实物:0(件),竞赛获奖:2(次),其它:调研实践获奖5项,学术会议收录1次,智库报告待发表1篇
项目主要研究成果情况
序号 | 成果名称 (获奖名称及等级) | 成果形式 | 作者(获奖者) | 出版社、发表刊物 或颁奖单位 | 时间(刊期) |
1 | 第十七届“挑战杯”学生课外学术科技作品竞赛-山东省一等奖 | 竞赛 | 姚寰宇、吕紫烟等 | 共青团山东省委、山东省科学技术协会等 | 2021.05 |
2 | 第十七届“挑战杯”学生课外学术科技作品竞赛-校级一等奖 | 竞赛 | 姚寰宇、吕紫烟等 | 共青团山东大学(威海)工作委员会 | 2021.04 |
3 | 山东大学暑期社会实践“三农”专项-校级优秀团队/校级优秀指导教师/省级+校级先进个人 | 竞赛/调研报告 | 张雯宇、吕紫烟、宋欣蔚、李星润/张景全老师/张雯宇 | 共青团山东大学工作委员会/山东省教育厅等 | 2021.11 |
4 | 日本“人权关切”制衡意图及我应对建议(待发表) | 智库报告 | 张雯宇、宋欣蔚 | 山东大学国际问题研究院 | 2022.04 |
5 | A Comparative Study on the Evaluation Functions of Chinese and Japanese Reported Speech Based on Big Data | 论文收录/发表 | 张雯宇 | ISAIAM 2022-Conference Proceedings(EI) | 2022.03 |
6 | 韩国主流媒体的中国脱贫攻坚报道研究——以2020、2021年语料库批评话语对比分析为例 | 学术会议论文收录 | 李星润 | 第三届四川省韩国学学术会议 | 2022.04 |
7 | 非国家行为体接力国际减贫事业的可持续发展之路——以国际农业发展基金广西农业综合发展项目为例 | 调研报告 | 张雯宇、吕紫烟等 | 无 | 2021.11 |
四、研究体会和心得:
课题开展前,团队成员对项目提出了自己的构想,共同目标为,融合各自专业知识,尤其是将大数据信息获取与处理分析技术运用至国际关系学、语言学及国际传播学中,尝试为我国的对外宣传与形象构建提供自己的力量,实现国际针对我国舆论的典型重点观测。为此,我们与指导老师及相关领域专家学者进行广泛沟通及请教之后,我们决定立足于“扶贫故事”,从美日韩三国入手,以小见大。
但在项目实际开展过程中,团队遇到了未曾预料到的困难。如在大数据信息搜集阶段,许多交互平台存在限制,无法简单在短时间内获取大量数据。于是团队一方面改进代码,多次向机电与信息工程学院专业老师及研究生学长学姐请教;一方面寻找可利用的网络平台,以提高信息搜集效率。
在成果撰写的过程中,我们邀请了多位相关研究领域的指导老师,为论文修改提出指导意见。在此特别感谢张景全老师和武鹏老师为项目全程提供的指导与帮助;感谢徐海娜老师在智库报告撰写中提供的鼓励与支持;感谢王之佳先生、胡正跃大使、唐世平教授对项目提供的专业建议;感谢冯亚松学长、尹胜楠学姐、张柔怿学姐提供的传播领域最新动态……
科研训练是一场学术的提升,也是一场心性的修炼。通过一年的学习,我们明白了不仅要坚守“创新”的宗旨、“训练”的初衷,还要不忘“严谨”的态度、“务实”的作风。团队会继续“修炼”,期待早日为国家的发展贡献一己之力。希望在今后的科研过程中,我们还能有机会再次合作!
五、经费使用明细情况:
项目获批总经费:10000(元),项目实际投入经费:10000(元),实际使用资金:10000(元),结余资金:0(元)
项目经费开支情况
名目 | 用途 | 金额(元) | 备注 |
论文版面费 | 论文版面费及学术会议注册费 | 9600 | |
专利申请费 | | | |
调研、差旅费 | | | |
打印、复印费 | 资料打印及社会实践相关宣传费用 | 100 | |
资料费 | 书籍、文献查阅 | 300 | |
试剂等耗材费 | | | |
元器件、软硬件测试、小型硬件购置费 | | | |
其它 | | | |