山东省大学生创新创业训练计划平台

您所在的位置：中期检查 >> 查看详细

一、项目进展情况及取得成果
项目进展情况：按计划进行
主要研究阶段(起止时间)	研究内容	完成情况
2021年5月上中旬	前期准备	已完成
2021年5月中下旬-2021.6月上旬	资料搜集与数据补齐	已完成
2021年6月中下旬	总体框架设计与结构分解	已完成
2021年7月至2021年10月	数据分析	已完成
2021年11月	中期整合	已完成
项目研究成果（已取得的成果）
序号	项目成果名称	成果形式

二、项目中期报告

（一）项目研究的主要进展和成果

科研立项进行过程中，团队成员于以下几方面对项目进行推进：

1.MRIO、SDA、SPA等方法的系统学习

环境扩展型多区域投入产出法（MRIO）可以追踪国家和全球供应链，反映各国家及区域间的相互依赖关系，有利于制定更合理的贸易或环境保护战略；结构分解分析(SDA)可以将因变量的变动分解为各有关独立自变量的多种形式变动之和，以考察自变量对因变量变动的贡献；结构路径分析(SPA)常与环境扩展型MRIO模型相结合来分析供应链层面的隐含流研究。在科研立项前期，指导老师带领小组成员对MRIO、SDA、SPA进行系统学习；在学习过程中，小组成员对多种科研方法形成了初步了解，便于后续科研立项的进行。

2.对增加值、多区域投入产出法（MRIO）相关中外文献进行总结综述

围绕本次科研立项“增加值”“投入产出”等立足点，小组成员于“Web of Science”、“ELSEVIER”、“中国知网”、《中国工业经济》等一系列中外数据库及期刊中搜索近三年相关文献，并在小组会议中进一步对涉及到的文章进行汇总分析，从文章使用方法、文章数据分析角度、文章政策提出角度等等一系列着眼点阅读文章，总结经验，并选取优秀文章进行总结模仿。

3.确定研究方法“多区域动态投入产出法”（DMRIO）

在指导老师的方向建议下，小组成员对多区域动态投入产出方法进行中外文献搜索，并且对收集到的文献进行学习分析，最终选定文章《Multi dynamic interregional input output shift share model theory and application》中涉及的DMRIO方法进行学习研究。文章中的DMRIO方法综合shift-share方法、SDA以及多区域投入产出表，将中国国内、一带一路、世界其他地区的经济增长分解，分别研究其影响因素。

4.DMRIO方法研究、数据计算

在确定加入动态研究对MRIO、SDA方法进行升级后，团队成员对DMRIO方法进行详细研究，完整了解DMRIO方法内涵及计算步骤。此后，团队成员利用Eora数据库数据，编程实现对中国国内、一带一路、世界其他地区的DMRIO计算。Eora26数据库作为全球投入产出数据库，每年的数据均包含有189个地区、26个部门、6个最终需求类别以及2619个不同来源的环境元素数据。

5.机器学习的初步研究

作为机器学习的一种方法，图挖掘（Graph Mining）是指利用图模型从海量数据中发现和提取有用知识和信息的过程。在指导老师的建议下，小组成员从图挖掘算法分类的角度出发，对图挖掘算法中的图的分类、不确定图的挖掘、图匹配、图中关键字查询、频繁子图挖掘、显著性子图挖掘、密集子图挖掘等等算法要点进行初步了解与总结，并以频繁子图及密集子图为重点进行相关文献总结综述。

（二）是否完成预期研究计划

团队成员综合考虑自身情况及科研状况，稳步推动科研进程，完成预期研究计划。

（三）项目开展过程中的重难点及问题

重点：

1.文献综述的跟进。“站在前人的肩膀上”才能更好进行科研工作。本次科研立项过程中，文献的及时更新为团队成员了解方法、开拓思路带来极大的帮助。

2.科研方法的更新。保持方法的先进性可以在一定程度上保证科研立项的质量。本次科研立项在对中外文献数据库相关文献持续更新的前提下积极更新传统SDA、MRIO及SPA方法为DMRIO与机器学习图结构挖掘，是保证科研质量的重要途径。

难点：

1.新方法的学习。在新方法的探索过程中，团队成员在方法理解、方法计算等各种层面均遇到了困难，方法部分也成为本次科研立项花费时间最长的部分。

2.相关算法代码的编写。在完成对方法的研究后，团队成员在对数据的处理过程中面临较多困难。由于多区域投入产出数据库Eora的数据量较大，Excel、SPSS等软件较难对其进行数据处理，团队成员选择利用Python Pandas包进行方法计算。在编程过程中，编程的不熟练也使得团队成员耗费了较长时间。

三、经费使用明细情况
项目获批总经费(元)	已使用项目研究经费(元)	已报销金额(元)	未报销金额(元)
10000	300	200	100
项目经费开支情况
名目	用途	金额(元)	备注
论文版面费	无	0	无
专利申请费	无	0	无
调研、差旅费	无	0	无
打印、复印费	打印报告	300	无
资料费	无	0	无
试剂等耗材费	无	0	无
元器件、软硬件测试、小型硬件购置费	无	0	无
其它	无	0	无

四、项目后期具体工作计划

（一）后续研究计划

动态多区域投入产出部分：

1.多区域动态投入产出（dynamic MRIO）数据完善

目前多区域动态投入产出的方法部分大体研究完毕，利用Python编写代码，并综合运用Shift-Share和SDA方法进行分解研究，计算出中国国内、一带一路与世界其他地区互相间的经济影响。下一步将进行数据的校对与完善。

2.加入环境变量

团队成员将基于之前研究的跳板对DMRIO进行研究创新，在DMRIO中加入环境变量，探究一带一路倡议下二氧化碳等污染物三大区域之间流量关系及其变化的影响因素。

3.数据分析

根据分解研究我们对增加值分解为八项，并分行业分年份进行比较分析，研究哪些项对增加值的增长有显著作用，并解读其背后的经济意义。接下来也将环境变量，根据二氧化碳等污染物在不同区域之间的流量关系，为碳减排提出针对性的建议。

4.撰写论文

根据研究数据，研究成果将以论文的方式进行呈现。

机器学习部分：

1.根据所需图挖掘算法寻找便于学习的相应代码以及程序包

经过对图挖掘算法的初步了解后，了解到图挖掘算法中的频繁子图和密集子图对于项目的研究有一定帮助，初步选定应用密集子图进行一带一路中国家之间的社团划分、寻找主要社团关系，应用频繁子图来确定长期情况下国家和集团之间关系的变化。由此，团队选定频繁子图与密集子图作为下一步的算法重点研究对象。为了便于使用频繁子图挖掘与密集子图挖掘进行研究，团队成员需要找到图挖掘算法的C、Java或Python对应代码或计算图挖掘算法的Python算法包，为下一步的研究做铺垫。

2.应用寻找到的代码以及程序包进行数据计算

理解并学习搜集到的代码或程序包，将代码化为本项目可用的形式，基于投入产出表数据，对一带一路及全球碳流量数据进行计算和分析，主要进行密集子图挖掘和频繁子图的挖掘，对碳净流动网络进行构建并挖掘出碳流量的主要社团关系，方便下一步的分析。

3.进行数据分析

由上一步的数据计算结果，分析研究数据。分析碳流动网络的主要特征和社团关系的特征，并结合多区域投入产出等方法进行原因的分析。

4.撰写论文

整理所得到的数据结果和分析结果，根据研究数据撰写论文。

（二）后续研究重难点

动态多区域投入产出部分：

1.数据完善

由于代码和DMRIO方法过于复杂，引入环境变量之后数据的完善需要耗费较大精力。

2.环境变量的加入

环境变量的加入是本研究的创新点，对于团队成员而言是新的课题，必然会遇到许多的困难与挑战，需要团队成员耗费较多精力研究方法，并深入研究如何将方法用到实际。

3.数据分析角度选取

作为论文的重点部分，数据分析的重要性毋庸置疑，而数据分析的角度无疑决定着论文质量。如何全面而新颖地分析数据，也是小组成员必须面对的问题。为此在后续研究中团队成员要多读文献，不断学习别人的分析角度，并以此进行思考与创新，形成自己的分析角度。

4.政策提出

科研结果必须落到实处，而政策的提出是科研的最终落脚点。找准落脚点，科研结论才不至于成为空中楼阁，这也是进行科研的最终目标和现实意义。根据研究得到的结果，团队成员要联系现实，提出一些解决现实问题的政策建议。

机器学习部分：

1.代码和程序包稀缺，查找较为困难

一方面，团队成员对图挖掘算法的了解比较初步，频繁子图挖掘和密集子图挖掘相关的资料较少，相较于其他常规方法较难获取相应教学资料，给成员的深入学习造成了一定的困难。另一方面，作为一个资料较少的机器学习算法，图挖掘算法的代码和数据包比较难寻找，为代码的学习也造成了一定阻碍。

2.代码修改以及数据计算需要反复试错

团队成员不仅需要时间学习新算法，同时也需要大量的试错计算数据结果。图挖掘算法的资料和符合学习要求的代码相对较少，在进行实践运行和数据计算的过程中势必会产生许多问题，因此在算法使用和代码修改中需要反复试错和修正。

3.数据分析角度选取

数据计算是数据分析的基础，只有找到正确而切实的分析角度才能发现问题。因此，在数据计算后的数据分析过程中需要找到合适的角度进行分析。

五、指导教师意见

附件：未上传

主办单位：山东省教育厅高等教育处技术支持：南京先极科技有限公司