Volume 2,Issue 9
Fall 2024
面向数字经济政策文本的新词发现方法研究
随着数字经济的快速发展,数字经济政策文本中涌现出大量新兴词汇,准确识别这些新词汇对于政策分析至关重要。传统的新词发现方法存在一定局限性,难以应对大规模文本和快速变化的技术词汇。本文提出了一种结合统计特征、规则基础和语义分析的无监督新词发现方法,旨在提升数字经济政策文本中新词识别的准确性。通过N-gram 建模、词性规则、改进互信息(PMI)和左右邻接熵等特征,并结合BERT 语义验证,本方法能够有效提高新词提取的精度和召回率。实验结果表明,所提方法在准确性和效率上优于传统方法,为数字经济政策的文本分析提供了一种新的技术工具,并为政策制定者提供了更加精准的分析手段。
[1] 师博,方嘉辉.数字经济赋能中国式新型工业化的理论内涵、实践取向与政策体系[J].人文杂志.2023,(1).
[2] 唐超,陈颖淇,胡宜挺.我国数字素养教育政策的演进脉络与结构特征[J].图书馆论坛.2023,43(11).
[3] 曹树金,曹茹烨.基于研究主题和引文分析的信息资源管理学科发展探究[J].信息资源管理学报.2023,(2).
[4] 陈光,钟方媛,明翠琴,等.地方政府创新政策工具偏好测量<br>—— 基于四川省政策文本的分析[J].科技进步与对策.2023,40(2).
[5] 曹玲静,张志强.政策信息学视角下政策文本量化方法研究进展[J].图书与情报.2022,42(6).
[6] 雷浩伟,廖秀健.省级政府大数据发展应用政策的规制导向与执行优化研究—— 基于政策文本的分析[J].公共管理与政策评论.2022,(2).
[7] 李川川,刘刚.发达经济体数字经济发展战略及对中国的启示[J].当代经济管理.2022,44(4).
[8] 潘琳,徐鸣.我国社区治理领域政策分析与评价研究—— 基于”过程— 工具— 内容”三维分析框架[J].理论学刊.2022,(6).
[9] 雷鸿竹,王谦.中国地方政府数字经济政策文本的量化研究[J].技术经济与管理研究.2022,(5).
[10] 张清慧,陈谊,武彩霞.基于词表示模型的领域文献数据可视分析方法[J].图学学报.2022,43(4).