首页出版说明中文期刊中文图书环宇英文官网付款页面

基于数据整合的产业链、创新链、人才链、资金链整合机制探索与实践

王 俊喆, 曾 博群, 赵 刚, 朱 迪
北京大学 光华管理学院

摘要


产业链、创新链、人才链与资金链数据分散异构,制约战略情报融合。本文提出基于领域特定语言(DSL)的模
块化多链数据整合机制,通过“接入—清洗—转换—拼接—建模”五阶段流程,利用 DSL 配置引擎驱动流式处理自动化接
入与标准化建模,并基于 Flink、Kafka、Doris 等平台构建可视化配置与灵活调度框架。仿真实验表明,相较传统 ETL 方法,
执行时间平均节约 40% 以上,拼接精确率与召回率均超 93%,数据缺陷修复率显著提升,扩展性能接近线性增长,为数字政府、
区域情报及科研管理平台提供了可复用技术范式。

关键词


数据整合;领域特定语言;数据建模;自动化处理

全文:

PDF


参考


[1] 冯建梅 & 李晨光 . (2023). 科技人才链数据融合与可

视化分析 . 现代情报 , 43(6), 36–42.

[2] 黄如花 . (2022). 异构数据整合中的语义冲突与解决

机制研究 . 情报杂志 , 41(4), 19–24.

[3] 刘则渊 & 赵宏 . (2023). 基于语义融合的多源数据整

合模型研究 . 情报理论与实践 , 46(4), 21–27.

[4] 王贇 & 张宏 . (2021). 面向政务数据流的 DSL 建模方

法研究 . 电子政务 , (6), 88–94.

[5] 张建平 . (2021). 区域知识服务体系的数据整合机制

研究 . 情报理论与实践 , 44(5), 67–74.

[6] 张晓林 . (2021). 数据驱动的国家知识治理与战略情

报体系建设 . 图书馆论坛 , 41(5), 18–24.

[7]Chen, Y., Zhang, Q., & Wang, H. (2021). A data-driven

method for innovation path discovery based on multi-source

integration. Scientometrics, 126(4), 3421–3440.

[8]Hudak, P. (1998). Modular domain specific languages

and tools. In Proceedings of the 5th International Conference on

Software Reuse. IEEE Press.

[9]Mernik, M., Heering, J., & Sloane, A. M. (2005). When

and how to develop domain-specific languages. ACM Computing

Surveys, 37(4), 316–344.

[10]Stonebraker, M., Çetintemel, U., & Zdonik, S. (2005).

The requirements of real-time stream processing. ACM SIGMOD

Record, 34(4), 42–47.

[11]Xu, Y., Wang, J., & Liu, Z. (2020). Task-oriented data

federation in strategic intelligence systems. Information Processing

& Management, 57(6), 102384.

[12]Zhai, W., Wu, M., & Feng, J. (2022). Analysis of

industrial product quality problems based on knowledge graph

reasoning. In Proceedings of the International Conference on

Computer Science and Communication Technology (ICCSCT 2022)

(SPIE Vol. 12506, Article 2662045). SPIE.




DOI: http://dx.doi.org/10.12361/2661-376X-08-01-175589

Refbacks

  • 当前没有refback。