基于数据整合的产业链、创新链、人才链、资金链整合机制探索与实践
摘要
块化多链数据整合机制,通过“接入—清洗—转换—拼接—建模”五阶段流程,利用 DSL 配置引擎驱动流式处理自动化接
入与标准化建模,并基于 Flink、Kafka、Doris 等平台构建可视化配置与灵活调度框架。仿真实验表明,相较传统 ETL 方法,
执行时间平均节约 40% 以上,拼接精确率与召回率均超 93%,数据缺陷修复率显著提升,扩展性能接近线性增长,为数字政府、
区域情报及科研管理平台提供了可复用技术范式。
关键词
全文:
PDF镜像
|参考
[1] 冯建梅 & 李晨光 . (2023). 科技人才链数据融合与可
视化分析 . 现代情报 , 43(6), 36–42.
[2] 黄如花 . (2022). 异构数据整合中的语义冲突与解决
机制研究 . 情报杂志 , 41(4), 19–24.
[3] 刘则渊 & 赵宏 . (2023). 基于语义融合的多源数据整
合模型研究 . 情报理论与实践 , 46(4), 21–27.
[4] 王贇 & 张宏 . (2021). 面向政务数据流的 DSL 建模方
法研究 . 电子政务 , (6), 88–94.
[5] 张建平 . (2021). 区域知识服务体系的数据整合机制
研究 . 情报理论与实践 , 44(5), 67–74.
[6] 张晓林 . (2021). 数据驱动的国家知识治理与战略情
报体系建设 . 图书馆论坛 , 41(5), 18–24.
[7]Chen, Y., Zhang, Q., & Wang, H. (2021). A data-driven
method for innovation path discovery based on multi-source
integration. Scientometrics, 126(4), 3421–3440.
[8]Hudak, P. (1998). Modular domain specific languages
and tools. In Proceedings of the 5th International Conference on
Software Reuse. IEEE Press.
[9]Mernik, M., Heering, J., & Sloane, A. M. (2005). When
and how to develop domain-specific languages. ACM Computing
Surveys, 37(4), 316–344.
[10]Stonebraker, M., Çetintemel, U., & Zdonik, S. (2005).
The requirements of real-time stream processing. ACM SIGMOD
Record, 34(4), 42–47.
[11]Xu, Y., Wang, J., & Liu, Z. (2020). Task-oriented data
federation in strategic intelligence systems. Information Processing
& Management, 57(6), 102384.
[12]Zhai, W., Wu, M., & Feng, J. (2022). Analysis of
industrial product quality problems based on knowledge graph
reasoning. In Proceedings of the International Conference on
Computer Science and Communication Technology (ICCSCT 2022)
(SPIE Vol. 12506, Article 2662045). SPIE.
DOI: http://dx.doi.org/10.12361/2661-376X-08-01-175589
Refbacks
- 当前没有refback。

