Please enable JavaScript.
Coggle requires JavaScript to display documents.
拟定标题:软件过程数据质量问题与软件过程数据治理技术研究 - Coggle Diagram
拟定标题:软件过程数据质量问题与软件过程数据治理技术研究
第一章:绪论 :pencil2:
背景-数据治理的意义
数据变化:
-
大量
历史数据
-数据被”
私有化
“为各个业务团队”资产“
-各环节”
数据孤岛
“
-数据科学家”
无数据可用
“
数据需求:
-把数据变成服务,数据需要满足越来越多的业务需求,使用高质量数据被广泛视为一种竞争优势
数据治理途径:
-数据的潜在应用场景有很多,但是只有将数据与
具体应用需求
相结合,从实际应用问题出发,结合数据治理技术才找到解决方案
研究思路
数据治理应用: :pencil2:
-数据治理问题在各行各业都是存在的,金融,电信,化工,自动化制造等等,且在未来,所有行业都将成为软件行业
-软件过程数据治理: 1.过程数据发展,2.数据应用需求,3.数据应用效果(相同&不同)
本文研究目标: :pencil2:
-故本文以治理软件开发过程中的数据治理为研究目标,探索软件过程中的存在的数据质量问题、数据治理技术等相关实践。
-当前各类数据应用场景对且对数据质量要求较高,这同时与过程仿真对数据的要求不谋而合,因此恰恰可以落地到过程仿真作为抓手,来研究数据问题
顶层设计: :pencil2:
-三者相互关系(紧急,严重),两两结合在未来工作上的延申
第二章:相关工作 :check:
数据治理研究现状 :check:
数据质量评估模型:实证软件工程研究数据质量评估模型orTaxonomy
数据治理框架:IBM数据治理框架,HAO数据治理模型
软件过程仿真研究现状 :check:
过程仿真案例研究
过程仿真系统化文献评价研究
软件可追溯性研究现状 :check:
软件可追溯性技术演化
软件可追溯性工业界实践研究
第三章:软件过程数据质量问题调研 :check:
研究内容1:针对过程仿真建模中数据质量问题的系统化文献评价研究
研究问题:
RQ1.过程仿真建模实践研究中会遇到哪些数据问题?
RQ2.过程仿真建模实践研究中提供了哪些应对措施?
-写作 :check:
-投稿 :!:
需重新投稿期刊
研究内容2:基于真实企业项目的过程仿真案例研究
建模案例讨论问题:
-在真实企业案例研究中,软件过程仿真建模时,数据准备阶段案例研究中遇到了哪些数据问题?
-其中哪些是面向软件过程的问题?本文案例采用了哪些措施?哪些可通过智能化的技术进行治理?
从而为过程仿真提供更为真实、可靠、完整的、过程数据
-写作 :check:
-投稿 :check: (
ICSSP2020,ICSSP2023
)
第四章:软件过程数据可追溯性治理技术 :check:
研究内容3:针对数据不平衡及稀疏性问题的可追溯性半监督学习框架
研究方法:实验
研究贡献:针对软件可追溯性两个关键的数据痛点(不平衡及稀疏性),提供了性能更优的半监督学习框架
-写作 :check:
-投稿 :check: (
FSE2022
)
研究内容4:针对可追溯性恢复问题的低成本标签传播主动学习及半监督学习整合框架
研究方法:实验
研究贡献:针对软件可追溯性模型性能优化痛点(半监督方法标签预测错误及标签成本高),提供了多种策略整合的学习框架
-写作 :check:
-投稿 :!:(
已投稿软件学报
,
计划投稿ICSE2024 or EMSE
)
第五章:基于可追溯性数据的过程仿真模型高保真性验证 :pencil2:
研究内容5:基于可追溯性数据的过程仿真模型高保真性验证研究
研究目标:
-验证多种过程制品间的可追溯性恢复数据在仿真模型效果
实验数据:
收集
治理前软件过程数据(OnlineRepository或者offline需求计划文档)和可追溯性恢复后软件过程数据
计算
仿真过程模型中各阶段productivity和rate
对比
各阶段output参数的保真性
-写作 :pencil2:
-投稿 :no_entry:更多实验对比数据难以获得(保密性原则),
ICSSP2023是否可以作为论文支撑
研究内容6:基于数据治理模块的(半)自动化仿真建模过程数据准备平台
包含功能模块:
数据侧:数据对接-数据质量评估-数据清洗-数据治理
仿真侧:仿真模型参数设置-数据匹配-参数计算-模型校准及验证-反馈数据问题
-写作 :!:与翁芷洛毕设过于重合
-投稿(
计划撰写专利 or 中文期刊
)
第六章:总结与讨论