随着深度学习的广泛应用,现代聊天机器人系统需要大规模的训练数据集才能达到其最佳性能,而手动收集如此庞大的数据集需要耗费巨大的人力和时间成本。现欲开发一众包信息系统来辅助收集训练数据集,其主要功能是:
(1)用户管理。众包工作者提供角色和标识,并存储在用户表中。
(2)添加问题。在不同情况下接收来自众包工作者和管理员输入的问题:众包工作者输入问题建议,管理员负责添加初始问题。将问题和问题类别分别进行存储。问题类别说明问题是由众包工作者还是管理员提供的。
(3)答复问题。众包工作者回答或拒绝系统随机展示的5个问题。答复流程是,如果回答问题则提供答案,如果拒绝问题则提供拒绝原因,如果回答问题数不足5个,继续展示问题,否则众包工作者提供问题建议。无论是回答还是拒绝,数据都存储在带有不同状态标记的答复表中。
(4)数据服务。根据其它训练平台的请求,为其提供问题、问题类别、回复的数据集。
现采用结构化方法对众包信息系统进行分析与设计,获得如图1所示的上下文数据流图和图2所示的0层数据流图。
图1 - 上下文数据流图
图2 - 0层数据流图
【问题1】(3分)
使用说明中的词语,给出图1中的实体E1~E3的名称。
【问题2】(4分)
使用说明中的词语,给出图2中的数据存储D1~D4的名称
【问题3】(4分)
根据说明和图中术语,补充图2中缺失的数据流及其起点和终点。
【问题4】(4分)
什么是分层数据流图中父图与子图的平衡?如何保持。