数据和知识多样性解决数据偏差
向于在没有人工查询处理程序任何帮助的情况下与客户进行通信。在这些聊天机器人中,大量数据用于针对在线查询进行训练。数据包括常见问题和一些非常规问题。模型中嵌入了多样化的字典以进行训练和测试。 人工智能和机器学习模型渴望获得数据。在AI方法中,一种被称为“终身学习机器”的新品种正在被设计为无限地,连续地处理数据。数据流构建了渴望的模型和所需的模型。但是,对数据的日益增长的重要性和需求正在以“数据偏差”的形式引入障碍。全世界的AI公司在积极解决数据偏差问题方面都面临着困难。 AI模型的过失 “技术界需要改进”。由于AI模型中的多次失败,这种姿态出现了。例如,Google照片有时无法正确标记实体。该应用程序将非裔美国人标记为“大猩猩”。还有更多 亚马逊的面部识别系统标记了国会议员的罪犯。这种冗长的词句进入现实世界会导致毁灭性的环境。这就是微软公司的创始人比尔·盖茨不赞成将AI模型和此类技术用于监视目的(例如在战争中)的原因。 数据偏差不是AI模型的一部分,但数据包含偏差元素。例如,用于数据处理,过滤,标记和分析的算法无法有效地按比例对特定性状进行分类。所有问题通常都与数据偏见相对应,在这种情况下,模型无法将案例无障碍地分类到相关类别中。此外,由于实践模型失败,法律后果对AI公司施加了重罚。 多样化的数据集:解决方案 AI数据经过各个阶段。在策划阶段可以积极解决数据偏差问题。原因是有时收集的数据不包含所有可能性或各种元素。在此问题上,数据源起着关键作用。例如,从某些来源收集的数据包含有关男人长相的更多数据。
有关男性的属性已明确定义并显示在数据中,但其中并未包含有关女性特征的任何细节。现在,在分类时,与男性有关的数据在女性类别中越来越少。 (编辑:保山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |