iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211162954.3 (22)申请日 2022.09.23 (71)申请人 杭州海康威视数字技 术股份有限公 司 地址 310051 浙江省杭州市滨江区阡 陌路 555号 (72)发明人 王琦 (74)专利代理 机构 北京天同知创知识产权代理 事务所(普通 合伙) 16046 专利代理师 韩建伟 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种训练处理方法、 装置、 电子设备和可读 存储介质 (57)摘要 本申请公开了一种训练处理方法、 装置、 电 子设备和可读存储介质, 该方法包括: 获取样本 数据; 将所述有标签样本数据和所述无标签样本 数据进行聚类得到多个簇; 获取所述样本数据中 的剩余样 本数据, 所述剩余样 本数据为未与无标 签样本数据成簇的有 标签样本数据; 将所述剩余 样本数据输入到生成网络模型中得到所述生成 网络模型输出的生成样本数据; 将所述生成样本 数据分别聚类到所述多个簇中的一个簇中; 使用 所述多个簇中的样本数据进行半监督模型的训 练。 通过本申请解决了 现有技术中无标签样本数 量不足或分布不均衡所导致的训练得到的模型 性能不佳的问题, 提高了在训练中可用的样本数 据的数据和质量, 从而提高了训练得到模型的质 量。 权利要求书3页 说明书13页 附图3页 CN 115456100 A 2022.12.09 CN 115456100 A 1.一种训练 处理方法, 其特 征在于, 包括: 获取样本数据, 其中, 所述样本数据包括有标签样本数据和无 标签样本数据; 将所述有标签样本数据和所述无 标签样本数据进行聚类得到多个簇; 获取所述样本数据中的剩余样本数据, 其中, 所述剩余样本数据为未与无标签样本数 据成簇的有标签样本数据; 将所述剩余样本数据输入到生成网络模型中得到所述生成网络模型输出的生成样本 数据, 其中, 所述生成网络模型使用所述多个簇的样本数据进 行训练得到的, 所述生成网络 模型用于根据有标签样本数据生成虚拟无 标签样本数据; 将所述生成样本数据分别聚类到所述多个簇中的一个簇中, 其中, 所述多个簇中的每 个簇均对应一个簇标签; 使用所述多个簇中的样本数据进行半监督模型的训练, 其中, 每个簇中的样本数据均 将该簇的簇标签作为该样本数据的标签在训练中使用。 2.根据权利要求1所述的方法, 其特征在于, 将所述有标签样本数据和无标签样本数据 进行聚类得到多个簇包括: 将所述有标签样本数据和无标签样本数据使用特征提取模型提取样本特征, 其中, 所 述特征提取模型为使用与所述样本数据类型相同的训练数据预先训练得到的, 所述特征提 取模型用于从输入的数据中提取 特征; 根据所述有标签样本数据和无 标签样本数据对应的样本特 征进行聚类。 3.根据权利要求1或2所述的方法, 其特征在于, 将所述有标签样本数据和所述无标签 样本数据进行聚类包括: 根据所述有标签样本数据和所述无标签样本数据进行自监督训练, 其中, 所述自监督 训练用于对样本数据进行聚类, 并根据聚类之后的簇中的样本数据的特征调整所述特征提 取模型, 然后再次聚类和调整所述特 征提取模型直到无新簇产生。 4.根据权利要求1或2所述的方法, 其特征在于, 根据所述有标签样本数据和所述无标 签样本数据进行聚类包括: 从所述样本数据中选择作为簇中心的样本数据; 根据选择的簇 中心进行聚类得到多个簇, 并计算每个簇中的样本数据到该样本数据 所 属的簇的簇中心的第一距离以及到其 他簇的簇中心的第二距离; 变更作为簇中心 的样本数据重新进行聚类, 并计算所述第一距离和所述第二距离, 直 到损失函数 的值最优, 其中, 所述第一距离越小并且所述第二距离越大则所述损失函数 的 值越优。 5.根据权利要求1所述的方法, 其特征在于, 使用所述多个簇的样本数据进行训练得到 所述生成网络模型包括: 使用所述多个簇的样本数据对生成式对抗网络模型进行训练, 其中, 所述多抗网络模 型包括第一生成器和 第一判别器, 所述第一生成器用于根据有标签样本数据生成无标签样 本数据, 所述第一判别器用于判断一个无标签样本数据是该簇内的无标签样本数据或者是 第一生成器生成的无 标签样本数据; 确定所述生成式对抗网络模型训练完成之后, 将所述多抗网络模型中的所述第 一生成 器作为所述 生成网络模型。权 利 要 求 书 1/3 页 2 CN 115456100 A 26.根据权利要求5所述的方法, 其特征在于, 所述生成式对抗网络模型还包括: 第二生 成器和第二判别器, 其中, 所述第二生成器用于根据无标签样本数据生成有标签样本数据, 所述第二判别器用于判断一个有标签样本数据是该簇内的有标签样本数据或者是第二生 成器生成的有标签样本数据。 7.根据权利要求6所述的方法, 其特征在于, 确定所述生成式对抗网络模型训练完成包 括: 计算所述生成式对抗网络模型的损失函数的值, 在所述生成式对抗网络模型的损失函 数的值最优的情况下, 确定所述生 成式对抗网络模 型训练完成, 其中, 所述生成 式对抗网络 模型的损失函数包括: 所述第一生成器生成的无标签样本数据和该簇内的无标签样本数据 相比得到的第一损失、 有标签样本数据和构造的有标签样本数据相比得到的第二损失、 所 述第二生成器生成的有标签样本数据和该簇内的有标签样本数据相比得到的第三损失、 无 标签样本数据和构 造的无标签样本数据相比得到的第四损失、 以及同一簇内有标签样本数 据和无标签样本数据相比得到的第 五损失, 其中, 所述第一损失、 所述第二损失、 所述第三 损失、 所述第四损失和第 五损失的和越小则所述损失函数 的值越优, 所述构造的有标签样 本数据是将有标签样本数据经过所述第一生成器生成的无标签样本数据之后再将该无标 签样本数据经过所述第二生成器生成的有标签样本数据, 所述构 造的无标签样本数据是将 无标签样本数据经过所述第二生成器生成的有标签样本数据之后再将该有标签样本数据 经过所述第一 生成器生成的无 标签样本数据。 8.根据权利要求5至7任一项所述的方法, 其特征在于, 使用所述多个簇的样本数据对 所述对抗网络进行训练包括: 将所述多个簇中的每个簇的样本数据分为样本对, 其中, 每个样本对均包括有标签样 本数据和无 标签样本; 使用所述样本对 对所述生成式对抗网络模型进行训练。 9.根据权利要求1所述的方法, 其特征在于, 使用所述多个簇 中的样本数据进行半监督 模型的训练包括: 使用所述多个簇中的样本数据对半监督的神经网络模型进行训练, 其中, 所述神经网 络模型的损失函数 的值是根据所述样本数据对应的簇标签以及所述神经网络模型输出的 标签之间的差距得到的。 10.根据权利要求1所述的方法, 其特 征在于, 还 包括: 获取所述每个簇内的有标签样本数据对应的标签; 将同一簇内有标签样本数据的标签的平均值作为该簇的簇标签。 11.一种训练处理装置, 其特征在于, 包括: 获取模块、 聚类模块、 生成模块和处理模块, 其中, 所述获取模块, 用于获取样本数据, 其中, 所述样本数据包括有标签样本数据和无标签 样本数据; 所述聚类模块, 用于将所述有标签样本数据和所述无标签样本数据进行聚类得到多个 簇; 所述获取模块, 还用于获取所述样本数据中的剩余样本数据, 其中, 所述剩余样本数据 为未与无 标签样本数据成簇的有标签样本数据;权 利 要 求 书 2/3 页 3 CN 115456100 A 3
专利 一种训练处理方法、装置、电子设备和可读存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 12:11:55
上传分享
举报
下载
原文档
(610.5 KB)
分享
友情链接
DB3301-T 0416—2023 河湖数字化引排水系统建设与管理规范 杭州市.pdf
思度安全-DSMM-012 数据接口安全管理规范V1.0.pdf
GM-T 0113-2021 在线快捷身份鉴别协议.pdf
GB-T 11682-2008 低本底α和-或β测量仪.pdf
GB-T 35317-2017 公安物联网系统信息安全等级保护要求.pdf
NB-T 10691-2021 数据中心机房用不间断电源系统.pdf
GB-T 30976.2-2014 工业控制系统信息安全 第2部分:验收规范.pdf
GB-T 17445-2022 铸造磨球.pdf
DB14-T 1502-2017 富硒谷子栽培技术规程 山西省.pdf
GB-T 6297-2002 陶瓷原料差热分析方法.pdf
GB-T 15166.6-2023 高压交流熔断器 第6部分:用于变压器回路的高压熔断器的熔断件选用导则.pdf
GM-T 0099-2020 开放式版式文档密码应用技术规范.pdf
ISO IEC 27005-2018 信息技术 安全技术 信息安全风险管理--中译本.pdf
DB3202-T 1052-2023 特种设备作业人员设置指南 无锡市.pdf
关键信息基础设施网络安全保护基本要求 关基安全保护基本要求报批稿 2019.11.5 .pdf
GB-T 15102-2017 浸渍胶膜纸饰面纤维板和刨花板.pdf
NIST SP 800-193_ BIOS 平台固件弹性指南 .pdf
POS终端 银行卡受理终端安全规范 第1部分销售点.pdf
GB-T 17747.2-2011 天然气压缩因子的计算 第2部分:用摩尔组成进行计算.pdf
DB3303-T059-2023 政务信息化项目软件开发费用测算规范 温州市.pdf
1
/
3
20
评价文档
赞助3元 点击下载(610.5 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。