iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210951261.6 (22)申请日 2022.08.09 (71)申请人 北京天融信网络安全技 术有限公司 地址 100085 北京市海淀区上地 东路1号院 3号楼四层 申请人 北京天融信科技有限公司 北京天融信软件 有限公司 (72)发明人 吕晋 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 刘秋月 (51)Int.Cl. H04L 61/4511(2022.01) H04L 61/5046(2022.01) H04L 43/04(2022.01)H04L 43/028(2022.01) G06N 20/00(2019.01) G06N 3/08(2006.01) (54)发明名称 一种基于人工智能模型的特征构建方法及 装置 (57)摘要 本申请提供一种基于人工智能模型的特征 构建方法及装置, 该方法包括: 收集DNS日志; 对 DNS日志进行整理去重, 得到去重日志; 在去重日 志中提取特征字段; 该特征字段包括请求域名字 段、 响应长度字段、 查询类型字段、 返回码字段、 问题部分包含实体数量字段、 权威区包含实体数 量字段以及生存时间特征字段; 对 特征字段进行 特征向量化处理, 得到特征向量: 基于特征向量 构建多义特征。 可见, 实施这种实施方式, 能够生 成大量的多义特征, 以使该大量多义特征能够训 练出更优质的DGA人工智能检测模型, 从而能够 显著降低检测误报率。 权利要求书2页 说明书10页 附图3页 CN 115334039 A 2022.11.11 CN 115334039 A 1.一种基于人工智能模型的特 征构建方法, 其特 征在于, 包括: 收集DNS日志; 对所述DNS日志进行整理去重, 得到去重日志; 在所述去重日志中提取特征字段; 该特征字段包括请求域名字段、 响应长度字段、 查询 类型字段、 返回码字段、 问题部 分包含实体数量字段、 权威区包含实体数量字段以及生存时 间特征字段; 对所述特 征字段进行 特征向量化处理, 得到特 征向量: 基于所述特 征向量构建多义特 征。 2.根据权利要求1所述的基于人工智能模型的特征构建方法, 其特征在于, 所述对所述 DNS日志进行整理去重, 得到去重日志的步骤 包括: 将所述DNS日志整理成每行包括字段名、 字段值和类别标签的jso n文件; 计算所述jso n文件中每行字段名和字段值的md5值; 滤除相同md5值对应的jso n行数据, 得到去重日志。 3.根据权利要求1所述的基于人工智能模型的特征构建方法, 其特征在于, 所述对所述 特征字段进行 特征向量化处理, 得到特 征向量的步骤 包括: 获取所述特征字段包括的字符串特 征和类别特 征; 对所述类别特 征进行特征向量化处理, 得到语义特 征向量; 对所述字符串特 征进行特征向量化处理, 得到域名特 征向量; 组合所述语义特 征向量和所述 域名特征向量, 得到特 征向量。 4.根据权利要求1所述的基于人工智能模型的特征构建方法, 其特征在于, 所述基于所 述特征向量构建多义特 征的步骤 包括: 基于不同的字段语义对所述特 征向量进行划分, 得到多个 语义特征; 拼接所述多个 语义特征, 得到多义特 征。 5.根据权利要求1所述的基于人工智能模型的特征构建方法, 其特征在于, 所述方法还 包括: 搭建包括自动关注模块和全连接分类模块的人工智能模型; 基于所述多义特征, 使用梯度反向传播方法对所述人工智能模型进行训练, 得到DGA域 名检测模型。 6.一种基于人工智能模型的特征构建装置, 其特征在于, 所述基于人工智能模型的特 征构建装置包括: 收集单元, 用于收集DNS日志; 去重单元, 用于对所述DNS日志进行整理去重, 得到去重日志; 提取单元, 用于在所述去重日志中提取特征字段; 该特征字段包括请求域名字段、 响应 长度字段、 查询类型字段、 返回码字段、 问题部分包含实体数量字段、 权威区包含实体数量 字段以及生存时间特 征字段; 处理单元, 用于对所述特 征字段进行 特征向量化处理, 得到特 征向量: 构建单元, 用于基于所述特 征向量构建多义特 征。 7.根据权利要求6所述的基于人工智能模型的特征构建装置, 其特征在于, 所述去重单 元包括:权 利 要 求 书 1/2 页 2 CN 115334039 A 2整理子单元, 用于将所述DNS日志整理成每行包括字段名、 字段值和类别标签的j son文 件; 计算子单 元, 用于计算所述jso n文件中每行字段名和字段值的md5值; 去重子单元, 用于滤除相同md5值对应的jso n行数据, 得到去重日志。 8.根据权利要求6所述的基于人工智能模型的特征构建装置, 其特征在于, 所述处理单 元包括: 获取子单 元, 用于获取 所述特征字段包括的字符串特 征和类别特 征; 处理子单元, 用于对所述类别特 征进行特征向量化处理, 得到语义特 征向量; 所述处理子单元, 还用于对所述字符串特 征进行特征向量化处理, 得到域名特 征向量; 组合子单 元, 用于组合所述语义特 征向量和所述 域名特征向量, 得到特 征向量。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器以及处理器, 所述存储器用于 存储计算机程序, 所述处理器运行所述计算机程序以使 所述电子 设备执行权利要求 1至5中 任一项所述的基于人工智能模型的特 征构建方法。 10.一种可读存储介质, 其特征在于, 所述可读存储介质中存储有计算机程序指令, 所 述计算机程序指 令被一处理器读取并运行时, 执行权利要求 1至5任一项 所述的基于人工智 能模型的特 征构建方法。权 利 要 求 书 2/2 页 3 CN 115334039 A 3
专利 一种基于人工智能模型的特征构建方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 人生无常 于
2024-03-18 13:00:15
上传分享
举报
下载
原文档
(738.9 KB)
分享
友情链接
DB45-T 2048-2019 微型消防站建设管理规范 广西壮族自治区.pdf
T-CADERM 5005—2019 国家级卫生应急培训演练基地建设规范.pdf
GB-T 39909-2021 科技计划形成的科学数据汇交 通用数据元.pdf
T-FSRS 1.1—2019 抚松人参”栽培技术规程 第1部分:福星1号.pdf
GB-T 40429-2021 汽车驾驶自动化分级.pdf
DB50-T 1279-2022 民用醇基液体燃料应用技术规程 重庆市.pdf
6-02-06-03 白酒酿造工.pdf
GB-T 24822-2009 家用和类似用途电器维修故障编码规范.pdf
GB-T 32662-2016 废橡胶废塑料裂解油化成套生产装备.pdf
YD-T 3838-2021 通信制造业绿色工厂评价细则.pdf
GB/T 38825-2020 民用飞机复合材料制件铆接要求.pdf
互联网信息服务管理办法(修订草案征求意见稿).pdf
GB-T 32570-2016 集装箱用钢板及钢带.pdf
GB-Z 42759-2023 智慧城市 人工智能技术应用场景分类指南.pdf
GB-T 28181-2022 公共安全视频监控联网系统信息传输、交换、控制技术要求.pdf
GB-T 40753-2021 供应链安全管理体系 ISO 28000实施指南 ISO 28004-2007.pdf
GB-T 17697-2014 声学 风机和其它通风设备辐射入管道的声功率测定 管道法.pdf
GB-T 70.3-2008 内六角沉头螺钉.pdf
YD-T 4060-2022 云计算安全责任共担模型.pdf
GB-T 19425-2003 防伪技术产品通用技术条件.pdf
1
/
3
16
评价文档
赞助3元 点击下载(738.9 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。