iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211175447.3 (22)申请日 2022.09.26 (71)申请人 中南大学 地址 410083 湖南省长 沙市岳麓区麓山 南 路932号 申请人 合肥本源量子 计算科技有限责任公 司 (72)发明人 石金晶 袁逸凡 王雯萱 赵雪娇  徐璐 施荣华  (74)专利代理 机构 长沙永星专利商标事务所 (普通合伙) 43001 专利代理师 周咏 米中业 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01)G06N 10/20(2022.01) (54)发明名称 基于量子启发式算法的文本情感分类方法 (57)摘要 本发明公开了一种基于量子启发式算法的 文本情感分类方法, 包括获取带有分类标签的原 始训练文本并处理得到训练文本; 加载预训练模 型和对应的参数并训练得到振幅嵌入向量; 将分 词后的高维句子进行 降维和特征提取得到相位 嵌入向量; 构建量子启发式神经网络模型; 采用 量子启发式神经网络模型进行实际的文本情感 分类。 本发 明提供的这种基于量子启发式算法的 文本情感分类方法, 通过双特征提取复词嵌入的 方式, 并结合基于量子启发式算法, 实现了文本 情感的分类; 而且本发明方法的准确性高, 可靠 性好。 权利要求书2页 说明书4页 附图1页 CN 115495580 A 2022.12.20 CN 115495580 A 1.一种基于量子启发式算法的文本情感分类方法, 包括如下步骤: S1.获取带有分类标签的原 始训练文本; S2.将步骤S1 获取的原 始训练文本进行处 理, 得到训练文本; S3.加载预训练模型和对应的参数, 并采用步骤S2得到的训练文本对预训练模型进行 训练, 从而得到振幅嵌入向量; S4.将分词后的高维句子进行降维和特 征提取, 从而得到相位嵌入向量; S5.基于振幅嵌入向量、 相位嵌入向量以及量子计算和 深度学习理论, 构建量子启发式 神经网络模型; S6.采用步骤S5得到的量子启发式神经网络模型, 进行实际的文本情感分类。 2.根据权利要求1所述的基于量子启发式算法的文本情感分类方法, 其特征在于步骤 S2所述的将步骤S1 获取的原 始训练文本进行处 理, 得到训练文本, 具体包括如下步骤: 对原始训练文本进行处理, 将文本中的单个句子均处理成索引的形式; 在每个句子前 增加标识符, 用于文本预训练之后的特 征提取。 3.根据权利要求2所述的基于量子启发式算法的文本情感分类方法, 其特征在于步骤 S3所述的加载预训练模型和对应的参数, 并采用步骤S2得到的训练文本对预训练模型进 行 训练, 从而得到振幅嵌入向量, 具体包括如下步骤: 预训练模型为BERT预训练模型; 将训练文本中分词后的句子 输入到BERT预训练模型中进行训练; 提取BERT预训练模型输出序列中的第一个位置的向量, 得到训练标识符; 将得到的训练标识符向量映射到对应量子态的希尔伯特空间中, 再采用振幅嵌入层进 行映射, 从而得到振幅嵌入向量。 4.根据权利要求3所述的基于量子启发式算法的文本情感分类方法, 其特征在于步骤 S4所述的将分词后的高维句 子进行降维和特征提取, 从而得到相位嵌入向量, 具体包括如 下步骤: 采用PCA技 术进行降维和特 征提取; 将每个Batch的文本句子进行分词, 将分词后形成的单次和对应的索引作为一个二维 矩阵X1; 对得到的二维矩阵X1进行均值 化处理, 得到新 二维矩阵X2; 计算新二维矩阵X2的协方差矩阵X3; 计算协方差矩阵X3的特征值和特 征向量, 并将特 征值从小到大进行排序; 保留排序后的前N个最大的特 征值所对应的特 征向量, N 为设定的自然数; 将原始特征映射到N个保留的特 征向量所构建的新空间中, 从而形成低维特 征向量; 将低维特征向量映射到对应量子态的希尔伯特空间中, 并采用相位嵌入层进行映射, 从而得到相位嵌入向量。 5.根据权利要求4所述的基于量子启发式算法的文本情感分类方法, 其特征在于所述 的对得到的二维矩阵X1进行均值化处理, 得到新二维矩阵X2, 具体为对得到的二维矩阵X1, 求解矩阵的每个维度的平均值, 再将当前维度中的每个特征减去对应维度的平均值, 从而 得到新二维矩阵X2。 6.根据权利要求5所述的基于量子启发式算法的文本情感分类方法, 其特征在于步骤权 利 要 求 书 1/2 页 2 CN 115495580 A 2S5所述的基于振幅嵌入向量、 相位嵌入向量以及量子计算和深度学习理论, 构建量子启发 式神经网络模型, 具体包括如下步骤: 将得到的振幅嵌入向量和相位嵌入向量构成句子的量子态 表示: α eβ i=α cos( β )+iα si n( β ) 式中α cos( β )为实部; α sin( β )为虚部; i为虚数单位; 振幅嵌入向量对应于实部, 相位嵌 入向量对应于虚部; 经过测量操作后, 得到实部矩阵和虚部矩阵, 用于表示经 过测量后的量子态; 将得到的实部矩阵和虚部矩阵进行Maxpooling操作, 从而提取得到实部矩阵和虚部矩 阵中的特 征; 将经过Maxpooling操作后的向量进行拼接, 得到一组新的向量; 采用多层感知机构成二分类 器; 将得到的新的向量输入到构建的二分类 器中, 得到最终后的分类标签。权 利 要 求 书 2/2 页 3 CN 115495580 A 3

.PDF文档 专利 基于量子启发式算法的文本情感分类方法

文档预览
中文文档 8 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于量子启发式算法的文本情感分类方法 第 1 页 专利 基于量子启发式算法的文本情感分类方法 第 2 页 专利 基于量子启发式算法的文本情感分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:14:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。