专利 一种面向点云视频流媒体传输的用户视角预测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210225898.7 (22)申请日 2022.03.09 (71)申请人合肥工业大学地址 230009 安徽省合肥市包河区屯溪路 193号 (72)发明人黎洁　李芷鑫　李奇越　文锋　邓锦深　张聪　韩玲　王枭　王慧宇　彭涛　陈勇　 (74)专利代理机构安徽省合肥新安专利代理有限责任公司 34101 专利代理师陆丽莉　何梅生 (51)Int.Cl. H04N 21/81(2011.01) H04N 21/6587(2011.01) H04N 21/44(2011.01)H04N 13/122(2018.01) G06V 20/40(2022.01) G06V 10/46(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01) (54)发明名称一种面向点云视频流媒体传输的用户视角预测方法 (57)摘要本发明公开了一种面向点云视频流媒体传输的用户视角预测方法，包括以下步骤： 1、构建面向点云视频流媒体传输的用户视角预测网络； 2、构建所述网络中的3D点云视频显著性检测模、基于用户视点预测提取特征模型和显著性检测与视点预测特征整合模型； 3、结合视频的显著性特征和基于视点预测提取的特征进行融合，得到预测的用户视角情况。本发明首次提出3D点云视频流视角预测方法，利用3D点云视频流的显著性检测与某个用户视角结合起来得到最终预测的用户视角，从而能提高预测精度。权利要求书3页说明书8页附图2页 CN 114584850 A 2022.06.03 CN 114584850 A 1.一种面向点云视频流媒体传输的用户视角预测方法，其特征是按如下步骤进行的：步骤一、数据预处理：步骤1.1、获取m个用户观看n帧点云视频的m ×n个视点信息其中，表示第m个用户观看第n帧点云视频的视点信息；步骤1.2、提取所述视点信息中用户视角内的n帧点云数据{x1,x2,...,xt,...,xn}，其中， xt表示第t帧点云数据，且每一帧点云数据包括m个用户视角内的点云数据；步骤二、构建面向点云视频流媒体传输的用户视角预测网络；所述用户视角预测网络包括： 3D点云视频显著性检测模型NVS、基于用户视点预测提取特征模型NEP、显著性检测与视点预测特征整合模型NF2one和解码网络；其中，所述3D点云视频显著性检测模型NVS包括：单帧点云显著性特征提取支路LSF和连续多帧点云时间特征提取支路LDC；其中，所述单帧点云显著性提取支路LSF包含：单帧同步帧采样模块MFS和单帧局部特征聚合模块MLFA；所述连续多帧点云时间特征提取支路LDC包含：多帧同步帧采样模块MFSM、多帧局部特征聚合模块MLFAM和多帧时间特征提取模块MDCF；所述基于用户视点预测提取特征模型NEP包含：视点同步帧采样模块MFSV和视点局部特征聚合模块MLFAV；步骤三、将所述第t帧点云数据xt作为当前帧点云数据并输入所述单帧点云显著性提取支路LSF中，经过所述单帧同步帧采样模块MFS的随机采样处理后，得到当前帧采样数据ft和采样时选取的中心点位置S；其中，当前帧采样数据ft的数据量为bs ×nps个采样点， bs表示采样块个数， nps表示每个采样块的点数；将当前帧采样数据ft输入所述单帧局部特征聚合模块MLFA中进行KNN算法处理，以搜寻出当前帧采样数据ft中所有采样点的邻近点，并将每个采样点的邻近点特征与采样点特征聚合，再经过多层感知机的处理得到当前帧空间尺度特征FtS；其维度为bs ×nps×1×1024；步骤四、所述当前帧点云数据xt和前k帧点云数据输入所述连续多帧点云时间特征提取支路LDC中，其中，当前帧点云数据xt的前k帧点云数据输入所述多帧同步帧采样模块MFSM中进行随机采样，并以所述中心点位置S为前k帧点云数据采样的中心点位置，从而得到前k帧采样数据{ft‑k,...,ft‑1}，其数据量均为bs ×nps个采样点；其中， ft‑1表示前一帧采样数据；将所述前k帧采样数据{ft‑k,...,ft‑1}并行输入所述多帧局部特征聚合模块MLFAM中进行 KNN算法处理，以搜寻出前k帧采样数据{ft‑k,...,ft‑1}中所有采样点的邻近点，并将每个采样点的邻近点特征与采样点特征聚合，再经过多层感知机的处理得到前k帧空间尺度特征其中，表示前一帧空间尺度特征；将所述前k帧空间尺度特征和当前帧空间尺度特征FtS输入所述多帧时间特征提取模块MDCF中进行处理，得到当前帧时间尺度特征FtT；将所述当前帧空间尺度特征FtS和当前帧时间尺度特征FtT按通道串联后，得到当前帧点云数据xt的时空特征FtST并作为3D点云视频的当前帧显著性特征；步骤五、利用LSTM神经网络对所述视点信息进行视点预权　利　要　求　书 1/3 页 2 CN 114584850 A 2测，得到m个用户n帧的视点预测信息其中，表示预测得到的第m个用户观看第n帧点云视频的视点信息；步骤六、从视点预测信息中随机选取第u个用户的当前帧视点预测信息并提取其点云数据xu,t；其中， xu,t包含第u个用户预测观看到的点云数据和第u个用户预测观看不到的点云数据并将观看到的点云数据的标签设置“1”，观看不到的点云数据的标签为“0”；所述点云数据xu,t输入所述基于用户视点预测提取特征模型NEP中，经过所述视点同步帧采样模块MFSV的随机采样，并以所述中心点位置S采样的中心点位置，得到预测后第u个用户的点云采样数据fu,t，其中，点云采样数据fu,t数据量为bs×nps个采样点；所述点云采样数据fu,t输入视点局部特征聚合模块MLFAV中进行KNN算法处理，以搜寻出点云采样数据fu,t中所有采样点的邻近点，并将每个采样点的邻近点特征与采样点特征聚合，再经过多层感知机的处理得到第u个用户当前帧视点预测点云特征其维度为bs × nps×1×1024；步骤七、所述当前帧显著性特征FtST和当前帧视点预测特征输入所述显著性检测与视点预测特征整合模型NF2one中进行整合处理后得到第u个用户当前帧特征Fu,t；步骤八、所述第u个用户当前帧特征Fu,t经过所述解码网络后得到最终预测的第u个用户第t帧看到的视角画面。 2.根据权利要求1所述一种面向点云视频流媒体传输的用户视角预测方法，其特征是，所述多帧时间特征提取模块MDCF是按如下步骤提取时间尺度特征： 1)提取前一帧和当前帧空间尺度特征其维度均为bs ×nps×1×nfs；其中， nfs是聚合的特征个数； 2)在所述采样块个数bs的维度上提取所述当前帧空间尺度特征的第i个采样块的特征其维度为1 ×nps×1×nfs； 3)将所述采样块的特征在所述采样块个数bs的维度上复制bs次，从而得到维度为 bs×nps×1×nfs的复制采样块特征 4)将所述复制采样块特征与前一帧空间尺度特征特征进行融合，得到维度为bs×nps×1×nfs的融合特征featcc； 5)将融合特征featcc进行一次共享多层感知机的处理后得到bs ×nps×1×1024维的总分数scores，其中，所述总分数scores在所述采样块个数bs的维度上共有bs个张量表示总分数scores在所述采样块个数bs维度上第bs个张量； 6)将所述总分数scores在所述采样块个数bs的维度上进行归一化处理并得到bs个分数{score1,score2,...,scorebs}，其中， scorebs表示总分数scores进行归一化处理后得到的第bs个分数； 7)计算bs个分数{score1,score2,...,scorebs}中最大分数scoremax所在的位置max；权　利　要　求　书 2/3 页 3 CN 114584850 A 3

专利 一种面向点云视频流媒体传输的用户视角预测方法

专利一种面向点云视频流媒体传输的用户视角预测方法