一种基于深度学习的推荐系统-半岛BOB·(中国)官方网站

文档序号:34131600发布日期:2023-11-28阅读:178来源:国知局


1.本发明涉及推荐系统设计技术领域,种基尤其涉及一种基于深度学习的于深推荐系统。


背景技术:

2.在互联网时代,度学网络数据规模呈现出爆发式增长模式。习的系统尤其是推荐在工业4.0时代人们在寻找信息、购买商品和选择服务时,种基面临着越来越多的于深选择;数据规模的急速增长带来了“信息过载”问题。为了解决“信息过载”问题,度学分类目录川和搜索引擎先后被提出。习的系统分类目录将主题类型相似的推荐网站放在同一大类型下,这虽然在一定程度上减少了信息获取的种基工作量,但是于深网络用户仍然很难获取这些分类网站之外的信息。搜索引擎的度学出现缓解了这一问题,搜索引擎可以根据用户键入的习的系统关键字来搜索相应的信息然而很多情况下用户并不能根据关键字准确地描述自己的需求,而且兴趣不同的用户在键入相同关键字时会出现相同的搜索结果;针对上述问题,推荐系统应运而生。推荐
3.经检索,中国专利号cn114741555a公开了一种基于深度学习的个性化推荐系统,该发明虽然提高用户对网站的满意度,但是无法高效获取各用户兴趣信息,且用户兴趣预测准确性低,无法实现更好的兴趣预测;此外,现有的推荐系统无法对平台冗余内存进行压缩释放,性能优化效率差,平台使用过程中容易出现卡顿情况,为此,我们提出一种基于深度学习的推荐系统。


技术实现要素:

4.本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种基于深度学习的推荐系统。
5.为了实现上述目的,本发明采用了如下技术方案:
6.一种基于深度学习的推荐系统,包括用户平台、行为分析模块、特征采集模块、兴趣预测模块、个性推荐模块、预测更新模块、运行优化模块以及数据存储模块;
7.所述用户平台用于收集用户基本信息,同时依据用户操作信息调用并展示相关浏览界面;
8.所述行为分析模块用于采集用户各操作行为,并对用户选择的各项信息进行信息建模;
9.所述特征采集模块用于接收行为分析模块的分析数据,并对其进行信息特征采集;
10.所述兴趣预测模块用于依据采集到的用户行为数据以及信息特征对用户爱好进行预测;
11.所述个性推荐模块用于依据预测结果,筛选出用户感兴趣的内容并反馈给用户;
12.所述预测更新模块用于对兴趣预测模块参数进行更新调整;
13.所述运行优化模块用于改进用户平台运行性能;
14.所述数据存储模块用于对用户操作数据以及兴趣推荐情况进行区块化存储。
15.作为本发明的进一步方案,所述用户操作信息具体包括选择、浏览、购买以及评价。
16.作为本发明的进一步方案,所述行为分析模块信息建模具体步骤如下:
17.步骤一:行为分析模块通过max-min方法将用户的基本信息、社交网络信息、兴趣标签进行归一化处理,之后使用特征交叉来捕捉特征之间的相互作用;
18.步骤二:根据处理后的数据,构建一个词汇表,将每个不同的词分配一个唯一的索引,将收集到用户数据转换为序列化的表示形式,并将每个句子分割为单词,并将每个单词映射为词汇表中的索引,同时对序列进行填充或截断,使它们具有相同的长度。
19.作为本发明的进一步方案,所述特征采集模块信息特征采集具体步骤如下:
20.步骤(1):特征采集模块将序列化后的用户行为数据映射为固定维度的向量,之后通过bi-gru网络,并将多个注意力头添加到bi-gru网络中,同时确定bi-gru网络参数信息;
21.步骤(2):拼接多个自注意力层,获取对应多头注意力机制,并通过多个注意力层从不同角度对相同输入进行线性变换,提取行为数据中的重要特征;
22.步骤(3):将多个注意力头的输出进行融合,并将融合后的特征向量输入到后续的层中,再通过学习嵌入向量,捕捉用户行为之间的相似性和关联关系。
23.作为本发明的进一步方案,步骤(2)所述多头注意力机制具体计算公式如下:
[0024][0025]
multihead(q,k,v)=concat(head1,

,headh)wo(2)
[0026]
wherehead=attention(qw
iq
,kw
ik
,vw
iv
)
ꢀꢀꢀꢀꢀ
(3)
[0027]
其中,wo、w
iq
、w
ik
以及w
iv
代表数据投影中可学习的参数矩阵,h代表注意力头的数量;
[0028]
步骤(2)所述线性变换具体计算公式如下:
[0029]
p=w
p
x,p∈(q,k,v)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0030]
其中,w
p
代表对应向量的线性变换矩阵。
[0031]
作为本发明的进一步方案,所述兴趣预测模块爱好预测具体步骤如下:
[0032]
步骤

:兴趣预测模块收集数据存储模块中存储的用户兴趣数据以及关联信息,之后对各组数据进行数据清洗以及缺失值处理后,将各组数据进行标准化处理并将各组数据整合成测试数据集;
[0033]
步骤

:计算测试数据集的标准偏差以筛除数据集中的异常数据,将测试数据集划分为训练集和测试集,再初始化神经网络的权重和参数,之后将训练集导入该神经网络中,根据输入数据和当前的权重和参数,计算输出,并获取输出层为隐节点输出的线性组合以及能量函数,当能量函数小于目标误差时,训练过程结束并输出预测神经模型;
[0034]
步骤

:将测试集导入预测神经模型中,通过前向传播获取预测输出,通过softmax函数将输出值中所有目标的线性预测值转换为概率值,当获取对应概率值后,使用损失函数计算真实数据与检测概率之间的损失值,若损失值未满足预设条件,则重新训练该模型并更新该预测神经模型参数;
[0035]
步骤

:该神经模型参数根据用户的特征和行为,对各类型数据进行评分或排序,并生成最相关的推荐结果,同时收集生成的各组推荐结果并构建个性化的推荐列表。
[0036]
作为本发明的进一步方案,所述预测更新模块参数更新调整具体步骤如下:
[0037]
步骤ⅰ:预测更新模块在预测神经模型的规定区间内初始化网络连接权值,之后从训练时的输入以及输出对的集合中提交训练样本,并计算预测神经模型的输出,再比较期望的网络输出与实际的网络输出,同时计算所有神经元的局部误差;
[0038]
步骤ⅱ:当局部误差超出预设阈值后,依据学习规则方程对预测神经模型的权值进行训练以及更新,并依据预设的学习率以及步长列出所有可能的数据结果,对于每一组数据,选取任意一个子集作为测试集,其余子集作为训练集,训练模型后对测试集进行检测,并统计检测结果的损失值;
[0039]
步骤ⅲ:将测试集更换为另一子集,再取剩余子集作为训练集,再次计算损失值,直至对所有数据都进行一次预测,通过选取损失值最小时对应的组合参数作为数据区间内最优的参数并替换预测神经模型原有参数。
[0040]
作为本发明的进一步方案,所述运行优化模块运行性能优化具体步骤如下:
[0041]
第一步:运行优化模块为用户平台的各组功能界面生成一个启动链表,并依据lru链表顺序,将各组启动链表按照各功能界面被访问次数由少到多进行进一步链接;
[0042]
第二步:依据各组功能界面的交互信息实时对各组启动链表中的各组页面进行数据更新,并从lru链表的头部依次选择被访问次数最少的功能界面启动链表进行受害页面选择,直至回收足够的受害页面后停止;
[0043]
第三步:将选择的受害页面合并为一个块并进行标记,之后唤醒一个压缩驱动程序以解析被标记的块,并获得属于该块的物理页,再将该物理页复制到缓冲区中,然后调用压缩算法将缓冲区中的该物理页压缩到压缩块中,并将压缩块存储至运行优化模块的压缩区域中。
[0044]
相比于现有技术,本发明的有益效果在于:
[0045]
1、该系统通过将多头注意力机制添加到bi-gru网络,再通过该bi-gru网络捕捉用户行为之间的相似性以及关联关系,之后兴趣预测模块收集并预处理数据存储模块中存储的用户兴趣数据以及关联信息后,将各组数据整合成测试数据集并筛除其中的异常数据,将测试数据集划分为训练集和测试集,再初始化神经网络的权重和参数,之后将训练集导入该神经网络中计算对应输出,当能量函数小于目标误差时,训练过程结束并输出预测神经模型,将测试集导入预测神经模型中,通过前向传播获取预测输出,再使用损失函数计算真实数据与检测概率之间的损失值,若损失值未满足预设条件,则重新训练该模型并更新该预测神经模型参数,该神经模型参数根据用户的特征和行为,对各类型数据进行评分或排序,并生成最相关的推荐结果,同时收集生成的各组推荐结果并构建个性化的推荐列表,能够高效地获取各用户兴趣信息,同时能够实时更新参数信息,保证参数的精确性,提高用户兴趣预测的准确性,有效提高推荐准确性,对计算资源利用率较高同时可以实现更好兴趣预测。
[0046]
2、本发明通过为用户平台的各组功能界面生成一个启动链表,并依据lru链表顺序按照各功能界面被访问次数由少到多进行进一步链接,依据各组功能界面的交互信息实时对各组启动链表中的各组页面进行数据更新,并从lru链表的头部依次选择被访问次数最少的功能界面启动链表进行受害页面选择,直至回收足够的受害页面后停止,将选择的受害页面合并为一个块并进行标记,之后唤醒一个压缩驱动程序以解析被标记的块,并获
得属于该块的物理页,再将该物理页复制到缓冲区中,然后调用压缩算法将缓冲区中的该物理页压缩到压缩块中,并将压缩块存储至运行优化模块的压缩区域中,能够自动化对平台冗余内存进行压缩释放,无需用户手动操作,提高性能优化效率,降低平台发生使用卡顿的情况,提高用户使用体验。
附图说明
[0047]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0048]
图1为本发明提出的一种基于深度学习的推荐系统的系统框图。
具体实施方式
[0049]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0050]
实施例1
[0051]
参照图1,一种基于深度学习的推荐系统,包括用户平台、行为分析模块、特征采集模块、兴趣预测模块、个性推荐模块、预测更新模块、运行优化模块以及数据存储模块。
[0052]
用户平台用于收集用户基本信息,同时依据用户操作信息调用并展示相关浏览界面;行为分析模块用于采集用户各操作行为,并对用户选择的各项信息进行信息建模。
[0053]
具体的,行为分析模块通过max-min方法将用户的基本信息、社交网络信息、兴趣标签进行归一化处理,之后使用特征交叉来捕捉特征之间的相互作用,根据处理后的数据,构建一个词汇表,将每个不同的词分配一个唯一的索引,将收集到用户数据转换为序列化的表示形式,并将每个句子分割为单词,并将每个单词映射为词汇表中的索引,同时对序列进行填充或截断,使它们具有相同的长度。
[0054]
本实施例中,用户操作信息具体包括选择、浏览、购买以及评价。
[0055]
特征采集模块用于接收行为分析模块的分析数据,并对其进行信息特征采集。
[0056]
具体的,特征采集模块将序列化后的用户行为数据映射为固定维度的向量,之后通过bi-gru网络,并将多个注意力头添加到bi-gru网络中,同时确定bi-gru网络参数信息,之后拼接多个自注意力层,获取对应多头注意力机制,并通过多个注意力层从不同角度对相同输入进行线性变换,提取行为数据中的重要特征,再将多个注意力头的输出进行融合,并将融合后的特征向量输入到后续的层中,再通过学习嵌入向量,捕捉用户行为之间的相似性和关联关系。
[0057]
需要进一步说明的是,多头注意力机制具体计算公式如下:
[0058][0059]
multihead(q,k,v)=concat(head1,

,headh)wo(2)
[0060]
wherehead=attention(qw
iq
,kw
ik
,vw
iv
)
ꢀꢀꢀꢀꢀ
(3)
[0061]
其中,wo、w
iq
、w
ik
以及w
iv
代表数据投影中可学习的参数矩阵,h代表注意力头的数量;
[0062]
线性变换具体计算公式如下:
[0063]
p=w
p
x,p∈(q,k,v)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0064]
其中,w
p
代表对应向量的线性变换矩阵。
[0065]
兴趣预测模块用于依据采集到的用户行为数据以及信息特征对用户爱好进行预测。
[0066]
具体的,兴趣预测模块收集数据存储模块中存储的用户兴趣数据以及关联信息,之后对各组数据进行数据清洗以及缺失值处理后,将各组数据进行标准化处理并将各组数据整合成测试数据集,计算测试数据集的标准偏差以筛除数据集中的异常数据,将测试数据集划分为训练集和测试集,再初始化神经网络的权重和参数,之后将训练集导入该神经网络中,根据输入数据和当前的权重和参数,计算输出,并获取输出层为隐节点输出的线性组合以及能量函数,当能量函数小于目标误差时,训练过程结束并输出预测神经模型,将测试集导入预测神经模型中,通过前向传播获取预测输出,通过softmax函数将输出值中所有目标的线性预测值转换为概率值,当获取对应概率值后,使用损失函数计算真实数据与检测概率之间的损失值,若损失值未满足预设条件,则重新训练该模型并更新该预测神经模型参数,该神经模型参数根据用户的特征和行为,对各类型数据进行评分或排序,并生成最相关的推荐结果,同时收集生成的各组推荐结果并构建个性化的推荐列表。
[0067]
实施例2
[0068]
参照图1,一种基于深度学习的推荐系统,包括用户平台、行为分析模块、特征采集模块、兴趣预测模块、个性推荐模块、预测更新模块、运行优化模块以及数据存储模块。
[0069]
个性推荐模块用于依据预测结果,筛选出用户感兴趣的内容并反馈给用户;预测更新模块用于对兴趣预测模块参数进行更新调整。
[0070]
具体的,预测更新模块在预测神经模型的规定区间内初始化网络连接权值,之后从训练时的输入以及输出对的集合中提交训练样本,并计算预测神经模型的输出,再比较期望的网络输出与实际的网络输出,同时计算所有神经元的局部误差,当局部误差超出预设阈值后,依据学习规则方程对预测神经模型的权值进行训练以及更新,并依据预设的学习率以及步长列出所有可能的数据结果,对于每一组数据,选取任意一个子集作为测试集,其余子集作为训练集,训练模型后对测试集进行检测,并统计检测结果的损失值,将测试集更换为另一子集,再取剩余子集作为训练集,再次计算损失值,直至对所有数据都进行一次预测,通过选取损失值最小时对应的组合参数作为数据区间内最优的参数并替换预测神经模型原有参数。
[0071]
运行优化模块用于改进用户平台运行性能;数据存储模块用于对用户操作数据以及兴趣推荐情况进行区块化存储。
[0072]
具体的,运行优化模块为用户平台的各组功能界面生成一个启动链表,并依据lru链表顺序,将各组启动链表按照各功能界面被访问次数由少到多进行进一步链接,依据各组功能界面的交互信息实时对各组启动链表中的各组页面进行数据更新,并从lru链表的头部依次选择被访问次数最少的功能界面启动链表进行受害页面选择,直至回收足够的受害页面后停止,将选择的受害页面合并为一个块并进行标记,之后唤醒一个压缩驱动程序以解析被标记的块,并获得属于该块的物理页,再将该物理页复制到缓冲区中,然后调用压缩算法将缓冲区中的该物理页压缩到压缩块中,并将压缩块存储至运行优化模块的压缩区域中。
网友询问留言已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
技术分类