用户心理模型范文

2024-05-17

用户心理模型范文(精选3篇)

用户心理模型 第1篇

随着web2.0时代的到来, 网络用户开始追求更加真实的应用体验, 社交网站应运而生。微博的诞生使社交网站的发展进入高潮, 也为其带来了无限商机。目前国内社交网站的主要收入模式是投放广告和营销服务。作为社交网站的主要收入来源, 精确的广告能够为用户找到其感兴趣的商品又不会影响用户体验。广告投放需要掌握用户的兴趣, 因此用户兴趣建模技术是实现精确广告投放的基本条件。但是, 出于对个人身份信息安全性的顾虑, 多数社交网站的用户不愿意在网站上提供过多的个人信息, 这使得用户兴趣信息的识别成为难题。因此, 如何通过用户的网络行为动态地识别出用户兴趣, 是社交网站提高用户满意度、实现盈利和自身发展急需解决的问题。

2 用户兴趣建模概述

2.1 用户兴趣的提取

心理学研究认为[1], 兴趣是人们探究某种事物或者从事某种活动的心理倾向, 人会对他感兴趣的事物给予优先注意和积极地探索, 并表现出心驰神往。而且可以认为用户对一个兴趣关注的程度与用户对该兴趣相关的信息的需求量是相关的。因此, 如何识别并提取用户的兴趣信息成为了亟待解决的问题。

用户兴趣的变化是一种遗忘现象, 与人的记忆活动相对应, 因此可以将其分为短期和长期兴趣这两种具有不同的特征的兴趣。长期兴趣是用户长期积累形成的兴趣爱好, 具有一定的稳定性, 不易被用户更改和遗忘, 可以通过分析用户的显式信息获取这些兴趣。短期兴趣是用户在短时间内体现出的对某一兴趣项的高度重视, 隐式信息中隐含着这些短期兴趣, 可以通过对隐式信息分析处理获取用户的短期兴趣。

显然, 在用户不能及时更新个人信息的情况下, 显式信息并不足以完整的描述用户兴趣, 而隐式信息基于用户当前的网络行为, 缺乏对用户长期稳定兴趣的认知。将二者相结合来获取用户的兴趣特征, 能够弥补只采用单一方式获取兴趣信息较为片面的缺陷, 进而建立完整准确的用户兴趣模型。

2.2 兴趣模型的表示方法

兴趣模型是一种将算法应用于特定数据结构的形式化描述, 其表现形式直接决定了模型对用户兴趣的描述能力及模型的可计算能力。常见的用户兴趣模型表示方法包括以下几类:

1) 基于向量空间模型的表示法。基于空间向量的表示法把用户的兴趣模型表示成一个n维的特征向量{ (t1, w1) , (t2, w2) , …, (tn, wn) }, 用以表示用户感兴趣的方面以及对这一方面的感兴趣程度[2], 其中ti (1≤i≤n) 表示兴趣特征项, wi (1≤i≤n) 表示特征项ti在模型中的权重, 代表着用户对兴趣项ti的感兴趣程度。

2) 基于神经网络的表示法。神经网络是由大量的简单的处理单元通过广泛的互相连接形成的复杂网络结构, 具有较强的自适应、自组织、自学习能力。基于神经网络的表示法利用网络稳定后, 网络连接权重特征化的网络状态来表示用户模型[3]。

3) 关键词列表表示法。基于关键词列表的表示法是利用表示用户兴趣的关键词列表来建立用户兴趣模型[4], 例如, 一个用户喜欢篮球比赛, 该用户的关键词列表为{姚明, NBA, 科比}等, 这些关键词可以由学习算法得到也可以由用户自己指定。

4) 基于本体论的表示法。基于本体论[5]的表示用户的兴趣模型是指将用户的兴趣爱好领域利用一个本体来表示。本体论有明确、形式化、共享等特点, 明确是指用到的概念以及使用这些概念的约束都有明确的定义;形式化是指本体是计算机可读且可处理的;共享是指本体中体现的都是共同认可的知识。

总体来看, 用户兴趣建模在相关的理论研究及应用上已经取得一些成果, 但目前的用户兴趣建模往往忽略了用户兴趣同时受到长期兴趣和短期兴趣两方面的影响, 导致对用户兴趣的描述不够全面准确。本文将阐述利用混合模型对用户偏好建模的过程。

2.3 兴趣模型的更新

用户的兴趣是不断变化的, 因此用户兴趣模型需要随着用户的兴趣变化而变化, 才能更好的与用户的最新爱好相贴合, 为用户提供质量更高的推荐。对模型进行更新时需要以可靠的信息源作为模型更新的依据, 这些信息源大致可以分为两种:一种是用户主动提供的显式信息, 另一种是通过跟踪用户的行为而获取的用户的隐式信息, 这些信息提供了用户兴趣模型的更新所需的有效数据, 使模型得到更新后能更加匹配用户的最新兴趣。目前较为流行的用户兴趣模型更新技术主要有两类:第一类是基于用户反馈的更新, 这一类更新主要是通过用户对项目进行反馈所得到的信息对用户兴趣模型进行更新。第二类是基于自然变化的模型更新, 这一类更新是不仅将新产生的兴趣项补充到用户兴趣模型中, 还对其他兴趣项进行权重的调整, 使得用户的兴趣爱好呈现自然变化, 不再关心的兴趣被自然遗忘, 而关注度高的兴趣权重会增加, 在这类更新中用户的新兴趣起着主导的作用。

用户兴趣模型的更新技术所关注的是用户最新的兴趣而并非建模方法, 因此如何快速准确的调整用户兴趣模型是模型更新的主要目标。

3 社交网站用户兴趣模型的构建

用户兴趣受长期个人兴趣和短期个人兴趣两方面影响, 因此用户兴趣模型可表示为:

IM=αIML+ (1-α) IMS

其中0≤α≤1, α的取值决定了模型的稳定型和对兴趣漂移的灵敏度, α取值越大模型越稳定, α取值越小对兴趣变化就越敏感, 越能够发现新的用户兴趣。一般情况下取α=0.5。

用户兴趣模型构建可以分为三步: (1) 利用用户的注册信息来为用户分类, 建立用户长期兴趣模型; (2) 利用用户的浏览行为来建立用户短期兴趣模型; (3) 通过基于自然变化的模型更新来修正用户兴趣。

3.1 基于K-means的用户长期兴趣模型构建

在社交网站上, 用户想要浏览网站上相关的信息首先需要注册账号并填写个人信息, 其中用户注册时所提供的信息一般有性别、年龄、所在地、学历、职业、兴趣。其中几个重要个人因素决定着用户的长期兴趣及偏好。此时, 可建立用户个人信息向量I= (性别, 年龄, 所在地, 学历, 职业, 兴趣) , 即I= (i1, , i2…, , i6) 其中ij (j=1, 2, …, 6) 为向量分量的数值表示。

在用户个人信息向量的基础上采用K-means聚类算法, 把用户聚类为K类稳定客户集合。具体算法如下:

步骤1:令N=1, 从n个点集合 (I1, I2, …, In) 中随机选取K个点 (R1 (N) , R2 (N) , …, RK (N) ) 作为K个簇的中心。

步骤2:当且仅当满足|Ia-Rb|<|Ia-Rc| (c=1, 2, …, K, 且c≠a) , 则将Ia (a=1, 2, …, n) 归入簇Cb (b=1, 2, …, K) 。

步骤3:计算得到簇的新中心点Ri (N+1) = (i=1, 2, …, K) , 其中ni是簇Ci中点的数量, 且令平均误差准则函数E (N+1) =|Ij (i) -Ri (N) |2) 。

步骤4:给定阀值ξ, 若|E (N+1) -E (N) |<ξ, 则算法结束, 否则N=N+1, 返回步骤2。

利用K-means算法将客户训练样本集聚为K类, 每个用户都归为类中的某一类。每类兴趣也用属性值、兴趣度、类别为元素的向量来表示, 作为每类用户的共同兴趣。具体算法如下:

步骤1:建立用户兴趣池Mki表示属于第k类i用户的兴趣集合, 兴趣池里每个元素由一个三元组表示:, 其中F为属性值词汇, V为属性值的兴趣度, C为属性值所属的类别。

步骤2:把属于第k类训练集中稳定用户的兴趣聚在一起, 生成一个类兴趣池为属于第i类的用户数。

步骤3:确定Mi中每个属性值的最终权值。将属于第k类用户的每个属性值的兴趣度分别加和标准化后, 得出所有属性值的最终兴趣度。

步骤4:给定阈值ζ, 将兴趣度大于ζ的属性值作为第k类用户的共同兴趣。

最后得到用户长期兴趣向量IML={, , …, }, 其中i为属性值个数, j为类别个数。

3.2 基于浏览动态挖掘的用户短期兴趣模型构建

用户浏览社交网站时必然会对其感兴趣的页面进行相关操作, 通过对用户的操作行为以及浏览页面上的信息进行挖掘分析, 可以得到用户的即时兴趣。

页面的文本属性值集合由访问的页面生成的, 因此文本属性值的权重也仅与用户对当前页面的兴趣度有关。对于一个页面的文本属性值集合, 用户对当前页面的兴趣度是多少, 对页面中每一个文本属性值的兴趣度就是多少。本文用户短期兴趣模型的建立是以用户单次访问页面为基本单位的, 用户在一个页面上的浏览行为用保存页面、打印页面、收藏页面以及页面停留时间这四项来近似代替[7]。为这四个行为分别建立行为函数:Save (p) 、Print (p) 、Bookmark (p) 以及Duration (p) 。

对于保存、打印、收藏页面这三个行为来说, 只要行为发生了, 就表明用户对这个页面的兴趣度很高, 而没有兴趣大小之分, 故对于这三个行为来说, 只有发生与不发生两个状态, 因此这三个行为的兴趣度函数为:

对于由用户在页面的停留时间产生的用户兴趣Duration (p) 而言, 其值的大小有幅度的变化, 而且这种幅度的变化往往体现了用户兴趣度的不同。用户在页面的停留时间越长, 表明用户对该页面的兴趣就越大。用户的页面停留时间产生的兴趣度函数Duration (p) 定义为:

其中t是访问时间, 当用户在页面的停留时间t

本文规定当保存、打印、收藏页面这三个行为发生时, 产生的兴趣度不累加, 页面的停留时间也不再作为计算因子加入公式;当保存、打印、收藏页面这三个行为均未发生时, 只计算页面的停留时间产生的兴趣度。因此, 用户访问一次页面p的兴趣度Interest (p) 的计算公式为:

Interest (p) = (1-H (p) ) Duration (p) +H (p)

其H (p) 是一个二值函数, 定义为:

计算得出单次访问页面的兴趣度, 抽取出访问页面中的属性值, 对所有页面包含的每个属性值进行加和标准化后, 得出所有属性值的兴趣度。

最终得到用户短期兴趣向量IMS={, , …, }, 其中i为属性值个数, j为类别个数。

3.3 基于遗忘函数的模型更新

由于人对事物的遗忘是一个渐进的过程, 相同的兴趣在不同阶段对人的重要性是一个逐渐变化的过程[6], 因此, 兴趣的权重可以通过遗忘函数来计算。

对于那些被用户逐渐遗忘的兴趣, 利用基于自然遗忘的兴趣度衰减公式实时计算用户兴趣度在经过一段时间的衰减后剩余的兴趣度。计算公式为:

其中v’j表示属性值fj衰减后的兴趣度;vj表示属性值fj衰减前的兴趣度;T表示属性值fj从上一次访问更新的时间到当前时刻的时间间隔, 单位为分钟;c和k是两个控制常量。

更新只需要模型中属性值上一次访问更新的时间与当前时刻的时间间隔就可以立即计算属性值的剩余兴趣度, 不需要更改模型, 因只具有线性复杂度, 可以快速计算任一时刻的剩余兴趣度, 具有很好的实时性。

4 实验分析

4.1 实验数据

实验的数据主要来自新浪微博, 利用新浪微博提供的API, 得到200名微博用户的基础信息作为训练集, 对微博用户进行聚类。选取某一类别, 利用新浪微博API并通过用户授权, 获取100名该类用户最近一周的浏览行为信息。另外, 通过问卷调查的形式帮助实验用户用人工建模的方法构建兴趣模型, 用于作对比数据。为了方便比较, 模型的表示方法选择兴趣类表示法, 另外还要给出用户兴趣类按照兴趣度大小的排序。

4.2 实验标准

为了验证本文方法得到的兴趣模型的准确性, 需要用合理的评价指标对模型行评价。本文选择直接的方式对模型进行评价, 对于用户兴趣模型采用查全率和查准率作为模型的评价指标。对实验用户用本文的方法进行兴趣建模, 然后通过问卷形式对用户用人工方法建模, 作为其真实的兴趣模型。

查全率能够体现本文方法发现用户兴趣的能力, 判断获得的用户兴趣模型是否全面[8]。公式如下:

查准率表示用本文方法获得的用户兴趣是否正确, 是粗略的评判模型准确性的指标。公式如下:

4.3 模拟实验及结果分析

利用第3.1节聚类分析法对4.1中数据集的200个样本进行训练, 建立用户兴趣池, 获取用户的长期兴趣IML。

以用户的注册信息为 (女, 20~30, 东北, 研究生, 学生) 的样本为例, 该用户的兴趣类别为 (综艺, 旅游, 美食, 音乐, 英语) 。从新浪微博中选取100名与其兴趣类别相同或相似的稳定用户聚为一类, 获得该类用户的共同兴趣向量为

IML= ( (快乐大本营, 0.13, 综艺) , (康熙来了, 0.10, 综艺) , (鼓浪屿, 0.12, 旅游) , (三亚, 0.10, 旅游) , (香港, 0.09, 旅游) , (布丁, 0.09, 美食) , (烤肉, 0.05, 美食) , (五月天, 0.09, 音乐) , (苏打绿, 0.06, 音乐) , (大学英语六级, 0.08, 英语) , (托业, 0.05, 英语) , (托福, 0.04, 英语) )

对用户的浏览行为利用第3.2节所述方法, 计算出每名用户的短期兴趣模型。

最后根据公式IM=0.5×IML+0.5×IMS及第3.3节的模型更新方法, 获得100名实验用户的兴趣模型。

本文的方法得到的用户模型包括用户的兴趣类和对兴趣类的兴趣度, 但是由于用于对比的实验数据, 即用户采用人工方法建立模型时很难准确的给出比较具体的兴趣度的值, 所以只要求给出各个兴趣按照兴趣度大小的排序。

从100名用户的实验结果中随机抽取10名, 其实验得到的模型和用于对比的人工给出模型如表1所示。

为了分析本文所建立的模型的效果, 把本文的新模型与仅基于注册信息的长期兴趣模型和仅基于浏览行为的短期兴趣模型进行对比, 分析这三种模型在查全率和查准率上的优劣。将得到的100名微博用户的兴趣模型, 按照第4.1节给出的公式, 计算出用户兴趣模型的查全率和查准率。得到查全率和查准率的对比数据如图1和图2所示。

通过以上数据可以得出, 采用本文所构建的用户兴趣模型平均查全率和查准率分别为0.816和0.784, 远高于另外两种旧模型, 说明本文的方法能更为全面准确的发现用户的兴趣类别, 能够满足社交网站广告投放系统的需求。

5 结束语

本文通过对社交网站用户的基础信息和浏览行为进行数据挖掘, 建立了一种基于长期兴趣与短期兴趣的混合用户模型。同时, 采用了基于遗传规律的更新方法对模型进行更新, 能够准确实时地对用户的兴趣变化进行处理。该模型能够比较准确地描述用户的兴趣, 具有较高的效率, 并且能够广泛应用于社交网站的广告推荐系统, 增加社交网站的盈利。本文对社交网站用户兴趣建模方法只是作了初步的探索和研究, 还存在着许多的不足之处, 将来的工作中, 还可以针对社交网站的特性考虑其他的数据来源, 如从用户标注的标签, 或者用户关注的特定信息等方面进行数据挖掘, 用来建立兴趣模型。

摘要:鉴于社交网站广告投放系统的需要, 将用户的兴趣爱好分为长期兴趣和短期兴趣两种, 利用用户的注册信息获取长期兴趣, 利用用户的浏览行为获取短期兴趣。为这两种兴趣分别建立用户的稳定兴趣模型和即时兴趣模型, 并将二者结合建立实时的用户兴趣模型, 用以完整实时的表现用户的兴趣爱好。同时, 采用基于自然遗忘的模型更新方法, 将人类的自然遗忘结合到模型的更新方法中。最后, 通过实验验证了该模型的有效性和准确性。

关键词:社交网站,长期兴趣,短期兴趣,自然遗忘

参考文献

[1]黄希庭.认知心理学[M].北京:中国轻工业出版社, 2000:215-219.

[2]SALTON G, WONG A, YANG C S.A vector space model for automatic indexing[J].Communication of ACM, 1975, 18 (5) :613-620.

[3]林霜梅, 汪更生, 陈奕秋.个性化推荐系统中的用户建模以及特征选择[J].计算机工程, 2007, 33 (17) :196-198.

[4]JOACHIMS T, FREITAG D, MITCHETAL T.WebWatcher:A tour guide for the world wide web[C]//Proceedings of the 1997IJCAI, 1997:770-777.

[5]LIU RUI, XIONG RUI, SONG LANG.A new ontologybased user modeling method for personalized recommendation[C]//International Conference on Computer Science and Education, 2010:918-922.

[6]江志恒, 刘乃芩.论遗忘函数——关于记忆心理学的数学讨论[J].心理科学进展, 1988 (3) :56-60.

[7]应晓敏.面向Internet个性化服务的用户建模技术研究[D].长沙:国防科技大学, 2003.

用户偏好统计模型 第2篇

目前,描述用户偏好的方法主要有,相似性、概率和相关性。向量相似性主要应用在协同过滤和内容过滤中;概率主要通过贝叶斯网络预测用户未来的行为;关联规则挖掘中,用关联来描述商品之间的关联性。

向量相似性缺点:无法直观地描述用户对商品的喜欢和不喜欢

概率缺点:概率不能直接描述用户的喜好,只能描述访问的可能性

关联性:主要用来发现有用的规则,并不是偏好

用户心理模型 第3篇

为定量估计与提高基于空间分割的手写输入系统用户绩效,运用Fitts定律及离散变量的数学期望等方法推导了用户绩效的.数学模型.实验验证了该模型在具体界面中能较好地拟合用户在8次(8×24字)训练后的实际操作绩效.应用该模型可较好地拟合用户使用手写系统完成抄写任务的时间、推算输入系统某些参数的最佳设置值;并发现当输入系统的其它参数为定值时,缩短用户单字手写时间会比缩短系统识别时间能更有效地提高用户绩效.

作 者:吴昌旭 李怀龙 杨群会 张侃 作者单位:吴昌旭(University of Michigan,Ann Arbor,U.S.A.48109)

李怀龙,杨群会,张侃(中国科学院心理研究所,北京,100101)

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【用户心理模型】相关文章:

面向IPTV用户的用户动态兴趣模型构建方法02-06

心理应激模型05-30

用户问题05-07

用户规模05-12

用户维护05-16

电力用户06-03

用户个性06-16

虚拟用户06-28

用户营销07-02

用户数据07-24

上一篇:高校教学思想政治理论下一篇:传媒公司