用户使用行为范文

2024-07-13

用户使用行为范文（精选12篇）

用户使用行为第1篇

随着移动互联网时代的到来,手机上网用户数量也已超过宽带上网,智能手机的流行已成为手机市场的一大趋势,智能手机也几乎成了这个时代不可或缺的代表配置。根据工信部最新数据[2,13]显示,2015年前7个月,全国移动流量消费累计达20.2亿GB,同比增长95.3%,三大运营商累计拥有12.95亿用户,其中3G、4G用户总数6.95亿,占比53.7%,随着光纤、4G等高带宽等高速发展,智能手机用户渗透率将达到70%。与传统的互联网相比,移动互联网具有随身行、个人性、位置性、终端性等特性。正是因为这些不同的个性化用户特征,使得移动设备更能够真正体现人的位置特征等动态特性。面对如此庞大的用户群体,如何精准向用户推送服务,成为当前移动互联网经济领域研究的热点[3]。

目前,Keralapura等人[4]研究了一个3G网络中用户的浏览行为,提出了一种基于新的沙漏模型的可扩展性聚类方法,并利用该方法对用户和浏览文件分别进行了聚类。Ahmad Hawalah等人[5]等人提出了用户画像的三级动态代理,并对此方法进行了阐述,提供了计算动态模型准确率的方法。唐胡鑫,钱旭[6]提出基于双路信息熵和凝聚信息熵算法提出双路凝聚信息熵算法与凝聚信息熵算法相比,其数据分析精确度有显著提高,并提出在数据分析过程中,确定合适的α值,能够充分的利用各路数据的协作关系。王继民等人[7]提出了基于日志挖掘的用户行为研究框架,包括主要量化指标、分析流程与主要分析方法。

综合对当前相关文献的理论分析和研究发现,当前针对移动互联用户的研究,仅局限于针对“移动搜索”这一个维度进行的分析与研究,无法体现真正的移动互联用户使用手机行为特征,本文试图对用户行为特征在多维度进行系统的梳理、总结和分析。

2 手机用户行为特征的分析方法

用户通过使用安卓手机,安装本实验应用APP,通过注册、GPS定位等功能,使得后台服务器获取用户的静态数据与动态数据,如图1所示:

本文使用的主要数据分析技术是用户画像,用户画像是对用户的描述,是真实用户的虚拟代表,是在深刻理解真实数据的基础上得出的一个的虚拟用户。本文中用户画像的描述包括静态信息和动态信息两方面,全面描绘出对数据分析有价值的用户信息。并且可以对用户按照习惯特征进行分群、归类,同一用户群内部呈现出特征的相似性,用户群之间呈现出特征的差异性,这就为定向服务提供了数据依据。具体的实现框架如图2所示,该框架主要由四个模块组成,分别是数据采集模块、数据分析模块、用户画像模块、个性化推荐模块,本文的重点在数据分析模块和用户画像模块。

2.1 数据采集的研究

本文利用当前流行的手机APP应用,首先通过用户注册,获取用户的基本信息,包括性别、年龄、手机号、终端类型等;然后通过GPS等功能获取用户的活动信息,对数据进行分析,获得用户动态行为信息,包括用户使用手机时长及频次、用户使用本实验APP的偏好信息、用户的轨迹信息等,及用户在使用个性化推荐的内容后的数据存储,通过对上述所获得的用户数据进行清洗、去重等操作,留下有效数据信息,并将数据转换为所需格式,并存储,流程如图3所示:

2.2 用户使用手机行为特征数据的研究

用户使用手机行为特征数据分析的主要目的是将数据采集模块得到的最终数据进行分析,标签化,再根据算法进行权重分析及计算,并根据用户反馈数据的权重结果,调整用户画像的阈值。

由于用户使用手机的行为数据具有数据量大、类型分散的特征,本文根据系统业务需求,将用户使用手机行为信息主要划分为九个维度,其中包含三个静态维度和三个动态维度。维度主要包含性别、年龄、终端维度。其中年龄维度根据当前中国年龄分类标准[8],及本实验需求,年龄维度的标签有青年、中年、老年。而终端维度包含终端的型号、品牌、参数配置等,根据当前市场流通手机品牌划分为不同的标签类别。

而动态维度主要包含以下三个维度:

1)地域维度:刻画用户的环境属性,可通过实时判断用户的位置,向用户提供实时实地的服务。

2)时间维度:刻画用户使用手机的时间点及时长、频次。

3)兴趣偏好维度:对于客户在互联网使用行为的刻画,包括使用App的情况、用户访问url情况等,并对用户网络使用的流量进行分析,细化数据可以分析到用户每一项业务使用的。

其中,对于时间维度,时间段的划分按照两个小时为一个时间段研究,而手机使用时长及频率,根据对相关文献的研究[9-10],通过大量实验,将用户行为的标签划分为如表1、表2所示的等级。

对于兴趣偏好维度,根据对相关论文的理论研究,以及实际生活中的常见分类标准,将用户行为使用两级标签表示,且动态可扩展。APP偏好标签分类[11]如下图图4所示,而图片分类[12]如图5所示

而对于用户的某个行为标签,需要包含访问或者使用次数和权重两个参数,其中权重[15]根据不同的场景,规则也不同。对于新的偏好,按照公式(1)计算权重,即由访问次数或访问次数决定。例如表(1)所示:某个用户有三种访问行为,分别是财经新闻(150次),促销活动(30次),体育新闻(20次),权重数值即为将不同标签的数值,按照进行百分比折算即可。

而对于在下文中,提到的,当已有偏好的新数据,处于该偏好的波动范围时,偏好的计算规则如公式(2)所示,其中为新/旧权重的不同占比。

如若超出该偏好的波动范围,则偏好的计算规则如公式(2)所示,其中为新/旧权重的不同占比。

然后,根据上述分类,将用户行为数据归到相应类别中,进行统计,最终如(4)所示,其中表示用户i的访问偏好信息,为标签为a类别的用户偏好访问权重:

2.3 用户画像的研究

用户画像模块的主要功能是建立用户画像模型[2],形成针对用户个体及用户群体的模型。本文主要创建用户个体模型和用户分群模型,具体如下:

1)用户个体建模:

基于数据分析模块中提到的六个维度建模,分析用户具体的特征,对用户进行个体画像,这样能够更细粒度地判断用户特征,以便于更加精准推送服务。具体流程如下图6所示:

2)用户分群建模

a)分类建模

分类模型对已有数据根据业务特点分类,将每个用户归属到各个类别中,在此采用B-P神经网络分类算法,即根据各个维度及权重计算出某个用户归属于哪一个类别如公式(5)所示,q其中xi为各个维度,wi为每个维度的权重为相应维度的阈值。而对于类别未知的用户,根据其基本信息,年龄、性别、区域等信息,根据同类型用户的偏好进行预测,以判断其属于哪个类别的概率比较高。

b)关联建模

关联建模是计算偏好相似的用户。在计算两个用户之间的关联度时,采用“余弦计算方法”,即根据上文提到的用户行为信息分类的类别将用户的使用行为用向量表示,则用户U1与用户U2之间的使用行为关联度的计算公式为公式(6)所表示的,其中是用户U1的使用行为,是用户U2的使用行为。

2.4 个性化推荐的研究

该模块的功能[14]是实现根据不同的用户个体或者用户群的用户画像,推送相应特征的内容。工作内容是对内容画像,并根据用户个体模型及用户分群模型,将正确的内容推送给相应的用户或者用户群体。本文使用的推荐算法是

3 试验及结果分析

本实验基于“易划”手机APP应用系统,通过移动互联内容发布平台,对用户使用手机行为特征进行研究。根据上述分析方法,通过采集并处理用户使用行为数据,并对其分析。以用户A在八月份使用手机APP情况为例,分析在8月份,A用户使用的APP次数如下图所示,其中小游戏类APP中,A偏好使用休闲类的游戏,那么此用户的偏好标签为休闲游戏,权重为0.32;通讯类权重为0.21。可以得出,用户A对于APP的使用,更偏好休闲游戏类。在有相关业务,比如APP推送时,根据权重阈值为0.28,那么,向A用户推送休闲游戏类的APP。推送结果如图8所示。

4 结束语

用户使用行为第2篇

国家药品不良反应监测体系

建设项目

药品不良反应监测系统用户手册

中科软科技股份有限公司

2011年5月

国家药品不良反应监测体系建设项目用户手册

c)在弹出的【安全设置 – Internet 区域】中，选择禁用【启用XSS筛选器】。解决在页面中无法显示智能分析报表问题。

国家药品不良反应监测体系建设项目用户手册

d)选择【启用】，【文件下载】；启用【文件下载的自动提示】。可解决无法以excel查看智能分析报表。

e)点击【确定】关闭关闭【安全设置 – Internet 区域】、【Internet 选项】。注：为保证设置生效请关闭所有IE窗口，并重新启动IE。

国家药品不良反应监测体系建设项目用户手册

图 5-2曾经滥用药物选择提示

3.滥用药物主要原因和场所部分，按提示选择多选框。点击“其他原因”多选框则可以填写“其他原因”输入框。案例如下：

图 5-3曾经滥用药物其他

4.尿液检测部分，如选择“未做”和“阴性”则药物检测种类不可填；如选择“阳性”则药物检测种类可填。案例如下：

图 5-4尿液检测

图 5-5尿液检测阳性选择

国家药品不良反应监测体系建设项目用户手册

5.艾滋病病毒检测和是否收治按提示选择。案例如下：

图 5-6艾滋病病毒检测与是否收治

6.本次是否

国家药品不良反应监测体系建设项目用户手册

图 5-9调查表查询列表

5.2.3 操作步骤

1.在页面上按条件填写查询调查表内容，点击“查询”按钮查询符合条件的调查表项目。

2.批量修改申请，可多选，点击表头“批量修改申请”按钮，进入批量修改申请页面，按照页面提示条件输入相应内容点击“保存”提交修改申请。

图 5-10调查表批量修改申请提交

3.导出excel，点击表头“导出excel”，弹出导出excel框。选择当前页面导出当前查询页面的数据，选择当前所有数据可按5000条每次导出相应数据。案例如下：

国家药品不良反应监测体系建设项目用户手册

图 5-11导出Excel 4.操作栏“查看”页面如下：

图 5-12调查表查看

此页面上部分调查表被调查者的基本信息，如：姓名、身份证、病历号等；下部分是被调查者的具体滥用药物情况，如：主要滥用药物、滥用药物来源、因滥用药物感染疾病等。

5.可单条删除调查表记录，逻辑删除。6.可单条提交修改申请。

7.高级查询页面。添加条件，点击“表达式”按钮生成查询表达式，点击查询执行表达式，如果数据库报错会显示在数据库操作异常框内。案例如下：

国家药品不良反应监测体系建设项目用户手册

图 5-13调查表高级查询

5.3 调查表修改申请查询

5.3.2 进入方式

点击左侧功能菜单中【药物滥用调查表管理】【调查表修改申请查询】。进入调查表修改申请查询页面。如下图所示：

图 5-14调查表修改申请查询页面

国家药品不良反应监测体系建设项目用户手册

5.3.3 操作步骤

1.表头可进行多选数据项，然后点击“删除”按钮批量删除。

5.4 修改历史查询

5.4.2 进入方式

点击左侧功能菜单中【药物滥用调查表管理】【修改历史查询】。进入修改历史查询页面。查询条件其中的操作类型为单选按钮，其他查询条件为基本的输入框，查询结果显示效果如下图所示：

图 5-15调查表修改历史查询页面

5.4.3 操作步骤

1.按页面提示条件查询相应数据项。

2.操作栏“查看”链接，点击查看操作后的调查表内容项。如下：

国家药品不良反应监测体系建设项目用户手册

图 5-16修改之前调查表查看页面

5.5 自动审核数据列表

5.5.2 进入方式

点击左侧功能菜单中【药物滥用调查表管理】【药物滥用调查表代审核列表查询】。进入药物滥用调查表代审核列表查询页面。如下图所示：

国家药品不良反应监测体系建设项目用户手册

5.5.3 操作步骤

依据查询条件分别输入表格编号，姓名，填表日期，或者审核原因。其中审核原因为选择下拉框，其它为普通文本输入框。点击查询按钮，便可查询数据结果。点击重置按钮，查询条件数据将清空。

5.6 调查表统计分析

5.6.2 进入方式

点击左侧功能菜单中【滥用药物调查表系统分析】【统计报表分析（报告地）】。进入统计报表分析页面。如下图所示：

5.6.3 操作步骤

点击相关的链接，便可进入对应的报表统计条件查询页面。然后输入相关的查询条件，点击统计按钮，页面将跳转到相关统计数据页面。

国家药品不良反应监测体系建设项目用户手册

5.7 资料管理

5.7.2 进入方式

点击左侧功能菜单中【资料管理】【资料管理】。进入资料管理页面。如下图所示：

图 5-17资料管理页面

5.7.3 操作步骤

1.按页面提示填写相关信息可查询满足条件要求的数据。

2.点击表头“删除”按钮，删除所选数据项，支持多选。

3.点击操作栏“编辑/查看”链接，分别进入修改和查看资料此条资料页面。

国家药品不良反应监测体系建设项目用户手册

5.8 信息通讯

5.8.2 进入方式

点击左侧功能菜单中【信息通讯】【站内信息】。进入站内信息页面。如下图所示：

5.8.3 操作步骤

1>点击写信可以进入写信界面。

国家药品不良反应监测体系建设项目用户手册

2>点击发件箱可以进入发件箱界面。

5.9 共享申请

5.9.2 进入方式

点击左侧功能菜单中【数据共享管理】【共享申请】。进入共享申请页面。如下图所示：

国家药品不良反应监测体系建设项目用户手册

图 5-18共享申请列表

5.9.3 操作步骤

1.按页面提示内容可查询相关数据项。

2.点击表头“申请”按钮，进入数据共享申请页面。如下：

图 5-19添加共享申请

3.点击操作栏“查看”链接，进入查看数据共享页面。如下：

国家药品不良反应监测体系建设项目用户手册

图 5-20共享申请查看

4.点击操作栏“修改”链接，进入修改数据共享页面。如下：

图 5-21共享申请修改

数共享申请修改页面中共享申请地区、合作地区、合作机构设置为选择下拉框。其他为普通文本输入框。当点击重置按钮是，表单数据恢复默认值，点击返回按钮，页面跳转至上一页面。当点击修改按钮，数据库中的数据开始同步更新。并提示操作成功。

5.10 共享数据

5.10.2 进入方式

点击左侧功能菜单中【数据共享管理】【共享数据】。进入共享数据列表页面。如下图所示：

国家药品不良反应监测体系建设项目用户手册

图 5-22共享数据查看页面

5.10.3 操作步骤

1.按页面提示输入条件可查询对应信息。

好产品改变用户行为第3篇

技术转变以场景为载体

什么是好产品？怎样改变用户的行为？以阅读为例，最初人们需要一本本抄在纸上；后来，印刷术的出现让阅读变得更加便捷；而今天，电子阅读又让人放下了纸质读物，转而投向屏幕。技术在不断改变我们的生活。

但是，光有技术是不够的，还要有场景的应用。比如现在很流行的虚拟现实，其实早在几十年前就有，但现在人们想通过眼镜的方式，让其走进千家万户。可对普通消费者来说，这也只是一个技术革新的展示，人们不可能每天都戴着眼镜行走在大街上，产品很难真正地大规模应用于生活场景，不现实。

技术要改变世界，需要场景来作为载体。今天乘坐地铁，大家会发现周围变得越来越安静，人们都沉浸在自己手机里的小屏幕。如果一个技术不能真正使用在生活场景中，那对普通消费者来说就是无用的，因为无法改变他们的行为。

当有足够多的用户改变了自己的行为，就会形成群体性习惯，当人数达到一定的程度后，就可以改变世界。所以好产品不容易，需要让旧习惯变为新习惯，不管时代怎么变化，市场总在那里，就看你怎么让新的习惯产生。

用户习惯成就好产品

只有让用户形成了使用习惯的产品，才能称之为好产品。以三星为例，在功能机时代我们经常去印度调研，想着什么样的产品能给这个市场带来创新。当时有一个现象，印度的生活环境很差，很多地方不通电，天黑以后也没有路灯，很多人回家都只能通过手机屏幕那一点微弱的光亮照明。了解到这一情况后，我们就想能不能在手机上增加一个功能，不再用屏幕，而是其他更省电的方式，随后，就在手机上增加了手电筒的功能。这是一个非常小的改变，但这个改变推动了新的行为，养成一个新的习惯，一旦形成习惯，我们的市场就取得了很大的成功。

现在OPPO卖得很火，可在两年前他们也曾挣扎过。从R系开始，OPPO找到了自己的方向。大家都知道，早前OPPO有一款摄像头可以翻转的手机，市场反响很不错，而现在的“充电5分钟通话2小时”也是可以改变用户习惯的一款产品。

OPPO的技术并不复杂，很多手机厂商都可以做到，但只有OPPO找到了这一点。对用户来说，谁改变了自己，就更容易跟着谁。

当然，很多人谈改变市场，产品走得快，但产能跟不上，没有人用你的产品，怎么会有新习惯代替旧习惯的行为产生。所以产能也是至关重要的一环。

好产品到底能带给用户什么改变。有人说，产品体验就是你在使用过程中所产生的一个感受，这很正确，也很主观，但对厂家来说却并不可控。企业需要的是可控的反馈，想要达到这一点，首先自己要明白产品想给消费者传递什么样的感受。这样，在他使用产品后，才会感受到你所想表达的东西。真正的用户体验从使用前就开始显现，因为在设计的时候，企业已经为消费者做出了所有的设想。

如何培养用户习惯

用户习惯的养成不是一朝一夕的，需要长时间一步一步地培养。如果你经常网购，你一定知道每年有几个日子可以疯狂扫货：“双11”是天猫淘宝的狂欢节，6月18日是京东的周年庆。这两个活动都是经过多年的经营，才达到不用宣传，用户都会知道的效果，甚至有用户会等待购物狂欢节的到来。相比一下唯品会、聚美优品，很少有消费者记得他们的购物狂欢节是什么时候。所以，在产品制造出来之后，还需要培养，才能让用户形成习惯。

持续培养

持续培养并不等于一个活动做一年，一个产品卖几年，而是要在同一个时间点去举办相同的活动，通过产品的迭代进化使用功能。人类的记忆是满足遗忘曲线的，所以要定期地刺激用户的记忆，维持用户的活跃度。

巩固成果

固化不等于每次都做相同的事情，而是要让用户有相似的感觉，但每次都要有新鲜感。持续培养和巩固成果是一套组合拳，缺一不可。想通过持续和固化让用户养成习惯，就必须制定产品运营规范和规律，这样做有两个好处：

通过一次性完成一个周期所需要的产品设计，日后每次运营的开展都更高效；对于用户，可以明确认知、养成用户习惯，用户只要进入产品，就看到这个特定节日的内容，慢慢地让用户培养习惯。

时刻检查数据变化与反馈

数据是调整运营计划一个很好的依据，在产品上市期间需要一直观察数据变化，及时地做出调整。做数据分析的时候，需要活动前后和活动往期做对比，这样才能分析出培养效果。当然，竞争对手也是很好的伙伴，你的成功有一半是由竞争对手成就的，所以需要时刻观察竞争对手的动态然后做出差异化的准备。

一个好的产品未来能不能持续走下去，需要了解用户，改变行为，而不是简单地把一个新的技术推给用户就结束了，要以体验的创新来实现长远的创新，进而实现技术的转化。

用户使用行为第4篇

Don Tapscott根据互联网上不同人口变量群体的上网情况和每个群体的概况, 特别界定出了一个和互联网一起成长起来的一代人——网络新生代 (简称N世代) 。虽然这个概念是Don Tapscott基于美国社会情况界定的, 但中国青年在网络活动中, 确实存在着与其父辈不同的特征。CNNIC第35次中国互联网发展状况调查显示, 2014年中国6.49亿网民中, 25周岁以下的青少年网民规模为2.77亿, 占网民总体的42.7%, 占中国青少年人口总体79.6%。《2014年中国青少年上网行为调查报告》也显示, 交流沟通类应用在青少年网民中拥有较好的使用率, 即时通信、微博、论坛/BBS使用率分别为93%、44.4%和21.1%, 均高于网民总体水平。根据这组数据不难看出, 中国青年群体更倾向于运用互联网进行人际交流, 尤其是利用即时通信工具。虽然现有关于网络社交的研究提出了一些青年群体相对于其他群体的特殊性, 例如:熊莎 (2013) 在研究中发现, 18-25岁用户比其他年龄段的用户在使用社交软件时觉得更有用, 更能帮助他们维系朋友之间的关系并有助于结交新朋友, 并且在使用社交软件时更容易受到周围人的影响, 当周围人都在使用时, 他们倾向于继续使用或者更愿意将微信推荐给其他人, 但研究中并没有将这一群体作为研究对象进行单独研究, 深入的挖掘青年用户群体的特征。

此外, 从社交软件的应用关系 (基于陌生人关系还是基于熟人关系) 维度来看, 现有的研究大多是将基于熟人关系的社交软件作为研究对象, 以近年来发展已经成熟的微信、QQ等为例而展开的。在已有研究中, 已经较为具体详细的研究了社交的行为动机、网络社交对青年的影响及对相应社交软件提出了一些建议。韩雪琳 (2014) 以微信为例, 研究了用户的使用动机、需求和影响用户黏度的原因, 并提出了提高用户黏度的建议。何璐 (2011) 以开心网和QQ空间为例, 详细论述了现有的SNS社交网络的价值和功能, 指出了SNS社交网络对网民产生的正面和负面价值以及不足之处, 并对SNS社交网络未来的发展提出了一些建议。但这些基于熟人关系的相关研究成果是否能延伸到基于陌生人关系的社交软件中, 并未得到完整系统的论证。

再者, 对于涉及陌生人社交的研究, 以专业陌生人社交软件为研究对象的较少, 大多是以网络的匿名环境为主, 探讨用户在网络匿名环境中的使用动机或行为。孙晓军等人 (2014) 论述了网络交往动机对交往行为的影响及线下社交关系对网络社交关系的影响。田丽和安静 (2013) 对网络社交现状、网络社交的基本特征等进行分析, 研究网络社交对现实人际交往的影响, 获得网络社交在人际关系影响方面的认识, 并探讨网络社交对人际交往的影响以及网络社交的主要特点。

在对陌生人社交软件进行研究的过程中, 不难发现传统基于熟人关系的社交软件与基于陌生人关系社交软件的差异。基于熟人关系的社交是对现实人际交往的维系和强化, 能对线下人际交往进行有益地补充 (Valkenbury&Peter, 2009) 。而对于陌生人社交而言, 不存在传统的以血缘、业缘、地缘等为纽带的人际关系, 使虚拟的人际关系间不存在任何固定纽带或稳定关系 (喻俊娇, 2011) 。此外, 相比于传统社交软件, 陌生人社交软件的起步较晚, 由于直接网络外部性, 用户规模越大, 用户感知的效用就越大, 转移成本也越大 (Carlota Lorenzo-Romero, 2011) , 使得用户不太愿意放弃原有的社交软件而转移到新的社交软件上, 造成了陌生人社交软件的用户粘性较低。故由于陌生人社交软件的弱关系纽带和较大的转移成本, 使得如何增强用户粘性成为了陌生人社交软件要解决的重大问题。

但陌生人社交突破了传统人际交往的限制, 减少了交往的束缚, 也增进了人际交往的平等意识 (喻俊娇, 2011) , 使青年用户可以更自由地去选择自己的交友对象, 更好地去展现自己和宣泄情感。心理分析表明, 网上交往的心理动力机制是个人力图控制环境和竭力表现自我的权力欲望 (Wallance, 2001) 。而陌生人社交软件恰好较好地满足用户在什么时候和选择什么样的人为交往对象, 以及用何种形式控制、影响他人, 可以完全不受熟人社会的制约 (赵德华、王晓霞, 2005) , 给了用户一个完全自由, 没有限制的环境。那么, 陌生人社交软件该如何利用自己的优势来寻求一个更好地发展空间, 给用户提供更加优质的服务, 必然成为了一个重要的课题。

基于以上分析, 本文通过分析青年用户使用陌生人社交软件的行为动机, 来更加准确地把握用户的使用心理, 从而不断提升用户对陌生人社交的满意度, 并据此为陌生人社交软件的发展提供一些参考建议。

二、研究方法与数据获取

(一) 研究方法

在本次研究活动中, 笔者采用了文献分析、深度访谈、问卷调查等研究方法。通过阅读文献, 了解研究领域的发展历程和研究现状, 掌握研究领域的主要研究成果和有待进一步研究的方面, 为今后的研究打好基础、指明方向。运用深度访谈法, 在陌生人社交软件中向青年用户询问其使用原因、使用深度及其与陌生人的交流方式, 并了解其真实交友状态, 为后期分析陌生人社交软件对青年用户产生的影响提供信息。运用问卷调查的方法进行数据收集, 通过SPSS统计分析软件对所得到的数据进行定量分析, 借助定量分析的结果对研究内容进行探讨, 并得出结论。

(二) 问卷设计

理性行为理论阐述了态度、意愿、规范和行为之间的关系, 它认为个体的行为由个体动机和意愿决定, 表明动机是行为产生的原因, 而内部动机则是由于某个行为本身或由于执行这个行为所带来的纯粹乐趣和满意感而去做事情的动机 (孙建军、顾东晓, 2014) 。根据Maslow的需求层次理论和Davis提出的技术接受模型, 本文将用户使用陌生人社交软件的内部动机划分为五个方面, 分别是娱乐动机、社交需求、自我实现、信息与工具性和沉浸需要, 各方面具体含义如表1所示。

调查问卷主要包括两大部分:第一部分为人口统计变量相关信息的调研和统计, 包括性别、年龄及使用陌生人社交软件的频率等基本信息;第二部分为变量主体部分, 包括了娱乐动机、社交需求、自我实现、信息与工具性和沉浸需要的测量, 这部分测量采用李克特五级量表法, 采用5分制, 从1分到5分的排列顺序为“非常不同意”、“不同意”、“中立”、“同意”、“非常同意”。

(三) 问卷回收

本次调查采取网上调查模式, 用问卷星发放问卷, 以18到25岁的青年为调查对象。参与线上问卷填写的人数为216人, 成功回收有效问卷为193份, 问卷的有效回收率为89.4%。样本数量的大小应根据调查问卷问项的数量来确定, 一般来说, 一个问项需要5-10倍的样本量, 本研究采用调查问卷的问项共有25个, 因此, 本研究的样本数的最少数量应达到25*5=125份, 故问卷回收数量符合要求。在193份有效问卷中, 涉及到国内28个省份和直辖市, 尽可能覆盖了多省市, 以避免地理差异对问卷数据造成的影响。后台统计193份有效问卷平均耗时为232秒, 可见被调查对象回答问题态度较为认真, 所以可以认为问卷结果较为可信。

三、数据统计与结果分析

(一) 信度分析

本文使用Cronbach Alpha系数来检验每个潜变量构建的内部一致性。一般情况下潜变量的Cronbach Alpha大于0.7就可接受。根据表2所示, 社交需求、自我实现和沉浸需要潜变量的Cronbach Alpha均大于0.7, 这表明问卷中的这几个潜变量都具有较好的内部一致性, 信息水平可以接受。娱乐动机和信息与工具性潜变量的Cronbach Alpha均大于0.6, 虽然一致性较弱, 但仍不失其价值, 可供参考。

(二) 效度分析

本文通过KMO和球形Barlett检验来进行效度分析, 结果显示:KMO的值为0.889大于0.8, 说明效度非常好;Barlett球形检验得出, 近似卡方值为1596.675, 自由度为153, p<0.001, 可认为原始变量之间存在相关性, 适合做因子分析。

(三) 结果分析

1. 陌生人社交软件的青年用户使用频率较低

数据显示:被调查者中只有10.9%的青年用户会每天多次使用陌生人社交软件, 大多数用户的使用频率较低, 说明用户对软件的依赖性不强, 大多数用户多保持着一个理性的态度在使用, 只是将其作为社交的一个辅助工具。相比于陌生人社交软件, 微信、QQ等社交软件的使用频率较高, 而过于频繁的网络交往易使青年漠视、疏远现实生活中融洽的人际关系, 引发孤独与压抑, 表现为兴趣冷淡、情绪低落, 思维迟钝, 甚至弱化青年人的现实人际沟通能力。相较而言, 陌生人社交软件从更大程度上避免了这种问题的发生。

2. 陌生人社交的自我实现动机最为强烈

在陌生人社交软件中进行社交与一般社交软件的最大区别, 是陌生人社交软件中不需要以真实的社会身份为基础, 一些陌生人社交软件还提供用户建立虚拟人格的功能 (例如抱抱中为用户提供个性标签) 。由于社会资源的有限性, 造成了很多人在现实社会中没有自我实现的机会或自我实现受到限制, 陌生人社交软件提供的功能恰好能够使个体掌握和表现自己绝对的主动权。因此, 在陌生人社交软件的使用动机中, 自我实现的动机最为强烈, 反而社交需求动机较弱。青年用户的社交需求, 可以通过熟人社交软件来满足, 因为在青年群体中, 几乎每个人都使用QQ、微信来建立现实社交关系。针对用户的这一使用特点, 软件开发商可以在功能设计时, 多设置能够体现用户自我价值的功能, 让用户有存在感。此外, 在各种功能设计上应该体现不同用户的差异性和个性化, 例如:可以在注册登录时, 显示是第几位注册登录的用户, 让用户体会到自己的存在感, 及自己为这个软件带来的改变。并且, 为用户设立自我价值积分, 在用户为其他用户发表的状态进行回复或给其他用户发表的问题进行解答时, 增加用户的自我价值积分, 让用户感受到自己在这个软件中自我地位的提升, 同时也可以提高用户在这款软件中的转移成本, 提高用户的粘性。

3. 陌生人社交软件的用户粘性较低

虽然陌生人社交打消了熟人社交的顾虑, 可以帮助用户建立各种有益的“弱连带关系”, 但失去了熟人社交血缘、业缘、地缘的纽带, 就失去了用户对软件的依赖和联系。只凭借着制造新的方法来维持对用户的强刺激, 来提高对用户沉浸需要的满足, 不能提高用户的使用频率, 也不能增强用户的粘性。在访谈过程中, 发现用户会给与自己聊得比较投机的交谈者留微信号或手机号, 进行更深层次地交往。这样, 必然会导致陌生人社交软件的转向熟人社交软件, 造成用户流失。因此, 陌生人社交软件的运营商往往会为了追求商业利益, 通过不断地开发新游戏或提供劲爆、非主流的信息, 来延长用户在软件上的停留时间, 导致用户之间展开互动的精力和时间被占用。这样做的另一个弊端是可能会导致用户对社交软件的认知误区, 把陌生人社交软件仅仅看作是一个娱乐工具, 从而使得软件的正效应难以充分发挥, 甚至带来一些负面的影响。所以, 应该加强对青年用户的信息素养教育, 引导青年群体正确地认识和使用相关软件, 使陌生人社交软件可以发挥更大地作用, 带来更多正效应。

4. 陌生人社交软件中的负面情绪宣泄较多

在访谈过程中, 发现陌生人社交软件的青年用户心情不好时更倾向于找陌生好友聊天, 来调节自己、转换心情。甚至, 有使用者会在心情好的时候卸载软件, 当心情不好的时候再安装, 期望在虚拟的网络世界中寻求陌生人的安慰。对于在现实生活中朋友不多或朋友不在身边的青年用户最易产生这种行为, 因为在现实生活中找不到合适的对象倾诉, 只能借助于软件向陌生人倾诉。愉快的事情, 青年用户更愿意发布在朋友圈或空间与朋友们分享, 接受别人的祝贺。因为愉快的事情大家总希望身边更多的人知道 (尤其是熟悉自己的人) , 更能体会到自己完成某项工作或取得某项成绩的不易和对自己的价值, 而陌生人未必能体会得到。相反, 让自己心情不好的事情, 可能是自己的失败经历或者糟糕的处境, 也可能关系到自己身边朋友的利益和声誉, 所以不想让熟悉的人知道或不便让他们知晓。而陌生人社交的环境, 与用户不存在任何实质性的利益冲突, 可以毫不避讳地在其中发表言论, 不会影响到现实生活中别人对自己的看法, 也不会影响到身边的人。它可以像一个宣泄室, 让用户在其中大声说出自己在现实生活中不敢说的话, 也能让用户找到与自己境遇或见解相同的人。但这种宽松的, 不受熟人社会制约的环境, 容易使青年在这个虚拟世界的交往过程中形成一个错误的自我认知、自我评价, 企图用网络交往来补偿现实中的人际关系, 更加不利于现实交往, 甚至逃避现实。在陌生人社交环境中, 用户摆脱了刻板效应, 可以仅凭自己的个人意志构建自己的虚拟人格, 从中得到的反馈也不那么真实可靠, 不利于个人的社会化。对此, 陌生人社交软件可以对用户进行一些积极的引导, 可以定期向用户推送一些积极的句子、短文或故事, 让用户不要沉溺于虚拟的世界, 同时可以检索用户聊天记录或发表的状态中的负面词汇, 当负面词汇量较多的时候, 可以给予提醒, 让用户意识到自己的状态, 并积极做一些调整。这样不仅可以引导用户尽可能多的散发正能量, 也能让用户体会到自己的存在感, 也利于提高用户对软件的认同感。

四、结语

陌生人社交软件的价值在于提供一种交友的途径, 让用户可以打破时空、血缘和业缘的传统交友方式, 仅凭兴趣、爱好、职业等共同特征去交友, 让用户有更多的选择余地。但本文调查发现, 陌生人社交软件能在一定程度上提高青年用户的自我实现需要, 提供给用户一个情感宣泄的场所。虽然大部分青年用户是以一种理性的态度在使用, 但这种自由宽松的虚拟环境, 可能会使少部分心理发育还不完全的青年群体产生错误的自我认知和自我评价, 需要对其加以引导。

相比于传统的、发展成熟的社交软件 (QQ、微信等) , 陌生人社交软件的起步较晚, 故用户在陌生人社交软件上的转移成本较低, 导致用户的粘性较低。笔者认为陌生人社交软件今后可以增加积分等功能来提高用户的转移成本, 减少用户向微信等社交软件转移本社交软件上好友的现象。此外, 陌生人社交软件可以通过开发一些可以提高用户自我实现需求的功能, 尽量避免与传统社交软件的同质性, 来提高用户粘性及满意度。

本研究由于客观条件的限制, 考虑到问卷填写的质量和数量, 在问卷设计中题量不能太多, 故对用户个人信息和交友情况的调查较少, 而侧重于对用户使用动机的测量, 没有针对不同性格特征的用户做出定量的分析, 也未详细阐明用户在现实生活中的社交情况对用户在陌生人社交软件中的行为方式的影响, 只是在深度访谈环节对现实交友情况进行了了解, 形成了一些宽泛的看法, 但这些研究结果并不够系统和完善, 在以后的研究中将对这两方面进行补充。

参考文献

[1]Nicholas Negroponte.数字化生存[M].海口:海南出版社, 1996:269.

[2]中国互联网络信息中心 (CNNIC) . (2015) .2014年中国青少年上网行为调查报告.引自http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/qsnbg/201506/P020150603434893070975.pdf.

[3]孙晓军, 牛更枫, 周宗奎, 魏华, 刘勤学.大学生的人际归因倾向、网络交往动机与网络人际关系成瘾的关系研究[J].心理科学.2014 (6) :1397-1403.

[4]田丽, 安静.网络社交现状及对现实人际交往的影响研究[J].图书情报工作, 2013 (8) , 57 (15) :13-19.

[6]喻俊娇.网络环境与青年人际价值观的培养[J].广西青年干部学院学报, 2011, 21 (2) :15-26.

[7]Carlota Lorenzo-Romero.Consumer adoption of social networking sites:implications for theory and practice[J].Journal of Research in Interactive Marketing, 2011 (5) :70-188.

[8]Patricia Wallance.互联网心理学[M].北京:中国轻工业出版社, 2001:192-196.

[9]赵德华, 王晓霞.网络人际交往动机探析[J].社会科学, 2005 (11) :118-123.

用户使用报告第5篇

某某项目绩效跟踪及评价项目于2013年5月在我单位启动。承建单位某某公司按照项目绩效跟踪及评价要求，对我单位XX类项目、XX类项目、XXXX、XXXX、XXXX财政支出绩效、XXXX经济社会效益和平台总体绩效等方面进行了基本情况调查、现场驻点、访调研、专题讨论等工作，提交了调研报告、绩效评价报告、功效分析、工作建议报告等资料。

该项目截止2014年7月，已完成了与各相关建设单位、平台应用企业、项目推广单位和企业的交流、走访、调研；组织绩效专题讨论会、绩效专家咨询活动；构建了构建绩效评价指标体系；提交平台运行绩效评价报告、工作建议报告等工作。

基于以上情况，我单位对某某公司承建的某某项目绩效跟踪及评价项目的验收成果表示认可。

网络环境下用户的信息搜寻行为第6篇

21世纪的社会无疑是一个大数据的时代，网络信息搜寻已逐步替代手工信息搜寻成为一个炙手可热的学科，网络环境下，用户的信息搜寻行为有许多种，本文主要通过介绍用户的信息搜寻行为，包括信息信息检索、信息浏览和信息询问，并分别对这些行为进行解释，阐述了信息搜寻行为的概念，为下面的论述做铺垫。接着列出信息搜寻的途径，深刻了解网络环境中信息搜寻与传统信息搜寻的区别；然后分析了影响用户信息搜寻行为的因素，主要从三个方面入手，个体因素、环境因素和成本因素，分别对他们进行阐释，最后得出结论，研究网络环境中用户的信息搜寻行为的意义是能让用户在这个大数据时代更好的获取所需要的信息。

用户信息搜寻行为概述

网络环境是一个非常复杂的环境，充斥着许多良莠不齐的信息，纷繁复杂，怎么在众多的信息中以最快的速度找到自己需要的并且有价值的信息，是用户信息搜寻行为的关键。按搜寻的内容划分，主要的信息搜寻行为有：购物网站的信息搜寻、学术网站的信息搜寻（CNKI等）、交友网站的信息搜寻、娱乐网站的信息搜寻、服务性网站的信息搜寻等。信息搜寻行为可以分为三种：信息检索、信息浏览、信息询问，这三种行为通常在一个搜寻过程中出现。信息检索一词在情报学中通常是指消费者对计算机情报检索系统的检索。所以，威尔逊把将信息检索行为专门定义为“信息用户（消费者）在与计算机系统交互作用时的各种行为表现”。信息浏览即选择有价值的信息进行浏览，信息询问即对不了解的信息进行询问。这三个过程通常是按顺序发生在信息搜寻行为中的。

信息搜寻行为的概念

为了对用户信息搜寻行为进行更深入的研究，首先要从信息搜寻行为的概念开始。信息搜寻行为是指有意识地激活记忆里所储存的知识或在周围环境中获得信息的过程（Engel，BlaekwellnadMinard，1986）。许多学者都对信息搜寻行为下了定义：廖以民认为“所谓信息搜寻行为就是因信息需求所产生的外在的有计划的或无计划的搜寻行为”。AbdelmajdiBouaZza认为“信息搜寻行为就是信息利用，也即利用信息来满足个体的信息需求的行为”。

网络环境下信息搜寻的途径

网络环境下信息的搜索途径主要有人际网络、数据库系统、社会媒体。网络是一个大型的信息检索系统，一个信息组织工具，一个沟通的渠道。

人际关系具有一定的局限性，因为我们所在的交际圈只是社会中很小的一部分，但是如果能利用好人际关系，也会给信息搜寻带来很大的帮助。人际关系主要包括社交网络，交友平台等，用户可以通过互动式问答来搜寻需要的信息。

数据库系统是一个庞大的系统，容纳了许多知识，用户可以通过信息检索行为快速的搜寻到需要的信息。大数据时代的数据库系统，无疑是信息存储量最大的数据库系统，当然也需要有效的数据挖掘技术，这样才会更方便有效的利用数据库。

社会媒体具有广泛的用户参与性，用户可以交流、协作、分享以及传播等，比如微博极大化地丰富了社会媒体。这不同于大众传播媒体，通过传统的电视、广告和报纸传播信息。社会媒体包括的博客、共享文档等。已有调查报告对种社会媒体的使用进行了调查，包括：协作式协作工具、会议工具、在线调度与会议安排工具、社交网络、图片或视频共享工具、微博、社会标签和书签。调查显示，用户利用社会媒体进行信息搜寻行为的频率正在逐步提高，用户可以通过一系列的社会媒体，搜索到有价值的信息。

信息搜寻行为的影响因素

网络环境下信息搜寻行为是由信息需求而产生的，终止于有价值信息的出现。信息搜寻过程是一个非常复杂的过程，它受很多方面的影响，Widdows（1999）的研究表明“用户的需求、兴趣与情绪状态不仅决定用户是否进行信息搜寻，而且还影用户如何对待和处理信息”。下面就几个有代表性的影响因素进行分析：

个体因素：不同的用户会有不同的信息需求，在不同的需求驱使下，会进行不同的信息搜寻行为。具体的个体因素包括：受教育程度、收入水平、性格、态度等方面。用户因为个体差异，所以会有不同的信息搜寻行为。不同的个体，也会有不同的价值观，用户搜寻信息，往往与他们的价值观相联系，符合价值观的信息即认为是有价值的信息。

环境因素：用户处在不同的环境中，往往会有不同的信息需求，则会产生不同的信息搜寻行为。环境因素具体包括：时间、地点、可利用的信息资源等。环境因素可以对信息搜寻行为造成直接影响，也可以造成间接影响。例如，用户所在的环境是一个信息资源相对匮乏的环境，那么他的信息搜寻行为与资源丰富的相比，就会明显受到环境的限制，这是环境对信息搜寻行为造成的直接影响。然而，用户如果处于一个相对聒噪的环境，他的信息搜寻行为与安静环境相比，信息搜寻能力会明显下降，受到了外部环境的影响，导致心理状况发生变化，也会间接地影响到用户的信息搜寻行为。

搜寻成本因素：信息的搜寻成本是影响用户信息搜寻行为的关键因素。搜寻成本的度量离不开搜寻时间，信息搜寻时间是指用户从信息检索行为开始到获得检索结果的一段时间，其间所付出的费用就是信息搜寻成本。信息搜寻成本具体包括：时间、精力、金钱等。

本文主要探讨了网络环境下用户的信息搜寻行为，介绍了信息搜寻行为的概念，主要把信息搜寻建立在网络环境下，以网络环境为基础探讨用户的信息搜寻行为，相比传统的信息搜寻，更加突出了互联网时代大数据的特征。网络环境下用户的信息搜寻途径有许多，研究不同用户的不同信息搜寻行为，有助于我们对网络的完善，有助于工作者对各种类型数据更好的加以处理，让用户能更好的搜寻到有价值的信息。

档案用户利用行为动机分析第7篇

一、学术利用行为动机分析

学术利用用户主要是通过对档案信息的综合分析, 作用于科学研究之中, 使得旧有的信息经过深化成为预测未来的依据。该类用户行为又分为社会科学研究行为以及自然科学研究行为。

社会科学研究行为侧重于改造人类生活的社会。该类档案时间跨度很大, 而且现今档案存放也不在一处, 因而查阅不便。为了获取最完整和最准确的信息, 需要社会科学研究行为用户付出持续的精力。此外, 该类用户需求档案的政治色彩浓烈。历史上统治者从自身的阶级利益出发, 对档案肆意取舍, 导致档案遭到很大破坏, 增加了利用的难度。

自然科学利用行为侧重对思维、理论的研究, 研究范围的不同使得其利用需求与社会科学利用行为呈现明显的差异。自然科学利用行为用户需要档案内容更专业, 多为与研究工作紧密相关的同一学科, 其研究范围是越来越窄。而且, 其需求的档案跨越性不如社会科学长远, 有明确的阶段划分, 需要的档案信息要求完整性和准确性, 从而为科研工作提供进一步探索的依据。

学术利用用户普遍信息素质高, 能力强, 需要的档案信息层次也高。一般来说, 档案意识越强, 则用户在处理工作或者遇到问题时, 充分利用档案信息资源来处理问题的自觉性就高, 利用先进技术获取档案信息的能力越强, 在档案信息利用过程中体现的尊重他人知识产权的意识也更强。这类用户需求信息不仅仅是为工作服务, 更是通过科研不断创新, 不断的实现自我价值。

学术利用用户需要的信息更专业, 更准确。这类用户可以准确描述自己的信息需求, 但由于其需求的专业性, 档案部门提供的信息多为繁复的原始信息。因此, 针对这类用户, 档案部门要积极配合其工作, 并联合用户, 制定专题, 为用户提供高效的服务。

二、实际利用行为动机分析

实际利用行为的用户的信息需求多为管理服务。其需要各类政策、方针、指南、方案等为单位提供决策, 制定规章制度。这类用户所需的档案信息政治性较强, 多采用相关法律、法规、政策、方案等, 且距离形成时间越近越好。实际利用行为的用户从事的工作社会性和政治性较强, 这不仅要求档案信息的准确性, 更需要档案信息内容的广泛性以及及时性。

实际利用行为的用户信息素质较高, 利用能力较强。由于从事管理职业, 需求档案的内容比较集中, 多以利用文书档案为主。这类用户在现实工作中, 需要查找解决实际的问题, 因而需要借助档案作为依据。此外, 实际利用行为用户还需要借助档案获取最客观、最真实的参考依据, 以便在大量充足的依据上, 综合判断、科学分析, 做出正确的决策。这类用户需求的档案信息更倾向于二次文献信息, 不仅快捷, 而且全面。

三、普遍利用行为动机分析

普遍利用行为的用户最为广泛, 学生、工人、商人、农民等各行各业的人员都是这个用户群体的组成部分。该类用户是我国存在人数最多的群体, 但其利用档案的比例却较低。该类用户的行为多具有突发性, 目的性强, 且要求迫切。这类用户的利用行为只会在碰到与自身利益相关的事情发生时产生, 如学生需要学籍档案办理出国手续或者是农民需要土地证明获取补助等。普遍利用行为的用户不需要对档案信息进行分析, 其查询档案的目的就是获得最明确的凭证, 解决问题。

普遍利用行为的用户需求内容最具多样性, 不同的职业、场合、利益出发点导致其需求目的各不相同。此外, 该类用户的需求行为是最具动态的, 档案利用者的目的变化受时间、地点等社会因素影响明显。普遍利用行为多与利用者的切身利益相关, 对信息的再利用率不高, 处于需求的中低层次。这类用户在寻求帮助时, 表达需求的能力不强, 因而更需要档案部门的帮助。

四、提升档案用户的行为层次

用户的档案信息素质与档案信息需求紧密相关。档案信息素质越高的用户, 档案信息需求会越高, 档案信息利用的效果也会越好, 这会促使他产生更多的档案信息需求, 使他的优势更为明显, 越来越成为档案信息的富有者;反之, 则成为档案信息的贫穷者。所以, 提升档案用户的行为层次, 不是简单地将普遍利用行为的用户转为学术利用行为的用户, 而是从根本上提升档案用户的信息素质。

(一) 通过知识的改变提升用户利用行为层次。

知识的改变可以包括用户自身的综合素质以及档案信息素质的双重提高。用户可以通过学习拓展知识面, 提高知识素养。档案信息素质的提升亦是一个积累的过程。首先, 用户要意识到档案利用的重要性以及普遍性。档案部门可以开展各项展览、讲座, 让用户意识到档案是与生活息息相关的, 档案利用是每个人都可能碰到的。培养用户的档案意识, 尤其是挖掘潜在的档案用户, 是十分重要的工作, 他们是档案信息开发工作能否在更广泛的范围内产生效果的关键。其次, 要激发用户的利用需求。用户的档案需求是用户利用信息的某种愿望, 通常情况下用户会明确地表达出来。然而, 有些用户由于受自身及环境的影响, 未能激发利用需求, 使其需求长期处于潜在的隐藏状态。这就需要档案部门加大与用户的沟通, 关注潜在需求的用户, 积极问询, 提供服务。最后, 要普及档案利用专业技能。档案利用亦是需要专业知识的辅佐才能更有效率地完成。随着科技的进步, 档案利用也迈向科技化。所以, 档案部门要加大对用户的技术支持, 要给予用户从问询到检索到复印到借阅等一系列专业的帮助;要完善对档案信息的统计与整理, 加大对数据库的管理, 采取简单易行的检索方式, 提供热情的服务, 辅佐用户完成对信息的获取。

(二) 通过态度的改变提升用户利用行为层次。

用户在线行为的记忆性研究第8篇

Barabási[4]最早发现电子邮件(Email)和爱因斯坦等人回复信件的间隔时间服从幂律分布,并提出了一个简单的基于任务优先级的排队论模型。后续有很多学者从不同的数据集去挖掘和分析更多的人类行为规律,譬如,在线电影点评[5]、网上购物[6]、微博的发布[7]、网页浏览[8]、电子邮件和信件的发送[9]和移动电话通信[10]等,从中发现大量人类行为的时间间隔分布均具有胖尾特征。

不少学者尝试着建立模型去解释人类行为中所表现的非泊松特性,周涛等人[11]试图从用户的在线行为中挖掘出人类兴趣的变化规律,考虑了优先返回,惯性效应以及新兴趣的探索三大要素,并建立了有偏的随机游走模型;韩筱璞等人[12]则提出了基于自适应兴趣的模型,该模型再现了用户通信间隔时间的幂律特性,幂指数为-1;焦玉等人[13]通过结合考虑排队模型与人类行为特有的习惯特征建立了基于习惯的人类动力学模型;王澎等人在文献[14]中发现了人类行为间隔时间的短期记忆性,并提出了一个基于时间偏好的简单模型,很好的再现了用户选择行为中间隔时间的胖尾特征和强的相关性关系。

现有的研究大都基于用户在线行为时间间隔的角度展开的,分析了时间间隔的统计特性,本文则从用户上网访问量的角度研究用户行为的统计特性,重点研究了用户访问量上存在的记忆特性。本文的研究结果有助于预测用户网络访问行为,为基于网络行为的网络安全管理提供策略指导。

1 实证数据分析

1.1 数据描述

本文分析的数据来源于某高校信息服务中心提供的网关日志记录,根据研究目的从原始数据中提取了两组数据集,分别为qzone数据集、sinawb数据集,这两组数据集的时间段都是2014年3月20日起至2014年7月1日为止。第一组数据集是随机抽取1 853人对QQ空间这个特定社交网站在这段时间内的访问记录,共计1 791 382条记录。第二组数据集随机抽取的是2 094人在这段时间内对新浪微博的访问记录,共计2 029 978条记录。数据中一条记录表示用户的一次上网访问行为。

1.2 分析方法

本文研究目的是从用户上网访问量的角度出发,研究用户上网访问序列上存在的记忆特性。为了研究以及描述方便,作出了如下一些定义。

(1){x1,x2,…,xi,…,xn}为访问时间序列,其中xi表示用户在第i天的访问量(i=1,2,…,n),

(2){y1,y2,…,yj,…,ym}为访问序列,其中yj表示用户在第j次在线状态的访问量(j=1,2,…,m),满足yj=xi的条件是序列{x1,x2,…,xi-1}中存在j-1个不为0的数且xi≠0,m表示该访问序列的长度,本文中定义用户的活跃性A=m,为了确保结果的准确性,主要研究了A≥50的用户。

为了定量分析访问序列的记忆性M,使用了文献[15]中计算相关性的方法,定义如下。

式(1)中ri表示该序列中的第i个值,m1、m2和σ1、σ2分别表示序列{r1,r2,…,rk-1}、{r2,r3,…,rk}的均值和标准差。

从M的定义中可知,相关性系数的范围M∈(-1,1)。如果M值为正数,则表示在序列中较大(较小)的值后面倾向于跟着一个更大(小)值;如果M值为负数,则表示序列中较大(较小)的值后面倾向于跟着一个较小(较大)的值。实际上,自相关系数方法可以测量出单个序列中相邻两个值之间的关联,因此,自相关系数可以用来描述记忆效应。

1.3 分析结果

利用公式(1)去计算每个用户访问序列的记忆性M,统计并观察群体用户M的概率分布,如图1所示,两组数据集M的概率分布均服从高斯分布,均值都大于0,表现出强记忆性。图1中同时表现出了随机模式下M的概率分布。随机模式是指随机打乱每个用户访问序列,以消除原访问序列中的行为模式,然后再次利用公式(1)计算每个用户的记忆性M,统计并观察群体用户M的概率分布,发现两组数据集的M均值近似为0,表现出弱的记忆性。通过比较两种模式,发现用户的上网行为存在强记忆性,表明用户的上网行为有一定的行为模式,并不是完全随机的。

使用梯度下降法拟合了实证数据中的记忆性M分布,拟合出来的高斯方程为

进一步研究了用户记忆性的持续时长。文献[16]中为了观察用户记忆的持续特性,定义了从高于(或低于)序列的均值变成低于(或高于)序列的均值就表示当前记忆持续的结束或者称为下次记忆持续的开始。如图2所示,统计观察到两组数据集中用户在线时的访问量yi的概率分布近似服从幂律分布,访问量高于均值的在线状态天数很少,使用均值作为分界线不能很好的反映数据,因此,本文尝试着使用中位数作为分界线,来判断记忆持续的开始或者结束。一个用户会产生很多次的记忆,定义λ作为每次记忆的长度,用于表示记忆的持续时长,如图3(a)所示。特别指出的是记忆持续时长λ的总和等于该序列的总长度,即λi表示该用户第i次记忆持续时长,k表示该用户的记忆数,L表示该用户访问序列的总长度。

图1两组数据集中用户上网行为记忆性M的概率分布图。均服从高斯分布且均值分别为〈Mqzone〉=0.224 62、〈Msinawb〉=0.162 21Fig.1 The distributions of memory M for the qzone and sinawb datasets.They all follow the normal distribution,in which,the memory〈Mqzone〉=0.224 62 and〈Msinawb〉=0.162 21

本文使用极大似然估计法拟合了实证数据中的记忆性M分布,拟合出来的幂律分布方程为:

从图3(b)可以直观的观察出在个体水平上记忆持续时长λ的分布P(λ)近似呈现出幂律特性,也就是说单个用户有可能存在长的记忆持续时长。实际上,在个体水平上,不同活跃程度的用户其λ均服从幂律分布。而在群体水平上,如图4所示,记忆时长分布P(λ)同样近似服从幂律分布。考虑完全随机的情况下,一个用户每天的访问量大于或小于访问序列的中位数的概率是0.5。理论上,可得出群体在完全随机的情况下λ的概率分布P(λ)服从指数分布,即P(λ)=0.5λ。图4同时显示了用户访问序列在完全随机的情况下的P(λ)分布,发现其与指数分布相吻合,也就是说,用户的上网行为一旦消除了其特有的行为模式之后就会表现出强随机性。

图2两组数据集中用户每天访问量在群体水平上的概率分布图。均近似服从幂律分布且幂指数分别为αqzone≈1.938 8和αsinawb≈2.111 6Fig.2 The distributions of the Internet traffic of the whole population for the two datasets.The two distributions can be fitted as P(L)~L-α,with exponentsα≈1.938 8 andα≈2.111 6

2 建模与仿真

2.1 模型的建立

通过以上的实证数据分析发现,用户连续两次访问量之间存在一定的相关性,即一个用户的下一次的访问量取决于当前访问量。因此,使用马尔科夫过程来模拟用户访问行为的内在机制,即用户根据当前访问量决定下一次访问量的大小。进一步,统计了连续两次访问量的偏差δ=yi+1-yi,发现其服从高斯分布且期望为μ=0,标准差为20.57。因此,马尔科夫过程的跳转概率服从期望为μ=yi、标准差为σ的高斯分布。从而,利用高斯分布即可求得用户下一个在线状态的访问量yi+1,其概率密度方程为

图3一个典型用户的记忆序列图以及记忆时长λ的概率分布图。子图(a)表示该用户的记忆序列,λ=5表示记忆时长为5;子图(b)呈现了该用户记忆时长λ的概率分布P(λ),其服从幂律分布P(λ)~λ-α,幂指数为α=1.294 4Fig.3 A typical user’s memory sequence and duration distribution P(λ)from the qzone data.Subplot(a)show the memory sequence,one of his/her memory’s duration isλ=5;Subplot(b)show the duration distribution P(λ),which follows the power-law distribution.The value of the fitted exponentαare approximately 1.294 4 for the one

2.2 仿真分析

根据以上模型,可由方程(4)产生的连续随机序列来仿真用户的访问序列。为了更好的逼近现实,在仿真过程中的一些假设参数都是从实证数据中直接获取,包括仿真中的用户数、每个用户活跃的天数以及每个用户第一次访问量的初始值。

在上面的模型中,有一个自由变量σ。尽管在实证数据中已经计算出σ,这个参数控制记忆效应的长度以及记忆持续P(λ)的分布。分析结果如图5所示,当σ取不同值的时候,发现记忆持续P(λ)呈现不同的指数截断幂律分布。该分布的前半截服从幂律分布,后半截服从指数分布,且随着参数σ的增加,后半截的指数分布更加明显,模型的仿真结果在一定程度上与实际情况较为吻合。

图4两组数据集中真实数据和随机模式下λ的概率分布对比图。真实情况下P(λ)近似服从幂律分布,而随机模式下P(λ)服从指数分布且与指数函数f(λ)=0.5λ近似吻合Fig.4 Memory duration distributions P(λ)of the empirical data,the null model,and the totally random case for the two datasets.While durationλof the empirical data follows the power-law distribution,that of the null model approximately follows the exponential distribution,which is very similar with the totally random case in which f(λ)=0.5λ

3 结束语

本文根据某高校的网关日志记录数据,从个体层面和群体层面对用户上网行为的记忆性进行了初步的探讨和研究分析。得出如下结论。

(1)用户的上网行为有较强记忆性,整体记忆性M服从高斯分布。两组数据集分别是QQ空间和新浪微博的历史访问记录日志,其表现出来的平均记忆性分别为〈Mqzone〉=0.224 62和〈Msinawb〉=0.162 21。

(2)用户记忆时长的概率分布P(λ)呈现幂律特性,而在随机模式下,其记忆时长的概率分布P(λ)服从指数分布且与f(λ)=0.5λ相吻合。

结合该高校用户访问社交网站数据的特点,本文采用了相应的马尔科夫过程模型,通过仿真发现该模型能够在一定程度上反应出用户上网行为的记忆性特征。

综上所述,用户的上网行为具有较强的记忆性,存在时间行为特征,并不是完全随机的,而是遵循一定的行为模式。随着网络的快速发展,网络用户越来越多,产生了海量的用户行为数据,如何整合这些信息,挖掘出更多的潜在模式,是值得以后深入研究的。

摘要：用户在线行为的记忆性研究有助于揭示用户在线行为特性,构建更准确的在线行为预测模式,对基于在线行为的网络安全防御和信息推荐都具有重要的意义。基于收集的某高校网关日志数据,首先分析了用户在线行为中的记忆特性。研究发现用户的在线行为具有较强的记忆性,其分布服从高斯分布。其次,定义了用户在线行为的记忆长度,统计发现其在个体水平和群体水平上都呈现幂律分布,表明用户的在线行为存在长期记忆。据此建立了马尔科夫过程模型,仿真重现了用户上网行为的记忆性特征。研究结果表明用户的在线行为不仅具有记忆性,而且这种记忆性可以为用户在线行为模式的构建提供指导。

基于用户行为的网站推荐系统模型第9篇

如何识别用户的喜好,是Web个性化[1]的关键技术。通过精确匹配由用户访问兴趣建立的项目/对象模型,可有效地解决信息超载的问题。然而,用户的行为识别是一个复杂的过程,它涉及到各种搜索参数之间的关系。在用户行为建模方面,从服务器日志中获得的隐式数据更可靠,因为它反映了在各自网站的查询中用户的实际需求。然而,这些数据的问题是多维度的,如日期、时间、使用的操作系统、浏览器和其他细节。检索它们之间的关系是一个复杂的过程。传统的方法使用两个多维数据建模技术、欧氏距离或余弦相似度措施,但是,以往的研究表明[2],在高维空间中,聚类的属性选择不同会产生相当大的差异。在这项研究中,我们建议使用TSM(张量空间模型),这是更高的三维数据建模工具,以有效地挖掘用户的信息,包括在每个维度上的用户访问兴趣。

1 相关的工作

TSM的使用已经成为流行,其多维数据建模和推论的能力已得到认可[3,4]。使用TSM Web挖掘和相关工作正处于起步阶段。TSM已广泛使用在化学计量学[4]。利用点击流数据来定位个性化网络搜索可以有效地进行Web挖掘[5]。最近,提出了ptucker(潜变量概率模型),它具有学习依赖性结构的能力。TSM使用降维HOSVD,已用于个性化的音乐和标签推荐体系,研究人员使用TSM创建基于标签的推荐模型。最近的工作是TSM的集群。不同于先前讨论的这些方法,我们将单个用户的行为模型化,组成张量,然后使用这种模式,根据用户最受好评的兴趣提出建议。

2 提出的方法

我们遵循传统的符号[4,5],标量采用小写字母,向量采用一维数组,矩阵采用两维数组。张量可以用下式n阶方阵表示

T∈RM1×M2×…×Mn. (1)

构建用户喜好模型中最关键的任务就是在每个维度上寻找相关特性,可以分为三个步骤是:(1)模型的构建(利用原始数据构建张量),(2)模型分解(寻找突出特性和不同特性之间的潜在关系),(3)重建模型(从每个维度中寻找相关特性)。

第1步,模型的构建:创建张量模型之前要进行数据预处理,包括删除不必要的属性或特征的数据集。要做到这一点,可进行分组、分节。对每个用户的会话数据进行分析。会话中所有出现的独特功能都提取到张量模型作为代表模式。构建好的用户访问张量如下:

T∈RMake×Mmodel×Bodytype×Searchtype×Costtype. (2)

第2步,模型分解:在多维数据模型的分解过程中,能够找到最突出的部分(即张量项和模式),以及可能存在的不同组件之间的隐藏关系。我们使用的是PARAFAC,Tucker和HOSVD张量分解技术。

第3步:重建模型:一旦用户模型创建和分解好后(步骤1和2),取每个维度上的前n个值作为维度值。如图1所示:

3 评价体系与结论

评价实验数据集:日志数据从太原龙城热线网站中200个用户组成的数据集的一部分,其中每一个用户有不同数量且至少4次以上搜索。

用于评估的各种方法采用高搜索项目(频率为基础),采用SVD、PCA、NNMF、PARAFAC、Tuacker、HOSVD张量分解技术。实验结果如表1所示:

整体而言,张量方法和三个矩阵方法(SVD,PCA和NNMF)相比,TSM要远远优于矩阵方法。基于多个搜索属性的用户行为建模是一个复杂的问题。从向量矩阵的各种方法来发现用户搜索的突出特点是当前研究热点。然而,由于Web日志数据的多维度,这些信息很容易松散化。为了映射相互关系,以避免失去不同的搜索组件之间存在着的潜在关系,有必要使用一些高维数据分析技术,像张量模型。这项研究主要集中在使用张量来进行用户行为建模。然而,为每个用户建立单独的张量模型的主要缺点之一是在时间和空间的开销。时间问题可以考虑建立离线,但空间和计算成本,以及建立高质量的推荐系统是一个重要的考虑因素,需要继续仔细分析研究,这将是我们下一步的工作重点。

参考文献

[1]Mobasher B.“Data Mining for Web Personalization”,inThe Adaptive Web[M].vol.4321,A.K.P.Brusi-lovsky,and W.Nejdl(Eds.),Ed.,2007:90-135.

[2] Skillicorn D. Understanding Complex Datasets: Data Mining With Matrix Decompositions[M].Chapman & Hall/CRC,2007.

[3]Kleinberg J.Authoritative sources in a hyperlinked envi-ronment[G].in Proceedings of the 9th Annual ACM-SI-AM Symposium on Discrete Algorithms,January 1998:668-677.

[4]Kolda T G,Bader B W.Tensor Decompositions and Ap-plications[G].Technical Report SAND2007-6702,San-dia National Laboratories,Albuquerque,NM and Liver-more,CA,,November 2007.

移动互联网用户行为分析第10篇

1 互联网行为的定义与行为分析的各个阶段

1.1 互联网行为定义

所谓互联网行为, 就是指行为主体为实现特点的目标, 以互联网为媒介而进行的一种有意识的社会活动。互联网行为具有社会行为的特点与基本构成要素。但究其实质而言, 互联网行为主要局限在虚拟网络空间中, 因此这种行为一般不具有物理行为的特点。同时, 互联网用户不存在空间上的距离, 这一特点就决定了互联网用户具有互联网优势, 能够实现长距离、超长距离上的信息传输。

1.2 互联网用户行为分析的阶段

(1) 预处理阶段。指通过各种可利用数据资源, 记录、使用互联网内容, 并同时完成数据提取。预处理是用户行为分析的基础性过程, 其基本内容包括记录预处理、内容预处理、信息结构预处理等。目前, 常见的用户行为分析模式主要包括: (1) 联系模式; (2) 统计分析; (3) 序列分析; (4) 依赖模式。

(2) 模式分析:对本模式中所发现的不感兴趣规则进行过滤, 通过知识查询机制解决问题。

(3) 建立互联网用户行为分析模式。

2 互联网用户行为特征分析

2.1 互联网用户行为的基本特征

现阶段, 互联网用户行为主要指用户的信息行为, 在此背景下互联网用户行为主要表现为以下几方面。

2.1.1 移动互联网用户的上网驱动力

本文简单统计了不同互联网人群的上网浏览信息, 具体结果见表1。

由表1可发现, 不同年龄段人群的上网驱动力存在较大差异, 但从上诉图表相关组成要素来看, 信息传输网页所占比例最大, 由此可见, 用户对移动搜索的需求最大。

2.1.2 移动互联网用户网络使用偏好

用户移动互联网应用主要表现在移动浏览器、通信与移动新闻三个方面, 这与现代人们生活的一般趋势是相吻合的。同时, 网上银行支付、移动办公、移动电子商务等新型电子信息正在不断兴起, 进一步扩大了移动互联网覆盖范围。一方面, 移动互联网的出现扩大了用户终端的便携性, 用户可随身携带移动设备, 并在不同地点阅览所需要的内容, 如刷微博、听音乐等;另一方面, 移动互联网的存在提高了信息的时效性, 用户可通过短信、微博、新闻网站等多种渠道收集信息, 用户也能通过移动互联网, 将信息转发给目标人群, 提高了信息的传递性。

从使用频率上来看, 50%的用户会在一天之内多次使用移动互联网, 82.3%的用户每天都会使用移动互联网;从使用时间上来看, 37.1%的用户使用移动互联网的时间大于1小时, 61.9%的用户使用移动互联网时间大于30分钟, 且这些数据正在缓慢增长之中, 说明移动互联网用户的一些行为还会得到持续的加强。

2.2 数据收集模式下的移动互联网用户行为分析

互联网嗅探捕获用户行为信息是数据收集模式下分析移动互联网用户行为的代表。在信息时代的大背景下, 可通过捕获互联网信息包的方式, 查看、监控数据包的形式, 也可有效判断用户行为。由于数据收集模式只适用在大型城市, 因此在数据包分析中可发现, 移动互联网用户行为主要集中在移动消费与移动搜索两方面。

移动消费快速增长是移动互联网行为的代表。随着移动互联网终端的快速发展, 移动终端的功能丰富, 再加之多数商家的推广, 使移动消费在网络消费中所占的比例不断上升。移动消费不受地点、受教育程度等因素限制, 用户可随时随地的查询消费信息。例如, 用户往往会针对某种商品而形成一个讨论区, 共同讨论该商品的特点、服务性能等, 可推动用户进行理智消费。

同时, 微博、微信等微技术的兴起逐渐占据了传统通信所占的比例。以微信为例, 微信能够实现人与人之间的语言交流与文字交流, 能满足不同阶段人群信息传递的需要, 且微信的信息传输不直接产生费用, 经济性能更好。在大型商场等WIFI覆盖区域, 随处可见部分用户使用微信进行语音通信, 传统的通信交流方式正在发生改变, 并影响深远。

3 结束语

在移动技术高速发展的今天, 移动互联网的作用越来越明显, 与人们之间的交流越来越密切。每个人都认识到移动互联网对其生活的影响, 这种影响虽然由产业层面推动而产出, 但人们依然要认识到这种影响下的各种表现。用户行为是影响移动互联网发展的重要因素, 不但影响产业上游商品生产的行为, 也会在传播文化、商品文化中得到体现, 具有一定的抽象性。在正确处理移动互联网用户行为的过程中, 应该站在信息发展的角度看待这一问题, 综合考虑多种因素, 通过技术创新、功能重构, 让移动互联网用户行为得到应有的重视。

摘要：随着现代移动技术的发展, 移动设备的功能不断丰富, 满足了不同人群的一般通信需求, 成为当前社会经济发展的一大新兴产业。与此同时, 社会各方面都认识到移动互联网中的商机, 推行了一系列有助于移动互联网发展的措施, 并收到良好效果。移动互联网用户是移动互联网的重要组成要素, 其行为影响移动互联网的发展。为科学的认识移动互联网用户的行为, 本文由互联网行为的定义入手, 讨论其行为分析的各个阶段, 最后对移动互联网用户的行为进行分析。

关键词：移动互联网用户,用户行为

参考文献

[1]胡宇辰, 郭宇.基于沙漏模型的移动互联网用户行为分析[J].管理世界, 2013 (07) :184-185.

[2]唐家琳.移动互联网用户行为比较分析[J].西安邮电大学学报2013, 18 (05) :90-99.

[3]郐淑娥.互联网用户的信息行为分析[J].中国管理信息化, 2014, 17 (19) :92-94.

[4]李威.移动互联网用户行为分析研究[D].北京邮电大学硕士学位论文, 2012 (12) :13-14.

正点科技：唤起用户使用的欲望第11篇

契合用户的刚性需求

很多新产品在面世之前没有任何市场，在这种情况下，要想让用户接受该产品，最重要的就是产品能够满足用户的刚性需求。就拿手机闹钟来说，它是除了打电话和发短信之外用户使用率最高的功能，契合了用户的刚性需求。

刚性需求下的产品，更加注重简单实用。只有让用户体验到简单的操作、准确找到自己想要的，用户才会有进一步使用的欲望。这时，企业和开发者要注重不断与用户沟通，得到他们的反馈，并不断地改进产品、完善自我。此外，在做一个手机应用之前，要先看一下相关平台的市场里都有什么样的应用、用户在论坛里关注什么；同时，也要在搜索引擎里查找相关信息的关注度，找寻身边的人进行访谈，这样有助于更加深入地了解用户的需求，以便研发出能得到用户和市场认可的产品。

以创新求发展

在产品同质化的市场背景下，创新是企业发展的基石和灵魂，唯有善于创新、敢于创新的企业才能独占鳌头，对于专注于闹钟类应用的企业也是如此。就拿正点闹钟来说，就非常注重产品的创新。他们独创的强大多样的时间逻辑，以及场景化模板的简单操作，得到了不少用户的好评和喜爱。

而且，正点科技一直不断优化产品，以便跟上市场的变化。例如：它不仅在软件里设置了欧洲杯和NBA总决赛的专栏，更推出了奥运专题版，除了可以进行风格皮肤的转变之外，热门区还提供了日期赛程、项目赛程、金牌赛程和冠军赛程等四种方式的赛事提醒，以满足不同用户的需要，这无疑更增加了用户的好感。

注重内容和服务

众所周知，在市场上做得好的产品都会实现用户从百万级向千万级的跨越。对于企业和开发商而言，在这两个不同阶段里，企业在产品、运营和推广上都是需要有所改变。用户规模的大小，让运营角度也会产生区别：规模小的时候应该主要关注产品的功能演进，而规模大的时候就应当侧重内容和用户服务。

如今，越来越多的开发商和企业已经着手开发工具类的应用，其实不管未来的移动互联网走向如何，企业和开发商都应该专注细分市场、做好精细化服务，这样才能为自己赢得一个美好的未来。

用户使用行为第12篇

关键词：电子商务,推荐系统,用户模型,智能推荐,用户兴趣度预测

引言

推荐系统是利用计算机技术与人工智能技术, 发现和定义用户兴趣, 推荐符合用户兴趣爱好的对象, 也称个性化推荐系统。

由于电子商务推荐系统所推荐的对象是商品, 其推荐成功的结果是发生购买行为, 为商家带来实际可见的利益, 更成为智能推荐领域研究热点。然而, 由于商品种类繁多、信息海量, 且用户购买行为复杂, 用户的兴趣领域既有交集, 又各有不同;因此, 对个体用户兴趣度进行预测, 从而构造出精准的个体用户模型, 成为电子商务推荐系统研究的重要着力点。本文在原型系统的基础上, 通过对用户行为的分析, 推导出用户隐形知识, 从而对用户模型进行构造和更新, 其研究思路如图1所示:

一、用户行为分析与用户知识识别

一个精准的个体用户模型最重要的目的和功能便是使系统准确地定义用户的兴趣取向与兴趣度, 所以首先必须对用户行为进行系统分析, 获取用户知识。“用户知识”是指关于用户的有组织的经验、价值观、相关信息及洞察力的动态组合, 它所构成的框架可以不断地评价和吸收新的经验和信息。用户兴趣度表示用户对推荐商品的感兴趣程度。收集与用户兴趣关联程度比较大的行为数据, 对这些数据进行处理和分析, 获取隐性用户知识, 是预测用户兴趣度的一种有效途径。

(一) 用户知识识别

显性用户知识:是经过人的整理和组织, 可以以文字、公式、计算机程序等形式表现出来, 并可以通过正式的、系统的方式加以传播, 便于其他人学习的知识。隐性用户知识:是指与人结合在一起的经验性知识, 主要包括用户使用系统的习惯、爱好、需求、个人位置等信息。隐性知识只能通过对隐式指示器收集的数据进行分析来获得。综合国内外研究现状, 常见的隐式指示器有:访问时间、页面访问次数、滚动条、鼠标移动、方向键、翻页键等。

(二) 用户兴趣度预测

通过对用户注册时提供的显性知识和浏览商品时的隐性行为分析, 可以对用户所感兴趣的内容及兴趣度进行预测。基于用户兴趣构造用户模型, 并以用户模型为支撑进行商品的智能推荐, 可以大幅提高推荐系统的质量。

用户注册时提供的显性知识是反映用户特质的基本信息, 体现了用户行为的规律性与一致性, 描述了用户的基本特征。与消费行为相关性强的用户显性知识主要有性别、年龄、学历、职业、收入及兴趣爱好等。由于这些显性知识系统一般无法通过人工学习获得, 故虽与消费行为有极高的相关性, 却只能通过用户的隐性行为加以分析预测。

用户在浏览商品时会产生许多隐性行为, 这些行为是用户在没有花额外时间去理解标准情况下产生的。所以隐性行为虽然不像显性行为那样具有系统性和精确性, 但却是用户兴趣的最原始体现, 故对隐性行为通过数据挖掘的方法进行分析, 能更完善的体现用户的兴趣, 是显性知识的一个很好的补充。在用户隐形行为中最易收集又能体现用户兴趣的有:访问次数、驻留时间、鼠标移动次数、滚动条滚动次数、以访问买历史记录。

令Interest (p) 为用户对商品p的兴趣度, 则Interest (p) 可以表示为:

公式2的含义如下: (1) 如果用户保存了页面, 则认为用户对类商品极感兴趣, 可重点推荐这类商品。 (2) 如果用户在浏览过程中多次重复浏览每一商品, 即对某浏览频率较高, 则表明对该商品很感兴趣。 (3) 如果页面驻留时间很长, 并伴随有鼠标、滚动条活动, 则认为用户对该页面商品感兴趣。 (4) 用户浏览网页时的点击行为或许是一个习惯性动作, “click”是用户表达情绪的一种方式, 尤其是用户点击查看商品大图时, 表明用户对该商品感兴趣。 (5) 用户常常通过卷屏来浏览或细看商品内容, 这说明卷屏行为同用户兴趣有一定关系。

二、用户模型表示

用户模型是用户与外部世界联系的知识模型, 是人们对外部世界的认识以及人与外部世界交互的描述。用户模型对用户进行“虚拟”表示, 主要涉及用户知识表示及其动态维护问题。用户模型由描述一类用户的公共特征的原型模型与表示单个用户的特征的个体模型组成。面对各种类型的用户, 系统仅有典型模型, 应用是很有限的。个体模型能使系统对每个用户的需求提供一个合适的接口, 并有助于兴趣情报的描述。

(一) 原型系统表示

主要原型模型的构造是在系统设计时进行的, 直接包含在系统的知识库中;然后在系统运行中, 根据需要从它们推导新的、较特殊的原型。而所有的用户个体模型, 均在系统运行中建立。从结构方面出发, 一个原型具有与用户模型类似的组织结构 (用户行为特征除外) , 它的基本结构如图2:

每个原型都有一个激活方法, 用户在首次进入系统时, 系统会动态分配给用户一个固定ID, 并且原型系统中的每个槽值, 如姓名、性别等也都会被赋值, 此时原型模型即被激活。原名模型被激活的唯一标志是该用户拥有了一个ID, 其他信息都是可以改变的, 甚至注册时该信息为默认的空值, 所以此模型不能表现出用户的真正兴趣, 在智能推荐中的作用不明显。一个能准确体现用户兴趣的模型称作为用户个体模型, 用户个体模型是通过对用户行为的分析, 获取用户的兴趣领域, 并把准确的信息添加到原型模型或对原型模型进行修改之后的结果。用户个体模型是对用户动态行为收集分析综合的结果。

(二) 个体用户模型表示

用户模型的建立是从用户进入系统开始的, 当用户进入系统后, 系统首先查找个体用户模型库, 如果没有该用户的模型, 则被认定为新用户。系统就会从零开始建立用户模型, 过程分五个步骤: (1) 获取显性知识。这一过程系统会动态为该用户分配一个ID, 表示用户的主索引i。 (2) 激活原型。原型中被激活的原型称为活动原型 (si) , 它们可以作为构造当前用户模型的开始点。 (3) 辨别原型。原型建立后用户会浏览商品, 初步获取用户感兴趣的商品集合, 用Personal_I表示。 (4) 精炼模型。系统重复执行以下两个活动:应用合适的获取方法, 收集或产生与用户有关的新信息;应用有关的实证方法检查和纠正新信息的一致性。模型精炼工作直到当前咨询结束为止。收集用户的隐形行为集合, 用Personal_R表示。 (5) 结束工作。当咨询结束时, 当前用户的模型已初次完成, 连同用户标识名一起存入用户模型库。系统经过智能分析, 得出用户行为Personal_R与用户兴趣本体Personal_I的关系ε, 并将用户最感兴趣前λ件商品计入用户数据库, 用户原型中的兴趣领域改变, 用户建模结束。

系统经过以上步骤的交互, 获取了用户信息, 将获取的知识表示出来, 即为用户模型。用户模型表述如下:

(1) Stereo Type:表示用户原型模型。一个系统只有一个原型类, 这是在系统规划时设计好的, 每个用户的进入, 都会将该类实例化一次。Si表示第i个用户的基本信息。

(2) Personal_I:包含用户兴趣的个性化领域本体, 即某一用户浏览商品的集合, ii表示该用户浏览的第i件商品。

(3) Personal_R:用户行为本体, 表示用户浏览商品时的行为的集合。 (cs, i, fs, i, ds, i, ms, i, ps, i) 表示ID为s的用户浏览第i件商品时行为的集合。

(4) ε:表示基于某一具体原型的用户从用户行为到用户个性化的映射, ε (s, i) 表示ID为s的用户对第i件商品的兴趣度。

三、用户模型的更新

如果用户是登陆系统, 即系统已知当前用户, 那么该用户模型已包含在用户模型库中, 所以用户第二次操作便是对模型的更新, 而不需要重新建立模型了。更新用户模型的操作有所不同, 与建模相比, 步骤 (1) ~ (3) 由另两个新的活动代替。更新模型的操作包含四个步骤:

(1) 检索模型。识别当前用户为已知用户, 即从用户个体模型库检索该用户的模型。在 (s1, s2, s3, …, sn) 依次遍历查询, 若有进行智能推荐。

(2) 智能推荐。根据已有的用户模型, 查找出用户最感兴趣的商品或商品类目, 优先呈现给用户。即根据ε的结果将用户最感兴趣前λ件商品和用户原型中的兴趣领域在用户进入系统时进行推荐。并在此基础上继续收集用户行为, 并将在当前咨询中进一步精炼。

(3) 精炼模型。

(4) 结束工作。

四、结论与展望