用户行为规律范文

2024-06-05

用户行为规律范文(精选8篇)

用户行为规律 第1篇

对互联网视频服务来说, 用户体验是影响用户粘度的重要因素。服务商显然希望能够随时掌握用户体验并使它处于可控状态, 避免出现用户连接失败、等待时间过长、视频画面不流畅等降低体验的情况, 这需要人们掌握用户体验评价方法。在大规模视频服务环境下, 服务商要想能够控制用户体验, 必须能够合理地调配服务系统资源, 这需要人们事先掌握用户行为规律。遗憾的是, 关于大规模视频服务中的用户体验和用户行为规律的诸多问题仍处于待解状态。

一般来说, 互联网视频访问量在时间分布上不均, 白天的访问量小, 晚间访问量大, 此外, 地域、社会热点事件, 宽带接入费率、观看环境等都会影响用户访问。不管怎样, 大规模的用户访问行为无疑会加重互联网视频服务系统的负载, 降低用户体验质量, 严重情况下甚至会导致拒绝服务 (Do S) 。但到目前为止, 人们并未系统地掌握大规模用户行为对视频服务系统的影响及规律。

1开展相关研究工作的可能方法和意义

从逻辑上看, 互联网视频服务系统可以被分解成由技术系统、用户体验、用户行为和外因四部分构成的复杂系统, 如图1所示。其中, 前三部分相互作用, 类似一个闭环系统。

技术系统的分发策略 (包括编码算法、视频源码率、CDN等的选择策略) 将影响用户体验评价指标。这些指标的值可以从用户终端获得, 它们可以用图像主观质量、图像客观质量、平均码率、缓冲率、流畅度、启动时间、收视失败率和用户主动退出率等表示。

用户体验指标值将影响用户行为指标。用户行为指标也可以从用户终端获得, 它们可以用登录、退出、连续观看同一节目时长、连续观看总时长和连续观看节目个数等表示。

服务系统的另一部分是“外因”, 它由用户所处区域 (地理位置) 、时间、社会事件、网络使用费率和用户观看环境率等外在因素组成, 能影响用户的收视行为。在用户体验和外因的综合作用下, 大规模用户并发将增大技术系统的负载, 容易引起分发节点过载或者总服务带宽不足等问题。

我们认为, 解决上述问题的可能方法是:

1.研究分发策略对用户体验的影响规律:研究多样化分发策略情形下的用户体验评价方法;研究用户体验归一化方法;研究不同编码算法对用户体验的影响;重点研究图像质量的变化, 同时研究视频源码率变化对其他用户体验参数的影响;研究CDN选择策略对用户体验的影响。

2.研究用户体验对用户行为的影响规律:研究图像主、客观质量对用户行为的影响, 深入研究图像平均码率、画面清晰度、流畅度对用户退出系统和持续观看程度的影响;研究视频启动时间、缓冲率、流畅度对用户行为的影响;深入研究连接失败率和退出率对用户行为的影响;研究用户多种行为与粘度值的关系。

3.研究大规模用户行为规律:研究大规模用户行为的登录、退出、连续观看同一节目时长、连续观看总时长、连续观看节目个数等参数的变化规律, 同时深入研究用户分布与用户的空间、时间、年龄、教育背景等分布的关系;研究大规模用户行为对技术系统的影响规律。在大规模用户服务环境下, 根据社会热点事件的区域属性、发生时间、所处区域的网络接入费率, 结合用户的收看环境, 研究技术系统前端负载的变化规律研究CDN分发节点的负载变化规律。

目前, 有关互联网大规模视频服务用户体验及行为规律研究方面的成果在国内外还鲜有报道, 未来几年, 预期研究成果可为互联网视频服务系统分发策略和结构优化, 以及提高互联网带宽利用率等提供技术指导, 为改善用户体验提供理论依据。对视频服务系统前端、CDN网络及终端的完善、发展和实用化具有现实的意义。

2国内外研究进展

国内外对互联网大规模视频应用用户体验和用户行为的研究还很少, 相关的研究主要是:用户行为活动度的研究工作[2,3,4,5,6]中, 大部分集中在访问活动度分布的重尾特性及其在系统级上的影响。Yu等人[5]在中国电信部署的VOD系统上提出一种测量研究方法对用户访问模式和会话长度进行建模。一些研究人员研究IPTV系统[7]中的动态频道, 以及流媒体系统中搜索-暂停-快进行为的学习[8]。然而在用户参与度 (user engagement) 方面, 如视频质量与用户收视行为、视频内容与用户收视行为间的研究[9], 研究结果十分有限。

此外, 部分文献中介绍的研究工作旨在改善服务器端系统, 如, 在减少内容分发代价的同时, 通过改善关键的质量指标来提高P2P VOD系统的鲁棒性, 以减少运行在动态环境下的服务器等基础设施的部署代价[7,10,11,12]。还有研究利用“黑盒”[11]~[15]和“白盒”[4,16,17,18]进行推理和测量技术来部署VOD和流媒体系统。但是并不能直接解决发现用户体验和用户行为之间规律的问题

测量方法论研究, 包括终端测量、网络测量、前端测量, 例如终端缓冲率测量、节目收看率统计、节目质量评估等方法研究。视频前端系统优化, 包括信源编码优化及码率调优、过载能力调优等方法研究。终端系统, 研究工作正从过去如何实现单一播放平台转向如何实现包括主动测量、播放、端到端协作工作的多功能平台。有关的最新研究成果集中体现在最近的SIGCOMM和IMC会议论文上, 也体现了继续深入研究大规模音视频协作分发机制与用户体验之间关系的必要性。

针对以上问题, 研究人员进行了积极探索[19]~[22], 例如Xi Liu等人[19]提出构建一个全网协作的视频控制平台, 以类似闭环控制的思想来控制数据的分发, H.H.Liu等人[20]提出CMO算法以控制粒度小、响应快为特征, 通过权衡CDN网络性能、流量费率等因素, 使得终端能够自动适配性能优、费率低的分发路径, P.Gill等人则研究如何通过网络测量的方法去提高视频分发能力[13], 但这些研究工作取得的重要成果在实际系统中仍很少得到体现。

现有的网络中, 考虑到分发成本和接收解码平台的通用性, 互联网视频服务商普遍将音视频的承载方式从传统的Real Networks、RTMP协议等转向HTTP协议, 使得网络性能更难以通过测量的方式预测, 不良用户体验直接影响节目收视率和互联网视频服务商运营收益, 这种糟糕的状况已得到佐证, 有数据表明, 在基于HTTP协议的大规模视频分发网络中, 遇到大于10%缓冲率的用户约为总数的20%, 视频启动时间大于10秒的占14%, 更有10%的用户根本无法观看视频[19], 并且, 用户对节目缓冲率非常敏感, 缓冲时间每增加1%, 用户收视时长的统计期望就会减少3分钟。可见, 尽管应用系统提供的数据缓冲功能可以减弱传输延迟的对视频流质量的影响, 但影响音视频节目用户体验和收看行为的主要因素已不再是过去关注的传输延迟和传输时长, 缓冲率异常才是主因。

过去几年, 也有一些研究成果与节目体验质量对用户行为影响相关, 但它们是在可控实验环境下得到的结论, 不适用于大规模视频服务情景[23]~[26]。对大规模服务场景有研究的是Florin Dobrian等人进行的与用户参与度有关的研究[9]和S.Shunmuga krishnan等人对节目体验质量和用户行为因果关系的研究[27], 但取得的成果都还太少, 还不足以深入地揭示体验质量与用户行为间的规律。

总之, 国内外对互联网视频体验质量及用户行为规律的研究还很少, 且未见关于大规模用户行为与应用系统之间关系的系统论述, 也未见平衡大规模用户行为、用户体验和应用系统压力间的系统性研究。

3亟待研究的重要问题及难点

3.1分发策略对用户体验的影响规律

计算机、电视和智能手机是互联网视频服务的主要终端, 它们接入互联的方式也多种多样, 有2G移动接入、3G移动接入、Wi Fi接入、ADSL接入、专线接入等, 接入能力呈现差异化的特点。为了使用户得到最好的体验, 视频服务技术系统为不同用户提供了不同的分发策略。

第一个亟待研究的问题是技术系统分发策略对用户体验的影响, 图2表示了分发策略与用户体验之间的关系。

3.1.1用户体验评价方法

针对视频服务系统分发策略多样化的特点, 研究用户体验的评价方法。

针对用户体验表现为多个参数的问题, 研究用户体验归一化方法, 即根据各参数的重要性赋予它们权值, 最后获得归一化的用户体验值。

3.1.2源视频质量对用户体验的影响

节目编码算法和码率决定了视频质量。针对编码算法复杂度影响前端服务器系统的计算资源开销, 及编码算法的效率影响网络资源利用率的问题, 研究不同编码算法对用户体验的影响。针对视频源码率大小影响网络带宽开销和图像质量的问题, 重点研究图像质量的变化, 同时研究视频源码率变化对其他用户体验参数的影响。

3.1.3 CDN对用户体验的影响

服务同一个用户, 可能可以通过不同的CDN网络。不同CDN网络的性能和使用费用可能不同。针对这个问题, 研究CDN选择策略对用户体验的影响。

在这个问题中, 难点是分发策略可控, 这需要建立一个研究平台, 例如研究中需要不断地改变编码算法和码率, 自适应分发策略优化研究还需要获得网络状态信息和用户体验参数。但是, 最关键的是要建立用户体验评价方法。

3.2用户体验对用户行为的影响规律

第二个亟待研究的问题是用户体验对用户行为的影响, 图3表示了用户体验对用户行为的影响关系。

3.2.1图像质量和平均码率对用户行为的影响

针对用户图像质量敏感的问题, 研究图像主、客观质量对用户行为的影响。深入研究图像平均码率、画面清晰度、流畅度对用户退出系统和持续观看程度的影响。

3.2.2启动时间、缓冲率和流畅度对用户行为的影响

启动时间会降低用户的耐心, 缓冲率高、流畅度低影响收看连续性。针对用户对等待时间敏感的问题, 研究视频启动时间、缓冲率和流畅度对用户行为的影响。

3.2.3失败率和退出率对用户行为的影响

收看失败和异常退出都属于非正常现象, 会影响用户对视频服务商的印象。针对这个问题, 深入研究连接失败率和退出率对用户行为的影响。

3.2.4用户粘度

视频服务商通过用户粘度来衡量用户对网站的忠诚度和贡献值。针对这个问题, 研究用户多种行为与粘度值的关系。

3.3大规模用户行为规律

上面提到了用户体验影响用户行为的研究, 第三个亟待研究的问题是在“外因”作用下的大规模用户行为规律, 如图4所示, 其重点是研究社会事件对大规模用户行为的影响。

3.3.1“外因”作用下的大规模用户行为规律

在大规模服务环境下, 根据社会热点事件的区域属性、发生时间、所处区域的网络接入费率, 结合用户的收看环境, 研究大规模用户行为的登录、退出、连续观看同一节目时长、连续观看总时长、连续观看节目个数等参数的变化规律, 同时深入研究用户分布与用户的空间、时间、年龄、教育背景等分布的关系。

要在研究中获得可信的理论研究成果, 首要解决如何获得真实的大规模用户行为数据, 及大规模用户行为数据的挖掘等关键问题。

3.3.2大规模用户行为对技术系统的影响规律

互联网世界中存在各种独特的现象, 例如20%的视频内容贡献80%的网络流量的“长尾分布”, 引起用户访问访问聚集的“fl ash crowd”闪聚现象等, 它们可以迅速地改变技术系统的负载, 对服务质量产生重大影响。大规模用户行为对技术系统的影响过程可用图5表示, 其基本研究内容包括:

1.大规模用户行为对前端系统负载的影响

在大规模用户服务环境下, 根据社会热点事件的区域属性、发生时间、所处区域的网络接入费率, 结合用户的收看环境, 研究技术系统前端负载的变化规律。

2.大规模用户行为对节点负载的影响

研究大规模用户服务环境下CDN分发节点的负载变化规律。

3.大规模用户行为下系统的负载均衡

根据大规模用户行为变化规律, 研究CDN分发节点的负载均衡策略。

4研究方法探讨

用户体验及行为规律研究既有计算机科学的特征, 又有社会学特征, 研究中, 有两个重要问题必须要问题:数据来源问题和数据挖掘问题。

4.1数据来源

用户行为数据有三个来源:研究平台、电视台等商业运营系统和仿真数据。前两种数据最具研究意义。

4.1.1来源于研究平台的数据

为了进行特定目的的研究, 可搭建专用研究平台, 从中可获得部分研究数据。研究平台产生的数据具有参数可控的特点, 可以用来验证某些理论结论。

4.1.2来源于商业运营系统的数据

商业视频服务系统的运营数据对研究工作意义重大。优秀的商业系统视频内容丰富, 服务范围涵盖全球, 用户数量众多, 它的运营数据不仅解决了大规模视频服务研究工作难以开展的难题, 还使得研究结果的可信度成倍提高。但是, 出于商业竞争和隐私保护的目的, 商业系统的运营数据通常不会对外机构人员公开, 无形中增大了研究人员开展工作的难度, 这也是目前学术界缺少相关研究成果的重要原因。

4.1.3仿真数据

需要进行数学模型验证时, 数据仿真将是有效的手段。数据仿真可以快速获得验证数据, 缩短研究周期。

4.2数据处理和理论建模

无论是研究分发策略对用户体验的影响, 还是研究用户体验对用户行为的影响, 或是研究用户行为规律对系统负载的影响, 本质上都是求解多维变量相关性问题, 其中, 用户体验数据是问题的自变量。

由于用户的体验参数不仅包括源视频码率、视频启动时间等客观测量指标, 也包括用户对于视频的主观质量感受, 对不同体验指标的简单的线性加权并不能反映用户对于视频播放体验的评价。此类问题属于复杂的多属性决策理论问题, 既要考虑用户主观感受, 又要考虑客观测量指标, 还要考虑复杂的系统技术指标才能评价各要素与用户体验之间的关系。

分析大规模用户行为规律, 宜采用数据挖掘中的分类、聚类算法和函数拟合等手段, 并可借助于SPSS、original等专业的数值统计分析工具。更多的数据处理方法, 文献[28]有更深入的讨论。

5结束语

在用户行为中寻找灵感 第2篇

让产品融入用户行为

好产品往往能够完美地融入到用户行为中去,并以一种用户能够理解的方式来支持这种行为。那究竟如何把握用户行为、如何以行为为中心展开设计呢?

1.硬件尺度

硬件尺度主要是指人体特征参数,用户和产品通过行为发生关系,落实到产品设计上是使用过程中身体部位与相关操作部位的对应,是人体特征与产品特征的吻合。

人体特征参数包括人体各部分的尺寸、活动半径、肌肉力量、运动形态等静态和动态的参数,是人机工程学最基础和最常用的学科内容。人体特征参数的不同严重影响着人作用于产品的行为方式。

同一款椅子,由于用户人体身高、腿长等特征参数的不同,人的坐姿、坐的时间长短和行为会有很大的变化,针对人体特征参数的不同引起的不同行为在许多设计中都得到了体现,比如可调节座椅的设计,或者软性座椅的设计。

2.软件尺度

软件尺度是指人的情绪因素。情绪与用户使用产品的目的通常没有直接关系,但情绪的变化会影响使用产品时的行为。

人在焦虑的时候,思路会变窄,仅仅集中于问题直接相关的方面,但有时却会有意想不到的结果出现,例如“急中生智”就很形象地描述出情绪对于行为的影响。情绪能控制身体肌肉,通过化学神经递质改变大脑的运行方式,进而影响操作行为。

美观的物品使人感觉良好,这种感觉反过来又使他们更具创造性地思考。但影响人类情绪的因素有很多,包括天气、光线、气温这些自然因素,同样包括音乐等人为因素。有研究人员做过一个试验,在商店中播放不同类型的音乐来调查人们购买红酒的行为变化,结果发现,是否播放音乐或者不同类型的音乐不太会影响人们购买红酒的数量,但是却对购买红酒的品质有较大的影响,特别是当播放爵士乐时,能够为红酒销售创造更多的利润。

3.习惯尺度

很多设计师都有一个理念,那就是认为“用户行为不可逆”,这虽然是一种过于武断和不太正确的理论,但是从另一个方面说明了用户习惯的重要性。

我们现在使用的Qwerty键盘是一个典型的基于用户习惯的设计案例,是劣势产品战胜优势产品的典型代表。最初,打字机的键盘是按照字母顺序排列的,这种全机械结构的打字工具,如果打字速度过快,某些键的组合就很容易出现卡键问题。

美国人肖尔斯将最常用的几个字母安置在相反方向,最大限度放慢了人们的敲键速度,以避免卡键。这种以放慢敲键速度为目的的键盘排列方式却延续至今,最主要的原因还是习惯的力量,对大多数人来讲,重新学习一套规则来提高打字速度没有太多实质性的意义,改革的成本很高。

4.潜意识尺度

潜意识也称无意识,它能对人的性格和行为施加压力和影响,一些看来微不足道的事情,如梦、口误、笔误都是大脑潜在意识决定的。

对于潜意识的认识和其在设计中的应用,是以行为为中心的设计需要重点关注的内容。就如同冰山理论所描述的那样,人类潜在的绝大部分意识对表层的意识和行为产生着影响,同样的,用户的潜在需求和潜意识的行为为产品设计提供了广阔的空间,对人类潜意识行为的关注能够创造看似简单却耐人寻味的产品,从而将人的潜意识认知外在化,引起强烈的认知,这种深层次的、反思的认知能创造深刻和持久的用户体验。

日本设计师深泽直人在演讲《意识的核心》中通过大量产品设计实例分析了产品设计中对于潜意识关注应用所产生的魅力。人们常常会把牛奶盒或水瓶往相似形状的凹槽里放,因为它们形状的吻合激发了人们的潜意识行为。

深泽直人十分崇尚直觉的设计,也就是不需要思考的思想,他认为设计要在无意识中发现灵感,作为设计者,要比非设计人员更多地发现生活中的潜意识行为和需求。当人们被问到需要什么样的设计时,他们往往会说不知道,但是有一天当他们看到某样东西时,却会说“啊,就是这个”,这是因为之前他们的潜意识没有被激发,而设计师就是要挖掘用户的潜意识行为和需求来设计产品。

如何做到以用户行为为中心?

1.理清行为背后的本质需求

理清行为背后的本质需求,往往会产生意想不到的想法,能够极大地扩展设计思路。

我们在对牙刷进行改良设计的时候,一般会从牙刷的形状、材料以及色彩等传统思路去考量,但是我们需要的真的是牙刷这种东西么?我们只是需要某种产品能够让口腔变得干净罢了。当认识到牙刷的本质功能是清洁口腔时,我们会思考“未来的口腔护理是怎样的?”是延续传统的“刷”,还是采取其它行为方式。例如“喷”、“嚼”,这样一来,设计思路就绝不会限制于牙刷这个物体本身,以用户本质需求为导向,基于用户行为,能产生新的解决方式。

2.行为有时候需要适应技术

在以行为为中心的设计中,我们承认必要的时候人类行为需要适应技术,希望产品的设计是为了有效地支持用户的行为,而不是仅仅服从用户的意愿。

人们确实是在适应技术,以行为为中心的设计不仅了解这一点,而且还可以很好地利用这一点。很多时候你必须先学习工具和技术,然后你就会理解所要进行的活动了,比如射击,你必须先理解枪支的结构和特点才能掌握这项运动的精髓,成为一个优秀的射击手。

科学家创造技术,设计师将技术转化为产品,用户适应技术。大部分时候就是这样的一个流程。例如,人从适应用鼠标操控计算机,到适应用手触控操作这种方式,人一直随着技术的发展改变用户行为,很难说触控方式是最好的人机交互方式,未来这种方式仍然会改变,人们将继续去适应技术。

这并不是要否定用户中心的思想,用户行为都是与人有关的,所以那些支持用户行为的系统和技术,通常也能很好地支持从事这些行为的人,因此我们仍然能够利用之前在以用户为中心的设计中积累的知识和经验。

3.用设计引导行为

以用户行为为中心的设计,并不是一定要求设计师观察行为,然后设计产品去迎合人们的行为。虽然大部分情况下如此,但还需要我们在适当的时候、适当的地点通过特定的设计来引导用户行为,以达到某种目的。设计对行为的引导可以是消极的也可以是积极的,这种引导可以从生理和心理两个层面去认识,概括来讲主要包括约束和刺激两种方法。

约束

要避免选择错误,最好的办法就是给用户唯一选择。同样地,要引导用户行为可以通过产品制造约束。如果用户能容易地看出并解释物理结构上的限制性因素,用户在使用之前就知道哪些操作是合理的,那么就可以有效地避免误操作。

比如门把手的设计,如果去掉明显的把手,不提供拉的可能性,那么用户就可以明白这个门是通过推来打开的,当然很多门会写上“推”或“拉”的文字,这同样是帮助人理解的设计,但此时这个门的使用方式需要进行两个层次的理解,就其本身而言并不是一个很好的设计,不仅增加了成本,也增加了用户理解的负担。

nlc202309011108

锁和钥匙的设计目前来讲很混乱,有的锁是顺时针旋转才能打开,有的则是逆时针,单从钥匙的旋转方向来讲就为用户造成了理解上的负担,如果放开约束,用户不论从哪个方向都能打开锁,或者能够让用户明白正确的使用方法,那才是好的设计。

通过约束性的设计来引导用户行为在公共空间设计中非常常见。比如盲道的设计,通过路面的突起为盲人提供一种空间上的约束,良好地引导盲人行走。事实上,很多正常人在特殊情况下也会利用盲道来行走,比如在专心发短信的时候,这也许是一种有意识的行为或者是一种潜意识的行为,设计师如果观察和理解了这一点,也许能创造更多的设计。

公共空间中座椅的设计一直以来就是设计师们关注的话题。大家都会发现,公园或者广场的长椅利用率很低,一般设计为三人或四人使用的长椅经常只有一个人坐在上面,尽管很多人徘徊、找不到座位,他们也不愿意同其他人坐在一起,为什么呢?因为很多人需要私密的空间,他们对陌生人会有本能的排斥,而传统长椅的形式让他们觉得同其他人过于亲密,尽管长椅能够为三到四个人提供足够坐的空间。如果将长椅木条的横向排列改成纵向的,或者仅仅是在长椅上加一些小的隔断,事情就大为改观,同样长度的长椅利用率便会上升。

刺激

前面已经讨论过“美观的物品更好用”,通过产品形态、色彩、材质甚至是声音等来刺激用户,激发思考,从而引导用户行为朝着预定的方向改变。

通过激发用户心理从而改变用户行为的产品历史悠久,风铃便是一个很好的例子。夏天炎热,在没有空调和风扇的日子里。人们因为燥热而变得烦躁,行为上也表现得好动不安,在这种情况下人的工作效率和热情会明显降低,并会导致更多的失误。而小小的风铃,通过轻盈、通透明亮的外观以及悦耳清新的声音使人心绪变得安宁,行为举止也显得优雅从容许多。

日本建筑师坂茂设计的卷筒卫生纸是用设计引导用户行为的一个绝佳例子,它事实上包含着约束和刺激两个层面的引导。这种卷筒卫生纸中间的芯是四角形的,卫生纸因此卷成了类似的方形。若是平常的圆形纸筒,在使用时,只要轻轻一拉,就可以很顺地抽下纸张,而在抽取卷在四角形纸管的卫生纸时,一定会因为产生阻力而发出“喀哒、喀哒”的声音,拉起纸来不是那么畅快。这个设计的特别就在于它造成的不便,四角纸筒产生的阻力以及所发出的并不那么悦耳的声音刺激着用户,引起思考,激发他们潜在的节约资源意识,将用户的行为朝着良性的方向引导。另外,方形纸筒由于节约了纸筒之间的间隙,能有效地降低制造和运输成本。

将卷筒纸的芯改成方形这样一个看似简单的设计改良,能够带来巨大的变化,它深刻地体现着设计师批判性的思考,设计就是具有这种对于生活的批判性,并且这种性质来源于对人类行为的观察和反思。

归根结底,用户和产品的关系是通过行为发生的。一定意义上,设计实际上是行为的设计,当用户的行为反映为对物的支持需要,或者当用户的行为与设计师的意图发生某种程度上的差异时,事实上就构成了人与产品的一种新关系,将这种关系物化的结果就是新设计的出现。

好产品

克莱斯勒300的精细化

克莱斯勒集团耗费了10亿美元研发、改良克莱斯勒300,推出“如意款”,从设计、性能和做工品质方面都试图做到更精细、更不循常规。3.6L Pentar V6搭配ZF 8变速箱,同时将美式粗犷与东方化精细美学巧妙融合,克莱新勒希望借此回归中国高端车市场。

柔软屏幕

LG率先将“塑料电子屏”应用在了电子书上,希望以此颠覆整个电子书设备市场。由于采用了塑料电子墨水基板,所以你可以单手抓握弯曲它,重量仅14克,也只有玻璃基板的二分之一,可弯曲角度提高到了40度,更接近纸张的触感和阅读效果。

手腕上的智能机

我们手上的设备正变得越来越智能化和通用化,比如手表。I’m Watch公司的I’m Color智能手表,可以通过蓝牙连接Android及iOS系统智能手机,在手表上访问社交网站、邮箱、查看天气预报、浏览相册等应用,还能接收短信、接听电话等。

两块屏幕的平板

两块5.5英寸IPS电容触摸屏,每块都可以达到1024×480的分辨率,索尼在Tablet系列平板上尝试异型的翻盖设计,打破了目前Android平板的设计思路局限。索尼Tablet P是目前唯一一款采用折叠式设计的平板电脑,可以最大程度还原笔记本的使用习惯。

用户行为规律 第3篇

1 高校档案的利用情况分析

1.1 利用情况统计

笔者通过对所在单位近五年来档案利用的情况进行统计, 归纳总结出档案用户的类型主要有: (1) 在校学生。 (2) 管理人员。 (3) 专职教师。 (4) 社会人员, 这4类人员共计1 348人, 利用档案1 526次, 借阅档案5 237件。详细的利用统计结果如表1。

1.2 利用目的分析

在校学生:主要利用目的有 (1) 转学, 利用档案的内容为该生的高考录取名册。 (2) 免修学分, 利用档案的内容为该生的学籍成绩课程认定表, 即曾经学习过该门课程的成绩记录及教务处的认定文件。

管理人员:这一类型的档案用户利用目的较为分散, 利用的档案一般为全局性、综合性的信息, 各部门、各单位均有对档案的利用需求, 如质量控制办公室查阅《关于规范学院奖励工作的决定》以编制教学工作质量优秀奖金。

专职教师:主要利用目的有 (1) 职称评定, 利用的内容为该位教师发表的科研论文档案、参与过的科研项目档案、曾获表彰的文件及取得上一级任职资格的文件。 (2) 课题研究, 主要查阅与项目有关的其他课题或者其他参加人员所做课题的档案资料。

社会人员:重点指的是学校的往届毕业生。对于利用档案的内容类别比较明确, 主要利用目的有 (1) 补办学历证明。 (2) 报考职业资格, 如建造师、建筑师等。利用档案的内容包括该生的录取明册、学生名册、成绩单、毕业证书编号/毕业证存根、派遣证存根等。极个别的其他社会人员, 如查阅我校设计所曾为其所在小区设计的平面图纸进行水电管道改造;曾在我校工作过的劳务人员查阅当年的工资发放凭证以办理退休、社会保险等。

其他:主要是指个别教师利用休假时间出国游玩, 需要学校的组织机构代码证、法人证书。

2 当前高校档案用户利用需求特点

当前, 随着现代计算机技术与信息技术的全面普及与快速发展, 高校档案管理工作也逐步实现由传统手工向现代化技术的跨越式发展。对于高校档案用户来说, 查找快速、利用快捷、内容准确是他们查阅档案时的基本要求和目标。

1) 查找快速。现在社会发展的节奏在逐渐加快, 高校档案用户在利用档案时最希望节省的就是时间成本, 即无论何时提出查阅需求时, 档案馆都应及时将档案查找出来。这也是档案用户最普遍的一个利用心理。在实际工作中, 也会经常遇到这样的问题:档案用户来自异地, 为了紧急的原因而即刻需要获取档案, 如果档案馆迟迟找不到该份档案, 那么不仅耽误用户利用档案的最佳时机, 使高校档案馆遭受负面评价的影响, 最主要的是阻碍了档案价值的发挥, 降低了保存档案的必要性和重要性。

2) 利用便捷。建立方便用户的档案利用体系是当前高校档案馆工作的主要目标之一, 因此, 借助于网络技术为人类带来巨大的便捷性, 高校档案馆已基本实现了档案的数字化、电子化管理。在利用档案的过程中, 所有档案用户为了节省时间、简化办事手续, 都希望可以方便快捷的利用档案。比如异地用户, 希望通过电话查询、网上借阅等灵活多样的形式利用档案, 而不必限制在只能到馆查询的方式。对于高校档案馆来说, 这样做, 既可以提升服务水平, 又塑造出了良好的服务形象, 达到了提高用户满意度的效果。

3) 内容准确。高校档案用户, 不管是否能够表达出明确的查询条件, 均希望获得直接的富有针对性的档案信息, 并希望查到的档案信息准确满足自己的需求。比如学生查询高考录取信息、财务处查询记账凭证信息, 要求必须对文件进行准确定位, 哪怕是相关的信息也无法满足查询要求。

3 当前高校档案用户的利用规律

3.1 利用时间的分散性与集中性

分散性是指日常零散的档案查阅工作, 在利用时间上没有明显的倾向性。

集中性与分散性相对应, 是指在某一特殊的时间段, 到馆查询某一类档案的用户骤然增多, 档案的查阅率也随之提高, 他们查询的内容类型相同, 只是责任者不同。比如每年的4月, 是建筑师、建造师等诸多职业资格考试的报名时间, 网上报名时需提供毕业证书编号, 那些毕业证遗失的往届毕业生就需要到原就读院校查询当年的毕业证编号, 这是我校档案馆最常遇到的用户类型;再如每年的职称申报时间, 能够参评的教师也都会集中到档案馆借阅其科研档案, 包括发表的论文与参加的科研项目档案。

3.2 利用内容的重复性与单一性

重复性指的是在查阅的档案内容中, 用户往往对某一类内容的档案需求度非常高, 档案馆的工作人员需要重复调取该类档案。上述统计已经看出, 在笔者所在单位, 社会人员 (主要是学校往届的毕业生) 为了补办学历证明查阅档案的次数位居档案借阅次数之首, 他们利用档案的内容较为单一, 就是学籍档案类, 具体内容不外乎录取名册、成绩单、毕业证信息等。因此, 这类档案重复查阅的最为频繁。在四川大学, 在调查中得知, 学生由于出国而到档案馆利用经过翻译的个人成绩档案, 是档案馆的一个庞大用户群, 这项翻译成绩档案工作的重复度也很高。

单一性与重复性相对应, 针对的是那些利用率较低的档案内容, 用户利用的时间不集中, 利用的内容也没有规律可循, 非常零散。

3.3 利用表述的清晰性与模糊性

清晰性是指高校档案馆用户能够清晰、准确、完整的表述出所需查询档案的时间、题名、作者等方面的特征, 档案服务人员在接收到这些讯息后, 能够准确快速的通过手工或者计算机的查找方式为用户找到相关的档案。比如党委办公室查找“《关于印发〈关于推行“服务承诺制、首问负责制、限时办结制和责任追究制”的意见〉的通知》”, 这是完整的文件标题, 在档案管理系统中, 按“题名”的途径进行检索即可找到该份文件。

模糊性与准确性相对应, 指的是档案用户事先未能详细了解所需档案的各种特征, 无法准确表达出有关档案的各种信息, 只能凭借大概的印象进行查找, 这种表述对档案服务人员来说是无法有效领会的, 也是查找难度最大的, 比如:查阅有关“绩效”的文件, 文件的发文单位不清楚、所属的年度不知道、详细的名称不记得, 属于“三不”文件。

4 结语

综上所述, 高校档案馆开展档案利用服务的过程中, 应该注意把握档案用户的需求特点与利用规律, 并以此为基础, 不断加强和改进档案服务工作, 推动高校档案工作的持续发展。

参考文献

[1]左玉亭.论高校档案用户需求与服务体系建设[J].兰台世界, 2007 (4) .

[2]吴艺博.面向服务的高校档案信息资源建设研究[D].郑州:郑州大学, 2011.

[3]孙华, 刘柳.高校档案信息用户需求研究[J].山东档案, 2013 (4) .

[4]强飚, 曹兴华, 等.基于用户需求的高校档案资源建设研究[J].兰台世界, 2013 (6) .

档案用户利用行为动机分析 第4篇

一、学术利用行为动机分析

学术利用用户主要是通过对档案信息的综合分析, 作用于科学研究之中, 使得旧有的信息经过深化成为预测未来的依据。该类用户行为又分为社会科学研究行为以及自然科学研究行为。

社会科学研究行为侧重于改造人类生活的社会。该类档案时间跨度很大, 而且现今档案存放也不在一处, 因而查阅不便。为了获取最完整和最准确的信息, 需要社会科学研究行为用户付出持续的精力。此外, 该类用户需求档案的政治色彩浓烈。历史上统治者从自身的阶级利益出发, 对档案肆意取舍, 导致档案遭到很大破坏, 增加了利用的难度。

自然科学利用行为侧重对思维、理论的研究, 研究范围的不同使得其利用需求与社会科学利用行为呈现明显的差异。自然科学利用行为用户需要档案内容更专业, 多为与研究工作紧密相关的同一学科, 其研究范围是越来越窄。而且, 其需求的档案跨越性不如社会科学长远, 有明确的阶段划分, 需要的档案信息要求完整性和准确性, 从而为科研工作提供进一步探索的依据。

学术利用用户普遍信息素质高, 能力强, 需要的档案信息层次也高。一般来说, 档案意识越强, 则用户在处理工作或者遇到问题时, 充分利用档案信息资源来处理问题的自觉性就高, 利用先进技术获取档案信息的能力越强, 在档案信息利用过程中体现的尊重他人知识产权的意识也更强。这类用户需求信息不仅仅是为工作服务, 更是通过科研不断创新, 不断的实现自我价值。

学术利用用户需要的信息更专业, 更准确。这类用户可以准确描述自己的信息需求, 但由于其需求的专业性, 档案部门提供的信息多为繁复的原始信息。因此, 针对这类用户, 档案部门要积极配合其工作, 并联合用户, 制定专题, 为用户提供高效的服务。

二、实际利用行为动机分析

实际利用行为的用户的信息需求多为管理服务。其需要各类政策、方针、指南、方案等为单位提供决策, 制定规章制度。这类用户所需的档案信息政治性较强, 多采用相关法律、法规、政策、方案等, 且距离形成时间越近越好。实际利用行为的用户从事的工作社会性和政治性较强, 这不仅要求档案信息的准确性, 更需要档案信息内容的广泛性以及及时性。

实际利用行为的用户信息素质较高, 利用能力较强。由于从事管理职业, 需求档案的内容比较集中, 多以利用文书档案为主。这类用户在现实工作中, 需要查找解决实际的问题, 因而需要借助档案作为依据。此外, 实际利用行为用户还需要借助档案获取最客观、最真实的参考依据, 以便在大量充足的依据上, 综合判断、科学分析, 做出正确的决策。这类用户需求的档案信息更倾向于二次文献信息, 不仅快捷, 而且全面。

三、普遍利用行为动机分析

普遍利用行为的用户最为广泛, 学生、工人、商人、农民等各行各业的人员都是这个用户群体的组成部分。该类用户是我国存在人数最多的群体, 但其利用档案的比例却较低。该类用户的行为多具有突发性, 目的性强, 且要求迫切。这类用户的利用行为只会在碰到与自身利益相关的事情发生时产生, 如学生需要学籍档案办理出国手续或者是农民需要土地证明获取补助等。普遍利用行为的用户不需要对档案信息进行分析, 其查询档案的目的就是获得最明确的凭证, 解决问题。

普遍利用行为的用户需求内容最具多样性, 不同的职业、场合、利益出发点导致其需求目的各不相同。此外, 该类用户的需求行为是最具动态的, 档案利用者的目的变化受时间、地点等社会因素影响明显。普遍利用行为多与利用者的切身利益相关, 对信息的再利用率不高, 处于需求的中低层次。这类用户在寻求帮助时, 表达需求的能力不强, 因而更需要档案部门的帮助。

四、提升档案用户的行为层次

用户的档案信息素质与档案信息需求紧密相关。档案信息素质越高的用户, 档案信息需求会越高, 档案信息利用的效果也会越好, 这会促使他产生更多的档案信息需求, 使他的优势更为明显, 越来越成为档案信息的富有者;反之, 则成为档案信息的贫穷者。所以, 提升档案用户的行为层次, 不是简单地将普遍利用行为的用户转为学术利用行为的用户, 而是从根本上提升档案用户的信息素质。

(一) 通过知识的改变提升用户利用行为层次。

知识的改变可以包括用户自身的综合素质以及档案信息素质的双重提高。用户可以通过学习拓展知识面, 提高知识素养。档案信息素质的提升亦是一个积累的过程。首先, 用户要意识到档案利用的重要性以及普遍性。档案部门可以开展各项展览、讲座, 让用户意识到档案是与生活息息相关的, 档案利用是每个人都可能碰到的。培养用户的档案意识, 尤其是挖掘潜在的档案用户, 是十分重要的工作, 他们是档案信息开发工作能否在更广泛的范围内产生效果的关键。其次, 要激发用户的利用需求。用户的档案需求是用户利用信息的某种愿望, 通常情况下用户会明确地表达出来。然而, 有些用户由于受自身及环境的影响, 未能激发利用需求, 使其需求长期处于潜在的隐藏状态。这就需要档案部门加大与用户的沟通, 关注潜在需求的用户, 积极问询, 提供服务。最后, 要普及档案利用专业技能。档案利用亦是需要专业知识的辅佐才能更有效率地完成。随着科技的进步, 档案利用也迈向科技化。所以, 档案部门要加大对用户的技术支持, 要给予用户从问询到检索到复印到借阅等一系列专业的帮助;要完善对档案信息的统计与整理, 加大对数据库的管理, 采取简单易行的检索方式, 提供热情的服务, 辅佐用户完成对信息的获取。

(二) 通过态度的改变提升用户利用行为层次。

用户在线行为的记忆性研究 第5篇

Barabási[4]最早发现电子邮件(Email)和爱因斯坦等人回复信件的间隔时间服从幂律分布,并提出了一个简单的基于任务优先级的排队论模型。后续有很多学者从不同的数据集去挖掘和分析更多的人类行为规律,譬如,在线电影点评[5]、网上购物[6]、微博的发布[7]、网页浏览[8]、电子邮件和信件的发送[9]和移动电话通信[10]等,从中发现大量人类行为的时间间隔分布均具有胖尾特征。

不少学者尝试着建立模型去解释人类行为中所表现的非泊松特性,周涛等人[11]试图从用户的在线行为中挖掘出人类兴趣的变化规律,考虑了优先返回,惯性效应以及新兴趣的探索三大要素,并建立了有偏的随机游走模型;韩筱璞等人[12]则提出了基于自适应兴趣的模型,该模型再现了用户通信间隔时间的幂律特性,幂指数为-1;焦玉等人[13]通过结合考虑排队模型与人类行为特有的习惯特征建立了基于习惯的人类动力学模型;王澎等人在文献[14]中发现了人类行为间隔时间的短期记忆性,并提出了一个基于时间偏好的简单模型,很好的再现了用户选择行为中间隔时间的胖尾特征和强的相关性关系。

现有的研究大都基于用户在线行为时间间隔的角度展开的,分析了时间间隔的统计特性,本文则从用户上网访问量的角度研究用户行为的统计特性,重点研究了用户访问量上存在的记忆特性。本文的研究结果有助于预测用户网络访问行为,为基于网络行为的网络安全管理提供策略指导。

1 实证数据分析

1.1 数据描述

本文分析的数据来源于某高校信息服务中心提供的网关日志记录,根据研究目的从原始数据中提取了两组数据集,分别为qzone数据集、sinawb数据集,这两组数据集的时间段都是2014年3月20日起至2014年7月1日为止。第一组数据集是随机抽取1 853人对QQ空间这个特定社交网站在这段时间内的访问记录,共计1 791 382条记录。第二组数据集随机抽取的是2 094人在这段时间内对新浪微博的访问记录,共计2 029 978条记录。数据中一条记录表示用户的一次上网访问行为。

1.2 分析方法

本文研究目的是从用户上网访问量的角度出发,研究用户上网访问序列上存在的记忆特性。为了研究以及描述方便,作出了如下一些定义。

(1){x1,x2,…,xi,…,xn}为访问时间序列,其中xi表示用户在第i天的访问量(i=1,2,…,n),

(2){y1,y2,…,yj,…,ym}为访问序列,其中yj表示用户在第j次在线状态的访问量(j=1,2,…,m),满足yj=xi的条件是序列{x1,x2,…,xi-1}中存在j-1个不为0的数且xi≠0,m表示该访问序列的长度,本文中定义用户的活跃性A=m,为了确保结果的准确性,主要研究了A≥50的用户。

为了定量分析访问序列的记忆性M,使用了文献[15]中计算相关性的方法,定义如下。

式(1)中ri表示该序列中的第i个值,m1、m2和σ1、σ2分别表示序列{r1,r2,…,rk-1}、{r2,r3,…,rk}的均值和标准差。

从M的定义中可知,相关性系数的范围M∈(-1,1)。如果M值为正数,则表示在序列中较大(较小)的值后面倾向于跟着一个更大(小)值;如果M值为负数,则表示序列中较大(较小)的值后面倾向于跟着一个较小(较大)的值。实际上,自相关系数方法可以测量出单个序列中相邻两个值之间的关联,因此,自相关系数可以用来描述记忆效应。

1.3 分析结果

利用公式(1)去计算每个用户访问序列的记忆性M,统计并观察群体用户M的概率分布,如图1所示,两组数据集M的概率分布均服从高斯分布,均值都大于0,表现出强记忆性。图1中同时表现出了随机模式下M的概率分布。随机模式是指随机打乱每个用户访问序列,以消除原访问序列中的行为模式,然后再次利用公式(1)计算每个用户的记忆性M,统计并观察群体用户M的概率分布,发现两组数据集的M均值近似为0,表现出弱的记忆性。通过比较两种模式,发现用户的上网行为存在强记忆性,表明用户的上网行为有一定的行为模式,并不是完全随机的。

使用梯度下降法拟合了实证数据中的记忆性M分布,拟合出来的高斯方程为

进一步研究了用户记忆性的持续时长。文献[16]中为了观察用户记忆的持续特性,定义了从高于(或低于)序列的均值变成低于(或高于)序列的均值就表示当前记忆持续的结束或者称为下次记忆持续的开始。如图2所示,统计观察到两组数据集中用户在线时的访问量yi的概率分布近似服从幂律分布,访问量高于均值的在线状态天数很少,使用均值作为分界线不能很好的反映数据,因此,本文尝试着使用中位数作为分界线,来判断记忆持续的开始或者结束。一个用户会产生很多次的记忆,定义λ作为每次记忆的长度,用于表示记忆的持续时长,如图3(a)所示。特别指出的是记忆持续时长λ的总和等于该序列的总长度,即λi表示该用户第i次记忆持续时长,k表示该用户的记忆数,L表示该用户访问序列的总长度。

图1两组数据集中用户上网行为记忆性M的概率分布图。均服从高斯分布且均值分别为〈Mqzone〉=0.224 62、〈Msinawb〉=0.162 21Fig.1 The distributions of memory M for the qzone and sinawb datasets.They all follow the normal distribution,in which,the memory〈Mqzone〉=0.224 62 and〈Msinawb〉=0.162 21

本文使用极大似然估计法拟合了实证数据中的记忆性M分布,拟合出来的幂律分布方程为:

从图3(b)可以直观的观察出在个体水平上记忆持续时长λ的分布P(λ)近似呈现出幂律特性,也就是说单个用户有可能存在长的记忆持续时长。实际上,在个体水平上,不同活跃程度的用户其λ均服从幂律分布。而在群体水平上,如图4所示,记忆时长分布P(λ)同样近似服从幂律分布。考虑完全随机的情况下,一个用户每天的访问量大于或小于访问序列的中位数的概率是0.5。理论上,可得出群体在完全随机的情况下λ的概率分布P(λ)服从指数分布,即P(λ)=0.5λ。图4同时显示了用户访问序列在完全随机的情况下的P(λ)分布,发现其与指数分布相吻合,也就是说,用户的上网行为一旦消除了其特有的行为模式之后就会表现出强随机性。

图2两组数据集中用户每天访问量在群体水平上的概率分布图。均近似服从幂律分布且幂指数分别为αqzone≈1.938 8和αsinawb≈2.111 6Fig.2 The distributions of the Internet traffic of the whole population for the two datasets.The two distributions can be fitted as P(L)~L-α,with exponentsα≈1.938 8 andα≈2.111 6

2 建模与仿真

2.1 模型的建立

通过以上的实证数据分析发现,用户连续两次访问量之间存在一定的相关性,即一个用户的下一次的访问量取决于当前访问量。因此,使用马尔科夫过程来模拟用户访问行为的内在机制,即用户根据当前访问量决定下一次访问量的大小。进一步,统计了连续两次访问量的偏差δ=yi+1-yi,发现其服从高斯分布且期望为μ=0,标准差为20.57。因此,马尔科夫过程的跳转概率服从期望为μ=yi、标准差为σ的高斯分布。从而,利用高斯分布即可求得用户下一个在线状态的访问量yi+1,其概率密度方程为

图3一个典型用户的记忆序列图以及记忆时长λ的概率分布图。子图(a)表示该用户的记忆序列,λ=5表示记忆时长为5;子图(b)呈现了该用户记忆时长λ的概率分布P(λ),其服从幂律分布P(λ)~λ-α,幂指数为α=1.294 4Fig.3 A typical user’s memory sequence and duration distribution P(λ)from the qzone data.Subplot(a)show the memory sequence,one of his/her memory’s duration isλ=5;Subplot(b)show the duration distribution P(λ),which follows the power-law distribution.The value of the fitted exponentαare approximately 1.294 4 for the one

2.2 仿真分析

根据以上模型,可由方程(4)产生的连续随机序列来仿真用户的访问序列。为了更好的逼近现实,在仿真过程中的一些假设参数都是从实证数据中直接获取,包括仿真中的用户数、每个用户活跃的天数以及每个用户第一次访问量的初始值。

在上面的模型中,有一个自由变量σ。尽管在实证数据中已经计算出σ,这个参数控制记忆效应的长度以及记忆持续P(λ)的分布。分析结果如图5所示,当σ取不同值的时候,发现记忆持续P(λ)呈现不同的指数截断幂律分布。该分布的前半截服从幂律分布,后半截服从指数分布,且随着参数σ的增加,后半截的指数分布更加明显,模型的仿真结果在一定程度上与实际情况较为吻合。

图4两组数据集中真实数据和随机模式下λ的概率分布对比图。真实情况下P(λ)近似服从幂律分布,而随机模式下P(λ)服从指数分布且与指数函数f(λ)=0.5λ近似吻合Fig.4 Memory duration distributions P(λ)of the empirical data,the null model,and the totally random case for the two datasets.While durationλof the empirical data follows the power-law distribution,that of the null model approximately follows the exponential distribution,which is very similar with the totally random case in which f(λ)=0.5λ

3 结束语

本文根据某高校的网关日志记录数据,从个体层面和群体层面对用户上网行为的记忆性进行了初步的探讨和研究分析。得出如下结论。

(1)用户的上网行为有较强记忆性,整体记忆性M服从高斯分布。两组数据集分别是QQ空间和新浪微博的历史访问记录日志,其表现出来的平均记忆性分别为〈Mqzone〉=0.224 62和〈Msinawb〉=0.162 21。

(2)用户记忆时长的概率分布P(λ)呈现幂律特性,而在随机模式下,其记忆时长的概率分布P(λ)服从指数分布且与f(λ)=0.5λ相吻合。

结合该高校用户访问社交网站数据的特点,本文采用了相应的马尔科夫过程模型,通过仿真发现该模型能够在一定程度上反应出用户上网行为的记忆性特征。

综上所述,用户的上网行为具有较强的记忆性,存在时间行为特征,并不是完全随机的,而是遵循一定的行为模式。随着网络的快速发展,网络用户越来越多,产生了海量的用户行为数据,如何整合这些信息,挖掘出更多的潜在模式,是值得以后深入研究的。

摘要:用户在线行为的记忆性研究有助于揭示用户在线行为特性,构建更准确的在线行为预测模式,对基于在线行为的网络安全防御和信息推荐都具有重要的意义。基于收集的某高校网关日志数据,首先分析了用户在线行为中的记忆特性。研究发现用户的在线行为具有较强的记忆性,其分布服从高斯分布。其次,定义了用户在线行为的记忆长度,统计发现其在个体水平和群体水平上都呈现幂律分布,表明用户的在线行为存在长期记忆。据此建立了马尔科夫过程模型,仿真重现了用户上网行为的记忆性特征。研究结果表明用户的在线行为不仅具有记忆性,而且这种记忆性可以为用户在线行为模式的构建提供指导。

基于用户行为的网站推荐系统模型 第6篇

如何识别用户的喜好,是Web个性化[1]的关键技术。通过精确匹配由用户访问兴趣建立的项目/对象模型,可有效地解决信息超载的问题。然而,用户的行为识别是一个复杂的过程,它涉及到各种搜索参数之间的关系。在用户行为建模方面,从服务器日志中获得的隐式数据更可靠,因为它反映了在各自网站的查询中用户的实际需求。然而,这些数据的问题是多维度的,如日期、时间、使用的操作系统、浏览器和其他细节。检索它们之间的关系是一个复杂的过程。传统的方法使用两个多维数据建模技术、欧氏距离或余弦相似度措施,但是,以往的研究表明[2],在高维空间中,聚类的属性选择不同会产生相当大的差异。在这项研究中,我们建议使用TSM(张量空间模型),这是更高的三维数据建模工具,以有效地挖掘用户的信息,包括在每个维度上的用户访问兴趣。

1 相关的工作

TSM的使用已经成为流行,其多维数据建模和推论的能力已得到认可[3,4]。使用TSM Web挖掘和相关工作正处于起步阶段。TSM已广泛使用在化学计量学[4]。利用点击流数据来定位个性化网络搜索可以有效地进行Web挖掘[5]。最近,提出了ptucker(潜变量概率模型),它具有学习依赖性结构的能力。TSM使用降维HOSVD,已用于个性化的音乐和标签推荐体系,研究人员使用TSM创建基于标签的推荐模型。最近的工作是TSM的集群。不同于先前讨论的这些方法,我们将单个用户的行为模型化,组成张量,然后使用这种模式,根据用户最受好评的兴趣提出建议。

2 提出的方法

我们遵循传统的符号[4,5],标量采用小写字母,向量采用一维数组,矩阵采用两维数组。张量可以用下式n阶方阵表示

T∈RM1×M2×…×Mn. (1)

构建用户喜好模型中最关键的任务就是在每个维度上寻找相关特性,可以分为三个步骤是:(1)模型的构建(利用原始数据构建张量),(2)模型分解(寻找突出特性和不同特性之间的潜在关系),(3)重建模型(从每个维度中寻找相关特性)。

第1步,模型的构建:创建张量模型之前要进行数据预处理,包括删除不必要的属性或特征的数据集。要做到这一点,可进行分组、分节。对每个用户的会话数据进行分析。会话中所有出现的独特功能都提取到张量模型作为代表模式。构建好的用户访问张量如下:

T∈RMake×Mmodel×Bodytype×Searchtype×Costtype. (2)

第2步,模型分解:在多维数据模型的分解过程中,能够找到最突出的部分(即张量项和模式),以及可能存在的不同组件之间的隐藏关系。我们使用的是PARAFAC,Tucker和HOSVD张量分解技术。

第3步:重建模型:一旦用户模型创建和分解好后(步骤1和2),取每个维度上的前n个值作为维度值。如图1所示:

3 评价体系与结论

评价实验数据集:日志数据从太原龙城热线网站中200个用户组成的数据集的一部分,其中每一个用户有不同数量且至少4次以上搜索。

用于评估的各种方法采用高搜索项目(频率为基础),采用SVD、PCA、NNMF、PARAFAC、Tuacker、HOSVD张量分解技术。实验结果如表1所示:

整体而言,张量方法和三个矩阵方法(SVD,PCA和NNMF)相比,TSM要远远优于矩阵方法。基于多个搜索属性的用户行为建模是一个复杂的问题。从向量矩阵的各种方法来发现用户搜索的突出特点是当前研究热点。然而,由于Web日志数据的多维度,这些信息很容易松散化。为了映射相互关系,以避免失去不同的搜索组件之间存在着的潜在关系,有必要使用一些高维数据分析技术,像张量模型。这项研究主要集中在使用张量来进行用户行为建模。然而,为每个用户建立单独的张量模型的主要缺点之一是在时间和空间的开销。时间问题可以考虑建立离线,但空间和计算成本,以及建立高质量的推荐系统是一个重要的考虑因素,需要继续仔细分析研究,这将是我们下一步的工作重点。

参考文献

[1]Mobasher B.“Data Mining for Web Personalization”,inThe Adaptive Web[M].vol.4321,A.K.P.Brusi-lovsky,and W.Nejdl(Eds.),Ed.,2007:90-135.

[2] Skillicorn D. Understanding Complex Datasets: Data Mining With Matrix Decompositions[M].Chapman & Hall/CRC,2007.

[3]Kleinberg J.Authoritative sources in a hyperlinked envi-ronment[G].in Proceedings of the 9th Annual ACM-SI-AM Symposium on Discrete Algorithms,January 1998:668-677.

[4]Kolda T G,Bader B W.Tensor Decompositions and Ap-plications[G].Technical Report SAND2007-6702,San-dia National Laboratories,Albuquerque,NM and Liver-more,CA,,November 2007.

移动互联网用户行为分析 第7篇

1 互联网行为的定义与行为分析的各个阶段

1.1 互联网行为定义

所谓互联网行为, 就是指行为主体为实现特点的目标, 以互联网为媒介而进行的一种有意识的社会活动。互联网行为具有社会行为的特点与基本构成要素。但究其实质而言, 互联网行为主要局限在虚拟网络空间中, 因此这种行为一般不具有物理行为的特点。同时, 互联网用户不存在空间上的距离, 这一特点就决定了互联网用户具有互联网优势, 能够实现长距离、超长距离上的信息传输。

1.2 互联网用户行为分析的阶段

(1) 预处理阶段。指通过各种可利用数据资源, 记录、使用互联网内容, 并同时完成数据提取。预处理是用户行为分析的基础性过程, 其基本内容包括记录预处理、内容预处理、信息结构预处理等。目前, 常见的用户行为分析模式主要包括: (1) 联系模式; (2) 统计分析; (3) 序列分析; (4) 依赖模式。

(2) 模式分析:对本模式中所发现的不感兴趣规则进行过滤, 通过知识查询机制解决问题。

(3) 建立互联网用户行为分析模式。

2 互联网用户行为特征分析

2.1 互联网用户行为的基本特征

现阶段, 互联网用户行为主要指用户的信息行为, 在此背景下互联网用户行为主要表现为以下几方面。

2.1.1 移动互联网用户的上网驱动力

本文简单统计了不同互联网人群的上网浏览信息, 具体结果见表1。

由表1可发现, 不同年龄段人群的上网驱动力存在较大差异, 但从上诉图表相关组成要素来看, 信息传输网页所占比例最大, 由此可见, 用户对移动搜索的需求最大。

2.1.2 移动互联网用户网络使用偏好

用户移动互联网应用主要表现在移动浏览器、通信与移动新闻三个方面, 这与现代人们生活的一般趋势是相吻合的。同时, 网上银行支付、移动办公、移动电子商务等新型电子信息正在不断兴起, 进一步扩大了移动互联网覆盖范围。一方面, 移动互联网的出现扩大了用户终端的便携性, 用户可随身携带移动设备, 并在不同地点阅览所需要的内容, 如刷微博、听音乐等;另一方面, 移动互联网的存在提高了信息的时效性, 用户可通过短信、微博、新闻网站等多种渠道收集信息, 用户也能通过移动互联网, 将信息转发给目标人群, 提高了信息的传递性。

从使用频率上来看, 50%的用户会在一天之内多次使用移动互联网, 82.3%的用户每天都会使用移动互联网;从使用时间上来看, 37.1%的用户使用移动互联网的时间大于1小时, 61.9%的用户使用移动互联网时间大于30分钟, 且这些数据正在缓慢增长之中, 说明移动互联网用户的一些行为还会得到持续的加强。

2.2 数据收集模式下的移动互联网用户行为分析

互联网嗅探捕获用户行为信息是数据收集模式下分析移动互联网用户行为的代表。在信息时代的大背景下, 可通过捕获互联网信息包的方式, 查看、监控数据包的形式, 也可有效判断用户行为。由于数据收集模式只适用在大型城市, 因此在数据包分析中可发现, 移动互联网用户行为主要集中在移动消费与移动搜索两方面。

移动消费快速增长是移动互联网行为的代表。随着移动互联网终端的快速发展, 移动终端的功能丰富, 再加之多数商家的推广, 使移动消费在网络消费中所占的比例不断上升。移动消费不受地点、受教育程度等因素限制, 用户可随时随地的查询消费信息。例如, 用户往往会针对某种商品而形成一个讨论区, 共同讨论该商品的特点、服务性能等, 可推动用户进行理智消费。

同时, 微博、微信等微技术的兴起逐渐占据了传统通信所占的比例。以微信为例, 微信能够实现人与人之间的语言交流与文字交流, 能满足不同阶段人群信息传递的需要, 且微信的信息传输不直接产生费用, 经济性能更好。在大型商场等WIFI覆盖区域, 随处可见部分用户使用微信进行语音通信, 传统的通信交流方式正在发生改变, 并影响深远。

3 结束语

在移动技术高速发展的今天, 移动互联网的作用越来越明显, 与人们之间的交流越来越密切。每个人都认识到移动互联网对其生活的影响, 这种影响虽然由产业层面推动而产出, 但人们依然要认识到这种影响下的各种表现。用户行为是影响移动互联网发展的重要因素, 不但影响产业上游商品生产的行为, 也会在传播文化、商品文化中得到体现, 具有一定的抽象性。在正确处理移动互联网用户行为的过程中, 应该站在信息发展的角度看待这一问题, 综合考虑多种因素, 通过技术创新、功能重构, 让移动互联网用户行为得到应有的重视。

摘要:随着现代移动技术的发展, 移动设备的功能不断丰富, 满足了不同人群的一般通信需求, 成为当前社会经济发展的一大新兴产业。与此同时, 社会各方面都认识到移动互联网中的商机, 推行了一系列有助于移动互联网发展的措施, 并收到良好效果。移动互联网用户是移动互联网的重要组成要素, 其行为影响移动互联网的发展。为科学的认识移动互联网用户的行为, 本文由互联网行为的定义入手, 讨论其行为分析的各个阶段, 最后对移动互联网用户的行为进行分析。

关键词:移动互联网用户,用户行为

参考文献

[1]胡宇辰, 郭宇.基于沙漏模型的移动互联网用户行为分析[J].管理世界, 2013 (07) :184-185.

[2]唐家琳.移动互联网用户行为比较分析[J].西安邮电大学学报2013, 18 (05) :90-99.

[3]郐淑娥.互联网用户的信息行为分析[J].中国管理信息化, 2014, 17 (19) :92-94.

[4]李威.移动互联网用户行为分析研究[D].北京邮电大学硕士学位论文, 2012 (12) :13-14.

用户行为规律 第8篇

关键词:电子商务,推荐系统,用户模型,智能推荐,用户兴趣度预测

引言

推荐系统是利用计算机技术与人工智能技术, 发现和定义用户兴趣, 推荐符合用户兴趣爱好的对象, 也称个性化推荐系统。

由于电子商务推荐系统所推荐的对象是商品, 其推荐成功的结果是发生购买行为, 为商家带来实际可见的利益, 更成为智能推荐领域研究热点。然而, 由于商品种类繁多、信息海量, 且用户购买行为复杂, 用户的兴趣领域既有交集, 又各有不同;因此, 对个体用户兴趣度进行预测, 从而构造出精准的个体用户模型, 成为电子商务推荐系统研究的重要着力点。本文在原型系统的基础上, 通过对用户行为的分析, 推导出用户隐形知识, 从而对用户模型进行构造和更新, 其研究思路如图1所示:

一、用户行为分析与用户知识识别

一个精准的个体用户模型最重要的目的和功能便是使系统准确地定义用户的兴趣取向与兴趣度, 所以首先必须对用户行为进行系统分析, 获取用户知识。“用户知识”是指关于用户的有组织的经验、价值观、相关信息及洞察力的动态组合, 它所构成的框架可以不断地评价和吸收新的经验和信息。用户兴趣度表示用户对推荐商品的感兴趣程度。收集与用户兴趣关联程度比较大的行为数据, 对这些数据进行处理和分析, 获取隐性用户知识, 是预测用户兴趣度的一种有效途径。

(一) 用户知识识别

显性用户知识:是经过人的整理和组织, 可以以文字、公式、计算机程序等形式表现出来, 并可以通过正式的、系统的方式加以传播, 便于其他人学习的知识。隐性用户知识:是指与人结合在一起的经验性知识, 主要包括用户使用系统的习惯、爱好、需求、个人位置等信息。隐性知识只能通过对隐式指示器收集的数据进行分析来获得。综合国内外研究现状, 常见的隐式指示器有:访问时间、页面访问次数、滚动条、鼠标移动、方向键、翻页键等。

(二) 用户兴趣度预测

通过对用户注册时提供的显性知识和浏览商品时的隐性行为分析, 可以对用户所感兴趣的内容及兴趣度进行预测。基于用户兴趣构造用户模型, 并以用户模型为支撑进行商品的智能推荐, 可以大幅提高推荐系统的质量。

用户注册时提供的显性知识是反映用户特质的基本信息, 体现了用户行为的规律性与一致性, 描述了用户的基本特征。与消费行为相关性强的用户显性知识主要有性别、年龄、学历、职业、收入及兴趣爱好等。由于这些显性知识系统一般无法通过人工学习获得, 故虽与消费行为有极高的相关性, 却只能通过用户的隐性行为加以分析预测。

用户在浏览商品时会产生许多隐性行为, 这些行为是用户在没有花额外时间去理解标准情况下产生的。所以隐性行为虽然不像显性行为那样具有系统性和精确性, 但却是用户兴趣的最原始体现, 故对隐性行为通过数据挖掘的方法进行分析, 能更完善的体现用户的兴趣, 是显性知识的一个很好的补充。在用户隐形行为中最易收集又能体现用户兴趣的有:访问次数、驻留时间、鼠标移动次数、滚动条滚动次数、以访问买历史记录。

令Interest (p) 为用户对商品p的兴趣度, 则Interest (p) 可以表示为:

公式2的含义如下: (1) 如果用户保存了页面, 则认为用户对类商品极感兴趣, 可重点推荐这类商品。 (2) 如果用户在浏览过程中多次重复浏览每一商品, 即对某浏览频率较高, 则表明对该商品很感兴趣。 (3) 如果页面驻留时间很长, 并伴随有鼠标、滚动条活动, 则认为用户对该页面商品感兴趣。 (4) 用户浏览网页时的点击行为或许是一个习惯性动作, “click”是用户表达情绪的一种方式, 尤其是用户点击查看商品大图时, 表明用户对该商品感兴趣。 (5) 用户常常通过卷屏来浏览或细看商品内容, 这说明卷屏行为同用户兴趣有一定关系。

二、用户模型表示

用户模型是用户与外部世界联系的知识模型, 是人们对外部世界的认识以及人与外部世界交互的描述。用户模型对用户进行“虚拟”表示, 主要涉及用户知识表示及其动态维护问题。用户模型由描述一类用户的公共特征的原型模型与表示单个用户的特征的个体模型组成。面对各种类型的用户, 系统仅有典型模型, 应用是很有限的。个体模型能使系统对每个用户的需求提供一个合适的接口, 并有助于兴趣情报的描述。

(一) 原型系统表示

主要原型模型的构造是在系统设计时进行的, 直接包含在系统的知识库中;然后在系统运行中, 根据需要从它们推导新的、较特殊的原型。而所有的用户个体模型, 均在系统运行中建立。从结构方面出发, 一个原型具有与用户模型类似的组织结构 (用户行为特征除外) , 它的基本结构如图2:

每个原型都有一个激活方法, 用户在首次进入系统时, 系统会动态分配给用户一个固定ID, 并且原型系统中的每个槽值, 如姓名、性别等也都会被赋值, 此时原型模型即被激活。原名模型被激活的唯一标志是该用户拥有了一个ID, 其他信息都是可以改变的, 甚至注册时该信息为默认的空值, 所以此模型不能表现出用户的真正兴趣, 在智能推荐中的作用不明显。一个能准确体现用户兴趣的模型称作为用户个体模型, 用户个体模型是通过对用户行为的分析, 获取用户的兴趣领域, 并把准确的信息添加到原型模型或对原型模型进行修改之后的结果。用户个体模型是对用户动态行为收集分析综合的结果。

(二) 个体用户模型表示

用户模型的建立是从用户进入系统开始的, 当用户进入系统后, 系统首先查找个体用户模型库, 如果没有该用户的模型, 则被认定为新用户。系统就会从零开始建立用户模型, 过程分五个步骤: (1) 获取显性知识。这一过程系统会动态为该用户分配一个ID, 表示用户的主索引i。 (2) 激活原型。原型中被激活的原型称为活动原型 (si) , 它们可以作为构造当前用户模型的开始点。 (3) 辨别原型。原型建立后用户会浏览商品, 初步获取用户感兴趣的商品集合, 用Personal_I表示。 (4) 精炼模型。系统重复执行以下两个活动:应用合适的获取方法, 收集或产生与用户有关的新信息;应用有关的实证方法检查和纠正新信息的一致性。模型精炼工作直到当前咨询结束为止。收集用户的隐形行为集合, 用Personal_R表示。 (5) 结束工作。当咨询结束时, 当前用户的模型已初次完成, 连同用户标识名一起存入用户模型库。系统经过智能分析, 得出用户行为Personal_R与用户兴趣本体Personal_I的关系ε, 并将用户最感兴趣前λ件商品计入用户数据库, 用户原型中的兴趣领域改变, 用户建模结束。

系统经过以上步骤的交互, 获取了用户信息, 将获取的知识表示出来, 即为用户模型。用户模型表述如下:

(1) Stereo Type:表示用户原型模型。一个系统只有一个原型类, 这是在系统规划时设计好的, 每个用户的进入, 都会将该类实例化一次。Si表示第i个用户的基本信息。

(2) Personal_I:包含用户兴趣的个性化领域本体, 即某一用户浏览商品的集合, ii表示该用户浏览的第i件商品。

(3) Personal_R:用户行为本体, 表示用户浏览商品时的行为的集合。 (cs, i, fs, i, ds, i, ms, i, ps, i) 表示ID为s的用户浏览第i件商品时行为的集合。

(4) ε:表示基于某一具体原型的用户从用户行为到用户个性化的映射, ε (s, i) 表示ID为s的用户对第i件商品的兴趣度。

三、用户模型的更新

如果用户是登陆系统, 即系统已知当前用户, 那么该用户模型已包含在用户模型库中, 所以用户第二次操作便是对模型的更新, 而不需要重新建立模型了。更新用户模型的操作有所不同, 与建模相比, 步骤 (1) ~ (3) 由另两个新的活动代替。更新模型的操作包含四个步骤:

(1) 检索模型。识别当前用户为已知用户, 即从用户个体模型库检索该用户的模型。在 (s1, s2, s3, …, sn) 依次遍历查询, 若有进行智能推荐。

(2) 智能推荐。根据已有的用户模型, 查找出用户最感兴趣的商品或商品类目, 优先呈现给用户。即根据ε的结果将用户最感兴趣前λ件商品和用户原型中的兴趣领域在用户进入系统时进行推荐。并在此基础上继续收集用户行为, 并将在当前咨询中进一步精炼。

(3) 精炼模型。

(4) 结束工作。

四、结论与展望

通过浏览行为估计用户兴趣度的方法无需用户主动参与, 有助于提高个性化服务系统的亲和力, 在理论上具有可行性, 但在实际运用中还有一定难度, 主要表现在时间滞后性与复杂的计算过程, 在下一阶段的研究工作中将主要研究如何解决这一问题。

参考文献

[1]李勇.智能信息检索中基于本体的个性化用户建模技术及应用[C].国防科技大学硕士论文, 2002

[2]单蓉.个性化信息系统中一种新的用户兴趣模型建立[J].科学技术与工程, 2009, 7, (8) :47-49

[3]蓝惠群.数字时代图书馆个性化信息服务研究[J].内蒙古科技与经济, 2009, 7 (14) :154-155

上一篇:歌唱表演与表演艺术下一篇:心肌重构

全站热搜