媒体查询范文

2024-07-26

媒体查询范文(精选8篇)

媒体查询 第1篇

如果真正想要发挥出ASP的强大功能, 就要用到数据库, 主要借助数据库的数据处理能力, 用ASP制作的作品才能方便地处理数据, 发挥网络编程强大的功能。在ASP编程中用来存取数据库的对象统称为ADO (Active Date Object) 对象。下面详细学习ASP中ADO对象的强大功能。

1.1 ADO对象

ADO对象是针对当前微软支持的数据进行操作的有效、简单并且功能强大的方法。

ADO对象主要含有Connection、Recordset、Command三种对象。其中Connection对象主要负责打开或连接数据库的文件;Recordset对象主要是存取数据库的内容;Command对象主要是对数据库下达查询指令。

ADO对象能够存取到数据库的内容, 首先要求数据库的驱动程序必须安装上, 否则, ADO对象是无法存取数据库的内容的, 其主要原理如图1所示。

1.2 SQL

用ADO进行数据库管理是ASP中的一个不可缺少的功能, 并且真正功能强大的系统都必须借助数据库的数据处理能力实现交互式动态网页, 所以数据库在ASP中就显得十分重要。要访问数据库, 简单、有效的方法是使用SQL语言。SQL语言即结构化查询语言, 它是一种专门用于关系数据库, 用来查询数据库的语言, 无论在以后用什么计算机语言进行编程, 在进行数据库操作时都必须使用SQL语言。

要想完全理解SQL语言并不是一件容易的事情, 文中只讲解SQL语言中经常用到一些语句, 主要是希望通过学习对SQL有所了解。

1.2.1从表中查询数据

使用SQL语言可以很容易地从数据库的表中读取想要的数据, 语法如下:

select字段from表名[where条件]

假设下面存在表userinfo, 如表1所示。

执行select姓名from userinfo where ID=1

执行结果可以将姓名字段中的‘张红’读取出来。

在执行select*from userinfo where ID=1

执行结果可以读取ID=1中任意字段的名称。其中select*代表读取表中所有字段, 即select id, 姓名, 年龄from userinfo where ID=1。

在条件语句中还可以使用or, and, not等常用逻辑语句来连接多个条件。如select*from userinfo where ID=1 or姓名=‘孙奇’, 查询结果就是两条记录ID=1和ID=4的数据全部满足条件。

1.2.2 插入、删除、更新数据

要想向表中插入数据需要通过SQL语言中的insert语句, 语法如下:

insert表名 (字段) values (数据)

同样使用上表userinfo, 想再在表中插入一条数据insert userinfo (ID, 姓名, 年龄) values (‘5’, ‘赵亮’, ‘30’)

那么此记录将插入查到数据库中, 原数据库就变成如表2所示。

在表中删除数据方法很简单, 语法如下:

delete from表名where条件

通过以上语法将表userinfo中符合条件的内容删除, 执行下面语句

delete from userinfo where id=5

通过执行以上语句, 就会把刚插入的ID=5, 姓名=赵亮, 年龄=30这条数据删除, 这样表中数据又恢复到初始表中的4条数据。

在表中更新数据需要通过update更新语句, 具体语法如下:

update表名set所要更新的表达式[where条件]

还是通过上面的表userinfo, 要想更改上面的ID=1的数据, 姓名字段中的数据由原来的‘张红’更改为‘张宏’并且年龄字段有原来的25更改为27, 需要执行如下语句

update表名set姓名=‘张宏’, 年龄=27 where ID=1

数据表userinfo就会发生变化, 如表3所示。

1.3 Connection、Recordset对象

在调用数据库之前必须先利用Connection对象连接数据库, 只有连接数据库以后才可以利用Recordset对象结合上面讲过的SQL语言对数据库进行各种操作。

1.3.1 Connection对象

(1) 连接Access数据库

(2) 连接SQL Server2000数据库

主要讲解 (2) 中数据库连接方式, 以上数据库连接方式全部为校园网络应用系统中数据库连接常用的方法。

(3) Connnection的close方法

打开数据库以后, 在程序全部执行完毕, 程序员应该养成关闭数据库并且释放资源的编程习惯, 否则在编程过程中会出现一些莫名其妙的错误。

执行方法如下:

(4) 防止数据库连接失败出现错误页面的方法

以上方法是十分有效的数据库错误判断方法。当数据库无法正确连接时, 通过以上判断可以避免数据库出现错误代码页面, 从而能够避免浏览者通过页面显示的错误信息看到数据库的相关信息, 这样能够防止他人对数据库进行攻击。

1.3.2 recordset对象

在成功连接数据库以后, 就可以通过recordcount对象操作数据库。首先建立Access数据库database, 库中存在一个表userinfo, 内容如表4所示。

通过上面学过的知识, 就可以对数据库中的表进行具体操作:

然后可以利用SQL查询语句对表进行具体操作, 下面简单介绍以下Recordset对象的一些常用方法。

2 访问数据库实例

通过以上的学习大家应该对ADO与SQL语言的基本用法有了一定的了解, 下面主要针对本校的多媒体教学资源检索系统的部分功能对ASP访问数据库进行讲解, 希望通过实例讲解, 能够让读者对以上所学习的知识有更清晰的思路。

2.1数据库信息表设计

如表5所示。

2.2 代码分析

2.2.1 title.asp (数据库连接头文件)

2.2.2 addinfo.asp (填写信息)

2.2.3 addinfook.asp (添加信息)

2.2.4 maninfo.asp (管理信息)

2.2.5 delinfo.asp (删除信息)

2.2.6 modiinfo.asp (修改信息)

2.2.7 modiinfook.asp (修改信息)

2.2.8 search.asp (查询数据)

以上文件就是多媒体教学资料查询系统的部分代码, 主要分为信息管理部分和信息查询部分, 系统还存在一些问题, 如:查询翻页、用户验证等, 在后面的实例中会详细进行讲解, 目前某校正在使用此系统, 在这里作为初学者的实例提供给大家。

3 总结

媒体查询 第2篇

(子查询、分组查询)

一、实验目的

使用SQL语言完成数据定义、数据查询、数据更新等功能。

二、实验要求

1.掌握使用SQL定义、删除和修改基本表。2.掌握使用SQL完成单表查询、多表查询。3.掌握连接查询和嵌套查询。

4.掌握使用SQL完成数据插入、数据修改、数据删除等功能。

三、实验内容

在“FLY飞翔公司数据库”数据库中,完成以下SQL查询实验。(以下的SQL查询实验可能会多种SQL命令描述方式,建议同学多思考、多尝试)

实验1 使用SQL命令,查询公司机构C1和C2中基本工资低于3000的员工信息。

提示:使用两个IN函数,其中一个IN函数是IN(“C1”, “C2”),另外一个IN函数是嵌套SELECT语句

实验2使用SQL命令,查询公司机构C1和C2中基本工资低于3000的员工信息。

实验3使用SQL命令,查询显示基本工资大于2000,且不超过3000元的员工编号及其所在公司名称。

实验4使用SQL命令,查询显示查询供应商“兆海公司”未供应的商品类型名称。提示:使用NOT IN 函数实现

实验5使用SQL命令,查询显示员工的姓名,所属公司名称和工资收入(工资收入=基本工资+任务工资+奖金-住房公积金-扣款)。提示:产生新字段要使用As

实验6使用SQL命令,分组统计供应了商品的供应商所提供的商品种类数量,显示供应商名称和商品种类数量。提示:使用COUNT函数 实验7使用SQL命令,分组统计每笔订单的净收益,显示订单编号和金额为200到500之间的净收益。(净收益=(销售价格-购入价格)*数量*折扣)。

提示:group by是分组,having是判断,同学选做。

实验8使用SQL命令,查询与员工王芳签订过订单的零售商名称和订单编号,并将结果存在一个新表New_temp中。

提示: Select 零售商名称, 订单编号 Into New_temp 是将所选字段存入新表New_temp中。

实验9使用SQL命令,查询未与员工E3签订过订单的零售商名称和所在城市。提示:使用Not IN函数

怎样查询个人信用 第3篇

信用是一笔财富

不仅如此,在我们进行新贷款的申请、信用卡的办理时,银行都会对客户的征信报告进行审核。征信报告上的瑕疵都可能对贷款人产生不利的影响。

前不久,记者的一位朋友小刘向银行申请住房贷款时,就体会到了征信系统的厉害。原来,小刘在前几年申请过一张信用卡,虽没有开卡,银行却要求收取年费。“觉得这笔费用不该交,加上后来正好搬家换掉了通信地址,这笔年费也就不了了之。”然而这笔拖欠的信用卡年费,却在小刘的征信报告上留下了污点。“去银行递交贷款资料之后,贷款经理帮我查询了征信记录,就发现有这笔逾期欠款,虽然金额不高,但是时间很长。”这段时间,小刘一直忙于和信用卡发卡行联系,补缴逾期还款之外,还需要信用卡中心提供结款证明。“我的信用评级也会受到影响,相应地,购房贷款成数和利率也会受到影响。”他不无沮丧地说,现在才真正体会到了“视个人资信状况而定”的意义了。

看似不起眼的一笔欠款,由于征信系统的存在,却会对购房、贷款这样的大事产生影响,“信用也是一笔财富”,其意义也就在于此了。

正是由于征信报告的重要性,我们在进行贷款申请之前,也有必要了解到自己相关的征信信息,以免出现像小刘这样的尴尬状况。现在,随着征信系统的完善,个人也有渠道了解到自己的征信记录信息。

如在上海,主要应用的是上海资信和央行所提供的征信系统。尽管目前这两套系统仍然相对独立,但是记者了解到,不少商业银行在进行征信信息的采集时,往往采用同时调用的方式。所以,对于个人而言,全面了解自己的征信信息也很重要。

两套系统的信息也各有优势。如上海资信所提供的个人征信报告,最大的优势在于其建立的时间较长,数据资料较为全面。上海资信是国内首家开展个人信用联合征信的第三方资信机构,其官方背景为上海市信息化委员会。从1999年开始,上海资信就开始进行个人及企业信用数据的收集。2000年时就提供了国内第一份个人征信报告。而来自央行的个人征信报告体系。2006年时正式投入使用。与上海资信的个人征信报告相比,央行个人征信系统最大的优势在于其全国范围内的资源共享。如上海资信收集的个人信息主要限于上海市居民,所采集的数据也主要来自于上海。但是央行的信用数据摆脱了地域的局限,收集的数据信息来自全国范围,像贷款申请人在上海之外的贷款记录、银行账户信息都可以在这个系统中进行查询。

如何查询征信报告

目前,这两套征信系统都可为个人提供查询的功能。如果需要了解到自己的“信用档案”,可以从上海资信和央行分别获得自己的信用报告。

其中,上海资信可以提供的是网上查询和现场查询两种方式。登录上海资信所提供的个人信用网上服务平台(www.my—credit.cn)就可以进行网上查询。据介绍,可进行查询的仅限于上海市民,且必须由被查询人本人提出申请。因此,在提交网上申请的过程中,网站需要申请人提供一些个人的资料,主要包括个人的有效证件号码、姓名、联系方式等个人身份信息,以及与身份验证相关的信用信息,主要为“贷款笔数”、“信用卡数”、“协议入网手机数”三类。在申请时,申请人至少需要填写一项账户信息。以填写“信用卡数”为例,需要在明细中填入你的一张信用卡发卡行、发卡时间、授予额度等。这些信息都是为了在审核申请时进行身份验证而使用。查询申请发出后,系统会发出申请激活指令到申请人所填写的信箱之中,同时附上的还有申请号码及密码,待到查询申请通过之后,可以根据邮件通知,使用查询申请号码、密码登录到网站,下载自己的信用报告。

如果需要快速下载征信报告,可以使用到现场查询的功能,目前可在上海资信有限公司、中信银行淮海中路支行、上海银行浦东分行三个服务网点办理现场查询。申请人本人携带有效证件就可获得自己的征信报告,需要的查询费用为30元。

央行系统的征信报告,需要直接到服务网点进行现场查询。如在上海,可提供央行征信报告查询的为央行上海分行。需要提交的是申请人本人的身份证原件和复印件,并填写一份申请表格,就可获得自己的个人信用报告。这一项服务是免费的,不需要收取任何查询费用。

那么,哪些信息会被列入征信报告中,并对我们的信用产生影响呢?

像在上海资信所提供的个人信用报告中,主要涵盖的内容有查询人的贷款信息,比如向银行申请过何种类型的贷款、申请的贷款金额、逾期记录等等,还有持有的信用卡信息,持有的信用卡张数、额度,以及历史上的逾期记录。此外,上海资信提供的信用报告中,将通信信息也包括在内,主要为手机的账户、缴费逾期情况。

相对来说,上海资信的报告中提供的信息较为粗略,如果需要查询进一步的详细信息。还需要查询人自己到资信公司进行咨询。

而在央行所提供的个人征信档案中。主要收集的是金融信息。包括曾经申请的银行贷款信息,如何时在哪家银行申请的贷款、贷款的金额、明细的还款情况;信用卡明细信息,查询人持有的信用卡、额度、最近24个月内的还款记录,个人结算账户信息,查询人的各项银行开户记录等等。

瑕疵档案如何拯救

一份良好的贷款记录,是顺利办理各种贷款手续的必要条件,征信系统的推广和应用之后,征信报告中的瑕疵和污点都可能对贷款的申请产生不利的影响。

尽管越来越多的人已经意识到信用的重要意义,但是如果你的信用记录上已经留有瑕疵。又该如何去弥补?

银行的工作人员向记者介绍说,瑕疵出现较为集中的是信用卡的还款记录。“征信报告中会提示客户使用信用卡时逾期还款发生的次数,这一记录也是无法消除的。银行在进行审核时,对于逾期次数过多的客户就会予以警惕,如果次数不多,影响不会特别大。但是如果当前仍有逾期款项,是难以通过审核的。”在一些情况下,贷款人已经进行了还款,但是由于信用记录并非实时更新,记录中表示当前仍有逾期款项。“如果发生了这一情况。就需要贷款人提供额外的资料来证明自己的账户为正常状态。”他介绍说,如像信用卡中心申请开具账户结清的证明、提供当前表明账户正常的账单,银行在审批时都可以进行采纳。

媒体查询 第4篇

关键词:B/S结构,数据库,Authorware ASP

一、实验室多媒体信息查询系统简介

实验室多媒体信息查询系统通过设在实验楼底下的触摸屏指导同学们进行各项实验室守则及实验室开发、分布、开设实验等信息的查询,让同学们了解自己所需要掌握的动手实践能力和实验方法等,促进了实践教学的顺利开展。实验室多媒体信息查询系统还能够帮助各系部教师更方便地与同学们进行沟通,及时听取反馈意见。

实验室多媒体信息查询系统可以支持多种播放格式,如TXT、JPG[1]、MPEG、AVI、WMV、WAV等。可播放学校新闻、讲座通知、实验室开放、实验室介绍、指导教师介绍等信息,并可查询实验开设情况、学生问答等详细信息。实验室多媒体信息查询系统以下几大优点:

1、提高学校形象和品位

多媒体信息查询系统是学校展示信息的最好平台之一,它是动态的广告,是一次性投资却可一直使用的广告资源,它无形中提高的学校形象和品味远远超过了它自身的实际价值。

2、促进管理

规范、清晰的实验室多媒体触摸屏查询系统,为实验室管理人员提供方便,提高了实验室现代化管理的水平,对提高学生的学习激情和效应,具有重要意义。

3、易交互

实验室多媒体触摸信息查询具有易于交流的特点,以最简单、方便、自然的人机交互方式,极大的简化了信息查询服务的使用难度,解决了公共信息市场上计算机所无法解决的问题,即使是对计算机一无所知,也能够信手拈来任意使用。

二、系统总体结构

多媒体查询系统主要面向社会公众,就要求操作一定要简便,主页面要展示所有提供的服务。本系统的功能结构图如图1:

三、系统模块介绍

1、学校信息、新闻浏览

此模块主要提供信息服务,学生可以直接触摸查询学校相关信息和新闻,操作十分简单便利。由于新闻信息更新频繁,故需采用数据库来存储和维护。

虽然Authorware利用系统提供的ODBC结合SQL可以完成对数据库的操作,但仅限于使用本地的数据库,这样就给Authorware的网络开发带来了很大的局限性。同时因为多媒体系统一般置于大厅或室外,所以政务信息数据的更新和维护都需要专人收集,然后特意到多媒体查询系统主机上去更新。

我们知道很多网站都是用Active Server Page+Access技术构建而成[2],我最初想到的是直接用Web插件调用ASP网页来实现数据库的远程操作,但这样子又无法发挥Authorware强大交互功能。于是我构建了这样一个方案,在多媒体查询系统所在主机上建立本地数据库,同时建立虚拟目录以及配置本地WEB服务,这样就可以实现工作人员在办公室用网站通过ADO[3]新数据库,具体结构见图2。

2、实验室守则等其它模块

实验室守则是为了方便学生提高实验技巧和操作技能,为了规范管理,维持开放实验室正常秩序等情况而制定的,学生进入实验室实验前应该对相关守则进行学习,以便于提高实验效率和避免实验事故。实验室及分布让学生了解整个学校实验室的情况及所处位置;实验室开放让学生能合理安排时间,去消化和验证平时所学的知识;实验查询及演示模块让学生了解各实验室能开设哪些实验,让其有针对性和方向性的去学习;实验指导教师介绍模块让其了解当他在解决实际问题遇到疑惑的时候,可以去咨询相关的实验老师。这些模块也是需要动态更新的,所以所需的技术与前面介绍的一样。

四、系统技术要点

1、Authorware访问数据库

Authorware访问数据库可以分为两个阶段:连接数据库和操作数据库。

(1)连接数据库

Authorware本身没有数据库接口,不能直接访问数据库,但可以通过设置ODBC接口连接数据库,具体操作如下:

使用控制面板中的ODBC管理程序手动建立:打开“控制面板”→“管理工具”→“数据源(ODBC)”,选择“用户DSN”选项卡,添加数据源[4]。

(2)操作数据库

在Authorware中对数据库的操作主要是通过ODBC.u32中的三个函数来实现的,这三个函数分别是ODBCOpen函数、ODBCExecute函数、ODBCClose函数[5]。

2、ASP技术访问数据库

系统实现了信息办公室采用WEB形式进行政务、政策、法规等信息的更新。这些功能是采用ASP技术通过ADO及ⅡS(Internet Information Service)技术实现的。这里连接数据库的方法如下(以SQLServer为例):

3、平面设计技术

本系统可作为学校的形象展示窗口,所以还有一个特色就是每一个界面都是精心设计,采用的统一风格,统一的设计主题,且必须附有学校的标志。这些页面的设计主要采用PhotoShop和Illustrate两款软件设计而成。

五、系统待改进的地方

多媒体信息查询系统是本人一个科技创新项目,已经有相应的软件研发出来。系统有一个问题还待解决,那就是如何使用Authorware编程来远程访问数据库,同时又不影响系统的交互性。如果能简便的实现用Authorware远程访问数据库,我们就可以不采用ASP技术和无需配置多媒体系统所在主机的WEB服务了。

参考文献

[1]孙其信.用Authorware开发多媒体课件的若干方法与技巧[J].中国电化教育.2002/1.

[2]洪运锡.ASP技术访问WEB数据库[J].贵州大学学报.2006/2.

[3]张蔚.ADO在教务管理系统中的应用[J].辽宁师专学报(自然科学版).2008/10/01.

[4]邓椿志.Authorware7.0基础与实例教程[M].北京:电子工业出版杜,2005.

社保查询个人账户怎么查询 第5篇

1、可以持本人身份证到当地社保局服务大厅查询打印缴费清单。

2、打当地社保局电话报个人身份证号查询个人医疗保险金缴费情况。

3、可以到医疗定点药店购买药品时,查询医疗保险卡内余额。

二、医疗保险个人帐户信息查询

1、参保人持社会保障卡和本人身份证,到就近的社保经办机构查询。

2、在社保经办机构信息查询机上自行查询。

3、可登录劳动保障服务网进行查询。

城市案例:查询使用说明:

一、本查询系统适用于在市本级(郑州市社保局)企业参保、离(退)休职工,(在省统筹机构或各区(县)级参保职工无法使用本系统)。

二、身份证号码和职工姓名请以每年我局打印的《郑州市企业职工个人对帐单》为准。

三、身份证号码的末尾为“x”的,查询时请将“x”输入为大字的“X”。

四、所填写身份证号码及该号所对应的职工姓名要完全一致,输完后点查询图标即可。

五、在职职工通过使用“职工个人帐户查询”栏目查询,离(退)休职工通过使用“养老金查询”栏目查询。

六、查询数据仅供参考,准确查询信息以经办大厅所打印的查询单为准.本系统的最终解释权归郑州市社会保险事业管理局所有。

七、郑州市社会保险事业管理局政策咨询热线:12333

上海:强制查询拒行贿 第6篇

2006年1月,在高检院职务犯罪预防厅的统一部署下,上海检察机关及时建立了检察机关行贿犯罪档案查询系统,建立了包括行贿犯罪案件的主体情况、犯罪基本事实和处理结果等在内的基础档案数据库,开始接受相关行业主管部门和项目法人的查询,并及时将查询报告反馈给查询用户。系统建立后,立即发挥其震慑行贿犯罪的作用,在市院预防处受理的第一起查询申请中,就发现了某供应商有行贿犯罪记录,检察机关向招标单位出具了告知函,从而取消了其投标资格。

2010年,上海检察机关开展专题调研,掌握了政府采购、工程建设等重点行业的管理规范,并与苏、浙、皖、赣、闽、鲁检察机关共同建立了华东六省一市行贿犯罪档案查询系统信息共享平台。显著的成果引起了时任上海市委书记俞正声同志的关注与批示,并要求有关部门进一步推进该项工作。

在市紀委、市建交委、市财政局、市机管局、市政府采购中心等单位的协助和配合下,上海市人民检察院预防处起草了《上海市政府采购和建设工程招投标领域行贿犯罪档案查询制度实施办法》(试行),由市委、市政府办公厅正式下发,并于2012年3月1日起开始实施。至此,凡参加政府采购活动的供应商和参加招投标的在沪建设工程,都必须到检察机关进行行贿犯罪档案查询,由相关部门根据查询结果作出相应处理。

查询办法的施行,成效斐然。截至2012年10月底,全市各级检察机关共接受社会查询4.8万余次,与前年同期相比增长470%,先后查出有行贿犯罪记录的单位及个人44次,均受到了相应处置,对防控贿赂犯罪发挥了积极的警示作用。市建交委的一位负责同志发自内心地说:“正因为有了这个制度,建筑领域的监管就有了新法宝,行业规范有了新保障,既降低了建设成本,又提高了工程质量。建立强制查询制度,非常及时和必要!”

为进一步提高工作效率,积极运用“制度加科技”手段,上海市人民检察院在查询系统中增加了计算机自动比对和集中查询功能,实现了与有关部门诚信系统的对接,确保查询工作的便捷高效。

在具体操作中,访问市财政局和建交委的网站进行数据下载和查询结果反馈,这其中涉及网络访问权限,查询和反馈数据大小、格式是否兼容匹配等问题。比如,访问建交委网站需要账号和密码即可,而访问市财政局网站除需账号和密码外,还需通过数字证书进行身份识别。又如,在进行数据库导入导出过程中,一开始就遇到数据格式不兼容、查询数据量过大无法上传等问题,经过与软件公司的多次磋商和调试,这些问题被逐个排除。

同时,为方便公众查询,上海检察机关严格落实首办责任制和三日回复制度,查询人可以选择最近的查询机关。一家知名跨国企业专门致信:检察机关的这套系统,帮助我们选择诚实可信的合作伙伴,有效避免了商业风险和经济损失,真心地感谢你们!而一些因为存有记录而失去商业机会的企业和个人也从中汲取了教训,真正认识到诚信经营、规矩做人的道理。

查询日志中查询意图的自动识别 第7篇

搜索引擎已经成为人们从互联网上获取信息的主要工具,用户通过提交查询串从互联网上获取信息。用户查询串隐含地包含了用户查询意图。

查询分类意在将互联网用户提交的查询按照主题或意图分配到预先定义的类别体系中[1]。在给定用户意图分类体系的情况下,查询意图识别演变为分类问题,即将查询串分到预先定义好的查询意图类别中。搜索引擎根据用户查询意图可以更好地为用户提供查询服务。因此,自动识别用户查询串中所隐含的查询意图,对于提高搜索引擎质量有重要意义。

1 相关研究

查询分类有两种不同的分类方式:按照查询串意图分类及按查询串主题分类。Broder[2]将查询串意图分为三类:导航类、信息类和事务类。Rose等[3]对Broder的分类体系做出进一步细化,提出层次化查询意图分类体系。Liu[4]和Lee[5]将事务类并入信息类,采用导航类和信息事务类的分类体系。查询串主题分类主要指将查询串映射到预定义的主题中[6],如“政治”、“体育”、“经济”等。目前对查询主题分类并没有一个标准的分类体系[7]。文献[7,8]对查询分类体系做了详细的综述。

查询日志记录了用户检索行为轨迹,能真实地反映用户的检索行为。Lee[5]通过分析查询日志,提出用户点击分布和平均点击次数特征,并用点击分布中值衡量用户点击分布特征。Liu[4]根据Sogou搜索日志查询的点击情况,提出n个点击满意度(nCS)和前n个结果满意度(nRS)特征,最后结合Lee提出的点击分布特征,利用决策树算法证明了其有效性。Yuan等[9]进一步提出了点击熵和域名点击熵的概念,得出用锚文本比用查询日志有更好的实验效果的结论。但忽略了锚文本覆盖面不广和可用性不强的特点[4]。Brenes等[10]则针对导航类提出最多访问结果权重、不同访问结果数量和导航类session百分比三个特征,但是没有考虑到子页面噪声的影响。

本文依据Liu和Lee的分类特征,将用户查询意图分为导航类和信息事务类。通过分析2012版Sogou搜索日志中用户对导航类和信息事务类查询串的点击分布情况及导航类查询串的分布规律发现:导航类查询串点击的不同页面数较少,且点击分布图中通常只存在一个极值;信息事务类查询串点击的不同页面数较多,且点击分布图中常存在多个极值;导航类查询串对应的点击页面中,子页面的干扰严重影响意图识别的正确率。针对以上特点,提出“不同页面点击数”、“点击分布值”和“异源页面点击数”三个特征,并将之与前人所研究的特征融合,利用C4.5算法训练分类器,进行用户查询意图识别。

2 意图识别问题描述

给定查询意图分类体系,将查询意图分为导航类和信息事务类,为此意图识别问题可转换为分类问题。根据经过标注的查询训练集Q,找到查询分类特征F和意图类别C之间的映射规则f,利用学习到的关系规则对新的查询串qi进行类别判断。即:

其中ci为意图类别C中某一个类别。

已标注查询串集合Q={q1,q2,…,qi,…,qm},查询串qi由分类特征F和1个类别分量cj组成,即:

分类特征F=<f1,f2,…,fi,…,fk>,是由一系列特征分量fi(1≤i≤k,k为特征个数)组成的向量。3.2节将详细介绍本文所用特征。

意图类别C={c1,c2,…,ci,…,cm},是由类别ci(1≤i≤m,m为类别个数)构成的集合。本文采用导航类和信息事务类分类体系。

映射规则f:映射规则的好坏直接影响分类结果,前人利用决策树算法取得了很好的分类效果[4]。本文采用C4.5算法训练得到决策树模型。

3 查询意图分类模型

3.1 决策树模型

决策树机器学习模型在分类领域有广泛应用。决策树是具有至少两个分支的树状结构,决策树内部的每个节点代表一个决策属性,每个叶子节点代表一个类,每个分支是一个测试的输出结果。决策树算法通过将样本的属性值与决策树相比较,对未知样本进行分类[11]。在决策树构建过程中,因为数据中噪声和孤立点的影响,部分分支反映出训练集的异常,因此需要进行剪枝,使决策树模型对噪声数据有很好的健壮性。剪枝的过程中,会删去一些代表决策属性的节点。可以利用决策树剪枝这一特性,在多特征融合构建决策树时,寻找互补特征[12]。

本文结合决策树算法和查询日志的特点,采用C4.5算法训练分类器,得到决策树模型。

3.2 特征抽取

构造查询意图分类器的关键问题是找出有效的分类特征。前人在解决查询意图识别问题在点击满意度、结果满意度、点击熵等方面做过相关研究。本文根据查询日志的统计信息提出“不同页面点击数”、“异源页面点击数”和“点击分布值”三个特征,详细介绍如下:

特征1不同页面点击数DPCN(Different Page Click Number),指查询串对应的点击URL集中,不同URL的数量。

用户在向搜索引擎提交一个查询串时,对于一个导航类的查询串,用户的目标网页比较明确,通常只点击一个或者少数几个页面,而信息事务类查询串相对较多。用户查询日志记录了用户通过搜索引擎从网上获取信息的整个过程,上述点击行为反映在查询日志中,表现为一个导航类查询串点击的不同URL数一般为一个或者少数几个,一个信息事务类查询串点击的不同URL数相对较多。

统计2012版部分搜狗日志查询串的不同URL点击数,由小到大排序,提取前500个查询串用做样本分析,其中导航类查询串186个,信息事务类查询串314个,得到不同页面点击值类别比例统计分布图,如图1所示。

分析图1,当不同页面点击数位于区间[1,7]时,共124个导航类(以Nav表示)查询串,占总导航类的66.7%,即2/3的导航类查询串不同页面点击数不大于7;当不同页面点击数大于7时,共有260个信息事务类(以Inf表示)查询串,约占总信息事务类的83%。从图中可以看出,不同页面点击数不大于7时,导航类所占比例均高于信息事务类;不同页面点击数大于7时,信息事务类所占比例均大于导航类所占比例。由此可见,不同页面点击数在导航类与信息事务类中呈现两极分化现象。

将上文所述点击过程中在查询日志表现出来的特征称为不同页面点击数(DPCN)特征。对于某个查询串q,DPCN的计算公式如下:

其中Pageq={URL1,URL2,…,URLk}表示q对应的点击页面集合,表示集合Pageq中元素个数。

特征2异源页面点击数PCNS(Page Click Number without Subpage),指查询串对应的URL集中,以点击频次最高的URL为基准,不同页面点击数与其子页面数量的差值。

查询串“百度”,在搜狗日志中统计得到DPCN值为17。根据特征1,判断出“百度”为信息事务类查询串,而“百度”实际为导航类查询串。观察Sogou日志中查询串“百度”对应的点击页面,发现其中有15个页面为“http://www.baidu.com/”的子页面,1个为广告页面。子页面噪声干扰问题严重影响查询意图识别的准确率。用户在提交同一个导航类查询串q后,如果所有的点击均集中在少数几个页面,DPCN(q)值不会很大。但由于用户点击的页面只是查询串对应页面的一个子页面、多个URL对应同一个页面以及垃圾网页(欺骗性网页、广告信息等)的影响,DPCN值会增大。另外,一些知名网站子页面较多,子页面知名度也较大,且在返回页面中排名靠前,用户往往会进入其子页面。比如用户会通过查询串“搜狗”来访问搜狗的子页面“http://pinyin.sogou.com/”。

为了解决子页面噪声干扰问题,本文提出异源页面点击数(PCNS)特征,该特征基于两个假设:(1)认为一个查询串q对应的点击页面集中,被点击次数最多的页面能代表用户的目标页面;(2)针对用户点击次数最多的页面,凡是用户点击了其子页面,均认为用户访问了该页面。

PCNS特征在真实的查询日志中分布情况如图2所示。图2采用图1所用数据,计算每个查询串对应的PCNS值,排序并统计。

由图2可以看到,随着PCNS值的增加,导航类所占比例呈下降趋势,信息事务类呈现上升趋势。当0<PCNS<6时,共148个导航类查询串,约占总导航类数的80%,相对于图1高出约13%,且在此区内,导航类查询串所占比例均远远大于信息事务类。当PCNS>5时,信息事务类所占比例均高于导航类。特征1中,设定导航类和信息事务类的分界值为7,在PCNS特征中,分界值设定为5。

PCNS特征是在DPCN基础上提出的,弥补了DPCN特征易受子页面噪声干扰的缺点。设URLmax表示查询串q对应URL集中被点击次数最多的URL,ais_→ab表示a是b的子页面,anot_a→b表示a不是b的子页面。PCNS(q)的计算公式为:

其中,numi为一个计数器,

特征3点击分布值CDV(Click Distribution Value),指在查询串的点击分布图中,位于某阈值上方的点的个数。

查询日志记录了用户的点击行为过程,查询串的点击分布图能清楚地展现出用户的点击分布情况。导航类查询串的返回页面中,用户一般只会点击一个或少数几个页面。例如查询串“youku”,大部分用户均会点击“http://www.youku.com”页面。信息事务类相反,大部分用户点击的页面会集中在若干个页面上。例如查询串“nba”,大部分用户的点击会集中在“新浪NBA”、“腾讯NBA”、“NBA中文网”等若干个网页。

通过统计分析查询日志,观察点击分布图,发现导航类和信息事务类查询串存在以下分布特征:导航类查询串中,大部分的点击行为集中于单个URL上,而信息事务类查询串中,用户点击比较分散。这种现象在点击分布图中表现为导航类往往只存在一个极值,而信息事务类通常存在多个极值。

鉴于导航类和信息事务类查询串的点击分布特点,可以选取一个阈值,使导航类查询串对应的点击分布图中,出现一个或者少数几个数位于阈值上方,信息事务类出现多个。本文称位于这个阈值上方的值的个数为点击分布值(CDV)。

查询串的平均点击数可以反映出该查询串的平均点击情况,以查询串平均点击数为阈值,采用图1所用数据,得到点击分布值分布图,如图3所示。

当点击分布值不大于2时,共有171个导航类查询串,约占导航类总数的92%;当点击分布值大于2时,信息事务类共210个,约占总信息事务类的70%。

由此可知,以查询串的平均点击数为阈值,点击分布值能够较准确地反映导航类和信息事务类的点击分布特点。

对于一个查询串q,设ACN(q)表示查询串q的平均点击数,CN(URLi)表示q对应的URL集中URLi的点击数。CDV(q)计算公式为:

其中,numi为一个计数器,

前人研究的特征包括Liu[4]提出的n CS和nRS,Lee[5]提出的点击分布特征,Yuan等[9]提出的点击熵特征CE(Click Entropy)和Brenes等[10]提出的最多访问结果权重特征(WMVR)。详细描述可参阅相关文档。

4 实验及结果分析

4.1 实验设置

1)实验数据

实验采用2012版搜狗搜索日志,随机抽取某一天中的部分日志,共计802 103条查询信息。其中包含非重复的查询串297 800条,session个数为216 212个。提取查询点击次数不少于50的查询串845个,对包含敏感词或敏感链接的查询串进行过滤,得到804个查询串。人工标注其查询意图,在标注过程中,排除模糊类、“不了解”类和“不适合”类[13],最终得到790个独立查询串,其中导航类278个,信息事务类512个。

2)评价指标

本文将查询串分为导航类和信息事务类两类,意图类别C={0,1},采用正确率、召回率、F值和整体正确率[13]对实验结果进行评价,分别记作P、R、F和A。对于查询意图ci,P、R、F的定义如下:

其中,Ncorrect表示被正确分为意图ci的查询串数量,N表示被分为意图ci的查询串数量;M表示测试集中属于意图ci的查询串数量;β为准确率和召回率的相对权重,本文中β取1。

整体正确率A是衡量全部意图类别分类性能的整体评价指标,整体正确率A的计算公式为:

其中,Qc表示被正确分类的查询串数量,Qall表示查询串的总数量。

4.2 实验与结果分析

为了考察本文提出的分类特征对查询意图分类的效果,共进行了两组实验。两组实验使用相同的训练集和测试集。

第一组实验中,以Liu[4]的实验为Baseline,使用本文提出的三个特征以及CE和WMVR特征分别训练分类器,验证本文所提三个特征单独使用的有效性,并分析实验结果,得到3个整体正确率最高的特征。

第二组实验中,以第一组实验得到的3个特征为Baseline,将3个特征组合得到4个组合特征,分别训练分类器。

1)第一组实验及结果分析

表1列出了单个特征进行实验得到的实验结果,其中Nav表示导航类,Inf表示信息事务类。实验1为Baseline。

从表1中可以看出,实验4的整体正确率最差;实验5的整体正确率最高,达到88.5%,比Baseline高7%,比实验4高14.1%;实验6的整体正确率与实验1相当。

PCNS特征是基于DPCN特征针对导航类的一个改进,所以在导航类识别正确率有很大提升。DPCN特征在识别信息事务类查询串有比较好的准确率。DPCN特征正确率、召回率和整体正确率均较低,主要有以下两方面原因:(1)受查询歧义的影响,如DPCN(百度)=17,其中有15个页面是“http://www.baidu.com/”的子页面,这种情况在查询日志中大量存在,尤其对于有分类目录的大型网站,比如“优酷”、“58同城”、“4399”等,此类网站子网页比较多,用户经常会点击其子页面,从而对DPCN特征造成比较大的影响,使得很多本属于导航类的查询串被归为信息事务类;(2)通过观察查询日志的统计结果,发现大部分DPCN值较小的信息事务类均为娱乐信息,包括视频、游戏和歌曲等,如表2所示。娱乐类信息,尤其是视频类信息,用户点击大部分都集中于若干大型网站,比如土豆、优酷、乐视等,从而使DPCN值不会很大。

2)第二组实验及结果分析

第一组实验验证了CDV特征和PCNS特征的有效性和可用性,第二组实验选取表1中整体正确率最高的3个特征:CE、WMVR和PCNS,将3个特征组合后进行实验,以单独使用3个特征作为Baseline。表3列出了实验结果。

分析表1、表3数据,可以得到以下结论:

(1)对比表3中实验1、2、3和表1中实验6,单独使用PC-NS特征的整体正确率均高于其余各个特征;

(2)对比实验2、5,WMVR特征与CE特征的组合并没有比单独使用这两个特征效果好,反而更低,这是由于特征不互补造成的;

(3)对比实验3、4、6、7,PCNS特征与任一特征组合,实验整体正确率均比对比实验高,并且与WMVR组合时,整体正确率最高,达到90.0%。

WMVR与PCNS特征组合效果最好,是由于这是一对互补的特征。WMVR值是非常大的查询串,可能由于子页面的干扰,造成点击的页面非常多,很容易被误认为是信息事务类查询串。例如WMVR(百度)=92.7%,不同页面点击数为17,而PCNS(百度)=2,形成互补,使得查询串“百度”的查询意图能被识别为导航类。

结合以上两组实验结果可以得到如下结论:

(1)验证了本文提出特征的有效性,并在前人研究基础上,整体正确率进一步提升;

(2)单独使用PCNS特征时,正确率达到88.5%,能比较好地解决子页面噪声干扰问题,当使用“WMVR+PCNS”这组分类特征时,能得到最好的实验结果,整体正确率达到90.0%;

(3)特征的累积并不一定能提高实验结果,甚至起反作用,互补的特征能达到“强强联合”的效果。

5 结语

本文从不同方面分析查询日志中查询串的点击分布特征,提出“不同页面点击数”、“异源页面点击数”和“点击分布值”三个特征,并结合前人研究,利用C4.5算法,识别用户查询意图。实验结果表明,该方法能有效地进行查询意图识别。通过分析实验结果,发现查询串对应的点击页面中,子页面的干扰是影响意图识别的主要因素。

查询日志的分布具有长尾效应。本文只针对频次较高的查询串进行研究,而“长尾”这部分的查询串,本文方法将不再适用。后续工作将进一步解决这个问题。

摘要:针对用户对搜索引擎查询结果满意度不高的问题,提出一种基于用户行为分析的查询意图识别方法来提高搜索引擎查询质量。将查询意图识别视为一个分类问题,分析搜狗查询日志发现:信息事务类查询串点击的不同页面数较多,分布呈现多极值性;导航类查询串点击的不同页面数较少,分布呈现单极值性;导航类查询结果中,子页面噪声对查询分类结果产生严重干扰。根据以上特点,提出“不同页面点击数”、“点击分布值”和“异源页面点击数”三个特征,并结合前人研究,利用C4.5算法训练分类器,进行查询意图识别。实验结果中查询分类的整体正确率达到90%,与Baseline相比,提高了8.5%。结果表明,该方法对识别用户查询意图是有效的。

跨行查询收费成被告 第8篇

自5月9日交行第一个吃螃蟹――宣布要对跨行查询收取手续费后,消费者的反对之声和媒体的质疑之声就没有断过。跨行查询收费是否合理?如何看待银行这几年来不断推出的收费行为?为此本刊记者采访了北京师范大学金融系教授钟伟。

收费的五大理由

相关的银行在解释收费行为时一致指出这是国际惯例。钟伟在接受采访时也认同了这个说法,并解释了银行收费的理由:

钟伟分析说,银行卡市场是个比较专门的市场,大多数人都不太了解。这个市场由两端构成:一块是发卡市场,比如你去银行领卡,银行就是发卡方;一块是受理市场,受理市场又有两样主要的东西组成:一个是POS机,一个是ATM机。一般来讲,发卡是有收益的,收益主要就在发卡年费,这构成了发卡行收益。在受理市场上,两种机子都需要去铺。作为银行,肯定也希望铺的机子有收益。

“现在POS机主要是银联和工行在提供,ATM机主要是四大国有商业银行在提供。如果对两种机子的使用不收费或者收费低,银行行为就会扭曲,很多银行出于经济利益的考虑,就会只发卡不铺机器,这就等于只发卡不提供服务,最后导致的结果是ATM机越来越少,你持卡购物会越来越不方便。因此,只有让ATM、POS机构成的受理市场有一定的收益和利益,银行才会有积极性改善服务,增加刷卡网点,用卡才会更方便。”这是他认为跨行查询收费合理的第一个理由。

钟伟认为跨行查询应该收费的第二个理由就是,ATM机本身的购买成本和日常维护成本都比较高。“ATM机价格很贵,一台在6万到8万元之间;在交通要道或者宾馆旁边安装机子也是要有场租费的;而且,ATM机需要经常维护,比如每天要加钞、要有安全维护保证系统运行,万一卡堵住了,需要有人帮忙取出等等,维护成本相当高。”

跨行查询应该收费的第三个理由是:距离今年12月11日我国金融业对外开放只有半年的时间了,金融业彻底放开之后,如果我们的银行不能和国际惯例接轨,仍然维持不收费的原则的话,就会出现这么一个奇怪的现象:老外拿着国外银行发的卡,到国内来查询是不用收费的,而中国人拿着卡到国外用,无论查询取现都要收费,一笔20到30美分,这就不公平了,凭什么老外到中国可以免费使用我们的市场?目前国内有7万多台ATM机,几十万台POS机,银联和银行为建这一网络投入了300-400亿的资金,原先市场不对外开放的时候,用句俗话说:肉多烂在锅里,中国人自己占自己便宜也就算了。现在相当于几百亿的市场免费提供给老外了,这就不对了。”钟伟认为,从这一角度讲,查询也是应该收费的。

钟伟说,跨行查询收费的第四个理由是,查询一次与取现一次的成本几乎是一样的,这一点可能许多消费者意识不到。“现在取现一笔2块钱,有的银行收4块钱,我很少听到有消费者抱怨。实际上查询和取现成本基本是一样的,你把卡插进机子,信号从受理行网络转到银联,银联把信号转到发卡行,发卡行确认信号是有效的,传回银联,银联再把信号传给受理行机子,查询和取现的唯一动作差别就是给机子发的指令不同,一个是显示余额,一个是吐钞票,实际成本是一样的。”

“你用ATM机查询的时候收费不舒服,现在电话、短信、网络都可以查询余额,但当你打电话查询时,比如说拨建行9555,注意这不是免费电话,是按市话收费的;手机发短信,最低一条也要一毛钱吧;互联网查询呢,起码要有台电脑,还要接入宽带,上网也要花钱。实际上,在跨行查询收费前,除了ATM机,所有查询都是收费的,只是大部分消费者没有意识到。” 这是钟伟认为跨行查询收费合理的第五方面理由。

同时,钟伟分析认为,现在查询一次收费3毛钱,只是解决了从不收费到收费的问题,是象征性地收费。“经测算,一次查询成本要在1块钱以上,这可以比照VISA和其他任何一家国外组织发行的信用卡,他们一般查询一次收费20到30美分,折合成人民币后,比国内要贵的多。”

银行收费会越来越普遍

有统计表明,从2003年6月新的《商业银行服务价格管理暂行办法》发布以来,短短两年多的时间,银行的收费项目已经暴增了20余项。包括清点零钞费、小额账户费、辅币兑换费、大额提现费、电话银行费、借记卡年费等。其中,年费、小额账户费、跨行存取及查询费等成为各银行普遍的收费项目。

对此,钟伟的解读是,只要银行提供了服务,就一定会对服务收费的,以后,银行对其提供的服务收费会成为越来越普遍的现象。

“因为以前的银行是国有体制,它肩负着一部分的社会福利功能,另一办才是商业银行的职能。而现在的银行,基本是商业性质的。它提供了服务,就一定要对服务收费。

因此,钟伟预计以后银行的收费项目还会越来越多。钟伟说,在国外的银行里,问询是收费的。

几招教你省掉跨行查询费

改用存折

这是最简易的办法。你开始存入多少钱,每次取出的数目,余额是多少,存折上都一目了然,记录得清清楚楚。即使哪天忘了银行里还存多少钱,把存折找出来一看便知。

当然了,这招的适用范围比较小,只适合那些时间充裕、不太习惯也不喜欢用卡的老年人。

在发卡行查询

这次收费的对象是跨行查询,即在非发卡行的ATM机、理财终端等自助设备上持卡查询账户余额要收费。换句话说,只要在发卡行的自助机具上查询就无需支付查询费用了。

更换银行卡

如果你所持银行卡的发卡行自助机具设备比较少,避免跨行查询确实很困难的话,你可以考虑更换机具配置规模较大的发卡行的银行卡,比如这次对跨行查询收费的工行、建行、中行等,相比较来说,这几大银行的ATM机等机具配置规模比较大。

当然,并不是所有银行都收取跨行查询费,所以你也可以把所持卡换成免收跨行查询费的银行卡

短信通知

目前很多银行都已推出短信通知服务,一般来说,该服务可根据提供信息内容的不同,分为交易额变动和余额变动短信通知。前者是当账户的交易增加或减少的金额大于预设金额时发送短信;后者是当客户的账户资金变动后的账户余额大于预设的金额上限或小于预设的金额下限时发送短信。

对短信通知服务,有些银行是收费的,每个月收取3至5元不等,而有些银行目前还没有收费。一旦成功申请该服务后,只要账户余额发生变动,银行就会以特定号码发送账户变动信息至持卡人指定的手机或小灵通上。

电话和网上查询

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【媒体查询】相关文章:

住房公积金查询查询11-26

查询模式05-30

高效查询06-17

查询档案06-17

安全查询06-20

查询技巧07-05

查询软件07-09

信息查询07-25

查询树算法05-28

图书查询06-02

上一篇:主题环境下一篇:绿色供应商