信息检索综述范文

2024-05-27

信息检索综述范文(精选6篇)

信息检索综述 第1篇

垃圾渗滤液处理技术

研究进展

班级:06级环境工程3班

学号:2006650703

姓名:宋美虹 指导老师:石露

垃圾渗滤液处理技术研究进展

摘要:近年来城市垃圾的处理处置问题已经成为人们普遍关注的问题。我国目前垃圾处置的方式以卫生填埋为主,而填埋场渗滤液的处理,一直是填埋场运行管理和污染防治的关键问题。生活垃圾填埋渗滤液是填埋场伴生的二次污染物,主要来源于降水和垃圾本身的内含水。本文主要介绍垃圾渗滤液的各种处理技术,包括物化处理法、生物处理法、土地处理法、回灌法和深度处理法等。综述了垃圾渗滤液的处理技术和研究进展,对垃圾渗滤液处理技术的研究发展方向提出了一些建议和展望。

关键词:垃圾渗滤液;处理技术;研究进展 垃圾渗滤液的来源、特性及其危害

1.1 垃圾渗滤液的产生和来源

卫生填埋存在一个关键的问题,即垃圾渗滤液的收集和处理问题。垃圾在堆放和填埋过程中由于压实、发酵和降水渗流作用,会产生一种高浓度的有机废水,我们称之为垃圾渗滤液。

垃圾渗滤液的来源包括以下几个方面:

(1)降水:降水包括降雨和降雪,它是渗滤液的主要来源之一;

(2)地表径流:地表径流是指来自场地表面上坡方向的径流水,具体数量取决于填埋场地周围的地势、覆土材料的种类和渗透性能、场地的植被情况及有无排水设施等;

(3)地下水:如果填埋场的底部位于地下水水位以下,地下水就有可能渗入填埋场内。如果在设计施工中采取防渗措施,就可以避免或减少地下水的渗入;(4)垃圾含水:包括垃圾本身携带的水分以及从大气和雨水中的吸附量,入场携带的水分有时是渗滤液的主要来源之一;

(5)有机物分解生成水:垃圾中的有机组分在填埋场内经厌氧分解会产生水分,其产生量与垃圾的组成、pH值、温度和活动菌群等因素有关;

(6)覆盖材料中的水分:随覆盖材料进入填埋场中的水量与覆盖层物质的类型、来源和类型有关。

垃圾填埋场产生的垃圾渗滤液如不妥善处理,对周围环境的影响尤其是对填埋场附近地下水、地表水的污染将会较为严重,而且污染持续时间长,还可能导致严重的二次污染,因而对渗滤液进行有效的收集和处理已经成为城市环境中亟待解决的问题。

1.2 垃圾渗滤液的性质

城市垃圾填埋场所处置的生活垃圾的成分差别不大,所产生的渗滤液的性质及组分也大致如下:(1)色度:颜色呈淡茶色或暗褐色,色度在2000~4000之间,有较浓的腐化臭味。(2)pH值:填埋场初期pH值为6~7,呈弱酸性,随着时间的推移,pH值可提高到7~8,呈弱碱性。

(3)BOD5:随着时间和微生物活动的增加,渗滤液中的BOD5也逐渐增加。一般填 埋6个月至2.5年,达到最高峰值,此时BOD5多以溶解性为主,随后此指标开始下降,到6~15年填埋场稳定化为止。

(4)COD:渗滤液的生物降解性可用BOD5/COD之比来反映,当BOD5/COD >0.5时,渗滤液较易生物降解;当BOD5/COD <0.1时,渗滤液难于生物降解。当BOD5/COD介于0.4到0.6之间时,表明渗滤液中的有机物开始生物降解;对于成熟的填埋场,渗滤液的此项比值通常为0.05~0.2,其中常含有不易生物降解的腐殖酸和富里酸。

(5)TOC:浓度一般为265~2800mg·L-1。BOD5/TOC可反映渗滤液中有机碳氧化状 态。填埋初期,BOD5/TOC值高;随着时间的推移,填埋场趋于稳定化,渗滤液中的有机碳以氧化态存在,则BOD5/TOC值降低。

(6)溶解性总固体:渗滤液中溶解固体总量随填埋时间推移而变化。填埋初期,溶解性盐的浓度可达10000mg·L-1,同时具有相当高的钠、钙、氯化物、硫酸盐和铁。填埋6~24个月达到峰值,此后随时间的增长无机物浓度降低。(7)SS一般多在300mg·L-1以下。(8)氮化物:氨氮浓度较高,以氨态为主,一般为0.4g·L-1左右,有时高达1g·L-1,有机氮占总氮的1/10。

(9)重金属:生活垃圾单独填埋时,重金属含量很低,不会超过环保标准;但与工业废物或污泥混埋时,重金属含量会增加,并可能超标。

实践证明,渗滤液水质在不同填埋时段差异很大。通常,填埋初期,渗滤液呈黑色,可生化性较好,易于处理,而随着填埋时间的延长,渗滤液逐渐呈褐色、可生化性变差,且氨氮浓度明显增加,越来越难以处理。

1.3 垃圾渗滤液的危害

渗滤液对周围地下水和地表水、土壤、大气、生物等多方面均会造成严重环境污染,并通过食物链直接或间接地进入人体,危害人类的健康。如果缺乏必要的防渗措施而使垃圾渗滤液渗入地下水区域,则会引起地下水的严重污染,而且其影响将是几年、几十年、几百年。渗滤液的处理方法

由于渗滤液水质复杂、变化大,目前国内外尚无十分有效的渗滤液处理工艺。总体上可以将其处理技术分为生物处理法、物化处理法、土地处理法、回灌法和深度处理法等。以下从这几个方面介绍:

2.1 物化处理法

物化法最早只用在处理填埋时间较长的单元中排出的渗滤液,即便是单独应用,在去除难生化降解的污染物时仍能保持一定的去除效率。而随着渗滤液处理排放标准越来越严格,物化法也用来处理新鲜的渗滤液,且是渗滤液后处理工艺中最常用的方法。

物化法主要包括混凝沉淀法、化学沉淀法、吹脱法、化学氧化法、电化学技术、光催化氧化、吸附法及膜技术等。

-1有资料显示,在COD为2000~4000mg·L时,物化方法的COD去除率可达50%~87%。和生物处理相比,物化处理不受水质水量变动的影响,出水水质比较稳定,尤其是对BOD5/COD比值较低(0.07~0.20)难以生物处理的垃圾渗滤液,有较好的处理效果,但其成本较高。

下面分别介绍几种主要的处理生活垃圾渗滤液的物理化学法。(1)混凝沉淀法

混凝沉淀法是化学沉淀法中最重要的一种方法,主要对污水进行预处理,降低垃圾渗滤液的悬浮物、氨氮以及有机物胶体,提高原水的可生化性。

该法是向废水中投加混凝剂, 使废水中的悬浮物和胶体聚集形成絮凝体, 再加以分离的方法。目前采用的混凝剂多为铁、铝盐类或聚合体类。但无论采用何种混凝剂, COD的去除率一般在30%~60%,很难有突破性的提高。

混凝沉淀法的不足之处是:会产生大量的化学污泥;出水的pH值较低;含盐 量高;氨氮的去除率较低;出水COD达不到国家生活垃圾填埋污染控制标准中渗滤液的一级排放标准;需要根据生化处理后的出水水质灵活地调节混凝剂的投加量;操作管理麻烦,所以即使有一定的处理效率,在选用时还是要慎重考虑。

(2)活性炭吸附法

吸附法主要是利用多孔性固体物质,使废水中的1种或多种物质被吸附在固体表面而去除的方法。在渗滤液处理中主要用于脱除水中难降解的有机物、金属离子和色度等。活性炭吸附法处理程度高,对水中的绝大多数有机物都有效,可适应水量和有机物负荷的变化,粒状炭可再生后重复使用,设备紧凑,管理方便。但是活性炭吸附易受pH值、水温及接触时间等因素的影响。

七十年代在欧洲的研究表明,用活性炭处理生化后的垃圾渗滤液,COD的去除率为50~60%,若用石灰石作预处理,去除率可高达80%。但活性炭在处理了140次同体积的渗滤液后去除效率将下降。在生产性试验中,由于渗滤液水质变化等原因,出现了去除效率下降和活性炭被大量污染的现象。

活性炭吸附工艺的主要问题是活性炭价格高,且缺乏一种简单、经济、有效的活性炭再生方法,故其推广使用受到了限制。

(3)吸脱法

吹脱法是指空气吹脱法,将空气通人废水中,使之相互充分接触,使废水中的溶解气体和易挥发的溶质穿过气液界面,向气相转移,从而达到脱除污染物的目的。垃圾填埋场尤其是中老年填埋场的渗滤液中营养比例严重失调,为调整C/N可对其进行氨吹脱预处理。脱氨方法主要有曝气吹脱和吹脱塔吹脱两类。氨氮在渗滤液中存在如下平衡:NH4++OH—-→NH3+H2O,当pH值调节至碱性时,NH3-N主要以游离氨的形式存在。然后经曝气吹脱或送入吹脱塔以喷淋和鼓风吹脱去除游离氨。曝气吹脱即直接或间接调整pH值后在调节池或吹脱池中曝气,渗滤液 中NH3 通过表面更新和向气泡的传质而脱除,从而改善渗滤液营养比例。

氨吹脱效果明显,处理效率较高,但由于需要调节pH值,必须投加大量的碱,而且为了曝气,还需要提供一定的风量,造成了处理费用偏高。同时氨吹脱只是将废水中的铵离子转化为游离氨,最后将之排放到大气中,实质上氨的污染问题并未得到解决。

(4)膜分离处理技术

鉴于垃圾渗滤液水质的复杂性,近年来,超滤膜、纳滤膜及反渗透处理技术在垃圾渗滤液处理工程中得到了广泛的应用。其中超滤膜主要用于膜生物反应器中,纳滤和反渗透作为独立的过滤工艺在拦截难降解有机物方面得到了应用。

膜分离法的特点是分离过程不发生相变化,能量的转化率高,一般不需要投加其他物质,且可在常温下进行。

虽然膜技术对渗滤液的水质处理有很好的效果,但是其处理费用很高,而且膜处理前一般都要有良好的预处理,否则膜很容易被污染而导致处理效率迅速下降。

(5)氧化法

氧化法包括O3氧化法、H2O2氧化法、光化学氧化法、辐射法、电解氧化法和电催化氧化法等。目前实践工程中使用的主要是O3氧化法和H2O2氧化法,光化学氧化和电催化氧化法主要还处于实验研究阶段。O3和H2O2本身具有很好的氧化电位, 能氧化很多的难降解物质;而电解催化和光催化技术是利用产生羟基自由基(·OH), 利用羟基自由基的强氧化性来氧化降解有机物, 实现污染物降解。

光化学氧化法和电催化氧化法目前虽然在实践工程中还未见有实例应用, 但实验研究的结果显示催化氧化技术对垃圾渗滤液处理有很好的处理效果。开发高效的光和电催化材料是今后一段时间内提高氧化法处理垃圾渗滤液一个重要的研究方向。

2.2 生物法

生物法是垃圾渗滤液处理中最常用的一类方法,因其运行费用低、处理效率高、不会出现化学污泥等特点而被世界各国广泛采用。生化处理具有处理效果好、成本低等优点,它是目前应用最广泛的处理方法。

生物处理包括好氧处理、厌氧处理以及好氧/厌氧结合这三种类型。(1)好氧处理法

好氧法是利用微生物的耗氧反应来降解渗滤液中的有机物, 实现对BOD5、COD 和氨氮的有效降低,且还可以部分除去Fe、Mn 等金属离子。目前好氧处理法主要包括活性污泥法、曝气稳定塘、生物膜法、物滤池和生物流化床等工艺。

但是使用多年的填埋场产生的渗滤液成分复杂,氨氮浓度很高, 需要结合其他的方法来使用, 否则处理效果一般。

(2)厌氧处理法

厌氧生物处理法具有运行费低、操作简单、投资运行费用低、有机负荷高、能耗少、污泥产率低、对无机营养元素含量要求较低和能提高污水可生化性等优点,非常适合于处理有机物浓度高的早期垃圾渗滤液。用于垃圾渗滤液处理的厌氧生物处理方法有:普通厌氧消化、两相厌氧消化、厌氧滤池、上流式厌氧污泥床(UASB)、厌氧复合反应器(UBF)和厌氧折流板反应器(ABR)等。与好氧法相比,厌氧生物处理有许多优点,最主要的是能耗少、操作简单,因此投资及运行费用低廉;而且由于产生的剩余污泥量少,所需的营养物质也少,其BOD5/P只需4000:1,适合垃圾渗滤液含磷少的特点;对许多在好氧条件下难于处理的高分子有机物在厌氧时可以被生物降解。但是,厌氧处理出水中的COD浓度和氨氮浓度仍比较高,溶解氧很低,不宜直接排放到河流或湖泊中,一般需要进行后续处理。

厌氧法处理垃圾渗滤液在发达国家应用较多,国内目前还未见有单独用厌氧处理法处理渗滤液的工程实例。

(3)厌氧-好氧结合处理法

对于高浓度的垃圾渗滤液单独采用好氧或厌氧处理很难达标排放,一般会采用厌氧/好氧结合的处理工艺,这样处理效率较高而且经济合理。

好氧-厌氧结合处理法国内正逐步推广, 但不是所有高浓度渗滤液都能用此法处理达标排放。

2.3 土地处理法

土地-植物处理法, 实质就是在人工控制条件下,通过一系列复杂的物理-生物-化学的综合反应, 使渗滤液得到净化。主要包括: 慢速渗流系统(SR), 快速渗流系统(RI)、表面漫流(OF)、湿地系统(WL)、地下渗滤土地处理系统(UG)及人工快滤处理系统(ARI)等多种土地处理系统。

土地-植物处理法具有投资少, 操作简单, 运行费用低等优点, 但从长远来看, 存在着重金属及盐类在土壤中的积累和饱和问题, 对土壤结构、植物生长和周围地下水有潜在污染作用。另外土壤的渗透能力也会随着时间的延长而逐渐下降, 使得处理效率也会随之降低, 且易受土地条件限制, 仅适合于土地广阔的地区。

2.4 回灌法

渗滤液的回灌技术是将垃圾填埋场产生的未处理的渗滤液部分或全部喷灌填埋场表面以达到渗滤液水质均化,实现渗滤液减量的目的,并利用填埋场的土壤层和填埋垃圾层物化吸附作用和微生物的净化作用,达到使渗滤液得到处理。

回灌处理方式主要有渗滤液直接回灌至垃圾层、表面喷灌或浇灌至填埋场表面、地表下回灌和内层回灌等。采用回灌技术不仅能降低渗滤液中的COD 浓度, 加快垃圾中有机质的降解, 提高垃圾的溶解速度, 且有利于降低垃圾中有机质的含量, 而不影响COD 浓度的稳定。

2.5 深度处理技术

对于可生化性低、毒性高的垃圾渗滤液来说,生物法处理效果往往不够理想,渗滤液处理出水要达到国家日益严格的排放标准,深度处理是一项迫切需要的技术。国内外常用的有光催化技术、电解处理技术、Fenton 处理技术、湿法氧化(WAO)/催化湿法氧化(CWAO)、膜分离法、化学混凝技术等,经过深度处理,能保证出水达到GB16889-1997 一级排放标准。

结论与建议

(1)针对垃圾渗滤液的处理可选用的方法虽然较多,但都不同程度的存在一些缺陷,如何选择最佳处理工艺或将现有的处理工艺有机结合,降低运行成本,提高出水质量是需要研究解决的问题。

(2)在选择垃圾渗滤液的处理工艺时, 考虑到渗滤液水质的复杂性和特殊性, 需因地制宜, 选择最为适合的处理方式。在有条件的情况下, 通过模拟试验来取得可靠优化的工艺参数, 对处理工艺的技术可行性、经济性起实践指导作用。

(3)目前我国垃圾渗滤液处理仍以生物法为主,但处理效果一直不理想,出水指标要达到国家一级标准,必须进行深度处理。

(4)目前的研究热点是将传统的生化系统和先进膜技术的结合应用,结合不同渗滤液的现状,对工艺流程进行适当改造,找出适合垃圾渗滤液处理的最佳方法。

参考文献

[1] 郑曼英,李丽桃,邢益和,等.垃圾渗滤液的污染特性及其控制.环境卫生工程.1997(2):7~11 [2] 吴长振,张淑娟,城市生活垃圾填埋场渗滤液的特性及其处理,环境与卫生,1998,12(4): 13~14

[3] 杨霞,杨朝晖等,城市生活垃圾填埋场渗滤液处理工艺的研究,环境工程,2000,18(5): 12~14

[4] 张兰英, 等.垃圾渗滤液中有机染物的污染及去除[J].中国环境科学, 1998;18(2): 184~188.[5] 张益, 陶华等.垃圾处理处置技术及工程实例[M].北京: 化学工业出版社, 2002.5.[6] 蒋建国, 陈嫣, 等.垃圾渗滤液的混凝处理实验研究[J].上海环境科学, 2003;22(7): 465~467.[7] 隋智慧, 等.物理化学法处理垃圾填埋场渗滤液的研究进展[J].环境污染治理技术与设备, 2002;3(4): 43~46.[8] 李军, 扬秀山, 等.微生物与水处理工程[M].北京:化学工业出版社, 2002.9.[9] 张跃升, 等.活性炭-H2O2 催化氧化处理垃圾渗滤液[J].中国给水排水, 2003;19(1): 50~51.[10] 黄本生, 等.用光催化氧化法处理垃圾渗滤液的实验研究[J].环境污染治理技术与设备, 2003;4(4): 22~26.[11] 王敏, 李小明.催化电解法处理垃圾渗滤液的研究[J].环境科学与技术, 2002;25(2): 17~19.[12] 王鹏, 等.垃圾渗滤液中氨氮的电化学氧化[J].中国环境科学, 2000;20(4): 289~291.[13] 沈耀良, 等.吹脱法去除率渗滤液中氨的动力学及机理[J].污染防治技术, 1999;12(2): 67~70.[14] 徐迪民, 等.垃圾填埋场渗滤水回灌技术的研究[J].同济大学学报, 1997;25(2): 195~199.[15] 申欢, 李明波, 等.膜生物法处理城市垃圾渗滤液[J].中国给水排水, 2004;20(3): 56~59.[16]支卫兵,谭惠忠.城市垃圾渗滤液处理方法综述[J].江西科学,2007,25(5):656-660. [17]郑曼英,李丽桃.垃圾渗滤液的污染特性及其控制[J].环境卫生工程,1997,(2):7-11. [18]谭小萍,王国生,杨克敏.光催化法深度处理垃圾渗滤液的影响因素[J].中国给水排水,1999,15(5):152-158.

[19]刘书俊.垃圾渗滤液污染处理的现状及对策[J].长江建设,2001,37(3):36—37.

[20]王文斌,董有,刘士庭.吹脱法去除垃圾渗滤液中的氨氮研究[J].环境污染治理技术与设备,2004,(5):51—53 [21] 赵宗升,刘鸿亮,李炳伟等,垃圾填埋场渗滤液污染的控制技术[J],中国给水排水,2000,16(6):20~23

[22] 何宗健,邓国志, 缺氧生物滤池与处理垃圾渗滤液的研究, 工业用水与废水[J],2003,34(2):29~31

[23] 杨议,杨朝晖,陈军,陈信常等,城市生活垃圾填埋场渗滤液处理工艺的研究[J],2000, 18(5):12~14

[24]游少鸿 刘琼 孙荣翠 李达星.垃圾填埋场渗滤液处理技术现状及展望[J].广州环境科学,2009,24(2):10-15.[25]付美云.垃圾渗滤液的环境污染特征及其研究进展[J].南华大学学报:自然科学版,2009(2):90-95.

信息检索综述 第2篇

一、信息检索技术现状

【1】梁鸿雁,信息检索技术综述,2010(9),软件导刊,35~37,在现有研究的基础上,信息检索技术实现了把信息检索从基于关键词层面提高到知识层面。从传统的基于关键词的检索到吸引广大研究者眼球的语义检索。实现了把信息检索从基于关键词层面提高到知识层面。传统的基于关键词信息检索,已取得了很大的成功,但是它不能从根本上表达用户的查询请求。语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术,它从语义理解的角度分析信息对象和检索者的检索请求,提高了检索性能。但由于自然语言理解和人工智能等领域的局限,语义检索技术将有一个长期深入研究的过程。

【2】陆娟,浅析当前网络信息检索与过滤技术,科技情报开发与经济,2006,16(23),目前,信息检索搜索引擎已经把浏览与检索功能进行了整合,使用户可以在一个网站同时利用两种功能,而且可以在某个类目下实施检索,提高了检索的准确率;鉴于网络面对的是全世界的用户,这些用户层次不

一、知识背景各不相同,实现了自然语言检索功能;通过信息智能检索(Agent)技术来学习用户兴趣,使客户端检索软件具备智能性,自主地在Internet网上漫游,收集用户感兴趣的信息,用户Agent可以根据用户的爱好对它们的任务进行动态调整,搜索网上潜在的有用信息,按照一定的规则进行过滤,并以一定的优先方式提供给用户;为更加客观公正地对检索结果进行排序,让用户快速获得最需要的信息,产生了一些新的排序算法根据其他网站指向某个网站链接的数量多少,决定该网站的重要性,数量越多越重要。

二、信息检索技术类型及方法

【1】赵阳,浅谈信息检索技术,2012年11月,科技创新与应用,45,介绍了当今比较热门的两种信息检索技术:第一,智能检索或知识检索传统的全文检索技术基于关键词匹配进行检索,智能检索利用分词词典、同义词典,同音词典等改善检索效果,还可在知识层面或者概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。第二,知识挖掘,目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息、提取知识,以满足信息检索的高层次需要。

【2】孙广维,多媒体信息检索技术的研究,2012,6,吉林建筑工程学院学报,79~81,作者提出传统的多媒体检索方法处理比较简单,有的仅通过多媒体的外部属性和简单的文字描述进行检索,还脱离不了文本、数值和关键词的检索范畴,对图像、音频、视频信息则只有浏览或查看功能,缺乏多媒体本质特征的描述,在多媒体数据库中集成了图像、视频、音频等非文本信息,这样我们就可以用图像、音频、视频信息方便的进行检索。

【3】双林平,分布式信息检索技术探析,2012(4),图书馆学刊,111~112,分布式信息检索是信息检索研究的一个重要方向,主要对分布式信息检索概念、分布式信息检索法、搜索引擎技术进行了分析,分布式技术与信息检索相结合,对于分布式资源的检索策略来讲,不仅可以对分布服务器之间的通信问题进行有效解决,还可以对信息检索功能进行研究,从而使得分散资源的检索效率大大提高。分布式技术使得数据更安全,信息检索改变了传统的方法,从而实现了多个数据库检索的目的,信息量和检索效率也因此得到提高。分布式检索技术与计算机技术相结合,实现了理论与实践的和谐统一,并且具有良好的可行性和易实现等特点,其应用前景非常广阔。

【4】 赵静,张鸿业,Web信息检索技术的探讨,2010(20),科技情报开发与经济,105~109,Web 信息资源大体可以分成两类:纯文本格式的信息和多媒体(图像、影视频)信息,为了有效地提取出人们所需要的信息,新一代的 Web 信息检索系统应该朝着搜索速度更快、,精度更高并且能够满足用户的个性化需求的方向发展。这就需要我们在自然语言处理、数据挖掘和机器学习等方面有所突破,并将这些技术充分地应用到信息检索中去,从而使人们更好地感受到 Web 信息的便利。

【5】李静柏,融合分类特征的信息检索技术研究,信息产业,85,文章介绍了一种融合分类特征选择技术进行分类检索结果重排序的方法。该方法在已抽取出类别特征的前提下,认为一篇文档中类别特征出现的频率越大,这篇文档与其所属类别的相关性就越大,就越符合该类别。那么在综合考虑检索词与文档相关性的同时,赋予这两个相关性一定的权值再对结果进行重新排序。这个方法能够在保持分类搜索引擎结果文档的召回率的前提下提高结果的平均准确率。主要处理过程如下:1 对一个分类体系结构的语料文档进行特征选择,为每个类别抽取出特征表。2 检索,得到符合 query的结果集。3 计算结果集中每篇文档包含的特征在该篇文档中的频率。4 使用 TF-IDF 模型计算 query与文档的相关性得分。5 综合考虑两个得分得到一个文档总评分。.6 按照评分从大到小将文档排序返回给用户。

【6】党杨阳,XML 信息检索技术综述,2011年10月,甘肃科技,41.指出XML 对分散的 Web 信息资源在逻辑上进行了有组织的管理,设计了一个专业内容的 Web 信息检索体系结构,为用户高效地获取面向专业内容的信息资源提供了一种方法。良好的数据存储格式,可扩展性,高度结构化以及便于网络传输等特点,决定了 XML 卓越的性能表现。由于 XML 能针对特点的应用定义自己的标记语言,这一特征使得 XML 可以在电子商务、政府文档、司法、保险、机构、厂商和中介组织信息交换等领域中大展身手,根据不同的系统和厂商提供各具特色的独立解决方案。,当整个互联网的信息在 XML 的平台上整合应时,现代信息海洋的杂乱无章无疑会得到根本的改善。未来的 Web 也将在高度

一、开放的数据标准之下,透过无所不在的应用终端,展开随时随地的移动交换和计算,真正为商务时代的互联网提供一个个性化的界面、规范化的流程和数据质量的保证。

【7】李思达,探析当前计算机网络信息检索技术,2012(2),无线互联科技,38,网络信息检索技术的优缺点:优点:降低了我们搜索信息的时间,扩大了信息的可利用资源,打破了传统计算机的局限性,可在短时间内搜索到可利用的资源,可以在第一时间得到与之对应的最新信息,加快传播,侧面增加了行事的成功几率。智能化的搜索依旧可以从中获得额外收获,信息的公开化,多端口的进入,可以容纳多人同时对信息的获取,节省了排队等待时间,提高了办事效率。缺点:网络上信息如雨后春笋层出不穷,无形之中就加大了我们筛选工作;由于发布信息的途径之多,端口宽,不受限制,重复率过高也会耗费我们在检索过程中的进度。同时也会带来信息的准确性的受人质疑的问题,很多网站设置虚假信息,显示关键词和网页内容不符,各种钓鱼网站的出现更是让人望而却步。

三、信息检索技术应用举例

【1】张颖,基于本体的智能信息检索在农业电子商务中的应用2012(5),安徽农业科学,2908~2910,近年来,随着农业电子商务迅猛发展,电子商务网站作为营销的第一个窗口已经成为提供网络服务和商务服务的基础。各类农产品流通信息突破时间和空间的限制,通过网络迅速传达到每个客户,从而为客户的生产、加工、商务往来提供了指导和便利。实现一种基于本体的智能信息检索,增加了语义制导,实现了基于知识的语义检索,在此基础上利用数据挖掘方法从语义层面实现了对农产品数据的挖掘,实现了农产品数据的高效率和高精度挖掘,并根据挖掘结果进行决策分析,为用户提供基于真正简易聚合的个性化服务。

【2】王冉,信息检索技术在高校图书馆的应用,科技情报开发与经济,2010(18),30~32,近年来,随着各高校规模的逐步扩大,办学质量的稳步提升,对图书馆的资金投入逐渐增大,高校图书馆的馆藏文献资源不断扩充,信息化进程不断推进。当前,高校图书馆具有藏书量大、电子信息资源丰富等优势。图书馆作为公众获取知识的重要来源,信息检索技术是图书馆为公众服务的主要工具,只有发展和提高信息检索技术,才能使馆藏资源有效地转换成社会发展的动力。作为高等学校图书馆,其任务艰巨而富有挑战,只有在服务上立足校园师生,着眼社会公众,在技术上保持国内领先,紧随国际前沿,不断开拓进取,紧扣时代发展的脉络,顺应社会发展的需要,才能服务高校发展,促进社会进步,完成自身保存文化、传承文明的使命。

【3】赵丽、王文哲,信息检索技术对企业信息化的助推性研究,信息化论坛,2012,24~26,信息技术的发展,在不断给企业的发展带来新的生机的同时,也给企业带来了许多严峻的挑战。这就要求企业的管理人员改变传统的思维方式,建立起完整的企业信息化的竞争战略,使之为企业的发展发挥推动作用。对企业而言,信息检索技术在企业中的合理应用是加快企业信息化建设的有力保障。一套专业的能够适应复杂 IT 环境的企业检索系统,将通过信息发现,知识分享,联通信息孤岛,展示企业信息的全貌,从而为各行各业的企业带来多元的商业价值,具体表现有,企业检索是决策支持和资源配置工具企业检索的第一驱动力的是决策的需要,企业检索有助于保护数据,企业检索有利于推动各部门的协作,增强企业竞争优势,专业的企业检索将为企业的信息扩展提供广阔空间,企业可通过轻松共享合作伙伴提供的资源库来扩展企业的视野。

四、信息检索技术发展趋势

【1】陆玲,浅谈信息检索技术的发展,科海故事博览·科教论坛,2011(10),4,信息检索已经发展到网络化阶段,信息检索的对象已从过去相对封闭、由独立数据库集中管理的信息内容扩展到如今开放、动态、更新快、分布广泛、管理松散的网络内容;信息检索的用户也由原来的信息专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式都提出了更高、更多样化的要求。因而,信息检索也呈多样化的发展趋势。在信息标引方面,关键词自动标引方面可能会引进少许规范化措施,对网页进行标引的深度将提高,只标引网站主页的网络信息检索工具将减少;在检索功能方面,增强和完善检索功能的主攻方向是提高检准率;在检索结果处理方面随着信息收集、著录、标引环节的改进和检索功能的增强,检索结果的处理也会有所改进;在信息技术方面自动分类将成为亟待攻克的重点研究课题; 在经营方面网络信息检索工具的兼并、集团化经营或联合经营具有优势,将成为发展方向; 在服务方面,网络的“个性化”功能将得到进一步加强,用户可以预先选择自己的信息源,向自己感兴趣的、值得自己信赖的信息源提问。

【2】曹鹏,现代信息检索技术发展探析,2010年8月,高等函授学报(自然科学版),73~75,作者认为随着当前信息技术的迅猛发展和用户对检索需求的变化使得现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。文章探析了现代信息检索技术发展趋势,从跨语种信息检索、智能化信息检索、可视化信息检索、个性化信息检索、跨媒体信息检索五个方面进行了探析,对检索技术发展趋势展开了一定的分析研究。

【3】黄振江、李勇,网络信息检索的现状及发展趋势,2011,23(2),菏泽医学专科学校学报,95—96,作者指出信息检索的对象已从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的web内容;信息检索的用户也由原来的情报等业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。因此,适应智能化、可视化以及个性化的需要是只前信息检索技术发展的新趋势。1网络检索智能化,近年来,不断涌现的人工智能产品,将提高网络信息检索的智能化程随着网络用户对检索的精度、检索效率要求的不断提高。2网络检索可视化,最新的一项信息检索可视化研究成果,是一种用于网络知识发现的信息可视化和检索集成工具wIDAS。提高了用户在信息发现中的准确性和效率。3.基于智能Agent的个性化信息检索系统,成为信息管理、计算机科学、人丁智能等领域研究的热点。

综上所述:随着计算机科学技术的飞速发展以及Internet的迅速普及,越来越多的人奔跑于信息的高速路上,加上信息检索是获取知识的捷径,信息检索技术将向跨语种化、智能化、可视化、个性化、跨媒体化五个方面综合发展,以提高查准率和查全率,满足不同层次用户的需求,并应用于各种领域,尤其是对现代教育的各个方面如自主学习、创新教育、教育技术以及教育科研都起到了巨大的推动作用。在检索结果处理方面,随着信息收集、著录、标引环节的改进和检索功能的增强,检索结果的处理也会有所改进,用户对期望的结果将有更大的选择可能。根据检索结果的判定进行的相似性检索方法可能被更多的检索工具采用。但以网络信息检索为代表的机械检索技术的发展冷落了传统的手工检索技术,其优点是速度快,但回溯性不好,且有时间限制,计算机的突发事故对用户的影响尤为大,所以在发展机械检索技术的同时,手工检索技术的提升也当引起重视。此外,在重视信息检索技术发展的同时,用户素质及意识的提升也不可忽略。

参考文献: 【1】梁鸿雁,信息检索技术综述[J],2010(9),软件导刊,35~37

【2】陆娟,浅析当前网络信息检索与过滤技术[J],2006(16)科技情报开发与经济,23 【3】赵阳,浅谈信息检索技术[J],2012,11,科技创新与应用,45 【4】孙广维,多媒体信息检索技术的研究,2012,6,吉林建筑工程学院学报,79~81 【5】双林平,分布式信息检索技术探析,2012(4),图书馆学刊,111~112 【6】 赵静,张鸿业,Web信息检索技术的探讨,2010(20),科技情报开发与经济,105~109

信息检索综述 第3篇

信息检索(Information Retrieval,IR)被认为是对大规模电子文本和其他人类语言数据进行表示、搜索和处理的技术。信息检索系统和服务现在已经非常普遍了,成千上万的人每天都在使用它们来方便的进行商务、教育和娱乐。Google、Bing、Yahoo、百度等Web搜索引擎,是目前为止最普遍和大量使用的信息检索服务形式,提供获取最新技术信息、搜索人和组织、总结新闻和事件意见简化比较购物的途径[1]。

信息检索通常包括:Web搜索、其他搜索应用、其他信息搜索应用等。通常的Web搜索形式是使用Web搜索引擎,通过输入简单的查询,得到问题的答案。对于其他搜索应用,两个常用的实例就是桌面搜索和文件系统搜索。与Web搜索引擎相比,桌面搜索引擎系统需要对文件格式和创建时间更加了解。其他搜索应用还包括企业级信息搜索系统、数字图书馆等其他专业信息检索系统。其他信息搜索应用通常处理的问题还包括存储、处理和检索人类语言数据等各种相互关联的问题[1],具体包括:文档路由、过滤和选择性传播、文本聚类和分类、摘要、信息提取、话题检索与跟踪、专家搜索、问答、多媒体信息检索等。

大部分信息检索系统都可以表示为一个共同的基础组织结构,如图1所示。首先用户产生一个信息需求,并基于该需求,用户在信息检索系统中输入一个查询,由搜索引擎根据该查询在数据库中进行检索,然后对检索结果进行过滤、排序等处理生成检索结果,最后将检索结果返回给用户。

2 检索意图识别的基本概念

搜索引擎在一定程度上降低了用户查找信息的难度。但因搜索引擎的搜索方式大多基于关键词组合,而用户提交给搜索引擎的有限关键词常常不能完整地表达其信息需求,且由于人类语言与机器语言的差异,使得搜索引擎在处理用户查询时,通常会丢失语义及逻辑信息,导致搜索引擎返回的结果有时不尽如人意。

检索意图(Retrieval Intention)是检索中包含的用户信息需求、查询目标、查询动机等。

根据用户输入的检索信息,自动识别出其检索意图,返回与其信息需求更相关的信息,成为有效把握用户需求、提高搜索引擎检索质量的途径之一。

对于检索意图的分类,学术界通常使用Broder等人提出的分类标准[2]:

(1)导航类(Navigational):又叫主页查找类。这类检索意图是为了访问某个特定的网站,例如某企业、组织的主页;

(2)信息类(Informational):又叫话题相关类。这类检索意图是为了获取例如如何改变阅读器背景颜色等会在多个网页上存在的信息;

(3)事务类(Transactional):又叫服务查找类。这类检索意图是为了进行一些基于Web的活动,例如:观看视频、网上购物等。

Rose等人[3]在Border等人的基础上,又提出了更加细致的分类层次,除了导航类和信息类外,又增加了:

(1)指导类(Directed):用户想知道关于某个话题的特定信息,其中包括:确定的(Closed)和开放的(Open);

(2)无指导类(Undirected):用户想知道关于一个话题的任何信息;

(3)建议(Advice):用户想要得到关于某个主题的建议或攻略等,例如:春节海南旅行攻略;

(4)位置(Locate):用户想知道在哪里能够得到现实世界中的某种服务或产品;

(5)下载(Download);

(6)娱乐(Entertainment);

(7)交互(Interact);

(8)获取(Obtain)。

基于检索意图识别的信息检索的关键技术通常包括[4]:特征提取(确定特征词汇、词项之间的关系、词性、相关数据的统计信息等)和数据集的构造或获取(用于分类的数据集通常包括训练接和测试集,通常可以使用搜索引擎的日志)。

3 基于检索意图识别的信息检索技术发展路线

一直以来,学界认为传统信息检索的核心宗旨为:用户内在的信息需求促使其采用相应的信息检索系统并产生相应检索行为,从而将用户查询中所包含的信息需求狭义地界定为信息类信息,即主题类查询。

1987年12月2日,日本的日立有限公司的申请(JPH01145721 A,19890607)首次通过评价检索意图来对搜索结果排序,公开了一种通过检索关键词计算得到的拟合优度(goodness-of-fit)这一测度来数值化检索意图的方法。直到2000年出现韩国的申请之前,在基于检索意图的信息检索领域的专利全部集中在日本,其中以FUJI XEROX CO LTD为首,包括12件专利申请,MATSU-SHITA ELECTRIC IND CO LTD、NIPPON TELEGRAPH&TELEPHONE、YAHOO JAPAN CORP、YAHOO KK次之,分别有8件专利申请。此时的基于检索意图的信息检索还遵循着传统的信息检索的定义,通过用户输入的关键词进行主题类查询。

自2002年开始,学术界认为用户执行检索不只是想获取信息类信息,并通过对用户查询及AltaVista日志进行分析将用户查询意图分为三类,即信息类(I)、导航类(N)和事务类(T)。自此,人们开始从多个角度研究基于检索意图识别的信息检索技术。

2003年7月2日,日本的OKI ELECTRIC IND CO LTD的申请(JP2003000190556,20030702)不仅通过关键词来获得用户的检索意图,同时加入关键词的属性,来共同表示检索意图。即,检索意图识别中的一个关键技术——特征提取——开始备受关注,多角度、多维度的特征提取方法激增。

中国专利CN101782909A公开了一种基于用户对网页搜索和操作网页的记录来计算用户后续需求意向的方法。通过记录用户对网页的点击数、点击速率、网页速度、浏览时长、浏览次数和链接文字的操作,计算出用户对搜索结果的喜好分值和后续需求意向。当用户点击一个超链接时,搜索引擎要实时的计算一个喜好分值,并将链接上的文字和检索请求相联系起来,可认为是相关联。

中国专利CN102246164A提供了一种基于对检索关键字分析结果来检测搜索者的意图的方法。该方法的实施是将关键字(可为单词单元、短语单元以及句子单元)按词性分离为语意单词,对分离后的关键字参考语法文法规则字典,执行语法分析,通过分析句子内分离后的单词是否具有任何文法关系以及语义关联,来获取所述语法表达式(逻辑表达式、修饰-被修饰以及语法列表表达式)进而来检测搜索者的意图。

中国专利CN102880723A公开了一种识别用户检索意图的搜索方法和系统。计算检索请求的意图特征相似度、实体词关联度、以及句法格式相似度三种度量,根据上述计算的三种度量确定用户检索意图,既考虑到检索词汇与意图特征库的相似度,又考虑到实体词的特殊作用以及整体的检索句法结构,从局部和整体上对检索关键字做意图识别,为搜索引擎提供尽可能多的信息支持,同时不完全依赖于线上搜索引擎的结果信息,更易于实现。

4 基于检索意图识别的信息检索技术重要申请人的技术路线

基于检索意图识别的信息检索技术专利申请,中国申请以阿里巴巴集团控股有限公司为首,有73件专利申请,百度在线网络技术(北京)有限公司次之,有43件专利申请;国外申请以阿里巴巴(ALIBABA GROUP HOLDING)为首,有19件专利申请,腾讯(TENCENT)次之,有18件专利申请。但阿里巴巴的申请的申请日都集中在2010年以后。在2010年以前,都集中在日本和美国,其中日本以FUJI XEROX CO LTD为主。

以下主要分析阿里巴巴在中国申请的关于检索意图识别方法的技术路线。

2009年9月4日,阿里巴巴在中国提交的第一件关于检索意图识别的信息检索方法(CN200910171083),主要以查询关键字的语言特点和历史用户行为作为特征,对用户意图进行分析,以语义检索为主,不再是传统信息检索中简单的文字匹配。

2010年4月30日,提交的CN201010160535提出了一种基于垂直搜索的查询方法,其体现了在搜索领域新出现的一个搜索技术——垂直搜索,是用这项新的技术,结合协同过滤的思想,在用户推荐领域获得用户的查询意图。

2010年12月31日,提交的CN201010618555提出了一种通过建立非意图词集的方式,预先确定多种推荐方式,其中第一预定推荐方式为基于知识库的推荐方式和/或基于会话相关性的推荐方式,从而解决了没有明确搜索意图的用户推荐搜索关键词时推荐效果不佳,造成搜索引擎服务器系统资源浪费的问题。

2011年9月1日,提交的CN201110256639使用两级查询,进一步提高检索精度。

2011年11月15日,提交的CN201110361975在原来只进行单词这一层面分析的基础上,使用词的匹配规则,进一步挖掘用户的搜索意图。

2012年1月17日,提交的CN201210015340通过输入的查询字和选取的类目,确定查询词与类目名称之间的上下位关系,根据确定的上下位关系确定扩展查询词,从而加大匹配到用户查询意图的可能性。且在2012年的多项申请中,都致力于根据用户输入的查询词,进行查询词扩展,找到更能符合用户查询意图的关键词。

2013年的申请主要结合用户的搜索行为制定个性化的搜索方案,从而输出合理的符合某一用户的搜索意图的结果。

5 结论

随着计算机技术的迅猛发展及用户需求的急剧增加,对信息检索的精度和速度的要求越来越高。为了得到更加贴近用户意图的检索结果,用户意图识别技术必将得到更多重视。与其他机器学习方法的发展历程一样,基于用户检索意图的信息检索正在由单维度向多维度发展,由底层的数据匹配向高层的语义匹配发展。

由于发明成果在专利文献中的公开早于其他公开媒介,且体现了行业和技术的发展趋势及商业价值。所以,有效利用专利文献更有利于提高研究效率、减少研究投入并提高研究水平。通过专利文献中技术的发展脉络,能够及时发现现有技术的空白点及改进点,有助于研究者及时调整技术研究及企业发展方向及战略,研发出更加符合用户需求的产品。

摘要:信息检索是对大规模电子文本和其他人类语言数据进行表示、搜索和处理的技术。随着信息检索技术的发展,为了使检索结果更加符合用户要求,基于检索意图识别的信息检索技术迅速发展。本文首先介绍信息检索和检索意图识别的基本概念,然后从专利技术的角度介绍基于检索意图识别的信息检索技术的发展路线,并介绍基于检索意图识别的信息检索技术重要申请人的技术路线,最后,总结现有的基于检索意图识别的信息检索技术的整体发展趋势和专利文献在其中所起的作用。

关键词:信息检索,检索意图,多维度

参考文献

[1]Stegan Büttcher,Charles L.A.Clarke,Gordon V.Cormack著,陈健,黄晋等译,信息检索:实现和评价搜索引擎,机械工业出版社,北京,2011.12.

[2]Andrei Broder.A taxonomy of web search[C].SIGIRForum.New York,N Y,USA:ACM Press,2002:3-10.

[3]Daniel E,Rose,Danny Levinson.U nderstandinguser goals in web search[C].WWW’04:Proceedingsof the 13th international conference on World Wide Web.New York,N Y,U SA:ACM Press,2004:13-19.

信息检索中的查询扩展技术综述 第4篇

关键词:信息检索;查询扩展;相关反馈

中图分类号:TP391.3

信息检索中由于一般用户在检索时输入的关键词过于短少,在信息比对上极易造成检索结果与用户需求不匹配的查准率低和检索结果不全面、漏查的查全率低下的问题。查询扩展是提高检索性能的有效手段,它把与原查询相关的语词、概念等以逻辑或的方式添加到原查询中,构造一个新的查询[1]。扩展后的新查询可以提供更多有利于判断文档相关性的信息,从而改善查准率和查全率。查询扩展技术的有效性吸引了很多学者进行研究,其中主要的方法有基于全局的、基于相关反馈的、基于伪相关反馈的和基于用户查询日志的等几种。

1 基于全局分析

基于全局的查询扩展方法是一种早期较常采用的技术。该技术需要对全部文档集中的词或词组进行相关度的计算分析,然后排序选择相关度最高的词进行扩展。在计算相关度时一般根据共现率(即两个词或词组同时出现在一篇文章中的频率),并将结果保存在一种特殊的类似同义词字典的数据结构中。当检索开始时,系统首先根据查询词在字典中查找与该查询词相关度最高的字词,并将其添加到原查询中扩展生成新的查询。全局分析的主要的技术有以下几种词:

1.1 基于词的聚类算法

在较早的信息检索系统中采用的基本算法就是Sparck Jones提出的对词进行聚类的算法,它根据查询词的共现性来实施词的聚类,从而进行扩展。之所以能够这样判断的依据是假设以下论断成立,即如果来源于检索文档源中的两个语词相关,则它们在文档源集合中共同出现的概率肯定就大。随着Voorhees、Hunag等人数十年的深入研究,我们在获得研究成果的同时也发现:聚类虽然能提高检索性能,但是它对词的歧义性不能正确的判断和分析处理,当遇到检索中的检索词包含多重涵义时,采用词的聚类算法及有可能将它们分配到各不相同的聚类中,造成查询结果偏离题意,降低了查询性能。

1.2 潜语义索引(LSI)

潜在语义索引技术基于简单高效的向量空间模型(VSM)。在向量空间模型中,文档和查询都被映射为向量空间中的一个点,并用n维向量表示出来。而文档与查询间的相似度就可以定义为查询向量和文档向量之间的夹角的余弦值。LSI使用奇异值分解技术SVD来发现检索词之间的关联关系,减少向量空间的维数。变换后的文档可用于比较两文档的相似度并找出与查询最匹配的前面N个词,即为查询扩展词。该方法最大的缺点是n维空间带来了巨大的计算开销,提高检索效率的效果不明显,对歧义词的问题仍然不能很好地解决,降维后的空间选择也缺乏行之有效的方法。

1.3 基于相似词典

为了解决检索词的歧义带来的检索性能下降问题,采用了将查询概念化的处理。在该处理过程中要求所选的扩展词要与全部原查询检索词同现,而不再是只比较单个的检索词,实验证明用多个查询检索词同时共现计算出的相似性结果可以极大降低单个检索词的歧义性风险,而且检索效果更佳。所以进行扩展词选择时,必须先计算比对文档集中的关键词与所有的查询词的共现度,通过加权合计计算出每个关键词和整个查询的相似性,然后建立相似性叙词表,选择相关度最高的概念中的关键词作为查询扩展词。不过获得概念需要对每一组词计算共现率,极大地增加了计算的工作量。

全局分析的优势是通过分析词间关系建立同义词词典,通过查找词典可以高效地实施查询扩展。但是随着文档素材的不断扩大,文档更新的速度日益加快,建立基于全局的同义词词典所耗费的时间和空间非常大。所以现在的查询扩展研究主要集中在与之对应的局部分析上。

2 基于相关反馈的查询扩展

相关反馈是一种应用广泛的基于局部分析的查询扩展技术。Rocchio早在1971年就在SM A RT系统中采用了相关反馈技术的进行查询扩展。其工作原理为:用户向信息检索系统提交初始查询句,系统进行初始查询,返回一组查询结果,然后用户对返回的结果进行判断,明确指出哪些文档是与查询相关的,然后系统从用户认为相关的文献中选择重要的词重构查询表达式。其核心思想是从用户认为相关的文档中选择重要的词语或表达式,用来对各个检索词的权重进行更新,加大那些出现在了相关文档中的检索词的权重,同时减小不相关文档中的检索词的权重,最后按照计算结果排序,将相关度最高的关键词扩展添加到原查询句中。这种扩展方法对检索的效果有明显提高,但是需要人工参与。并且Rocchio方法中的许多参数必须通过大量的实验才能得到最优设定。实践中这种方法还有许多细节问题需要解决。同时由于只对前N篇相关文档作分析,相对于全局分析的扩展方法,极大地减少了计算量,所以一般也将该方法归类为基于局部分析的查询扩展技术。

3 基于伪相关反馈的查询扩展

为了克服相关反馈中需要用户参与,降低检索速度的弊端,一种无需用户干预的伪相关反馈技术应运而生。该技术基于以下假设成立:排在初检结果的前面的若干篇文档一定是满足用户需求的相关文档。然后采用Rocchio方法等常规相关反馈技术,从这些排在前面的文档中检索关键词进行扩展。由于无需人为交互,极大提高了检索速度。从TREC的评测结果可以看出,伪相关反馈是一种简单高效的查询扩展技术。然而该技术也有缺点,由于查询扩展词来源于初始检索结果的前N篇文档的伪相关文档集,而事实上这N篇文档并不总与查询相关,从不相关的文档里提取的扩展词会产生主题漂移的情况,造成检索性能的下降。因此,如何在初始检索结果里确定相关文档,形成较高质量的伪相关文档集是避免信息漂移、提高查准率的首要问题。

4 基于查询日志的查询扩展

2003年崔航提出基于用户查询日志的查询扩展。其最主要的特点是将扩展词的选择范围从所有的文档集转变为众多用户的历史查询日志。由于用户查询日志里保存着众多用户使用检索系统时的历史检索结果,相当于存储着大量用户多次反馈后的结果信息。因此对查询日志的分析比一般相关反馈更具统计学意义。它的实现过程是通过查询日志中用户的查询记录建立用户查询空间,同时在文档集上建立文档空间。当用户提交某个查询后,系统自动选取历史上作为该查询扩展用词概率最大的语词,添加到该查询中[2]。这种算法通过预先对查询日志的分析,既没有全局分析那么大的运算开销,也避免了局部分析中需要用户参与的弊端,是一种介于两种方法之间的能够提高查准率和查全率的查询扩展技术。

5 结束语

目前查询扩展的研究方向更多地与语义的研究相结合,形成更贴合用户需求的解决方案,主要有基于关联规则的查询扩展、基于语义关系的查询扩展以及基于本体的查询扩展等。随着信息检索在网络中的迅猛发展,查询扩展技术的研究也将会更加深入。

参考文献:

[1]黄名选.查询扩展技术进展与展望[J].计算机应用与软件,2007(11):1-4.

[2]崔航.基于用户日志的查询扩展统计模型[J].软件学报,2003(14):1593-1599.

[3]李卫疆等.基于上下文的查询扩展[J].计算机研究与发展,2010(02).

作者简介:邹琼(1977.12-),女,河北鄂州人,本科,讲师,研究方向:信息检索技术与数据库应用。

信息检索综述 第5篇

北京市网格化服务管理始于2004年东城区创建的万米单元网格管理法和城市部件网格管理法,主要是为迎接奥运,解决城市管理问题。2005年6-7月间,建设部和北京市下发文件,在全国27个城市推广东城区做法.2005年底,北京市信息化城市管理系统市级平台和八个区级平台建成使用。2010年7月,北京市召开全市社会服务管理创新推进大会,确定在东城、朝阳、顺义开展网格化社会服务管理试点,西城等其他区县也开始了网格化服务管理的探索。

北京市全面推进网格化服务管理面临的问题.调研发现,对网格化的认识不尽一致“一种观点认为,推进网格化服务管理有利于精细化管理,有利于落实工作责任制,有利于提高工作效率,是新形势下加强社会服务管理的重要途径,处于牵头抓总的地位;这项工作宜早不宜迟,需要给(区)县留有充分余地,不能搞一刀切,成功经验应该得到推广;另外一种观点认为,网格化管理并不新,只要切实抓好责任制落实,服务管理同样到位;推行网格化管理,需建立新的工作体系,加大了协调难度,搞不好既影响当前工作,又加剧条块矛盾”如何进一步统一思想认识,是北京市面临的重要问题。

现行科层体系实行部门制,从发现问题到解决问题,由相关部门直接负责“网格化使工作流程发生变化,在发现和处理问题两个环节上更多地依靠信息系统,相关部门的职能主要体现在解决问题上”服务管理网格化要求对现行工作模式进行调整“西城、朝阳等区城管网格市级平台积压的问题,大都是因部门间难以协调造成”如何破解难题,加强统筹协调,需要创新工作机制“是否设立层级指挥平台,指挥平台是否建成实体性机构,各级平台的职责如何划分,是否建立相对独立的网格监督员队伍,是否建立工作考评体系等等,这些都要根据需求进行设计。

推进网格化服务管理,必须整合各方资源,形成合力”行政上,如何打破部门界限,在网格上实现各单位、各部门联动;管理上,如何科学配臵管理人员,广泛运用新技术、新手段,走出人海战术的怪圈;组织上,如何提高社会动员能力,进一步扩大社区、社会单位、社会组织和群众参与等等、这些都是推进网格化过程中面临的课题。

B《情报科学》第25卷第3期 2007年3月456-461,宛天巍,王沈尘,马德秀,《网格化管理原则及网格结构模型研究》

递阶结构中,部门按照工作职能设臵,彼此间业务分工明确,直接向上级负责,同级间交流合作较少。这种职能分工的方式虽可以使专业职能尽发挥,但却使很多需要多个部门协同办理的业务变的难以满足。职能分割的各部门只向上级部门负责的机制妨碍了各部门之间的相互协调,因此解决这种业务合作问题的责任自然而然落到了提出需求的用户头上,由用户个人在各个部门之间来回访问,自行解决业务上的协调间题,给用户带来了非常大的不便。递阶结构中,事务处理的顺序是由用户到职能部门再到管理部门,然而,从权力势能的高低程度来分,是管理部门最高,职能部门其次,用户最低。即是说,事务处理通道的方向同权力的势能方向“相逆”,这样就会增大事务处理时的难度和时间。于是在用户提交需求时就容易产生“拉关系”、塔规则”、“好处费”等不正常的现象;而管理部门有能力使业务快速办理,又促使了管理部门“权力寻租”的产生。于是可见,缺乏监任的“逆”权力流向的事务处理过程,费时费力且易滋生问题。

而网购化管理在保持递阶结构管理体系和权力体系的同时,尽量增加各个横向节点之间的互触互通,使创裂的职能部门重新整合起来,这样纵向之间是上下级部门的权力线,横向之间是职能部门之间的业务联系线,形成了一个个的格子,因此称之为网格结构,在这种结构上进行的管理创新称为网格化管理。递阶结构的功能可以说“有条无块”,“条”上即权力线上的业务沟通比较多,效率也较高,而“块”上即部门之间缺乏联系,即使联系也要通过共同的上级来进行协调,程序增多,效率降低。网格化管理要改变这种现状,要建立块与块之间的业务线,使解决业务时,能够按照最少的程序,最节约的办法来办理,使得条与块能够互相协助,做到“条块合总”,共同发挥作用,提供更加高效的服务。C《城市问题》2006年第2期76-79, 阎耀军,《城市网格化管理的特点及启示》 三 城市网格化管理可以避免城市管理中的死角和盲点

由于城市规模的日趋庞杂和运行的日趋速变,人们不仅难以掌握所有的问题,而且也来不及对业已发现的问题加以精确判断。所以以往的城市管理往往多是凭经验和直觉进行/模糊管理。这种粗放型管理的结果便是形成了许多城市管理的/死角和/盲点,以至许多问题多人管,许多问题没人管,发现问题快慢没人管,处理问题是否及时没人管,问题处理到什么程度没人管。我们常说/细节决定成败,网格化管理就是从细节做起,实现精细型管理。网格化的管理与服务系统可以就城管、公安、环保、水务等多项管理内容实施全方位立体化的管理空间布局,进行全时段全空间的监控管理,犹如一张疏而不漏的大网,可将城市中需要管理的问题通过电子网格/一网打尽0。例如武汉市江汉区辖区33.43平方公里,以13条街道和114个社区为基本框架,被划分为1003个网格状的单元,形成一张全新的电子网格地图。网格内的各种公共设施,小到一个窨井盖、一盏路灯,都有自己的/身份代码。目前,江汉区网格化管理系统共收纳了约10万个部件,分别按其地理坐标定位在电子网格地图上。同时,各类城市管理中可能遇到的所有事件,如污水漫溢、无证行医举报、社区居民求助等,则按照社区建设的有关内容,被划分为4大类、28小类、134个事件,并预先明确处理该事项的责任部门、处理流程和处理时限,编成代码输入系统程序。有关职能部门只要键入代码就可随时发现自己分管的问题所在及其处理状况。

D《上海行政学院学报》2014年第15卷3期36-46, 周志忍,李倩,《政策扩散中的变异及其发生机理研究》

理解中国的政策扩散首先要了解中国的制度背景。中国改革是一个不断进行政策创新的过程。地方试点基础上的全国推广是中国政策实验的典型模式,这一模式的运作过程(首先选择一定数量的地方作为执行某一新政策的试点。如果实验取得成功,就对这些试点进行经验总结,取得中央的认同后倡导其他地方学习如果持续取得成功,该政策将会被大范围推广,直到成为全国通行的政策—— 这一过程形成了政策首创者和追随者两类主体,其创新或采纳的动力和条件有明显不同,由此导致结果的差异。

J区的网格化管理显然是在建设部全国推广的背景下实施的。具有纵向推进模式下,被动追随者的特征加上后面将要详细讨论的条件约束,发生比较严重的变异也就不难理解。特别值得一提的是J区网格化管理的出台正是2010年5月开始发生的一系列震惊全国的幼儿园凶杀事件之后,面对维稳不力可能带来的行政问责,地方政府普遍存在忧虑,急于引入快速有效的管理工具。这就是说,特殊的情境或事件会导致政策扩散中的变异。当时J区一位政府官员坦言,作为管理者,我们竟然连自己区里有多少幼儿园,分布在何处都不清楚,不要谈布臵警力,治安管理了。而网格化管理是一种非常适宜用于综治维稳的方法,社区对辖区不稳定因素如特殊人群及流动人口进行了全面排查,把特殊人群和流动人口作为重点监控对象,投资约20万在社区主干道设臵监控系统……显然,划格子,派人监督,信息技术等外在特征和要素一应具备,但网格化管理的性质却从对物的管理变成了对人的监控。当然,我们可以把这种变异称为网格化管理在治安维稳领域的创新性应用,但这样一来,这一工具就失去了建设部着力推进的网格化管理的本来意义。更重要的是,对治安维稳来说,借助网格化工具的监控更多属于“治标的范畴,需要在”治本“上下大功夫。J区没有在"治本”方面提供相应的信息,轻则属于重要缺失,重则可称为本末倒臵。

E《厦门大学学报》2014年第1期102-109.朱仁显,邬文英。《从网格管理到合作共治——转型期我国社区治理模式路径演进分析》

网格化管理机构膨胀,财政负担沉重。在社会群体性事件蜂起和个人极端事件频发的社会转型期,网格化管理模式的兴起带有一定的应急性。然而不可忽视的是,社区网格化管理在运行中潜藏着行政成本膨胀的风险——这直接决定着网格化管理的可持续性。以厦门市鼓浪屿街道为例,该街道龙头、内厝两个社区分别划为3 个网格,每个网格分为2 个小组,每个小组分为3 个网格单元,每个网格单元约200 户。由于社区居委会人手有限,社区总网格长、网格长和网格组长由社区居委会工作人员担任,基层网格管理员只有从社会招聘,一个社区将增加12 名网格管理员。而厦门市共有477 个社区,人力和设备的投入将是一个巨大的数目。我国虽是发展中国家,但财政供养规模已达到发达国家水平,截至2009 年,中国财政供养的人员就已超过5700 万,以官民比例来看,平均23.5 个中国人就要供养1 名公职人员。为此,2013 年3 月17 日,李克强作为新一届政府总理第一次与媒体会面时就表示,本届政府内财政供养的人员只减不增。在国家财政供养紧缩的大背景和社区居委会原本就超负荷运转的小环境下,以大量增加工作人员的方式来推行网格化管理将是不可持续的。推行网格化管理可能陷入这样的困境: 或者大量增加人员推行网格化,最后因财政压力导致不可持续;或者维持原有的人员规模,只做表面化的“网格化”。

F《三峡大学学报》2014年第36卷4期87-90.曾鹏,汪燕。《城市网格管理员的身份困境及其破解》

化学文献检索综述论文 第6篇

双水相萃取分离技术的研究进展及应用

学院:化学与生物工程学院 专业:化学工程与工艺 学生:李鸣昊 年级: 2012级 学号:201207547 指导老师:杨西

摘 要 双水相萃取技术是一种新兴的生物分离技术,近年来发展迅猛,因其与传统的液液萃取方法相比有其独特的优点,故双水相萃取技术的发展和应用受到了越来越多的研究专家的重视。本文综述了双水相萃取技术的基本原理、特点及应用,并对双水相萃取技术现阶段存在的问题和未来发展趋势做出简单论述。关键词 双水相体系 萃取技术 分离技术 1 前言

近年来,随着分离技术在生命科学、天然药物提纯及各类抗生素药物生产等方面应用的需求和发展,一种新型的液液分离技术—双水相萃取技术应运而生。双水相萃取技术又称水溶液两相分配技术,是利用组分在两水相间分配的差异而进行组分的分离提纯的技术。由于双水相萃取分离过程具有条件温和、可调节因素多、易于放大、可连续操作且不存在有机溶剂残留等优点,已被广泛用于生物物质的分离和提纯。在1956年,瑞典的Albertsson首次运用了双水相萃取技术来提取生物物质,开始对ATPS(双水相系统)进行比较系统的研究,测定了许多ATPS的相图,考察了蛋白质、核酸、病毒、细胞及细胞颗粒在ATPS中的分配行为,为发展双水相萃取技术打下了坚实的基础。目前,双水相萃取技术已被广泛地应用于医药化学、细胞生物学、生物化工和食品工业等领域,是一项拥有广阔应用前景的新型分离技术。本文将就双水相萃取技术的原理、应用和发展情况作一简述。2 双水相萃取原理

双水相萃取与水—有机相萃取的原理相似,都是依据物质在两相间的选择性分配。当萃取体系的性质不同时,物质进入双水相体系后,由于表面性质、电荷作用和各种力(如憎水键、氢键和离子键等)的存在和环境因素的影响,使其在上、下相中的浓度不同。溶质(包括蛋白质等大分子物质、稀有金属以及贵金属的络合物、中草药成分等)在双水相体系中服从Nernst[ 1]分配定律:K= C上/ C下(其中K为分配系数,C上和C下分别为被分离物质在上、下相的浓度)系统固定时,分配系数为一常数,与溶质的浓度无关。当目标物质进入双水相体系后,在上相和下相间进行选择性分配,这种分配关系与常规的萃取分配关系相比,表现出更大或更小的分配系数。如各种类型的细胞粒子、噬菌体的分配系数都大于100或者小于0101,因此为物质分离提供了可能。水溶性两相的形成条件和定量关系常用相图来表示,以PEG/ Dextran体系的相图为例(图1[2 ]),这两种聚合物都能与水无限混合,当它们的组成在图1曲线的上方时(用M点表示)体系就会分成两相,分别有不同的组成和密度,轻相(或称上相)组成用T点表示,重相(或称下相)组成用B表示。C为临界点,曲线TCB称为结线,直线TMB称为系线。结线上方是两相区,下方是单相区。所有组成在系统上的点,分成两相后,其上下相组成分别为T 和B。M点时两相T和B的量之间的关系服从杠杆定律,即T和B相重量之比等于系线上MB与MT的线段长度之比。

图1 PEG/ Dextran体系的相图 双水相萃取体系的特点

[2] 双水相萃取成为新兴生物技术产业研究的热点,主要是该技术对于生物物质的分离和纯化表现出特有的优点和独有的技术优势。双水相体系萃取技术具有如下特点:(1)双水相系统之间的传质和平衡过程速度快,回收效率高,相对于某些分离过程来说,能耗小,速度快。如选择适当体系,回收率可达80%,倍数可达2~20倍;

(2)系统含水量多达75%~90%,两相界面张力极低(10~10 N·m-1),有助于保持生物活性和强化相际间的质量传递,但也有系统易乳化的问题,值得注意。(3)分相时间短(特别是聚合物/盐系统),自然分相时间一般只有5~15min。(4)双水相分配技术易于连续化操作。若系统物性研究透彻,可运用化学工程中的萃

-4取原理进行放大,但要加强萃取设备方面的研究。

(5)目标产物的分配系数一般大于3,大多数情况下,目标产物有较高的收率。(6)大量杂质能够与所有固体物质一起去掉,与其它常用固液分离方法相比,双水相分配技术可省去1~2个分离步骤,使整个分离过程更经济。

(7)易于放大,各种参数可以按比例放大而产物收率并不降低。Albertson证明了分配系数仅与分离体积有关,这是其他过程无法比拟的,这一点对于工业应用有位有利;(8)设备投资费用少,操作简单,不存在有机溶剂残留问题。(9)操作条件温和,整个操作过程在常温常压下进行;(10)亲和双水相萃取技术可以提高分配系数和萃取的专一性。

由于双水相萃取具有上述优点,因此,被广泛用于生物化学、细胞生物学和生物化工等领域的产品分离和提取。双水相萃取技术应用的影响因素

物质在双水相体系中的分配系数不是一个确定的量,它要受许多因素的影响(表2)。对于某一物质,只要选择合适的双水相体系,控制一定的条件,就可以得到合适的(较大的)分配系数,从而达到分离纯化之目的,包括直接从细胞破碎匀浆液中萃取蛋白质而无须将细胞碎片分离,改变体系的pH值和电解质浓度可进行反萃取。

表2 影响生物物质分配的主要因素

4.4.1 聚合物及分子量的影响

不同聚合物的水相系统显示出不同的疏水性,水溶液中聚合物的疏水性按下列次序递增:葡萄糖硫酸盐< 甲基葡萄糖< 葡萄糖< 羟丙基葡聚糖< 甲基纤维素< 聚乙烯醇< 聚乙二醇< 聚丙三醇,这种疏水性的差异对目的产物与相的相互作用是重要的。同一聚合物的疏水性随分子量增加而增加,其大小的选择依赖于萃取过程的目的和方向,若想在上相获得较高的蛋白质收率,对于PEG聚合物,应降低它的平均分子量,相反,若想在下相获得较高的蛋白质收率,则平均分子量应增加。4.4.2 PH值的影响

体系的pH值对被萃取物的分配有很大影响,这是由于体系的pH值变化能明显的改变两相的电位差,如体系pH 值与蛋白质的等电点相差越大,则蛋白质在两相中分配越不均匀。4.4.3 温度的影响

分配系数对温度的变化不敏感,这是由于成相聚合物对蛋白质有稳定化作用,所以室温操作活性收率依然很高,而且室温时粘度较冷却时(4 ℃)低,有助于相的分离并节省了能源开支。双水相萃取技术的应用进展 5.1 在生命科学中的应用

传统的液液萃取分离,由于使用了有机溶剂,通常会使生物大分子(如蛋白质等)失活。而双水相技术作为一种生化分离技术,由于其条件温和,易操作,可调节因素多,目前已成功应用于生命科学中蛋白质、生物酶、细胞器、氨基酸、抗生素以及生物小分子等的分离纯化。双水相萃取技术在生命科学中的应用,国内外的研究都取得了很多丰富的成果。如Miyuki通过PEG/ K3PO4双水相体系,用两步法对葡糖淀粉酶进行了萃取纯化。用第一步萃取后含有酶的下相和PEG组成双水相作为第二步萃取体系,称作两步法。葡糖淀粉酶的最佳分配条件是PEG4000(第一步)、PEG 1500(第二步),pH=7,纯化系数提高了3倍。张志娟等用PEG/磷酸盐双水相体系萃取青霉TS67胞外活性蛋白,研究了PEG的浓度、磷酸盐的浓度对蛋白的分配特性的影响。周念波等采用PEG-(NH4)2SO4双水相体系直接从Bacillus sp.LS发酵液上清液中分离壳聚糖酶,确定了室温下双水相萃取最佳条件为:PEG 600 20%、(NH4)2SO4 20%、NaCl 0.1%、pH值6.0,在此条件下壳聚糖酶分配系数达5.91,萃取率达88.7%。

4.2 在天然药物提取与分离中的应用

双水相萃取技术在天然药物提取与分离方面也有着独特的优势。在这方面的许多研究成果主要集中在国内。如朱自强等用8%的PEG 2000与20%的(NH4)2SO4组成的双水相系统提

[5]

[4][3][3]取青霉素G,分配系数高达58.39,浓缩倍数为3.53,回收率为93.67%。霍清分别研究了葛根素在PEG/(NH4)2SO4双水相体系与丙酮/K2HPO4双水相体中的分配特性,实验确定了PEG/(NH4)2SO4双水相最佳体系:PEG 1500质量分数20%,(NH4)2SO4质量分数16%,最大的分配系数可达148.2,最大收率99.09%;丙酮/ K2HPO4双水相最佳体系为:丙酮:水=8:2,K2HPO4质量为1.5g,最大的分配系数可达36.7,最大收率99.55%。刑健敏等研究了聚乙二醇/盐双水相体系中烟碱的分配行为,确定了当含盐量25%、pH=9为体系的最佳分离萃取条件,回收率为96.7%,纯度为99.87%。4.3 在金属分离及络合物中的应用

双水相还可用于稀有金属/贵金属分离,传统的溶剂萃取方法存在着溶剂污染环境,对人体有害,运行成本高,工艺复杂等缺点。双水相技术萃取技术引入到该领域,无疑是金属分离的一种新技术。据报道,在丙醇-硫酸铵双水相萃取体系中,实现了从大量基体金属如Fe2+、Ca2+、Mg2+、Mn2+、Al3+、Pb2+和Zn2+中分离Pd(Ⅱ),萃取率可达99.2%。在溴化十六烷基吡啶一双水相体系中,实现了能够使Bi(Ⅲ)与Mn(Ⅱ)、Fe(Ⅲ)、Co(Ⅱ)、Ni(Ⅱ)、Zn(Ⅱ)、Al(Ⅲ)等常见离子完全分离;在丙醇-硫酸铵-碘化钾双水相体系中,实现了Au(Ⅲ)的分离,获得了最佳萃取条件:HCl浓度0.6mol/L,(NH4)2SO4用量6.0g,KI浓度0.1mol/L,在最佳萃取条件下,体系对Au的平均萃取率为98.6%5 双水相萃取技术的局限和展望

目前,双水相萃取技术已被研究用于众多生物产品的分离提纯,并显示出众多其他分离技术不具备的优点,是一种应用前景广阔的新型生物分离技术。但是,要将这一技术开发应用到大规模生产过程,还有许多理论和实践方面的技术问题有待解决。在理论上,由于双水相体系中组分间的作用非常复杂,目前还没有建立一套完整的理论和方法来解释和预测物质在双水相体系中的相行为和被分配物质在两相中的分配行为。研究基本上还是通过实验进行,且研究的结果还只是建立在实验的基础上,大部分情况下不能外延,而且研究总结的成果缺乏对过程规律的认识。实践方面,双水相体系分离的成本、效率、操作条件等在实践过程中存在很多的不确定性:如双水相体系中经常使用的聚合物/聚合物构成的[10]

[9]

[8][7]

[6]

。双水相体系,虽具有良好的分离性能,但用于构造双水相体系的成相聚合物的价格都过于昂贵,对于一般的生物产品来说,分离成本过高,在经济角度是不合理的;又如双水相体系界面张力较小,虽有利于提高传质效率,但是较小的界面张力易导致乳化现象的产生,使相分离时间延长,降低分离效率。

为了让双水相体系萃取技术走向成熟化,工业化,我们不妨从以下几个方面展开观察和研究:继续研发利用廉价的无机盐等代替常用的昂贵的葡聚糖;利用廉价易得的原料如变性淀粉PPT、糊精、麦芽糖糊精、乙基羟乙基纤维素等取代葡聚糖;用分子量较小的乙醇、异丙醇、丙酮、四氢呋喃等替代聚乙二醇;研究如何通过改变双水相体系的组成,操作条件,来节约双水相体系分离所需的时间,提高双水相体系的分离效率等等。今后,随着对双水相体系研究的深入,以及其他双水相体系的不断开发,例如离子液体双水相体系,其形成机理,热力学模型、动力学模型以及工艺技术等方面的问题最终会被突破和解决,其应用领域将进一步拓宽,双水相萃取将会成为一种优良的分离技术。

参考文献

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【信息检索综述】相关文章:

信息检索技术综述论文09-08

信息技术网络信息检索05-05

信息检索技术07-06

信息重复检索07-07

农业信息检索07-08

网页信息检索08-09

图像信息检索08-17

信息检索1005-24

信息检索大赛08-20

信息检索课程08-21

上一篇:2025地理教研组工作总结下一篇:庙滩镇中小学校规范收费公示制度