服务资源检索范文

2024-09-15

服务资源检索范文(精选9篇)

服务资源检索 第1篇

1.1 社区卫生服务

随着卫生体制改革的深入发展, 大部分省市、自治区逐步建立了社区卫生服务组织、综合医院和专科医院合理分工的医疗服务新体系。社区卫生服务组织主要从事预防、保健、健康教育、计划生育和常见病、多发病、诊断明确的慢性病治疗和康复长期以来, 医患双方存在较严重的信息不对称, 由于患者掌握的信息较少, 就医行为往往显得被动, 患者对医院的信任感也相对不足。为了让患者明明白白、踏踏实实看病, 医院网站整合了多种信息资源, 在网站上做到政策依据公开、医疗程序公开、服务过程公开、实施结果公开, 充分满足患者的知情权和查询需要。随着社区卫生服务组织和综合医院、专科医院双向转诊制度的不断建立与完善, 也进一步明确了社区卫生服务组织和综合医院及专科医院存在着密切的双向转诊、指导培训、信息反馈等关系。这就需要医院信息系统与社区卫生服务信息系统之间能够实现资源共享, 以尽快满足医疗卫生服务模式的转变及实现医疗卫生管理信息化的需要。

1.2 医院的现状

医院信息科的职能作用应是作为一个权威信息部门来管理医院综合信息, 并利用现代化的管理知识和网络化的微机系统进行收集和处理, 经过归纳汇总分析后。为医院领导层提供有价值的信息参考, 目前国内医院信息科 (处) 组织形式各不相同, 比较一致的是几乎全部医院都把图书馆、计算机室 (网络中心) 、统计室、病案室归于信息科管理其隶属关系亦不相同, 有的隶属于院长直接领导下的职能科室。随着现代化医院管理科学的飞速发展, 医院信息管理的重要性已逐渐得到重视, 医院的信息化程度已被普遍视为衡量该院科学管理的重要标志。做到层层负责, 层层落实。简单通俗一点, 就是集中力量, 利用现代信息技术, 为全院提供纵向到顶, 横向到边的全方位服务。目前信息科 (处) 还未充分体现出信息工作的基本特性和优越性, 它的职能作用未充分发挥。

2 信息系统

2.1 资源信息管理

信息技术队伍结构不理想、层次不高信息科专业多分工细, 涵盖信息采集处理、信息资源管理和声像等多媒体制作, 技术独立性和专业性较强, 而当前不少医院的信息科编制少, 知识结构不理想, 直到今天, 医务人员除了掌握本专业学科的知识之外还需学习哲学、心理学、伦理学等人文科学, 这引发了医务人员对医学知识、社会学知识更多的需求。医务人员和医学研究人员要把握自己专业领域范围内的同内外最近研究动态和进展, 业务上无多大直接联系。比如图书馆与统计室。此状况在一定程度上防碍了信息科内部交流, 信息科人才严重缺乏, 是一个普遍现象。图书馆、病案室、统计室多是其他专业改行, 本专业水平低。计算机人才流失频率快, HIS建设存在很多问题无法解决。这些不合理的现象。极大地削弱了信息工作者的地位和自信心, 严重影响信息科工作上档次。

2.2 医院信息科的职能作用

随着现代化医院管理科学的飞速发展, 医院信息管理的重要性已逐渐得到重视, 医院的信息化程度已被普遍视为衡量该院科学管理的重要标志。因此, 由过去体制形成的医院信息部门的工作重点和管理职能必须做出重大的转变, 才能适应医院管理工作的需要。在新的形势下, 医院信息科的职能应转变为承上启下, 担负起向上 (决策层) 精确、快速反馈整个医院医疗信息及医院的科研发展水平, 向下通过计算机网络准确传达实施领导层的管理控制信息、决策信息和快速发展的网络医学信息。在新的形势下, 必须首先明确信息科的基本任务和目标, 使之成为名符其实医院综合管理职能部门。医院知识管理的主要任务是要对医院的知识资源进行全面和充分的开发以及有效的利用, 从而达到医院医疗、科研和管理的创新, 这也是知识管理区别于其他管理的一个主要方面。

3 医院信息的管理

3.1 信息的收集

对知识的收集不再需要耗费大量的人力和时间, 这为医院进行知识管理提供了有效的技术保障和支持。医院在进行知识的收集时应有创新精神, 摒弃一些保守的观念和传统, 加大对知识的投入, 有计划地、科学地进行知识的采集。同时还要认识到, 医院知识收集是一个长期积累、循序渐进、不断完善的过程, 不可能一步到位。检查、督促、处理医院信息工作信息科的新型职能是管理医院的信息资源, 开发、利用信息资源, 为医院领导决策提供及时可靠的信息, 为医院的管理、医疗、教学及科研服务。信息科要充分发挥职能作用, 必须理顺监管与服务的关系, 检查监督与服务的关系。信息部门要建立电子病案、数字化医学影像与通信系统 (PACS) 和检验检查信息库, 实现医疗知识结构化和电子病案结构化。最重要和关键的是如何将隐性知识转化为显性知识, 充分发挥隐性知识对知识创新的巨大作用。

3.2 建立知识管理平台

医院可以通过建立医院知识管理平台来实现医院知识的高效管理和应。高效的知识管理还需要人和技术有良好的配合。知识库的建立则为临床医生提供了学习的渠道, 也为医师培训和继续教育提供了良好的手段。医院要展现积极的态度、制定有效的政策、采取多样的方法来鼓励医务人员对知识加以利用, 激发医务人员的创新潜力和热情。其内容应包括临床医学知识、临床护理知识、辅助学科知识、药学知识、医学文献提供、病例讨论分析、医院科研管理、医学专家人才库、医院公文系统、医学药学护理学考试练习等模块平台还应该为领导的决策提供依据, 实现领导自由定制所需要显示的模块以及工作分类, 还能够将业务系统的数据抓取到领导工作台上展现, 领导能够及时看到所关心的数据信息, 节省时间成本并提高效率。

结束语

医院信息科作为一个新型的多职能综合性科室, 最主要的作用和基本任务就是负责医院信息管理。它必须改变传统的只限于统计信息方面的管理, 而是要掌握医院整体人流、物流和信息流, 成为领导决策的权威性参谋机构。再者医院信息系统中增加的一些新子系统上线后, 也都对发挥着不可替代的作用, 是医院信息系统能够正常运转和有效应用和推广的重要保证。

摘要:简述了信息工作现代化的概念、主要内容及基本要求, 并针对医院信息工作的具体情况进行分析, 提出了医院信息工作的发展思路, 并探讨了发展信息研究系统的具体措施和改革方向。信息资源整合系统的用户构成 (谁在使用该系统) 、信息资源整合系统的工作机理 (用户是怎样使用该系统的) 、信息资源整合系统的设计目的 (用户在该系统的适用过程中能够得到什么) 决定了它们在整合的基本要素、设计原则、设计程序, 整合中用户的参与层次以及整合模式等方面存在差异。

关键词:医院,资源的信息,信息管理

参考文献

[1]傅征, 任连仲.医院信息系统建设与应用[M].北京:人民军医出版社, 2003.

常用网络资源检索方法探析 第2篇

〔关键字〕 网络资源;信息检索 ;百度;Google

在浩如烟海的网络信息中, 要获取自己所需要的信息,并不是一件容易的事, 尤如大海捞针、沙里淘金, 往往使用户望洋兴叹, 一筹莫展, 即使利用搜索引擎, 但当你输入关键字后, 出现了成百上千的查询结果, 使你面对一大堆信息垃圾, 带给你的不是快乐, 而是沮丧。这是你没有很好的驾驭它, 才导致如此结果。下面针对百度和Google中国两大搜索引擎,结合实例,介绍一些网络资源搜索技巧,主要针对从事科研、教学、学生等对网络利用率较高的用户,提供相关检索技巧,增强检索能力。

一、网络资源搜索引擎百度和Google简介

百度1999 年底成立于美国硅谷, 创始人是北京大学的两位毕业生李彦宏和徐勇,“百度”一词来源于辛弃疾脍炙人口的词句“众里寻他千百度”,象征着百度对中文信息检索技术执著的追求,百度现已成为全球最优秀的中文信息检索与传递技术供应商。百度搜索引擎是目前世界上规模最大的中文搜索引擎。

Google 成立于1998 年, 创始人为美国斯坦福大学的两位博士研究生Larry Page 和Sergey Brin。Google 一词由英文单词“Googol"变化而来,“Googol" 指的是10的100次幂,写出的形式为数字1后跟100个零,显示了公司想征服网上无穷无尽资料的雄心。Google 被公认为全球最大的搜索引擎。

二、常用资源检索策略

(一)缩小检索范围的“与”“或”“非”

为缩小检索范围,减少信息垃圾,可以使用:“与”“或”“非”三个布尔逻辑运算符,其代表符号依次为:“AND”“OR”“-”。下面针对“与”“或”“非”各举一例。

如果搜索所有包含“搜索引擎”和“历史”的网页,在搜索框输入:“搜索引擎AND历史”,可以发现比单独输入“搜索引擎”和“历史”查询结果少了很多。百度和Google对“与”的运算逻辑可以减少检索范围,如果包含多个检索词,可以在搜索时把每个检索词之间加个“AND”,可以减少检索范围。通常在进行“与”检索时,“AND”可以用空格代替,检索结果相同。

同理,搜索结果若至少包含多个关键字中的任意一个,用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A ,要么有B ,要么同时有A 和B。若检索不包含某个关键字,使用“非”运算,例如检索包含“搜索引擎”和“历史”但不含“文化”的所有网页,在搜索框输入: “搜索引擎AND历史-文化”即可。这里的“OR”和“-”号, 是英文字符, 而不是中文字符。另外百度和Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

(二)特殊要求检索技巧

1.对资源来源的网站进行限制

对搜索的网站进行限制使用“site :”,表示搜索结果局限于某个具体网站或者网站频道, 如“www. sina.com.cn ”、“edu. sina.com.cn ”, 或者是某个域名, 如“com. cn”、“com”等等。如果是要排除某网站或者域名范围内的页面, 只需用“网站域名”。例:搜索中文教育科研网站(edu. cn )上关于“搜索引擎技巧”的页面。在搜索框输入: “搜索引擎技巧site :edu.cn ”,即可查看所有中文教育科研网站上关于“搜索引擎技巧”的网页。注意“site” 后的冒号为英文字符, 而且冒号后不能有空格, 否则, “site :”将被作为一个搜索的关键字。此外,网站域名不能有“http : ∥”前缀, 也不能有任何“/ ”的目录后缀; 网站频道则只局限于“频道名.域名”方式, 而不能是“域名.频道名”方式,如“site:edu.sina.com.cn”。

2.检索某一类型文件

百度和Google在检索某一类型文件时使用的方法不同,百度搜索时可以直接把文件类型的后缀当作关键词进行检索,而Google使用“filetype :”来标示文件类型。Google 不仅能搜索一般的文字页面, 还能对某些二进制文档进行检索。目前, Google 已经能检索微软的Office 文档如xls、ppt 、doc , rtf , WordPerfect文档, Lotus文档, Adobe 的1pdf文档, ShockWave的swf文档(Flash 动画) 等。其中最实用的文档搜索是PDF 搜索。PDF 是ADOBE 公司开发的电子文档格式, 现在已经成为互联网的电子化出版标准。目前Google 检索的PDF 文档大约有2500 万左右, 大约占所有索引的二进制文档数量的80 %。PDF 文档通常是一些图文并茂的综合性文档, 提供的资讯一般比较集中全面。例: 搜索几个资产负债表的Office 文档。搜索: “资产负债表filetype : doc OR filetype:xls OR filetype : ppt”,则可以下载有关资产负债表的Word、Excel、Powerpoint文档。注意下载的Office 文件可能含有宏病毒, 谨慎操作。

3.搜索的关键字包含在URL 链接中

“inurl :”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中, 如“MP3”、“GALLARY”等,于是可以用INURL 语法找到这些相关资源链接, 然后, 用第二个关键词确定是否有某项具体资料。INURL 语法和基本搜索语法的最大区别在于, 前者通常能提供非常精确的专题资料。示例: 查找MIDI 曲“沧海一声笑”。搜索: “inurl : midi“沧海一声笑””,则可以看到关于此内容的链接。注意: “inurl :”后面不能有空格,百度和Google也不对URL符号如“/ ”进行搜索会把“/ ”当成空格处理。

4.搜索的关键字包含在网页标题中

“intitle :”和“allintitle :”的用法类似于上面的inurl 和allinurl ,只是后者对URL 进行查询,而前者对网页的标题栏进行查询。网页标题就是HTML标记语言title 中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此, 只查询标题栏, 通常也可以找到高相关率的专题页面。例: 查找台湾明星林志玲的照片集。搜索: “intitle :林志玲“写真集””结果搜索出有关intitle :林志玲“写真集”的中文(简体)网页。

5.搜索所有链接到某个URL 地址的网页

如果你拥有个人网站, 如果想知道有多少人对你的网站作了链接。而“link :”语法就能让你迅速达到这个目的。例: 搜索所有含指向华军软件园“www.newhua.com”链接的网页。搜索:“link:www.newhua.com”结果: 搜索有链接到www.newhua.com 的网页。“link”不能与其他语法相混合操作,所以“link :”后面即使有空格,也将被忽略。另外还要说明的是,link只列出索引链接很小一部分,而非全部。一般说来,友情链接的网站都有相似地方。这样,你可以通过友情链接,找到一大批具有相似内容的网站。

三、百度和Google的特色资源检索

(一)Baidu 独特的功能与特点

百度搜索引擎自如的可扩展性和采用ASP (APPLICATION SERVICE PROVIDER) 商业服务模式是它的两个最鲜明的特点。可扩展的搜索技术保证最快最多地收集网络信息,构建大规模索引库。一些搜索引擎网站可能遇到过这样的情况,当有少量的用户登陆他们所使用的搜索引擎时, 系统工作得非常好,但是一旦用户数量到达高峰时,整个系统就接近瘫痪了,这是因为他们的搜索引擎不具备真正的可扩展性,而Baidu 就可以承受所有高峰的负荷而不会在性能方面有任何偏差。

1.体贴的提示功能

百度深刻理解中文用户搜索习惯, 开发出关键词自动提示: 用户输入拼音, 就能获得中文关键词正确提示; 百度还开发出中文搜索自动纠错, 如果用户误输入错别字, 可以自动给出正确关键词提示。此外百度还有其它多项体贴普通用户的功能, 如相关搜索、中文人名识别、简繁体中文自动转换、网页预览等,这些都给用户极大的方便。

2. 雪中送炭的百度快照功能

百度快照是一个广受用户欢迎的特色功能, 解决了用户上网访问经常遇到死链接的问题: 百度搜索引擎预先浏览各网站, 拍下网页的快照并贮存起来。在进行网上浏览时,如因网站服务器暂时中断或堵塞、网站链接更换、网页被删等原因不能正常链接到所需的页面, 就可使用百度快照调用暂存的网页来救急,而且通过百度快照寻找资料往往要比常规方法的速度快得多。

3.专业的MP3 搜索功能

为了满足部分用户从专业的角度来查找音乐资料, 百度搜索引擎在数亿中文网页中提取MP3 下载链接, 建立了庞大的MP3 歌曲下载链接库, 从而塑造出了MP3 音乐搜索、下载和歌词查询基地, 深受广大音乐爱好者的赞誉。此外, 百度还增加了Flash搜索、新闻搜索信息快递搜索等, 更加满足用户的专业需求。

4. 便于用户交流的“贴吧”“知道”功能

百度虽然能搜寻高达3 亿5 千万中文网页的信息, 但与8000 万中国网民头脑中的所有知识之和相比, 仍然只是沧海一粟。为了便于用户交流知识、想法和经验, 百度设置了独一无二的“贴吧”功能, 只要在搜索框内输入感兴趣的话题, 点击搜索按钮, 即可进入相应贴吧, 交流非常方便。

5.生活的百宝箱——百度常用搜索功能

在百度的首页, 有一个“百度常用搜索”, 它提供了大量的与日常生活密切相关的信息。其中包括天气预报、电话区号和邮政编码查询、电视预报、列车时刻表、飞机航班、万年历、外汇牌价、度量制式转换、地址查询、学历查询和数学计算等, 只要点击一下感兴趣的话题, 它就会给你带来实实在在的生活便利。

(二)Google 独特的功能与特点

Google 独特的功能与特点Google 具有语言转换功能。在主页点击右侧的语言工具,可选择搜索特定语言或国家的网页。在翻译选项中选择将网页翻译的语种,在使用偏好内,可将所有网页内容转换成用户所熟悉的语言,还可提供中文简体和繁体文本之间的自动“翻

译”转换。如果你想找一个指定的网站,还可以用到Google的一击即中的独门绝技——“手气不错”,非常方便用户。

Google 在短时间内夺颖而出、傲视群雄, 访问量首屈一指, 主要原因之一是拥有强大、独特、实用的检索功能, 具体是: 图像搜索功能、在线的英文活字典、出色的页面翻译、极强的新闻网站群、新奇的年度排行榜、便捷的网页快照、精准的手气不错(I'm Feeling Lucky TM )功能、实用的语言转换功能等,这些功能绝大部分都是Google 首创, 非常实用。此外, 在Google 主页之外还有一些不为人熟知的辅助搜索功能, 它们相对独立, 各具特色, 是Google 搜索功能的重要补充, 这些功能是: 新闻搜索( http://www.news.google.com)、购物搜索( http://froogle.google.com)、大学搜索(http://www.google.com/options/univ

ersities.html)、邮政快递搜索(http://catalogs.google.com)、更简单的浏览方(http://labs.google.com/gviewer.html)、特殊搜索(http://www.google.com/ options /specialsearchers.html)、无线搜索(http://www.google.com/options/wireless.html)、答案搜索(http://answers.google.com/answers/main) 、术语搜索(http://labs.google.

com/glossary)、引用搜索(http://labs.google.com/cgibin/webquotes)、相关搜索(http://labs.google.com/sets) 等。它们与Google 主页功能相结合, 构成了Google 强劲的搜索功能。

四.结语

百度和Google都是当今最优秀的机器人搜索引擎, 两者既有很多相同之处, 又有很大不同, 前者的用户是全球网民, 后者的用户是全球中文网民, 但两者都以追求完美为最高目标,双方的主要技术各有所长, 难分伯仲; 用户在使用网络引擎检索网络资源之时,可以充分考虑二者之间的特点,快速从浩瀚的信息海洋中获取自己需要的资源,掌握一定的网络资源检索技巧,增强网络资源的检索能力。

参考文献

[1]费志勇,褚润贞.搜索引擎Baidu(百度)研究[J].现代情报,2003,(9)

[2]李艳梅.浅议搜索引擎Google[J].现代情报,2004.(7)

[3]许涛,吴淑燕.Google 搜索引擎及其技术简介[J].现代图书情报技术,2003,(4)

[4]吴娱.中文搜索引擎的现状与发展[J].现代情报,2005.(3)

[5]黄文忠.网络搜索引擎GOOGLE评析[J].现代情报,2005,(3)

浅论信息资源检索 第3篇

人类正是通过信息对自然界、人类社会及思维方式与运动规律的认识与概括, 再经过大脑思维重新组合成系统化了的信息, 也就是知识, 它被某种载体记录下来, 可以打破时空且被传递, 不断积累, 不断更新。信息资源是经过人类开发与组织的存储于载体 (包括人脑) 上的已知或未知的可被利用的信息的集合。信息资源的定义与信息的定义一样, 目前仍是众说纷纭, 其核心是对“信息”、“资源”二词的理解及对二词语法结构的理解不同, 是信息化的资源, 还是资源化的信息?还是信息、资源二词仅为同位语?一般说来, 信息与信息资源可视为同义语, 但在有些场合, 尤其是二词同时出现, 需要严格区别。在英文中, “信息资源”一词为单数“Information Resource”时是指信息本身, 当该词为复数时, 常指信息及与信息有关的设备、人员等的集合体。信息资源包括信息生产者、信息和信息技术三个基本要素。

1 信息资源类型

按照信息资源的开发程度来分, 可分为潜在的信息资源与现实信息资源两大类。

1.1 潜在的信息资源是指个人在认知和创

造过程中储存在大脑中的信息资源, 其特点是只能为个人所理解和利用, 无法为他人直接理解和利用;易于随忘却过程而消失。因此是一种没有表达出来的、有限再生的信息资源

1.2 现实的信息资源可分为以下几类

1.2.1 口语信息资源

以口头语言如交谈、聊天、授课、讨论等方式获得的信息资源。特点是传递迅速、互动性强, 但稍纵即逝, 久传易出差异, 不十分准确与可靠。

1.2.2 体语信息资源

以手势、表情、姿势如舞蹈、体育比赛、杂技等方式所传递的信息资源。如“千手观音”。其特点是直观性强、生动丰富, 极富感染力, 印象深刻, 往往起到“此时无声胜有声”的效果, 但此类信息的容量有限。

1.2.3 实物信息资源

以实物如文物、产品样本、模型、雕塑等形式表示的信息资源。如“秦始皇兵马俑”其特点是直观性强、信息量大, 但需要通过知识、智慧、经验和工具挖掘隐含的大量信息。

1.2.4 文献信息资源

以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息。文献是指记录有知识的一切载体。新版《辞海》:“记录有知识的一切载体的统称, 即用文字、图像、符号、声频、视频等手段以记录人类知识的各种载体。”特点是较为系统、准确、可靠, 便于保存与利用, 但也存在信息相对滞后的情况。

按文献的载体形式可分为:书写型、印刷型、缩微型、声像型、机读型。

按文献的出版形式可分为十种:图书、期刊文献、会议论文、科技报告、专利文献、学位论文、政府出版物、标准文献、产品样本、档案。

按文献的加工形式可分为:一次文献、二次文献、三次文献。

1.2.5 网络信息资源

以电子形式存储于世界上成千上万台计算机组成的网络中的信息资源。特点是信息量大, 传递迅速、内容更新快, 但大量的信息中重复交叉较多, 垃圾信息不少。

网络信息资源按组织与揭示方式或分为几种:自由文本组织方式、超维组织方式、FTP组织方式、主题树组织与揭示方式、计算机索引数据库组织与揭示方式。

2 信息资源检索

广义的信息资源检索概念应包括现两个方面:其一, 将分散的信息按一定的方式组织起来进行有序存储, 其二, 根据情报用户的需要从该信息集合中找出有用信息的过程。信息检索是从大量相关信息中利用人-机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。信息检索包含存储与检索两个部分。所谓存储是对有关信息进行选择、并对信息特征进行著录、标引和组织, 建立信息数据库;所谓检索则根据提问制定策略和表达式, 利用信息数据库。只有将大量无序的信息通过一定的方法使之有序化, 检索才有可能。因此从这个意义上讲, 信息存储是信息检索的逆过程, 两者是不可分割的一个某一主题文献的线索查找出来的检索。检索结果不需要具体、唯一的回答用户与提出的问题, 只需提供课题有关的参考文献线索, 即来源信息, 它是一种相关性检索。

事实/数据检索:将存储与数据库中关于某一事件发生的时间、地点、经过等情况查找出来, 或者是在数据库中根据需要查出可回答某一问题的数据的检索。事实或数据检索提供事实、数据等信息的原始资料, 这是一种直接的确定性检索。

2.1.2按组织方式分

全文检索:是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章节、段、句、词等的信息, 也可进行各种统计分析。例如, 它可以回答“《红楼梦》一书中‘林黛玉’一共出现多少次?”的问题。

超文本检索:是对每个结点中所存信息以及信息链构成的网络中的信息和检索。它强调中心结点之间的语义联接结构, 靠系统提供的复杂工具进行图示穿行和结点展示, 提供浏览式查询, 可以进行跨库检索。

超媒体检索:是对存储的文本、图像、声音等多种媒体信息的检索。它是多维存储结构, 有向的链接, 与超文本检索一样, 可以提供游览式查询和跨库检索。

参考文献

[1]许家梁.信息检索[M].北京:国防工业出版社, 2004.

[2]肖珑.数字信息资源的检索与利用[M].北京:北京大学出版社, 2003.

[3]王国良, 等.信息资源检索与利用[M].沈阳:兵器工业出版社, 2005.

信息资源检索心得体会 第4篇

通过信息资源检索这门课程的学习,我收获了很多。首先,通过课堂内容的学习掌握了现代信息资源检索的基础知识。在老师的指引下熟悉了国内外常用的中外文数据库、信息机构网站和搜索引擎,通过万方、维普等数据库并利用布尔逻辑搜索、截词搜索、位置检索和字段限定检索等方法进行信息检索分析,最重要的是掌握了检索策略,通过所学方法进行文献调研与科技查新,在数据库中快速而精确的找到相关专业的热点问题以及自己所需要的其他相关内容。

随着课程的进行,在完成老师所布置的作业时,慢慢的发现自己以前所用的检索过于简陋,浪费了太多的时间,原本一个简单的检索式可以完成的工作,自己以前甚至花上几天的时间浪费在文章的筛选上。在完成查新报告的小组作业时,发现每个人的能量是有限的,团队工作真的很重要,每个人在检索时都不可避免的会疏忽一些东西,课堂上老师说这个问题会随着经验的丰富而逐渐缩小,所以以后我会尽量多进行检索尝试,完善自己的技能。

随着课程的结束,课程作业的完成,我现在已经基本掌握了信息资源检索的技能,我会通过这项技能弄清楚专业将来的发展趋势确定以后的研究方向,并通过它来找到工作方向。此外,我会多检索并阅读一些英文文献,通过国内外文献的学习了解本专业的最新动态,提高自己的专业素质。

学习信息资源检索这门课程,需要多一些实践性的机会,例如平时多一些像查新报告的上机实习或者各种形式的课堂讨论,这样可以让同学们集百家之长,更好的学好信息资源检索这门课。同时,上机课时还会发现一种现象,大多数同学都不是在忙课堂作业,而是忙各种其他的事情,所以建议老师能够把控好每台计算机,有时候需要老师的引导,学生才能更好的完成相关内容的学习。如果这门课的能够因材施教更好,比如不同的院系讲授不同的内容,毕竟每个院系的检索数据库并不完全相同,有些时候所学内容需要跟本专业密切的结合。另外,上机课由于人数太多,部分学生找不到座位,建议分专业上课。

科技信息资源检索与利用 第5篇

1 科技信息检索的意义

科技信息检索就其实质来说, 是获取和利用信息中所载有的科技情报。它是科学劳动的重要组成部分, 目的在于开发和利用已收集和经过加工整理的信息资源, 为科学研究和技术开发服务。搞好科技信息检索工作, 对于推动整个科学技术的发展, 具有重要的现实意义。

1.1 传播科技信息, 促进科技知识的开发和利用

历代流传下来的和目前源源不断地涌现着的科技信息, 象一个巨大的知识宝库, 是一种如同能源, 材料和劳动力一样重要的资源, 能否充分地利用这种资源, 直接影响到一个国家的科学、教育、文化和经济的发展。因此, 搞好科技知识的开发和利用, 是非常重要的。科技信息检索工作就是传播科技信息, 加速科技知识开发利用的重要环节。可以说这是一项经营信息的工作。目前国内外许多专家认为, 信息、知识创造价值, 并且在信息社会里价值的增长主要来自信息知识。日本经济的发展就是一个明显的例子。日本人口很多, 资源匮乏。现在居然成了新崛起的世界经济大国, 为什么, 就是靠知识开发和利用。日本现在就是依靠它的知识换取了世界上的各种各样的原料、能源和新产品。

1.2 节省科研时间, 提高科研工作的效率

现代科技信息发展的特点是规模庞大, 学科门类越分越细, 并且学科之间互相交叉, 表现为高度的综合性。科研人员要想全面地迅速地获得自己所需要的信息, 难度越来越大。为了借鉴前人和他人已有经验或避免重复研究, 科研人员查阅科技信息资料所耗费的时间已占研究时间的1/3, 甚至达1/2。如果通过检索系统特别是现代化检索系统查找信息, 就会缩短查阅信息的时间, 相对增加科研时间, 极大提高科研工作效率。目前, 有些以电子计算机为主要手段的现代化情报检索系统, 可以在几分钟至几十分钟内为成千上万个科研课题查遍一定时间的最新文献和几年甚至十几年的过期文献。如美国国家医学图书馆的检索系统平均每10分钟就能完成一个课题的, 相当于一个人用30种文字, 读2000种专业杂志, 博览9万多篇科学论文。按传统的人工检索方法, 一个人花60~70年的时间也难以达到这样的效果。因此, 世界各国科学家都越来越清楚地认识到, 要想在信息海洋中广快精准地获得对自己有用的信息, 提高科研效率, 唯一的办法是靠信息检索。由此可见, 搞好科技信息检索, 对于节省科研时间, 提高科研效率, 具有重要的意义。

1.3 帮助科研人员确定选题方向, 避免重复研究或走弯路

整个科学技术史表明, 科学技术的发展, 是以前人的研究成果或借鉴他人的成功经验为主要前提, 不断突破和创新。科研工作者如果不开阔眼界, 从横向与纵向的结合上, 从宏观与微观的联系上去了解世界上某种科研项目的现有成果而闭门造车, 就会造成重复研究, 浪费人力和物力。例如, 20世纪50年代, 美国研究出继电器接点电路合成法时, 则发现另一个国家在他们设计此课题之前, 已做了同样试验, 并取得同样的效果, 并已发表过研究论文, 美国研制前由于没有有效的检索系统, 未查到这篇论文, 所以白白浪费了50万美元和5年时间。我国的信息工作一直比较落后, 当前重复研究的现象比较严重, 不仅有些人是在徒劳地、重复地研究国外已有技术, 而且国内各机构之间相互重复研究的现象也不少。所以科技信息检索是科研工作者整个研究过程中不可缺少的步骤和手段, 我们决不可忽视信息检索的重要作用。

1.4 提高现有藏书的利用率, 拓展信息情报来源。

信息检索的基本任务, 一是建立检索系统以及组织和积累检索工具;二是通过检索工具, 在大量的科技信息中快速地查全、查准, 得出与课题相关的信息。人们掌握检索方法, 可以积极主动地去到科技信息海洋中寻找所需要的珍贵情报, 也可以发现现有馆藏中有哪些信息是不经常被利用的, 甚至是无用的资料, 这就为一个科研机构、情报单位和图书馆提高本馆馆藏信息的利用率, 扩大科技信息情报的来源, 提供了重要的依据。

2 检索方法与技巧

2.1 关键词法

利用搜索引擎直接输入关键词, 网站会将与关键词相符合的或者是与关键词相近的在结果显示在网页中, 要查看相关的信息, 只需通过搜索引擎提供的链接地址便可以访问。利用关键词查询最简单、常用。但在选用关键词时应注意下列几点。

(1) 选用具有专指性的关键词, 遥免使用内容广泛的关键词, 如:不用“技术”, 而用“网络技术”“焊接技术”等。

(2) 选用具有实际意义的实词, 不选无意义的虚词。如语言中的副词、连词、介词等虚词, 或者是“be”的变体, 如is, are, were、been等均不宜作关键词进行搜索。

(3) 多个关键词的逻辑关系要合理, 应正确使用“与、或、非”的逻辑关系。在运用多项条件进行搜索时, 要弄清多个关链词之间的逻辑关系。

2.2 双引号法

直接输入关键词查找往往会反馈回大量不需要的信息, 当在对两个或两个以上的关键词组合查询时, 如果将输入的关键词用括号括起来, 便可使检索结果为最少、最精确。

2.3 布尔逻辑运算符

(1) 逻辑词语“与”:通常用AND, and、*或+表示, 在检索中起到缩小查询范围, 提高查准率。它的使用格式为A and B, A*B或A+B, 表示搜索结果中既包含A也包含B。如:胰岛素and糖尿病, 可检索出与胰岛素有关糖尿病方面的文献。

(2) 逻辑词语“或”:通常用OR或or表示, 在检索中用来扩大查找范围, 提高查全率。使用格式为A OR B或者A or B, 表示搜索或者包含关键词A, 或者包含关键词B的文献。如:土豆OR马铃薯, 可检出含有土豆或马铃薯的文献。一般情况下, 两个关键词之间没有空格就相当于逻辑“或”。

(3) 逻辑词语“非”:通常用NOT, not或一号表示, 为了缩小检索范围, 限定检索结果中排除不需要包含的词汇, 以增强专指性。使用格式为A not B或A-B, 表示搜索包含A但不包含B的文献。如:糖尿病NOT成人, 可检出排除成人以外的糖尿病的文献。

2.4 专用搜索语法

(1) site表示搜索结果限定在某个具体网站中。即在关键词后加site及具体的网址, 可以查找到指定网站中包含该关键词的网页文件。如:挖掘机site:sina.com.cn表示在新浪网里搜索和“挖掘机”相关的资料。

(2) filetype表示搜索某一特定格式的文件, 即在搜索的关键词后加filetype及文件格式类型。如输人:医学教育技术filetype:ppt, 就可以得到带关键词医学教育技术的ppt格式文件。常用的文件类型还有:doc, xls、pdf、rtf等。

(3) imd表示搜索网址中含有关键词的网页, 即在一个或几个关键词前加血imd, 可以限制只搜索网址中含有这些关键词的网页。如:imd:mp3表示搜索网址中含有mp3的网页。

(4) link用于搜索链接到某个网址的网页。如:link:www.sohu.com, 表示搜索链接到“搜狐”上的网页。

(5) intitle表示搜索的关键词包含在网页标题中, 即在intitle后加一个或几个关键词, 可以查询到网页的标题中含有该关键词的信息。如intitle:工程机械, 表示搜索标题中含有关键词“工程机械”的网页。

2.5 通配符法

在检素网上信息时, 当记不清某个具体内容的时候, 可使用通配符进行模糊搜索, 通配符可代替一个或多个真正字符。通常使用“*”号, 也可使用“?”号。*可代表任何文字, 如在搜索框中输入“电子*”, 搜索结果可能会是“电子元器件”、“电子称”、“电子计算机”等。?仅代表单个字, 比如输入comp?ter, 能找到“compater、competer、computer”等单词。在查询中, 对查询的内容不清楚或不记得单词的拼写情况下, 局部的通配符是非常有帮助的。

3 结语

总之, 信息检索是科学研究的基础工作, 也是任何科学研究过程中必不可缺少的一个步骤, 掌握信息检索的方法和技能, 是每个科研人员的基本功。图书情报工作者的劳动是具有科学性质的研究工作的一个组成部分, 这种科学性质的研究工作最直接的体现就是科技信息检索。我们必须加强科技文献检索基础知识普及、宣传和教育工作。首先, 从事图书情报工作的同志应该学好信息检索基本知识, 以便更好地开展信息服务工作。其次, 对于青年学生进行科技信息检索知识教育也很重要, 培养他们掌握了科技工作的这项基本功, 就奠定了以后他们做为科研工作人员的素质基础。

摘要:网络对传统的科技信息检索带来了巨大的挑战和冲击, 如何利用这一现代化的技术手段进行快速、准确、高效的科技信息检索, 是广大专业技术人员和科技情报工作者十分关心的问题。通过对网上信息资源的分析, 探讨了科技信息资源检索与利用的常用方法和技巧。

关键词:网络,科技信息,检索,搜索引擎,数据库

参考文献

[1]燕慧泉.手工检索与计算机信息检索在检索策略之拟定和优化方面的分析比较[[J].现代情报, 2003, (12) :74-74.

[2]王字佳.网络信息检索发展趋势摭谈[J].现代情报, 2008, (7) :48-49.

[3]周红炜.Internet网上的文献资源[J].图书馆理论与实践, 1998, (4) :43-44.

[4]丁伟国.网络时代信息检索的发展趋势[J.图书馆学刊, 2005, (1) :22-23.

网络艺术资源的共享与检索 第6篇

关键词:艺术资源,共享,检索

信息时代计算机和网络的快速发展, 使得网络数字资源成为内容最丰富、获取最便捷的信息资源。网络数字资源的发展, 为艺术资源的共享与检索带来了前所未有的便利, 也提出了新的挑战。以Rich Media (富媒体) 为主要特征的网络艺术资源的共享与检索, 不仅仅是计算机专业人员需要面对的问题, 更是广大的艺术工作者不得不面对的问题。因为它不但涉及到科学与艺术, 且具有跨学科及学科交叉融合的显著特点。

本文通过对网络艺术资源的种类的归纳及特点的研究, 提出资源共享的方法及需要注意的问题, 并给出信息检索的策略。

1 网络艺术资源的种类与特点

对艺术资源的分类方法繁多, 标准不一。本文从数字资源的角度, 对网络艺术资源的种类和特点进行分析。

1.1 按艺术学科门类划分

现在, 艺术学升级为中国的第13个学科门类, 下设五个一级学科。按照一级学科划分网络艺术资源, 有利于艺术工作者的工作和学习习惯。表1是一级学科所对应的数字资源的主要形式:

1.2 按计算机数字资源表现形式划分

富媒体特性是网络艺术资源最主要的特性。按照数字资源的表现形式划分, 可方便信息的组织和检索。表2为各种数字信息对应的艺术作品形式:

1.3 按艺术形态存在方式划分

艺术形态有其独特的存在方式。表3为艺术形态的存在方式及对应的艺术类别和数字资源主要形式:

1.4 按作品性质划分

艺术作品完成的时代不同, 其材料、工具和表现形式亦有所不同。有的作品是直接在计算机上实现的电子数据作品, 有的作品则是对已完成的传统作品的数字化处理, 是真实作品的数字表现。以摄影作品为例, 用数码相机可以直接拍摄得到数字作品, 而用胶片相机则必须在拍摄后将经过冲洗以后的照片或底片经过转换 (如扫描等) , 才可以得到数字化作品。

⑴现代数字创作作品:如MIDI、数码照片、数码摄像、平面设计、CAD、计算机动画等。

⑵传统作品的数字化:对画作、雕塑、陶瓷等实体形态艺术品的扫描或摄影等。

1.5 按作品创作过程划分

艺术作品是艺术工作者进行艺术创作的成果。很多作品在艺术创作过程中要利用一些艺术资源进行再加工和再创作, 按照作品的完成度或作品的创作过程, 网络艺术资源可分为:⑴数字化素材:如各种声音的采集汇总, 各种图形图像元素的合集等等。这些既是作品创作的阶段性成果, 当它作为艺术创作的素材使用时, 也是另一些艺术作品创作过程的组成元素。⑵数字化作品:各种最终完成的艺术作品, 一般拥有原创的版权。总的来说, 富媒体化和数据量大是网络艺术资源最主要的特征。数字信息对实际艺术作品的表述和再现可能存在一定的局限和偏差, 网络艺术资源的素材采集和加工困难, 一些数据压缩等技术操作也会造成信息损失, 引起作品质量的下降。上述原因造成艺术资源数据库结构复杂, 共享和检索的难度加大。

2 网络艺术资源的共享

2.1 艺术资源数据库

专业的数据库不仅信息量大, 权威性高, 而且针对性强。特别是由专业人士建立的具有学术性的数据库, 更是人们进行科研、学习和创作所必需的信息资源。因此, 通过建立艺术资源数据库, 可以更好地实现资源共享。

要建立艺术资源数据库, 首先要搜集和加工制作相应的艺术资源, 按照一定的标准对资源进行合理的分类, 并提取资源特征, 对资源进行准确的描述, 方便数据库的检索和使用。由于艺术资源包含很多富媒体信息, 因此还需要对这些信息进行压缩编码, 而这些工作的进行, 不仅需要计算机专业人士, 也需要艺术专业人士。比如艺术资源, 由艺术家本身制作的资源素材, 具有其他行业人员所无法比拟的优势。因此, 对艺术院校来说, 艺术资源数据库的建立, 离不开校本资源的搜集、加工和制作。

根据需求可以建立不同使用目的或不同使用人群的专项数据库, 如对创作人员来说, 专业的各类图形图像或音频视频的素材数据库尤为重要。对艺术鉴赏和学习研究来说, 需要各类艺术作品数据库。对艺术理论研究来说, 艺术论文数据库也是必不可少的数字资源。

2.2 虚拟艺术场馆

要欣赏到世界各地的艺术作品, 了解灿若星辰的艺术家, 能亲临实体博物馆或美术馆当然更好。但由于地理位置、时间等限制, 一个人能够亲临的实体场馆有限, 对大多数人来说, 网上虚拟博物馆或美术馆是一个绝好的去处。特别是3D云技术等现代技术的不断发展, 可以逼真地还原各类展览场馆, 虚拟艺术场馆的出现, 不但扩大了受众人群, 也满足了社会多层次多方位的需求, 同时也保护了藏品, 弘扬了文化, 使得馆藏艺术资源得到最大程度上的共享。

2.3 课程资源共享

课程资源是学校教学过程中最重要的资源, 优质课程资源的开发和共享是促进学生全面发展、提高教学质量的重要保障。优秀的课程资源可以是富有学校特色的资源, 也可以是具有通识教育特点的资源。对艺术院校来说, 可以充分开发和利用具有专业特点和艺术特色的课程资源, 并实现其最大程度上的共享。

2.4 网站、电子杂志、社交软件和网络存储等

随着网络应用的范围扩大, 用户增多, 信息的传播方式和存储方式也越来越多。要实现共享的最大化和最便利化, 必须要利用一切可利用资源, 如特色网站、电子杂志、社交软件等等。同时, 由于网络艺术资源的数据量大, 信息呈现的形态多, 要充分利用云计算、云存储等先进网络技术和服务, 通过计算机、手机、移动终端等多种设备, 实现网络数字资源的集中存储和共享。

3 网络艺术资源的检索

信息检索是获取所需信息的途径和技能, 只有学会正确建立检索策略, 准确分析信息的能力, 才能快速、准确、全面地获取有用资源。而网络艺术资源的检索, 较之其他类型资源, 需要掌握更多的方法和技巧。

3.1 充分利用各种网络信息资源检索方法

网络信息资源的检索, 可以根据检索对象采用不同的检索方法, 较为常用的方法有搜索引擎、国际联机信息检索、各类数据库检索 (如专题数据库、综合数据库、光盘数据库等) , 还可利用一些交互式网络工具进行检索, 如电子邮件、远程登录 (Telnet) 、文件传输协议 (FTP) 、新闻组网络系统 (Usenet) 等等。

3.2 多媒体信息检索

网络艺术资源的多媒体特性使得多媒体信息检索对艺术资源的检索尤为重要。多媒体信息检索的方式可以分为基于外部特征的检索和基于内容特征的检索。由于不同的媒体特性, 又分别采用具体的检索方法。

3.2.1 图像检索

早期的图像检索主要是基于文本的图像检索技术, 如可根据图像的标题、创作时间、收藏地点、出版情况等可以用文本描述的关键词来进行检索。基于内容特征的检索则在此基础上对多媒体数据进行内容语义分析, 使之进入到更深的检索层次。

基于内容的图像检索是通过分析图像的具体特征并通过特征匹配来进行检索。这些特征包括图像的色彩、形状、纹理、空间关系等等。为了提高检索准确率, 加快检索速率, 需要一些专门的艺术知识, 如图像的局部特征、图像中的人物故事、所属艺术流派、画面的情感色彩等等。

IBM公司的QBIC系统最早成功应用基于内容的图像检索技术, 它是一个绘画作品查询系统, 支持利用标准图像、草图、扫描图像等进行检索, 也可支持Internet上的图像和动态影像查询。系统包含多个图像数据库, 如旧金山美术博物馆图像数据库、法国文化部图像数据库、美国加州大学戴维斯分校艺术和艺术史图像资料等。

基于内容的图像检索系统还有MIT的Photob o ok、Visual SEEk和Web SEEK等。

3.2.2 视频检索

视频检索是从大量的视频数据中检索到所需的视频片段, 主要采用基于内容的视频检索方法。对视频数据进行的处理主要有视频结构的分析、视频数据的自动索引和视频聚类。检索则通常需要经过多次匹配、反馈等逐步求精的过程。视频检索主要有基于关键帧检索和基于运动的检索。

但由于视频包含了丰富的信息, 即便是同一段视频, 同样的内容也可被不同的人应用在不同的地方。因此, 视频的检索与具体应用密切相关, 检索系统在定义和实现上受到相应的限制。视频检索系统的建立就不仅仅是计算机的技术问题, 也涉及到与视频内容相关的专业知识和实际应用的问题。

3.2.3 音频检索

音频检索除了可以采用关键字检索外, 如检索音乐的题名、作者、主题等等, 也可根据音乐的旋律等来进行检索。基于内容的音频检索是从广泛的音频数据中提取特征信息进行分类和检索。如根据音频的特征值 (如声强、能量、带宽等) 进行检索、示例匹配检索等等。

4 结语

大量的网络艺术资源给人们带来了便利, 但要更好地利用这些资源则对建设者和使用者提出了更高的要求, 这种要求是信息时代的要求, 也是艺术专业发展的要求, 只有认识到资源共享和检索的重要性, 才能够更多更好地建设和使用这些信息。对网络艺术资源的共享和检索的研究还有很长的路要走, 它值得计算机技术人员和艺术工作者共同探索和尝试。

参考文献

[1]刘俊熙, 等.计算机信息检索 (第二版) [M].北京:中国铁道出版社.2009.

[2]褚宁琳.现代网络与美术信息检索[J].美术与设计.2002 (02) .

大数据时代信息资源的检索方法 第7篇

广义上的文献信息就是指:以文字、图形、符号、音频、视频等方式记录在各种载体上的知识和信息资源。检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程[1]。

早在没有网络的时候,图书馆一直作为重要的知识传播方式存在。通过书目的检索和寻找,虽然信息量远不如现在的网络承载量,但也相对节省了信息选择的时间和精力。

1掌握检索信息重要性

期刊的检索方式总结为以下几个方面:第一,检索词必须与检索项匹配。例如,检索词是人名,检索项应选作者;检索词是机构,检索项应选单位等。其次,使用两个以上检索词必须选择逻辑关系,“并且”表示两个条件均满足;“或者”表示两者任一即可;“不包含”表示排除该特点。第二,学科检索途径是利用专辑导航功能,从专业的角度检索论文,是一种辅助的检索途径。学科途径的优点是查全率高,缺点是检索步骤偏多。第三,数字图书馆等资源优缺点并存。优点是信息涵盖范围广,领域宽,检索速度快。缺点是观看体验不如纸质书。

2合理利用网络资源,达到较好的检索效果

第一,学会判断信息的来源。学习判断信息是否来自权威以及是否具有稳定性。例如,来源于科研机构或报纸等的信息,可信度比一般网站的信息要更加可靠。第二,巧妙使用关键字搜索技巧。在做科研时,如果涉及其他语言的信息,会对研究者造成很大的不便。谷歌语言工具可提供单词、段落、文章90多种语言的互译。可直接输入需要访问的外国网址,此时的目标网页可以译成中文页面。例如:左栏输入原始语种“http://网址”,在右栏选择目标语种。第三,对于教师来讲,备课资源的寻找会耗费到很大的精力。例如:教育部“爱课程”资源共享课、Me Te L教学资源平台、国家精品课程平台等,主要收录多国名校的教学资源,包含各种音频、视频资料[2]。第四,对于一些数据的检索,可以依托一些国家数据网站。国研网提供的数据属于研究数据,虽然大部分是收费数据,但对信息经过了深度加工。

文献信息检索的重要意义。例如:美国在实施“阿波罗登月计划”中,对阿波罗飞船的燃料箱进行压力实验时,发现甲醇会引起钛应力腐蚀,为此投资了数百万美元来研究解决这一问题。事后查明,早在10多年前就有人研究出来了,该方法非常简单,只需要在甲醇中加入2%的水即可,检索这篇文献的时间是10多分钟[3]。可以说文献检索的作用非常大,它可以避免重复研究、节省研究人员的时间、提供获取新知识的捷径等。

3信息检索的思想观念应与时俱进

在互联网还没有普及的时候,主要是通过检索工具书手工进行检索。随着信息技术的发展,我们的学习、工作和生活的环境都发生了变化,现在已进入移动互联时代,人们通过手机、平板电脑等便携设备可以随时随地上网。信息检索也在不断发生变革,通过计算机和网络进行信息检索已成为目前主要的检索手段。我们也应该顺势而为,要了解当前互联网上有哪些常用学术资源信息、数据库和工具软件,以及这些数据库和软件的使用方法,否则信息检索的能力就会止步不前。中国知网和维普网的搜索特点、提供资料的侧重领域都有所不同。很多人有多年在网上收集信息的经验,但许多时候只知道用百度与谷歌,即使是常用的百度,也有许多新功能没有用到,因此,在信息检索时要注意以下几点:

首先,在进行信息检索前要能够全面地掌握有关的必要信息,增强决策的科学性。掌握一定量的必要信息,是进行搜索的首要条件,也是进行正确决策必不可少的前提条件。科学的决策,源于对信息资料的充分了解与认识,信息检索是获取信息的重要途径。因此,信息检索会使个人的决策建立在科学基础之上,大大增加了决策的科学性,减少了决策的盲目性。其次,要努力获取所需的全部信息。掌握常用中文数据库检索、网络搜索引擎的高级检索方法,电子图书的检索与利用,国内外硕、博士学位论文的检索与全文获取、网络免费学术资源的检索与利用,多媒体学术资源及其使用等方面的知识。熟练掌握信息检索的技术和方法,拥有信息的鉴别利用的能力。信息素质的提高,可增强信息意识,熟悉检索技巧,有利于科学研究工作的顺利开展。再次,锻炼撰写论文的能力。信息检索是获取知识的有效途径,学会运用信息检索的基本技能是学习和科研的一项基本功,因为在撰写科研论文的时候需要专业基础知识和科学最前沿的信息,而所需要写作的这些知识都分布在图书馆的图书和数据库里面,要想充分地利用现有的数据库文献,必须学会运用检索工具,比如,Web of Science核心数据库的检索与利用、中外文电子期刊全文数据库检索与利用、国内外学位论文的检索与原文获取、多媒体学术资源及其使用,撰写论文虽然与个人的基本学术素质和学习态度有着十分密切的关系,但也要求重视最新信息的收集、充分利用图书馆的资源[1]。

4常用几种检索工具的简要总结

第一,维普期刊服务平台是国内最早开发的中文期刊数据库,收罗面广,功能齐全,专功期刊,包含的期刊种类比知网多,平台比知网便宜。

第二,读秀学术搜索是一个知识搜索平台,最大的特点是知识搜索。一般搜索到的书很少能几本同时看。读秀平台上将一本图书打碎,以章节为单位,想看某一内容,能同时检索到好几本书相关的内容。可单独查内容、讲座、电子书等信息点。这个对老师编书编教材时非常有用。缺点是查到的内容比较旧。标准公文通过百度找不到,使用读秀可以找到过去的一些文件。学位论文、学术论文就比不上维普。对于个人用户来说,还有费用问题,普通的只能免费读15页,使用图书馆文献传递,只能传递50页,并且还有时间限制。

第三,数字图书馆。一是超星数字图书馆是国内第一个数字图书馆,它没有自己的数据库,都是链接的,类似于百度,分类标准是按内容种类进行分类;二是国家图书馆,电子书覆盖了新中国成立以来所有电子书的80%以上,报纸覆盖100%的报业集团,提供了各大类大部分重要工具书,覆盖绝大多地方综合年鉴和行业年鉴,艺术图片覆盖了各艺术领域。

第四,专业检索窗口。如:大雅相似度检测工具,可提供300~10 000字的免费检索,还提供了相关知识点可视化服务,从而实现以图显示出知识点的关联性。

第五,大众检索工具:百度与谷歌。以百度为例进行介绍:可支持多种媒体,没有正规的文献数据库,只能解决简单的搜索需求,查不到政府出版物与文献。这种检索工具虽然是万事通,但搞研究可能借鉴的东西很少。上面有许多实用的功能值得去使用,如:地图,百度学术,百度云、百度阅读等。百度阅读:一般都是旧书,没版权的书;百度云:多功能的网络存储器;百度预测:如流行病高发区是大数据的应用案例;百度视频:可以观测动物园实时情况;此外,还支持以图搜图,手写输入等功能。

5百度信息检索技巧使用结果对比

学术方面检索使用较多的是中国知网、维普网等,检索技巧也相差无几。下面仅就百度搜索检索的高级技巧,简述使用。

第一,不同运算符输入搜索结果的对比。在输入框输入“百度空格谷歌”时,大家可以对照最前面的搜索结果;而输入“百度|谷歌”时,大家可以对照最前面的搜索结果;再输入“百度-谷歌”时,大家可以对照最前面的搜索结果。因此,可以看到运算符不同,带来的结果显然是不一样的。

第二,限定词的使用搜索结果对比。Site:搜索范围限定在特定站点中,例如在输入框中输入:暴风影音site:www.skycn.com,大家可以对照结果;Intitle:搜索范围限定在网页标题,例如输入“世界历史intitle美国”,可以对照搜索结果;Inurl:搜索范围限定在url链接中,例如输入“photoshop视频教程inurl:video”,可以对照搜索结果;Filetype:搜索范围限定在指定文档格式中,例如输入“photoshop使用技巧filetype:doc”;+包含特定查询词,输入“阿甘正传+qvod”,大家可以对照搜索结果;-不含特定查询词,输入“阿甘正传-qvod”,大家可以对照结果。百度搜索中,一些主要的搜索高级技巧,非常实用,不同的结果显而易见。

为了提高检索效率,应学会使用常用的运算符与限定符,如:与运算:使用“空格”,A B实现A、B条件交集功能;或运算:使用“|”,A|B实现A+B功能;非运算:使用“-”,A-B-C实现去除功能;限定符:site搜索范围限定在特定站点中,intitle搜索范围限定在指定的网页标题中,inurl:搜索范围限定在URL链接中,filetype:搜索范围限定在指定文档格式中。

信息检索从表面看是一种技术,但从内涵上看,可以帮助我们通过分类、对比、总结,起到大数据的作用,便于我们对发展的趋势做出正确的判断。同时,掌握良好的信息检索习惯及方法,便于我们在信息量爆炸式增长的时代,提高检索的质量和速率[2]。信息检索,还可以帮助我们站在前人的肩膀上,以前人的科研成果为基础,结合自己的兴趣和优势,发挥自己的强项,提高科研水平和能力,并且能够有效地避险学术上的抄袭现象发生,尊重别人的知识劳动成果,维护良好的科研氛围。

我国信息检索的发展相对国外还有一定的差距,数据库的数量虽多,但是高质量、高水平的学术成果数量较少,因此,为了能够便于提高我国信息检索的有效性及真实性,需要我们每一个用户的共同努力。不断提高自己的学术水平,有效地撰写和提供高水平高质量的学术成果,不断地完善信息检索的内容建设。

6高质量检索能力是提高信息运用能力的基础

只会在百度上查找自己想要知道的问题,而且选的关键字的正确率不高,这是大多数学生甚至老师都出现的问题。信息检索是查找信息的方法和手段,它能使人们在浩如烟海的信息海洋中迅速正确全面地查找所需信息。在实际检索过程中,仅需一个检索词就能满足检索要求的情况并不很多。通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂问题的要求。对于文献信息检索的方法,最重要的是关键词的选择,即检索词和检索策略的选择。检索词选得精确,不仅可以节省时间,提高检索速度,而且可以大大提高检索结果的质量,更容易找到自己所需数据或文献资料。如果不懂得高质量的信息检索的方法,不能提高信息检索的准确性和有效性,不仅不能体现信息检索的工具的价值,并且我们在信息检索上所花费的时间也没有收到相应的回报。只有当你具备高质量的信息检索能力,才谈得上信息运用能力[3]。

7信息检索能力的培养需要在大量的实践中完成

理论和实践相结合的道理,在信息检索能力的培养中一样适用。学习了很多的信息检索的方法,不能合理区分和运用这些方法并达到熟练的程度,仍然不能说自己具备信息检索的能力。因此,这就需要我们在实践中大量地进行训练,针对自己所要搜集信息特征的不同,在不同的数据库当中,通过初级检索到高级检索的运用,不断地筛选出自己需要的信息。通过这种长期的训练,总结出一些规律和特征,提高自己的信息检索能力。

8信息素养是信息检索能力培养的终极目标

信息素养涉及各方面的知识,是一个特殊的、涵盖面很广的能力,它包含人文、技术、法律等诸多因素。信息检索能力更加强调对信息的收集和使用技能。而信息素养的重点是意识、内容、传播、分析以及评价。它是一种了解、搜集、评估和利用信息的知识结构,既需要通过熟练的信息检索这一硬件,还需要软件与人,其中信息素养也暗含人对待信息的心理状态、情感与意识,三个要素组成一个整体,三个要素之间必须十分协调配合,才能充分发挥信息系统的效能,达到预期目标。

总之,信息检索能力的培养和信息素养的养成是一个漫长的过程,特别是在海量数据检索的今天,提高检索能力实现精准搜索已成为当今图书馆职员与广大师生不可缺少的重要技能。

摘要:文献检索是指根据学习和工作的需要获取文献的过程。生活信息大爆炸的当今社会,如何收集、获取、选择、利用信息已经成为提升个人素质和竞争力的一个有力标准。

关键词:大数据,信息资源,检索方法

参考文献

[1]张大勇.论网络环境下高校图书馆工作人员的素质[J].才智,2016(7):15.

[2]覃丽金,吉家凡,唐朝胜.基于查新档案利用的学科服务实践研究——以海南大学为例[J].图书情报工作,2016(6):20.

服务资源检索 第8篇

民航突发事件主要是指发生在民航领域内的各种突发事件。民航突发事件发生时,民航应急决策人员需要快速检索和调度相应的民航应急资源,有效组织应急救援,保障生命财产安全[1]。民航应急资源信息通常存储在数据库中,民航突发事件发生时,民航应急决策人员需检索数据库中的民航应急资源信息并对其处理,作出应急决策。目前,这些常基于传统的关键词检索技术实现,并对于整合、发挥各救援部门的合理作用,提高应急救援工作水平发挥了积极作用。然而,传统信息检索技术只采用语法匹配访问数据库,因此存在着高匹配、低精度,低匹配、无匹配等问题,导致检索的查全率和查准率往往都不太令人满意。这些问题会干扰民航应急决策人员作出应急决策和制定应急处置方案,对决策效率与质量产生不利影响。

语义检索是一种基于明确的、形式化定义的语义信息而进行的匹配查询内容的搜索技术[2]。基于本体的语义检索可以有效提高检索的查全率,同时也可以改善查准率。文献[3]提出一种基于本体的关系数据库检索方法,用于经济领域论文的检索。文献[4]以产品信息检索为例,研究了产品信息检索系统框架以及语义相似度算法,提出了一个基于本体的产品信息检索模型;文献[5]以玉米种植领域为例,提出了基于领域本体的语义标注方法以及用户查询处理和查询推荐算法,设计了一个面向玉米种植领域的语义检索系统;文献[6]以电子学习资源领域为例,提出了一种基于领域本体的电子学习资源库检索模型。在以上领域,语义检索方法对于提高信息检索的查全率和查准率取得很好的效果,因此,将基于本体的语义检索技术引入民航应急资源信息的检索,以解决传统的信息检索技术存在的问题。

1 语义检索方法

1.1 问题分析

在民航机场的应急管理中,用户通过输入一个或者多个关键词,希望检索得到包含所有或者尽量多的关键词的民航应急资源信息。民航应急资源主要由应急部门信息、应急设备信息、存放地点等各类信息构成,存储在数据库中。假设数据库中包含了c个元组t1,t2,…,tc,元组与元组之间通过元组之间主码—外码关系连接,构成一个数据图,因此,检索的结果是这个图中的一个包含了用户输入关键词的元组连接图。

定义1查询请求Question由一组关键词k1,k2,…,km组成,表示为Q(k1,k2,…,km)。

定义2检索结果Answer由一组元组t1,t2,…,tn组成,表示为A(t1,t2,…,tn),A满足以下条件:(1)含有至少一个Q中的关键词;(2)t1,t2,…,tn通过主码—外码关系连接成为一棵元组连接图。

本文定义3类关键词:(1):;(2):;(3):?。其中为词语,是关系操作符,可以是“=、≤、≥、<或>”,只能为数字。“:”之前的,用来匹配领域本体中的概念或者属性,用于限制查询的范围,“:”之后的关键词为要检索的内容。第1类关键词作为文本信息的查询条件;第2类关键词作为数字属性的查询条件;第3类关键词作为查询的目标,输入的一段查询语言可以出现多个第1类或第2类关键词,但有且只有一个第3类关键词。

如用户输入多个关键词如:{设备:泡沫车,地点:东丽区,设备≥3,单位:?},检索结果如图1所示,包括五个元组t1,t2,t3,t4,t5,图中的每个方块代表了一个元组中的属性,U用于标识应急部门,R用于标识应急资源,G用于标识地点信息,五个元组分布在不同的表中,通过数据库的主码—外码关系连接,构成了一个元组连接图,元组连接图涵盖了输入所有的关键词,其中U0001是元组t1的主码,元组t2,t4的外码,元组t1,t2,t4,通过U0001连接起来,同理,元组t2,t3通过主码R0002,元组t4,t5通过主码G0001连接起来。

1.2 框架的提出

本文提出一个基于领域本体的语义检索框架,包括下面四个层次:用户接口层、信息检索层、语义层和数据层。如图2所示。

其中,用户接口层包括用户界面模块,用于与用户进行人机交互;信息检索层包括查询解析模块,查询扩展模块、查询生成模块、检索引擎模块、检索结果排序模块,根据用户输入的查询请求,进行信息查询,并对检索结果进行排序;语义层,存放领域本体及相关配置文件,配置文件包括词语—本体元素映射文件和本体—数据库元素映射文件;其四,数据层,数据以表的形式存放在数据库中,作为查询的数据源。各个功能模块详细设计如下:

(1)人机交互模块该模块提供给用户输入查询请求,浏览检索结果的功能。

(2)查询解析模块该模块基于词语—本体元素配置文件对用户输入请求进行解析,解析成多个关键词的形式化的表示,提供给查询扩展模块进行扩展和提供给查询生成模块。

(3)查询扩展模块该模块基于领域本体,对原查询请求进行处理,提取关键词在领域中语义信息,把与原查询请求语义相关联的检索词添加到原查询,扩展原查询请求。

(4)查询生成模块该模块合并查询解析和查询扩展模块提供的查询请求,基于本体—数据库元素映射文件,生成相应的SQL语句。

(5)检索引擎模块调用查询生成模块生成的SQL语句,对数据层的关系数据库进行检索,再把得到检索结果提交给结果排序模块处理。

(6)检索结果排序模块对检索引擎返回检索结果,根据检索到的结果与检索请求的相关度大小按照从大到小排序,再将排序后的结果交付给用户。

1.3 语义检索流程

利用Java语言搭建语义检索框架,实现框架中模块的基本功能以及模块之间的交互。利用惠普研究所开发的jena包[7]所提供的API来访问并获取本体信息。对于语义检索框架,其语义检索流程如图3所示。

(1)用户输入的查询请求Q(k1,k2,…,kn),ki为用户输入的关键词。

(2)查询解析模块基于词语—本体元素配置文件对用户输入的查询请求进行解析,把匹配上本体概念的关键词提交给查询扩展模块,无法匹配上的关键词提交给查询生成模块。

(3)查询扩展模块基于领域本体,计算本体中其他的概念和提交上的概念的语义相似度,把语义相似度高的概念作为新的检索词,把处理后的关键词提交给查询生成模块。

(4)查询生成模块合并查询解析模块和查询扩展模块分别提交的关键词集合,生成相应关系数据库查询语句,然后提交检索引擎模块。

(5)检索引擎根据得到查询语句,对关键词进行检索,得到检索结果,返回给检索结果排序模块。

(6)检索结果排序模块对检索结果进行排序,把排序后的结果返回给用户。

2 语义检索方法的实现

2.1 民航应急管理领域本体

民航突发事件应急管理领域本体定义为一个四元组:O=(C,AC,R,I)。其中O为领域本体,C为概念的集合,AC为概念属性的集合,R为关系的集合,I是实例的集合。

(1)概念。概念是对民航突发事件领域中个体的抽象,可以指任何事物,如描述、功能、行为、策略和推理过程等,本体中概念通常构成一个分类层次。如果概念ci是概念集合中C的一个概念,记作ci∈C。

(2)概念属性。如果ci∈C,那么ci的属性可以表示为AC(ci)。概念间存在差异是因为概念间存在着不同的属性,对应着不同的个体集合。因此,概念的属性集合又被称为概念的内涵,它所对应的个体集合为概念的外延。

(3)关系。关系代表了在民航突发事件领域本体中概念之间的交互作用。形式上定义为n维笛卡儿乘积的子集:R:c1×c2×…×cn,c1,c2,…,cn∈C。当关系rk∈R为二元关系,它的定义域为ci,值域为cj,ci,cj∈C,则表示为rk(ci,cj)。

(4)实例。实例是指属于某概念类的基本元素,即某概念类所指的具体实体。它对应着本体中的一个概念或多个概念,具有概念描述的属性和具体的属性值。如果实例ik∈C,概念ci∈C,ik是的实例ci,则表示C(ik,ci)。

本文使用Protégé4.0作为本体开发工具构建的民航突发事件应急管理领域本体[8],包括应急预案体系、应急案例、救援方案、应急部门、应急设备、事件过程、事件等级、事件类型等主要概念,用于描述民航突发事件应急管理领域公认的概念、实例、概念与概念之间、实例与实例之间的关系。图4为民航突发事件应急管理领域本体中的片段,描述了应急资源的相关概念及其语义关系。

基于这些概念、语义信息和这些概念下的实例,可以提取出用户输入的关键词在本领域的语义信息,通过添加与用户输入关键词同义、相似的词语作为额外的检索词,使检索由传统的基于关键词的检索变成语义的基于内容的检索。

2.2 语义相似度计算

利用本体的层次结构计算本体中概念的语义相似度,参照文献[9,10]通过计算概念之间的语义距离,获取它们的语义相似度。

定义3层次记为H(S,≤)。假设H(S,≤)是一个偏序集,H(S,≤)是一个哈斯图,即一个五环图,其结点集为S,并且有一个最小边集E,当且仅当,u→pv(表示在这个哈斯图中从u到v存在一条路径)。

两个概念之间的距离可以通过它们在概念层次中的相对位置来决定。由于不同层次之间抽象跨度的不均匀性,给概念层次中的每个结点c赋予一个计算距离用的值,并成为里程,它可以通过以下公式得到[2]:

其中k为大于1的因子,用来指明mileage值沿着概念的层次向下方向递减的速度。在具体实现中,取k=2。lev(c)表示结点c在概念层次中的深度:对于本体概念的顶层结点root来说,lev(root)=0,向下逐层递增1。

对于概念层次中的任意两个概念c1、c2,它们都具有一个最近公共父类[9]ccp(c1,c2))。如果概念c1是c2的父类,或者概念c2是c1的父类,那么ccp(c1,c2)分别为c1或c2。概念c1与c2之间的距离是由它们分别与最近公共父类的mileage差值之间的和来确定:

根据式(1)至式(3)计算出概念c1与c2之间的语义距离后,它们之间的相似度Sim(c1,c2)为:

通过计算概念与概念之间的相似度,查询扩展模块把与原查询请求语义相似度高的概念作为新的检索词添加到原查询,扩展原查询请求。

2.3 检索结果排序

对于检索结果中的元组连接图A(t1,t2,…,tn)排序的规则是:A如果包含用户输入的关键词越多,那么该图与检索请求的相关度越大,则得分越高,故排在返回结果的前面;当关键词的个数相同时,A包含的元组的权值和越大,并且所含的元组个数越少,那么A与检索请求的相关度越大,则得分越高,故排在返回结果的前面。A采用如下评分公式:

其中,A是查询结果Answer的缩写,是构成查询结果的一个元组连接图;sizeof(A)是A中所含的元组的个数,它与查询结果的得分成反比;n是查询请求Q中的关键词个数;n'是A中所含关键词的数量;α是个常数,为了提高元组的个数对查询结果排序的影响程度,α使用一个较大的值,这里取值为10,用来保证含关键词的查询结果的得分更高;Score(ti)是元组ti所包含关键词的评分和。

3 实验与分析

为了评估语义检索在民航应急资源中检索的效率,以天津机场及协作单位的民航机场应急资源数据构建的数据库作为查询,共有417个元组,建立了语义检索和基于关键词的检索实验环境。使用信息检索常用的两个基本评价指标———查全率和查准率评价语义检索的性能。假设查询请求为Q,R代表在数据库中与Q的相关的元组连接图集合,A代表着返回的查询结果,Rα代表着返回的查询结果中与Q相关的元组连接图集合。

查全率:用来衡量检索成功度的指标,即检索出的相关元组连接图与数据库全部相关的元组连接图的比值:

查准率:用来衡量检索信号噪声比的指标,即检索的相关元组连接图与返回的结果的比值:

其中,分别为Rα、R、A的数量值。

为了使实验尽可能做到全面而准备,选取常用的9个关键词组作为检索信息进行检索实验,这9个检索词涵盖了应急资源中常用的应急部门、应急设备、地点三个方面,如表1所示。

利用以上的测试所用检索词组得到了两种检索方式的查全率和查准率对比图,如图5、图6所示。使用语义检索方法的查全率相对使用关键词检索方法的查全率要高。这是因为通过基于领域本体的查询扩展可以得到更多的相关概念作为检索词,提高了检索的查全率。

语义检索方法的平均查准率要比基于关键词检索方法的平均检索率要高,语义检索方法的查准率曲线更平缓,原因有以下几点:(1)查询扩展通过增加语义相关的检索词,提高检索查全率的同时,也增加了检索的噪声,因此,在只有文本属性作为关键词的情况下,语义检索的查准率有时比不上传统检索的查准率,如编号5、7;(2)当关键词中包含了数字属性时,关键词检索因为不能完全匹配上所有关键词,很多只满足数字属性的元组被检索出来,造成查准率偏低,如编号1、3、4;(3)当关键词中包含了数字属性时,语义检索可以通过查询扩展获得更多文本属性的关键词,来约束检索,因此,在包含数字属性检索中语义检索的查准率要比传统检索的查准率表现更好。

总体来说,相比传统的基于关键词的检索方法,语义检索方法的查全率和查准率都有所提高,检索性能有所提升。

4 结语

本文针对现有检索技术在民航应急资源信息检索中存在着高匹配、低精度,低匹配、无匹配等问题,提出一个基于领域本体的语义检索框架,给出了语义检索的流程。围绕领域本体,语义相似度计算及检索结果排序等关键技术进行了探讨,最后搭建了实验平台。实验表明语义检索在查全率、查准率方面的检索效果都有所提高,更加符合用户的需求。

参考文献

[1]杨太东,张积洪.机场运行指挥[M].北京:中国民航出版社,2008.

[2]朱海平,基于概念图匹配的语义检索[D].上海:上海交通大学,2006.

[3]王珊,张俊,彭朝晖,等.基于本体的关系数据库语义检索[J].计算机科学与探索,2007(1):59 78.

[4]Gao Huiying,Zhao Jinghua,Yin Qiuju,et al.Ontology-based enterprise information retrieval model[C]//Proceedings of 2009 IEEE International Conference on Grey Systems and Intelligent Services.Washington,DC:IEEE Computer Society,2009:1326 1330.

[5]Qi Hong,Zhang Liangliang,Gao Ying.Semantic retrieval system based on corn ontology[C]//Proceedings of the 5th International Conference on Frontier of Computer Science and Technology.Washington,DC:IEEE Computer Society,2010:116 121.

[6]张泸寅,张铭洋,李鑫.基于领域本体的电子学习资源库模型[J].计算机应用,2012,32(1):191 195.

[7]jena[EB/OL].http://sourceforge.net/projects/jena/files/Jena/Jena-2.6.4/.

[8]王红,杨璇,王静,等.基于本体的民航应急决策知识表达与推理方法研究[J].计算机工程与科学,2011,33(4):129 133.

[9]石静,肖航宇,熊前兴.基于SWRL规则与本体相似度的语义检索模型研究[J].计算机应用与软件,2010,27(7):236-238,273.

公开网络信息资源的组织与检索探析 第9篇

关键词:网络信息,资源组织与检索

在互联网高速发展的今天, 网络的广泛应用, 使人们获取信息越来越容易。但是, 一方面信息的大量增加, 出现了信息爆炸;另一方面, 碎片化信息越聚越多。这种情况的出现, 大大增强了人们获得所需有用信息的难度, 同时也给网络信息的组织与检索提出了前所未有的挑战。面对日益频繁的网络信息资源, 进一步熟悉其内涵和特点, 采取更有效的措施, 成为当前网络信息资源组织与管理越来越重要的一项工作。

1 网络信息资源概述

从广义来说, 网络信息资源的范围比较广阔, 本文这里特指在公开网络环境下可以利用的所有信息资源, 比如网站上一些信息。与其他类型信息资源相比, 网络信息资源具有以下主要特点: (1) 表现形式多样性。 (2) 存取方式广泛性。 (3) 存在形态无序性与不稳定性。 (4) 信息值差异性。其来源分散, 难以控制, 内容庞杂, 几乎涵盖了各个领域, 表现形式丰富多样, 除结构化信息外, 还有非结构化或半结构化。根据不同的标准, 还可以将网络信息资源划分为不同的类型。例如根据内容范围可划分为商业信息、政府信息、教育信息、学术信息、娱乐信息等。根据内容类型可划分为文本、图像、音频、视频等。随着网络的深入发展, 未来网络信息资源也会有更多类型的内容出现。

2 网络信息资源组织方式和检索利用

2.1 网络信息资源主要组织方式

网络信息的组织方式比较丰富, 大致有以下几种方式: (1) 文件方式。主要以文件为单位共享和传输信息, 但是, 随着网络中持续增加的数据量, 以文件组织方式的信息会使网络负荷加大, 导致控制和管理的难度增加, 从而影响信息资源组织效率。 (2) 数据库方式。主要是把所获得的资源按照一定的规则存储起来, 用户可以通过关键词查询到所需要的信息线索, 它能高速处理大量各种类型的信息资源, 尤其是在关系数据库、面向对象数据库中, 不仅能提供用户查询, 还实现了信息的知识关联, 极大地提高了用户对知识需求满意度。但是查询规则的建立比较繁琐, 前期花费时间较多。 (3) 主题树方式。主要通过将所有获得的信息资源, 按照某种事件确定的概念体系结构加以组织, 然后建立主题类目和子类目, 这种方式结构比较清晰、目的性更强、查准率也较高。但对于体系结构的要求比较简单, 所以只能适合建立在专业性或示范性的网络信息资源体系中。 (4) 超媒体方式。主要通过将文字、声音、图像、视频等各种多媒体信息以超文本方式组织起来, 实现高度链接的网络结构, 用户可以在多种信息类型中查询到所需要的信息。这种方式类似于人类的联想记忆结构, 把各种类型的资源有机整合起来, 方便描述和建立各媒体信息之间的语义关系。但是, 多种类型的融合, 使所占空间变大, 这给网站的内容规划与设计增加了工作量。

2.2 网络信息资源的检索

网络信息资源的检索应用在网络环境下, 要想获得信息, 除了要了解网络信息资源的组织方式外, 还要学会检索策略、利用检索工具, 才能更有效地获得自己想要的信息资源。检索策略一般是在分析检索提问的基础上, 根据需要确定检索的数据库、检索的用词, 并明确检索词之间的逻辑关系和查找步骤的科学安排。通常情况下, 网络信息资源检索策略主要有2种实现方式: (1) 一般检索。以浏览的方式, 采用主题法的自然语言进行检索, 它使检索变得更加直接、简单, 这种检索方式通常又被称为“智能检索”。 (2) 高级检索。使用叙词语言进行检索, 如布尔逻辑检索、邻近检索、截词检索、字段限制检索、短语检索等。它提高了用户检索网络信息资源的准确性和时间效率。检索工具。是指用于存储、查找和报销档案信息的系统化文字描述工具, 是目录、索引、指南等统称, 也是检索策略实施的平台。主要方式有3种: (1) 自动搜寻。通过自动搜寻网络资源、自动索引和摘要, 提供检索方法和用户界面等功能。但是其收录信息良莠不齐, 虽然检全率高, 但检准率较低。 (2) 人工分类。通过人工或机器进行搜寻, 使用人工分类制作索引数据库, 可以达到信息质量高、准确性强, 但人工花费时间和工作量都较大。 (3) 混合搜寻。这种方式是多种方式的结合体, 既可以通过类目浏览查询, 也可以输入句子、短语等进行自由查询, 并且它具有自动搜寻与人工分类的2种方式的特点。

3 网络信息资源组织与检索存在问题及对策

3.1 存在的主要问题

当前, 网络信息资源的组织与检索主要面临以下一些问题:一般网站上的信息资源, 在整体组织上还比较混乱, 主要表现在类目划分标准上还不够合理, 对信息资源在同一层次上划分不统一。如一些网站, 在网站内容规划与设计的时候考虑不周全, 导致不能适应不断变化的用户需求等。还有一些网站一个类目下面包含一些不属于它的下一层子类的现象, 这样一来, 导致用户检索时, 出现一些毫不相干的内容。如色情信息、虚假新闻、网络广告等。多数网站动态反映比较多。从一定意义上方便用户及时了解最新变化, 但是一些动态脚本、小程序、插件等, 在一定程度上影响了用户的检索时间。检索结果缺乏准确性, 平均50%的返回信息是无用的。如在百度搜索引擎中, 用户检索一个关键词, 出来相关甚至不相关的信息会成千上万条, 这些信息当中真正发挥对用户作用的有效信息屈指可数。检索失败, 用户得到的有用信息少于20%, 大多数据情况下, 普遍用户检索信息的返回结果并不理想, 甚至有的返回信息为零。

3.2 解决的主要对策

目前, 国际国内的许多专家一致认同对网络信息资源的有效管理和利用, 离不开先进的技术支持, 尤其是网络内容管理系统和智能化的概念检索系统将是提高网络信息组织与检索效率的关键。在此主要介绍网络内容管理系统和智能信息检索系统。

网络内容管理系统是可以协助进行网络内容管理的一种工具或者一套工具的组合, 是提供给组织中懂得技术的成员和不懂得技术的成员创建、编辑、管理和出版内容的工具, 在此过程中还要受到一套规则、过程和工作流程的限制, 以确保管理组织的有效性 (见图1) 。

目前, 国内部分知名中文的Web内容管理系统有北京拓尔思信息技术有限公司开发的TRS内容协作平台、北京泰得互联开发的Turbo CMS、深圳市蓝电科技有限公司开发的Xplus网站内容管理系统、上海网达信息技术有限公司开发的网达内容管理系统、联想集团开发的联想内容管理系统等。虽然在这方面国内取得了一定的成果, 但国内的网络内容管理系统供应商和国外的网络内容管理系统供应商之间还存在着一定的差距, 有待于进一步提高完善。

智能信息检索系统。当前, 国外的检索系统如The telcordia semantic indexing software (简称LSI) , 检索效果比较好, 在实际应用中已经克服了普遍使用以关键词为基础进行的检索的缺点, 并已经应用广泛。但是, 国内现阶段专业人员提高检索效率的主要有6种方式: (1) 利用各种分类表、主题词表、叙词表建立网上信息检索自动索引、在线目录和主题索引。如采用张琪玉教授提出的“分类法主题法一体化”方法, 即编制一种分类号与主题词的双向对应表, 作为网络资源分类、检索的依据。 (2) 建立同义词转换概念空间。通过这种方法建立转换系统对提高信息的查全率和查准率有着非常重要的作用。就是把表示同一概念的词转换为同一等级的代码, 如电脑、计算机统一转化为“计算机”等。 (3) 建立学科领域统一概念。主要是建立专门领域或学科的词典, 可以起到主题过滤的作用。如统一的医学语言系统UMLS数据表。 (4) 建立否定关键词程序。通过准确计算的否定模式来消除不相关。也就是说在实际操作中用户可以消除不想得到的信息, 从而得到真正想要的内容。 (5) 建立和完善信息反馈程序。就是通过设计一个用户信息反馈程序, 在用户进行信息检索时, 可以提高检索效率和用户的满意程度。 (6) 建立个性化过滤系统。这个主要基于用户特别的兴趣偏好, 通过过滤系统实现模仿用户本人, 并选择符合用户需求的信息传送给用户。如利用先进的感知器获得用户个人信息, 再通过使用时间序列分析等预测技术推断用户行为模型。

4 结语

在科技迅速发展的今天, 人们已经置身于网络信息的汪洋大海之中, 唯有不断地对网络信息资源的进行有效组织管理, 才能更好地为用户检索分析提供优质服务。本文总结在网络信息资源组织和检索中常见的一些问题, 所提出的对策是基于网络内容管理系统和检索策略2个方面的知识梳理。如何面对未来网络信息资源组织与检索的新问题, 如何提出有效地解决新办法, 留给了人们广阔的研究和探索空间。

参考文献

[1]戴伟辉.网络内容管理与情报分析[M].北京:商务印书馆, 2009.

[2]徐海燕.互联网信息组织与检索初探[J].图书馆建设, 2003 (4) :78-80.

[3]穆颖丽.网络信息资源的组织与检索[J].图书馆学刊, 2004 (2) :52-53.

[4]邱桂梅.主题语言在网络信息组织与检索中的应用[J].现代情报, 2005 (2) :152-154.

上一篇:政策环境研究下一篇:证券欺诈的法律责任