智能垃圾邮件范文

2024-05-28

智能垃圾邮件范文(精选11篇)

智能垃圾邮件 第1篇

1 垃圾邮件的相关概述

所谓垃圾邮件是一些对邮箱用户本身没有价值的邮件,而且这部分邮件是没有经过邮箱用户同意的,属于“不请自来”的邮件,而且,这类邮件都是带有一定目的性的,这些垃圾邮件可以分为良性和恶性的。其中良性的垃圾邮件主要是以广告信息为主,并不会对邮箱用户的邮箱安全造成影响。而恶性的垃圾邮件,其会威胁邮箱用户的个人信息和的财产安全,恶性的垃圾邮件会给邮箱用户的正常使用造成影响,严重时可能会危及用户的财产安全和信息安全。另外,部分不法分子可以借由垃圾邮件,传播一些不良的信息情况,使得国家利益和人们的生活环境造成影响。而且,由于垃圾邮件的传播者想要大面积散播垃圾信息,经常采用多台计算机同时巨量发送的方式攻击服务器,这也就导致服务器的带宽损失增加,严重影响邮件的正常工作,制约邮箱用户的稳定应用。

为此,需要重视垃圾邮件的过滤工作,加强对垃圾邮件的控制工作。针对智能垃圾邮件过滤系统进行建设和完善,发挥其功能性,实现对垃圾邮件的拦截和处理,为人们提供一个健康、积极的网络环境。

2 智能垃圾邮件过滤系统

2.1 垃圾邮件过滤技术

垃圾邮件过滤技术是实现垃圾邮件过滤系统的关键内容,为此,需要强化对垃圾邮件过滤技术的分析和解读,发挥技术的功能性,使得垃圾邮件过滤系统可以得到有效开发。

(1)基于黑名单和白名单的垃圾邮件过滤技术。邮箱用户可以根据邮箱发件人的基本情况,对发件人进行处理,将不良发件人拉入黑名单中,并对黑名单和白名单的地址进行分析,并将这一地址所发送的信息进行进一步隔离和分析,从而完成对垃圾邮件的过滤。

(2)基于规则过滤的的垃圾邮件过滤。结合邮件的实际情况,设置一些规则,完成对不同类型垃圾邮件过滤,相比黑白名单过滤,规则过滤的覆盖面积更广,实现对部分垃圾邮件的处理。

(3)基于内容的垃圾邮件过滤。将实际垃圾邮件过滤技术应用过程汇总,基于内容过滤的垃圾邮件过滤技术,可以有效对内容进行分析,实现对垃圾邮件的过滤,其功能性明显优于黑白名单的垃圾邮件过滤和规则的邮件过滤。垃圾邮件智能分析、过滤系统框图如图1所示:

2.2 智能邮件过滤的分析与设计

智能邮件组主要是由四个模块子系统构成的,各类不同的子系统,实现不同的功能,从而使得智能邮件过滤系统的功能性可以得到全面发挥。智能邮件过滤系统主要是由知识库子系统、邮件导入子系统和关键词获取子系统以及简约子系统等子系统构成。

2.2.1 邮件导入子系统

邮件导入子系统是完成邮件进入到系统中,其中主要是对外界数据库中的信息进行分析,并实现对信息数据库的信息读入,并完成对信息的量化和转化,使其成为系统能够读取的数据信息,将其存入到系统内部的数据库中,为信息的内容和关键词获取提供基础保障。

2.2.2 知识库子系统

知识库子系统主要负责存储信息,其主要是由专家知识库、领域规则库和结果规则库等部分构成,不同部分承担不同的功能。专家知识库主要对领域专家的知识进行存储,领域规则库可以实现对分类知识的基本概念、数学和实体等知识的存储。

2.2.3 关键词获取子系统

关键词获取子系统是基于内容智能垃圾邮件过滤技术的子系统,主要是对导入数据库的数据信息进行分析,实现对关键词的获取,并结合基于空间的向量模型,实现对邮件的预处理,配合属性约简子系统,完成对信息内容的获取。

2.2.4 属性约简子系统

属性约简子系统主要完成对关键词集合的二次过滤,实现对关键词的有效筛选,并结合邮件内部关键词的基本情况对其进行智能判断,如果关键词中出现一些敏感词汇,或是无意义的相关关键词,由系统实现对邮件的智能化判断,从而使得邮件的过滤系统功能性可以得到全面发挥,避免各类垃圾邮件对用户产生影响。

3 智能垃圾邮件过滤系统实现

智能垃圾邮件过滤系统的基本目的是先对大量邮件进行快速判断和分析,实现对垃圾邮件的隔离和控制,避免垃圾邮件对用户的正常邮箱应用造成影响,保证用户的交流和信息传递质量。

在实际的智能垃圾邮件过滤系统构建的过程中,需要重视智能化垃圾邮件过滤系统的学习能力,使得系统可以完成各类学习能力,从而完成对垃圾邮件的有效分析,并保障系统的测试内容可以随着新的内容不断填入而不断优化和更新,从而使得垃圾邮件可以得到有效控制。客户端程序垃圾过滤的界面如图2所示:

(1)数据载入。需要根据垃圾邮件过滤系统的基本运行情况,结合系统序列图,从而使得智能垃圾邮件可以得到有效输入和识别,从而使得数据可以顺利载入,完成对智能垃圾邮件过滤系统的控制,为邮件的测试提供参考。

(2)测试。针对数据载入的情况,需要科学展开数据的测试工作,测试界面也就是系统的判断界面。借由测试界面,可以有效对邮件的性质进行分析,从而完成对邮件的判断,从而判断邮件是垃圾邮件和非垃圾邮件,进而智能化实现对垃圾邮件的过滤和控制,减少垃圾邮件对用户生活造成的影响。

4 结语

智能垃圾邮件过滤系统可以有效根据用户的基本邮件情况,完成对用户垃圾信息的判断,结合智能垃圾邮件过滤系统,可以实现基于邮件内容的邮件判断工作,从而完成对邮件性质的判断,如果邮件的性质属于无用或是传播无意义信息等,由系统完成对其的隔离,从而完成对垃圾邮件的处理和控制,保障网络用户的邮箱安全使用,避免钓鱼等情况发生,推动用户网络体验水平的提升,减少垃圾邮箱用户造成的影响。

参考文献

[1]李玉峰.基于Spam Assassin的中文垃圾邮件过滤系统的设计与实现[J].内蒙古农业大学学报(自然科学版),2012(3):245-249.

[2]汪洁,朱军.基于Linux的中文垃圾邮件过滤系统设计与实现[J].安徽农业大学学报,2011(2):309-314.

[3]奚建荣.基于综合过滤技术的邮件过滤终端研究[J].计算机应用与软件,2011(6):186-188.

智能垃圾邮件 第2篇

信息产业部副部长奚国华今天在北京宣布启动为时一年的“阳光绿色网络工程”,并同时启动集中治理垃圾电子邮件活动,公布了垃圾邮件举报电话(010)12321,举报邮箱abuse@anti-spam.cn和举报网站www.anti-spam.cn, 信息产业部已于2月20日出台了《互联网电子邮件服务管理办法》,3月30日起正式施行。

信息产业部电信管理局副局长王秀军介绍说,目前我国每年电子邮件数量已达到500多亿封,但其中60%左右都是垃圾邮件,我国已是国际上垃圾邮件的重灾区和受害国。《互联网电子邮件服务管理办法》对内容提供、接入服务等增值电信服务业务提供商都做出要求,通过市场准入、ip地址登记制度等手段来加强电子邮件的服务管理。

信息产业部政策法规司副司长李国斌说,办法规定了对垃圾邮件的处罚措施,主要从垃圾邮件的情节而非数量上考虑处罚的轻重,越是社会危害性高、对电信管理秩序破坏严重的垃圾邮件处罚也越高,

但他表示,由于我国尚无更高层次的法律依据,《互联网电子邮件服务管理办法》只能按照部门规章的层级,依法规定了警告、3万元以下罚款等罚则。

据了解,《互联网电子邮件服务管理办法》近期将在信息产业部 上全文公布。除“清除垃圾电子信息”外,信息产业部的“阳光绿色网络工程”还将围绕治理不良短信、强化网络安全、打击非法网络服务等主题展开。

垃圾邮件如何管 第3篇

去年底中国互联网协会公布了去年第三次反垃圾邮件调查报告,结果显示垃圾邮件首次出现反弹迹象。为此信息产业部近日正式对外公布,我国将于3月30日起施行《互联网电子邮件服务管理办法》(以下简称《管理办法》)。

《管理办法》主要从如下三个方面进行限制:一是针对广告型电子邮件发送方,明确规定对于广告类电子邮件必须征得接收者同意之后,才能向其发送;二是针对电子邮件服务提供商,首次实行许可准入管理,并且邮件服务器IP地址要进行登记,除此之外还必须关闭匿名转发功能;三是消除中间代理,即获得电子邮件服务准入的厂商,不得为没有获得许可或者备案的组织和个人,提供电子邮件接入服务。

《管理办法》的出台是一项净化网络的举措,但具体落实中可能出现的问题需要我们进一步思考;在实践中不断摸索,寻示解决办法。

《管理办法》第一条限制要求广告型电子邮件发送方必须事先取得接收者明确同意才能发送。当前大部分用户都是免费申请电子邮件服务,申请时提供的资料绝大部分都是虚假资料,事先的沟通还是要通过电子邮件,这样原来只受到广告型电子邮件的骚扰现在可能会受到沟通类邮件与广告类邮件双重骚扰,广告型电子邮件发送方可以不停地发送沟通类邮件,直到对方不堪打扰被迫同意为止,因为这样做广告类电子邮件发送方并不违规。

再来看第二条限制。这一条可操作性看起来比较强,因为国内电子邮件服务提供商就那么有限的几家,但其实垃圾邮件制造者可以从国外的电子服务提供商处申请服务;对于第三条限制,如果申请国外的电子邮件提供商为代理向国内用户发邮件从技术上说也是可行的。而违规后的罚款处理,找到罚款对象也是件耗时耗力的事情。

反垃圾邮件技术 第4篇

1 常用反垃圾邮件技术

只要未经用户允许, 擅自发送到用户邮箱的电子邮件都可被称为垃圾邮件。除去常见的广告等垃圾信息外, 垃圾邮件还包括病毒、木马等恶意信息, 危害巨大。当前常用的反垃圾邮件技术有:过滤技术和验证技术。

1.1 过滤技术

过滤技术是当今使用最频繁的反垃圾邮件技术, 根据过滤处理的内容成分可分为地址过滤技术和内容过滤技术两大类。

1.1.1 地址过滤技术

地址过滤技术对邮件的发送地址进行分析来判断邮件是否为垃圾邮件, 黑名单技术是应用地址过滤的一个范例。这是最早被使用的一种反垃圾邮件技术, 凡是黑名单上的地址均会被拒绝连接, 如今的邮件服务器都采用了这项技术。黑名单中的垃圾邮件地址名单可以通过权威机构发布的黑名单进行配置。利用该技术处理邮件时, 查看邮件的来源地址, 如果此地址被包含在黑名单中, 则该邮件会被过滤掉, 不能继续传播。这项技术可以控制垃圾邮件的发送量, 压制了垃圾邮件的发展。

实时黑名单 (Realtime Blackhole List, RBL) 技术是当前使用最广泛的黑名单技术, 它通过对黑名单服务器的查询判断, 来过滤掉垃圾邮件。黑名单服务器以域名服务器的形式来提供动态的、实时的IP地址;也可将此服务器的数据复制到本地的域名服务器, 这样就可直接查询本地服务器来进行垃圾邮件的鉴定。通常黑名单是由国际上比较有信誉的组织提供和维护的, 所以该名单是可信任的。由此可见, 实时黑名单技术不需要用户自己设置黑名单, 并且能及时、自动的更新黑名单, 能提高检验的准确性、降低误报率。

黑名单技术简单、快速, 容易实现;但也存在一定的局限性。因为服务器中的黑名单不可能包含所有的垃圾邮件源头地址, 所以存在漏报的情况;同时, 整个判断全部依赖名单, 如果黑名单过于强势, 则存在一定的误报率, 使用户丢失正常的邮件。

1.1.2 内容过滤技术

基于内容的过滤技术是对邮件的内容特征或者其他特征 (如群发特征) 进行判别来实现, 主要分为基于规则匹配和基于概率统计两类[1]。

基于规则的过滤技术是对垃圾邮件的某些特征进行分析提取, 根据这些特征制定出一系列的规则, 形成规则库;检测时将邮件的特征与规则库里的规则进行对比匹配, 来判别该邮件是否为垃圾邮件。此技术的关键在于规则库的建立与维护。关键词过滤技术是基于规则过滤的一个典型应用, 它通过一个单词列表来辨别垃圾邮件。单词列表由与垃圾邮件相关的若干关键词组成, 是垃圾邮件特征的集合;建立一个庞大的单词列表是关键词过滤技术的核心。基于规则过滤技术的局限性在于过滤的能力全部依赖规则库, 存在漏报与误报, 并且占用的系统资源会比较多。

基于统计的过滤技术, 比基于规则的过滤技术复杂和智能, 因为规则是由统计方法自动生成的[2]。目前常用的基于概率统计的方法有SVM (支持向量机) [3,4]、k-NN (k-Nearst Neighbor) 、Winnow方法、贝叶斯 (Bayesian) 方法等, 其中应用最广泛的是贝叶斯方法[5]。贝叶斯方法是对电子邮件的邮件头和邮件体中出现的分词进行概率统计, 进而全面判断此邮件是否为垃圾邮件的一种技术, 其工作流程包括两个阶段:学习阶段和判别阶段。学习阶段通过训练邮件样本, 分析特征, 从中提取出特征字符串, 可以获得每个特征字符串在垃圾邮件和正常邮件中的出现概率;判别阶段将整个邮件内容进行分词, 将这些分词出现的概率与前面学习阶段获得的概率按贝叶斯算法进行计算分析, 来判别出垃圾邮件与正常邮件。与前面基于规则的过滤方法不同, 贝叶斯方法是基于邮件的全部内容作出判断, 而不是仅仅依靠是否有特殊词语的出现, 所以准确性得以提升。而且, 在检测过程当中, 贝叶斯技术通过对新的垃圾邮件与正常邮件样本进行学习, 使它能够自动应对新型的垃圾邮件。从目前的分类效果来看, 这种方法以其运算速度快、易于实现等特点被广泛应用[6]。

1.1.3 过滤技术缺点

现行的很多反垃圾处理系统就是多种过滤技术的综合使用。过滤器通过他们的误报和漏报来分等级, 基于过滤技术的反垃圾邮件系统需要解决三个问题:漏报、误报和复查。

漏报, 即垃圾邮件可能被绕过。垃圾邮件发送者会根据过滤规则修改垃圾邮件的内容, 以此逃避检测。多数过滤技术的数据库一般最多只能保持几周的有效期, 所以, 过滤数据库必须不断更新。

误报, 即将正常邮件判断为垃圾邮件, 这是反垃圾邮件技术最不能犯的错误。比如, 基于地址过滤技术时, 某些正常服务器会被包含在不负责任的组织发布的黑名单中而被屏蔽掉。但是, 如果要减少误报, 就有可能造成漏报。

复查, 是为了避免误报而存在的问题。在一般邮件系统中, 对于垃圾邮件的处理不是删除而是将其放置到垃圾箱中。这样, 并不能彻底解决垃圾邮件, 仍然需要用户去察看垃圾邮件。

虽然过滤技术存在一定的局限性, 它仍然是当前使用最广泛的反垃圾邮件技术。

1.2 验证技术

简单邮件传输协议 (Simple Mail Transfer Protocol, SMTP) 是电子邮件的主要支持协议, 因为简单, 所以缺乏身份认证, 邮件很容易被伪造邮件头或隐藏源头来躲避检测。如果能够识别被伪造的邮件, 就可以避免大量程度的垃圾邮件的产生。验证技术就是通过对发送方进行检验的技术手段, 主要包含反向查询技术、DKIM、Sender ID和Fai UCE四种技术。

反向查询技术是通过对邮件发送地址进行验证来判断邮件是否被伪造。反向邮件交换 (RMX) 、发送者许可 (SPF) 和标明邮件协议 (DMP) 是反向查询的应用范例。这些技术查询的原理类似, 即将发送者的域名和IP地址进行比较验证。反向查询技术就是定义反向的MX (邮件交换记录, 列出了邮件服务器) 纪录, 根据此记录 (RMX) 将发信人的IP地址反向解析, 确定其真实域名。如果获得的域名与邮件头的指定域名不一致, 即可判断此邮件是伪造的。反向查询方法的局限性在于:只能查询来自固定IP地址的邮件。如果域名分配的是动态IP地址的时候, 反向查询就无法进行。

DKIM (Domain Keys Identified Mail) 技术是基于雅虎的Domain Keys验证技术和思科的Internet Identified Mail, 通过密钥来验证。Sender ID技术通过对邮件的来源进行检查验证来区分垃圾邮件, 它需要发件方和接收方的共同支持。Fair UCE技术由IBM开发, 通过分析邮件域名来辨别垃圾邮件。

验证技术通过对发信方进行身份验证来判别邮件是否为垃圾邮件, 但此技术不够灵活, 存在一定的局限性。例如, 当遇到垃圾邮件制造者利用免费注册的合法域名来发送垃圾邮件, 或者利用有漏洞的合法邮件服务器发送垃圾邮件这类情况发生时, 验证查询技术就失效了。

2 新兴反垃圾邮件技术

垃圾邮件与反垃圾邮件技术, 是一个不停斗争的过程, 每一种反垃圾邮件新技术都会导致能与之对抗的新的垃圾邮件的出现。同时, 任何一种反垃圾技术都不可能解决所有的垃圾邮件问题, 所以反垃圾邮件技术必将不停发展。目前新兴的反垃圾邮件技术有:反图像垃圾邮件技术、行为识别技术和专门针对中文垃圾邮件的反中文垃圾邮件过滤技术。

2.1 反图像垃圾邮件技术

图像垃圾邮件是将垃圾信息通过技术手段嵌入到图像文件中并发送的垃圾邮件。把垃圾邮件以图片的形式发送, 可隐蔽掉文本信息, 躲避内容过滤。如今, 对于图片垃圾邮件比较有效的技术手段是OCR识别技术和指纹识别技术[7]。

OCR (Optical Character Recognition) 识别技术也可以算一种过滤技术, 它先将图片中的图像信息转换成文本信息, 再将文本的特征提取出来, 进行比对识别, 就可过滤掉垃圾邮件。OCR是光学识别技术, 通过算法模式识别, 将图片中的文字转变为文本字符。识别过程中, 图片质量、识别的方法、学习及测试的样本等因素均可影响到识别转换。所以, 图片转换为字符不可能完全正确;降低OCR的误报率是本技术的关键问题。

指纹识别技术采用数字指纹算法, 能够用一个数字DNA来标记一封具有相似内容的邮件[7]。此技术提取邮件中的数字DNA (指纹信息) , 并将其保存到数据库中。利用垃圾邮件大量发送的特点, 当检测到含有相同DNA的邮件同时大量发送时, 就可以判定此邮件是垃圾邮件。对于图片邮件, 无论图片的背景、部分文字怎么变换, 只要其指纹特性并未改变, 它的数字DNA就确定不变。所以, 此技术与邮件的内容格式无关, 具有一定的自适应性。对于指纹识别技术, 关键在于庞大指纹数据库的建立与维护。

2.2 行为识别技术

由垃圾邮件和正常邮件的通信行为对比得知, 正确判别垃圾邮件的关键问题在于对邮件发送过程中的通信信息进行正确的识别[8]。对邮件的发送行为进行分析, 可以区分出垃圾邮件与正常邮件, 在垃圾邮件发送之前就拒绝其发送请求, 将其扼杀在萌芽阶段。

电子邮件的邮件头中包含了邮件投递过程中的各种参数, 邮件的行为可以从邮件头中提取。行为识别先收集邮件获得邮件数据集合, 从集合中提取邮件头信息并从中确定垃圾邮件的行为特征, 然后对行为特征进行向量化处理, 对这些向量化的行为特征进行数据挖掘, 从而建立行为识别模型[9]。这样, 就可以通过行为识别模型对垃圾邮件进行处理。基于行为识别技术开发的反垃圾邮件系统, 不需要处理邮件正文, 只对邮件头进行处理, 极大提高了系统的处理速度。行为识别技术在会话连接阶段就进行识别和拦截, 无需后续工作, 节约了网络资源。并且, 因为邮件头信息有固定的格式, 不会频繁改变, 这样可以保证识别效果持久。由此可见, 行为识别技术是垃圾邮件处理技术的发展方向之一。

2.3 中文垃圾邮件过滤技术

因为中文分词和特征选取与英语完全不同, 所以对于中文垃圾邮件, 采用通常的过滤技术存在一定难度。英文的分词由空格字符完成, 而中文的词与词之间没有分词符号, 是通过人的理解来划分的, 并且中文语义理解还处于研究初期。所以, 贝叶斯过滤技术不能直接应用于中文环境。对此, 可以对中文以词为单位进行分词, 再提取特征建立样本库, 实现基于贝叶斯的中文垃圾邮件过滤系统[10]。发展到现在, 又提出了基于短语的贝叶斯中文垃圾邮件过滤方法[11], 短语是由几个单词按一定的语序和语法规则组成的序列, 包含更多的信息, 可以有效弥补以词为单位的欠缺。经过实验统计, 基于短语过滤技术的准确率可以达到比较大的提升。

3 结语

垃圾邮件是一个全球性的问题, 已成为一种普遍的社会现象。通过上文对反垃圾邮件技术的介绍可知, 每种技术都有其局限性, 所以成熟的反垃圾邮件系统不会只支持一种反垃圾技术, 而应是多种反垃圾技术的联合应用。随着各种新型垃圾邮件的出现, 反垃圾邮件技术必将不停发展。

参考文献

[1]王斌, 潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报, 2005, 19 (5) :1-10.

[2]衣治安, 毛岩.垃圾邮件过滤技术概述[J].长江大学学报:自然科学版, 2010, 7 (1) :256-258.

[3]H Drucker, D Wu, VN Vapnik.Support Vector Machines for Spam Categorization[J].IEEE Transactions on Neural Networks, 1999, 10 (5) :1048-1054.

[4]向昌盛, 周子英.支持向量分类机的参数选择方法研究[J].计算机技术与发展, 2010, 20 (9) :94-97.

[5]金彩琴, 裘国永.对垃圾邮件过滤技术的问题研究[J].计算机技术与发展, 2011, 21 (9) :225-228.

[6]张铭锋, 李云春, 李巍.垃圾邮件过滤的贝叶斯方法综述[J].计算机应用研究, 2005 (8) :14-19.

[7]郑冬冬, 宋顺林.图片垃圾邮件过滤技术综述[J].计算机工程与设计, 2010, 31 (1) :41-44.

[8]T Oda, T White.Developing an Immunity to Spam[A]//In Proceedings of the Genetic and Evolutionary Computation Conference (GECCO 2003) [C].2003.

[9]李新洁, 张新有.垃圾邮件行为识别技术研究[J].计算机技术与发展, 2011, 21 (10) :20-27.

[10]黄志刚.基于贝叶斯的中文垃圾邮件过滤系统的设计与实现[D].成都:成都电子科技大学, 2007.

过滤垃圾邮件小窍门 第5篇

内置于Office 2003中的最新版本的Microsoft Outlook和Eudora都包含了非常先进的反垃圾邮件功能,但是一些比较传统的电子邮件客户端软件,例如Outlook Express就需要附加一些功能更加强大的反垃圾邮件软件。

目前可供用户选择的反垃圾邮件软件种类很多,售价高低不等,当然也有不少免费软件。有些软件可以内置到您的电子邮件客户端程序中,有的则是单独的软件。所有的反垃圾邮件软件都包含了全自动和半自动模式下的垃圾过滤技术。您可以阅读《Natural-Born Spam Killers》 (find.pcworld.com/38753)一文来了解阻挡垃圾邮件相关技术的概况,在find.pcworld.com/38754中您可以找到目前可供下载的反垃圾邮件软件的列表。

每一款反垃圾邮件软件都各有特色,但是绝大多数都有类似的核心功能。以下列举了一些达到最佳阻挡效果的设置过程,可能您使用的软件并没有涵盖所有这些功能。用来作为演示范本的是Symantec推出的Norton AntiSpam 2004和Sunbelt Software推出的IHateSpam (售价20美元, www.sunbelt-software.com)。由于文章篇幅有限,我们无法将每一种软件的具体细节一一列出,您最好仔细阅读软件手册和在线帮助。

设定阻挡级别:

绝大多数反垃圾邮件软件都允许用户自己设定阻挡过滤级别。设定级别需要一定的技巧,因为它本身要兼顾安全和方便,级别设置不当也会给用户带来一些麻烦,例如级别设置过高可能会阻挡一些正常的合法邮件,而低级别则可能带来一些垃圾邮件的“漏网之鱼”。

记住您的朋友:

如果您是初次使用反垃圾邮件软件,您首先要注意的一件事情就是千万别让过滤器把您想收到的重要邮件给屏蔽了。绝大多数软件都可以直接访问您的电子邮件客户端软件中的地址簿,您可以将其中的一些地址设置为“朋友”,这样过滤器就不会阻挡发送自这些地址的电子邮件。对于那些没有在“地址簿”中出现的“朋友”您也不必担心,您可以在检查被阻挡邮件时将其中的一些发送地址标记为“朋友”。

不妨试试您的ISP的反垃圾邮件功能:

很多互联网接入服务提供商都可以提供免费的或者低价的内置垃圾邮件过滤器。有些提供商是默认提供该功能,您可以访问您的ISP的主页,从中了解相关细节。如果您的ISP没有集成反垃圾邮件软件,或者您不打算使用该软件,您可以根据自己的需要安装喜欢的垃圾邮件过滤软件。基于服务器的反垃圾邮件软件的安装设置过程和您的ISP提供的软件类似,安装本地的反垃圾邮件软件也是大同小异。

打开特殊功能:

例如在IhateSpam中,您可以阻挡那些使用外语字符集书写的邮件,Norton AntiSpam可以分析每一封发出去的电子邮件,从而提高阻挡垃圾邮件的准确性。您可以在软件的帮助手册和在线帮助文档中一一了解这些附加功能,如果觉得哪些功能有用就不妨试试。

设置和维护黑名单:

一般情况下,垃圾邮件发送者会经常改变其电子邮件地址,所以您也必须要时常注意更新您的“黑名单”。这项功能有时也被称作是阻挡列表或恶意发送人列表,其中包含了一些您很讨厌的电子邮件地址或整个域名。很多软件都提供“黑名单”的在线升级功能,您只要定期访问他们的服务器进行更新,就可以获得最新的“黑名单”列表,当然,您也可以在任何时候自己向“黑名单”中添加地址。

多一点耐心:

这是所有步骤中最为困难的一项。您不要指望您安装的反垃圾邮件软件在安装后的当天就能百分之一百地如您所愿发挥作用。您得做好心理准备来应付一些具有“黑白颠倒”性质的问题,例如合法邮件被标记为垃圾邮件,垃圾邮件则大摇大摆地进入了您的收件箱。随着您一步一步地按照我们前面提到的步骤调整过滤设置,您的软件也能够逐渐在适应过程中提高过滤命中率。尽管有些厂商出于营销的考虑宣称自己的反垃圾邮件软件可以做到“百发百中”,事实上没有一个软件能够真正做到在任何时候都能阻挡所有的垃圾邮件,但是只要设置合理,这些软件还是能帮我们解决很多问题。

反垃圾邮件技术分析 第6篇

关键词:电子邮件,垃圾邮件,黑名单,白名单,身份认证,安全审计

1. 引言

通过因特网收发的邮件叫做电子邮件。因特网提供的最常见的网络服务之一就是电子邮件服务。电子邮件的快速、高效、方便以及廉价,是普通邮件所不能比拟的。垃圾邮件是指强制发送到用户电子信箱中的、未经用户同意或请求的、对用户没有意义的电子邮件。这些垃圾邮件一般包含广告、病毒、色情资料等内容,一般具有批量发送等特征,对用户的工作、生活有害无益。

2. 垃圾邮件的概念

垃圾邮件一般分为以下几类:未经收件人请求或同意,而强行发送到收件人电子邮箱中的有宣传作用的垃圾电子邮件;收件用户无法拒绝接收的电子邮件;隐藏发件用户地址、身份等信息的垃圾电子邮件;含有假冒的发件人、信息源、路由等信息的垃圾电子邮件;含有色情资料、病毒软件、反动内容等有害信息的垃圾电子邮件。

垃圾电子邮件有非常大的危害。垃圾电子邮件泛滥成灾,占用大量网络带宽,使因特网不堪重负,还传播病毒,成为黑客利用的工具,危害系统和网络安全。垃圾邮件不仅侵犯收件人的隐私权,而且妖言惑众,骗人钱财,传播色情等内容,对现实社会造成极大的危害。在经济利益的驱动下,垃圾邮件在很长一段时间内还会继续存在。反垃圾邮件工作是一项艰巨而长期的任务。

3. 过滤技术

一种直接而简单的垃圾电子邮件处理技术是过滤技术,通过过滤垃圾电子邮件的内容或来源来拦截垃圾电子邮件。这种过滤技术有广泛的应用,大部分反垃圾电子邮件的产品都支持过滤技术。为了提高过滤效果,反垃圾邮件产品往往结合使用多种过滤技术。

(1)黑名单技术。这种技术将已知垃圾邮件制造者的IP地址、主机域名或邮箱地址,存入一个黑名单数据库。邮件服务器或邮件客户端以这个黑名单数据库为依据,拒绝接收垃圾邮件制造者的垃圾邮件。当垃圾电子邮件的制造者快速地改变其电子邮箱地址时,黑名单过滤技术的整体过滤效力就会大幅下降。

实时黑名单技术需要权威机构建立并实时更新一个含有黑名单的数据库服务器,这个服务器上包含的黑名单数据被及时传输到本地的DNS服务器,供本地的电子邮件服务器或邮件客户端访问使用。国内的黑名单数据库服务器由中国的反垃圾电子邮件联盟提供使用。目前主流的电子邮件服务器都支持这种实时的黑名单过滤技术,如Postfix、Qmail、Sendmail、IMail等。

(2)白名单技术。这种技术将合法的、可信赖的邮件发送者的IP地址、主机域名或邮箱地址,存入一个白名单数据库。邮件服务器或邮件客户端以这个白名单数据库为依据,只接收白名单中包含的发送邮件者发过来的电子邮件。

白名单过滤技术提供了两种过滤方式:一种方式是直接拒绝接收白名单中没有包含的发送用户发来的电子邮件;另一种方式是邮件系统给发送邮件者发送一个质询邮件,要求他回复,以证实确实有发送邮件者这个人,通过验证后,邮件发送者被加入白名单。

白名单技术也有缺点。白名单的更新和维护难以达到实时。接收方只有将发送方加入白名单,才能顺利接收发送方发来的电子邮件。如果发送方改变了邮箱地址,那么接收方必须将新地址加入白名单,才能顺利接收发送方发来的电子邮件。白名单技术会产生大量质询邮件,要求垃圾电子邮件制造者回复,这些起质询作用的邮件也会成为垃圾电子邮件。白名单过滤技术会把因各种具体原因而无法响应质询的正常发信用户发送的电子邮件阻断。

(3)基于规则过滤垃圾电子邮件的技术。这种过滤技术将垃圾电子邮件的典型特征抽取出来,构成规则或模式的集合。这种技术以规则或模式为依据,来判定一封电子邮件是否为垃圾邮件。例如,对包含某些关键词的邮件进行加分,当分数累积到一定程度时,就认为该邮件是垃圾邮件,将其过滤掉。

基于规则的过滤技术的优点明显。规则可以共享,推广性很强。一套规则可以供多个邮件服务器使用。我国科研和教育计算机网下面的紧急响应组,已经推出了一个中文垃圾邮件过滤规则集,被广泛使用。

基于规则的过滤技术也有缺点。规则更新速度慢、时效性差。例如,标题包含“免费培训”的邮件一般是垃圾邮件,但过滤器可能会因为标题字符间存在空格而未将该邮件过滤掉。另外,过滤器的过滤规则越完备,其运行速度就会越慢。

(4)贝叶斯过滤垃圾邮件技术。这种过滤技术通过特定的过滤算法,对海量垃圾电子邮件和非垃圾电子邮件进行分析统计,从而得到各种各样的关键词在两类电子邮件中出现的概率统计模型。这种过滤技术利用建立起来的概率统计模型,来估算一封电子邮件是垃圾电子邮件的概率,判断准确、全面。

贝叶斯过滤技术的优点很多。这种过滤技术具有自学习过滤能力,能够分辨垃圾电子邮件与非垃圾电子邮件之间的区别,并自动地用于以后的邮件检测中。在接收到几百封电子邮件后,贝叶斯过滤器软件就可以自动地识别出各种垃圾电子邮件。这种技术由于自适应性好、自学习能力好,所以得到广泛应用。

(5)HASH技术。这种技术也叫哈希技术、散列技术,可以把任意长度的输入内容,通过散列算法,变换成较短的固定长度的输出,该输出被称为散列值。利用这种技术,将邮件的内容、发件人等作为参数,可以求得邮件的散列值。如果大量邮件的散列值相同,那么就可以怀疑有人在大批量发送垃圾邮件。

(6)指纹识别技术。这种技术需要在各种垃圾邮件中进行抽样,并对邮件样本进行计算,得出该样本的特征码,也就是所谓的“指纹”,将指纹存入指纹库。如果一封邮件的特征与指纹库中的某个指纹相互符合,那么我们就可以断定这封电子邮件是垃圾邮件。这种识别技术需要经常维护相应的指纹库。

(7)反向DNS域名核查技术。垃圾邮件制造者在发送邮件时,随意捏造一个虚假域名非常容易。反向DNS域名核查,是指接收邮件服务器在接收到电子信件时,要对电子邮件发送者的域名进行检查,以验证发送者的信息是否真实,防止发送者利用虚假域名进行欺骗。

4. 基于SMTP的改进技术

(1)反向查询技术。SMTP是指简单邮件传输协议,是在因特网中用于邮件服务器之间交换邮件的协议。SMTP在设计时没有考虑安全问题,许多垃圾邮件工具借助该协议的漏洞隐藏或伪造邮件发送者等信息。针对垃圾邮件问题,需要对SMTP进行技术改进。如果我们能够解决垃圾电子邮件的发送地址伪造问题,我们就可以防止垃圾电子邮件的产生。为此,接收邮件服务器可以要求验证电子邮件的发送地址。反向查询邮件技术可以检查电子邮件发送方的域名和IP地址是否对应,如果不对应,就可以判定该邮件为垃圾邮件。

(2)Sender ID检查技术。该技术需要邮件发送方和接收方共同支持,能够辨别出电子信件的确切地址来源,因此能够大幅度减少垃圾电子邮件的地址欺骗行为。邮件发送方在发送邮件时要按照技术规程留下其真实身份记录,接收电子邮件的服务器要利用Sender ID检查技术对发件用户的身份进行核查验证,以决定是否接收该邮件。

(3)Fair UCE技术。该技术在邮件发送方IP地址、域名、E-mail地址间建立一种联系,以确定电子邮件的合法性。该技术会核查电子邮件发送用户的地址是否有过不良记录,是否曾经被接收方加入黑名单中,从而决定采取什么样的措施来处理该邮件。这种技术还可以通过追查源头来找到垃圾电子邮件的发送源,并将这些垃圾电子邮件返回给发送源,以此来打击垃圾电子邮件的发送者。

(4)DKIM技术。该技术利用公开密钥密码体制对电子邮件进行数字签名。用户发送邮件时,发信服务器会自动利用私钥给电子邮件(包括发送方域名等信息)加密即签名。收信服务器利用公钥解密邮件即验证签名,从而判定电子邮件及发送方信息的真实性。收信服务器确认邮件并非垃圾邮件后,投递到收件人邮箱中。

(5)加密技术。SMTP不支持邮件加密,因此不能保证邮件的安全性。为此,可以扩展SMTP的功能,引入邮件加密技术。邮件加密可以保证邮件的保密性和完整性。要证明发件人的身份,还要对邮件使用数字签名技术。

5. 邮件服务器的安全管理技术

(1)病毒过滤。邮件服务器是收发电子邮件的网络服务器。许多病毒是通过垃圾邮件传播的,因此邮件服务器必须具备垃圾邮件处理功能,能够过滤尽可能多的垃圾邮件。邮件服务器还要具备基本的病毒防御和查杀功能,以抵御大部分网络病毒的攻击。

(2)身份认证。身份认证主要是指对电子邮件发送方的身份进行识别和验证,以防止黑客用非法身份攻击邮件服务器。身份认证还可以保证邮件服务器的各种资源被充分应用到邮件处理过程中,不会造成资源浪费。

(3)安全审计。对电子邮件服务器提供的各种实际应用、各种具体服务及时记录工作情况,做好审计日志,以便在电子邮件服务器出现故障时能够快速找到故障的原因。还要对电子邮件服务器当前正在运行的各种应用和服务进行实时地监察,以便动态地调整电子邮件服务器的参数,保证电子邮件服务器安全运行。

6. 结语

综上所述,各种反垃圾邮件技术各有利弊,在实际应用中,只有把各种技术结合使用,实现优势互补,才能取得良好的效果。如今,网络安全已经成为国际性问题,只有把各种技术手段和各种管理手段相结合,才能最大限度地保证网络安全。

参考文献

[1]Dengguo Feng.Information Security and Cryptology[M].Wuhan,Hubei,China:Hubei Dictionary Press,2006

[2]Aditya Bagchi.Information systems security[M].Guangzhou,Guangdong,China:Guangdong Education Press,2006

[3]CISSP,Harold F.Tipton.Information Security Management Handbook,Fourth Edition,Volume III[M].AUERBACH,2001

办公用户如何应对垃圾邮件 第7篇

什么是垃圾邮件?中国互联网协会在《中国互联网协会反垃圾邮件规范》中作出如下定义:“本规范所称垃圾邮件, 包括下述属性的电子邮件: (一) 收件人事先没有提出要求或者同意接收的广告、电子刊物、各种形式的宣传品等宣传性的电子邮件; (二) 收件人无法拒收的电子邮件; (三) 隐藏发件人身份、地址、标题等信息的电子邮件; (四) 含有虚假的信息源、发件人、路由等信息的电子邮件。”这个描述实际上指出了垃圾邮件的几种典型特征:未经许可而向接收者发送, 内容对于接收者没有价值或内容虚假, 邮件来路不明。如果一封邮件符合以上一种或多种特征, 那么就可以将其认定为垃圾邮件。

垃圾邮件产生的根源并不难理解。电子邮件是一种成本低廉、传递速度极高、传播范围广泛的网络工具, 这些优势使得它成为最为普及的一种网络应用。电子邮件的众多技术优势成为一把双刃剑, 它在发挥积极作用的同时, 也被许多别有用心的人员利用, 成为他们传播非法信息、垃圾信息甚至病毒木马的工具。由于技术原因, 垃圾邮件的追查难度比较大, 取证也比较困难, 客观上纵容了它的泛滥。

几乎每一名邮箱用户都遭遇过垃圾邮件, 中国互联网协会反垃圾邮件中心发布的《2010年第二季度反垃圾邮件调查报告》透露, 中国网民每周收到垃圾邮件的数量为11.8封, 垃圾邮件占比37.1%。可以说, 这是相当令人震惊的数据。

垃圾邮件已经成为网络公害, 主要体现为以下几方面:首先, 对于整个网络而言, 垃圾邮件占用大量带宽, 耗费网络资源;其次, 对于电子邮箱用户而言, 垃圾邮件占用邮箱空间, 迫使用户浪费大量时间和精力进行处理;第三, 垃圾邮件传播有害信息甚至病毒和木马程序, 对用户的信息安全造成极大的危害。对于办公用户来说, 第三种威胁显然更具杀伤力, 轻则秘密信息外泄, 重则会造成不可挽回的经济损失。

面对挥之不去的垃圾邮件的严重干扰, 办公用户应当采取哪些方法将垃圾邮件的负面影响降到最低程度呢?笔者特提出如下应对措施供职场用户参考。

选择具有较强垃圾邮件过滤技术的邮箱服务商

使用电子邮箱遇到的第一个问题就是对服务商的选择, 应对垃圾邮件的第一步也要从选择服务商开始。网络上的电子邮箱服务商比较多, 技术水平参差不齐。选择服务商需要考虑的主要因素有品牌信誉、市场知名度、服务器地域、技术实力、服务稳定性等几方面, 除此之外还要重点考察一下服务商反垃圾邮件的技术能力。目前, 国内比较著名的大型服务商都有比较成熟的反垃圾邮件的技术实力, 甚至能够识别邮件中图片是否为垃圾信息。用户选择服务商时, 应当认真了解其服务的技术水准, 从中选出可信任的服务商。

确定服务商后, 下一个需要决定的问题就是是否采用免费邮箱。服务商提供的邮箱服务基本上可以分为两大类, 即免费服务和收费服务。免费邮箱无需用户支出费用, 但是可能会存在安全性与稳定性方面的隐患, 而且对于垃圾邮件的过滤存在不足, 有些服务商主动向用户免费邮箱中发送一些广告, 或者将广告内容植入到邮件之中, 会不同程度地干扰用户。收费邮箱需要用户定期支付费用, 能够提供安全稳定的服务, 而且能够屏蔽绝大部分特征十分明显的群发垃圾邮件。本文建议办公用户尽可能选择收费邮箱服务, 除了安全方面的优势外, 收费邮箱能够极大地降低垃圾邮件的“光临”频率, 免除用户额外的时间和精力。

构思独特的用户名称

在注册邮箱时, 必须认真构思用户名称, 这也是防范垃圾邮件的一个有效前提。用户名位于@符号前面, 是构成邮箱地址必不可少的部分。垃圾邮件正是依据邮箱地址来发的, 垃圾邮件制造者往往会选择比较常见的用户名称构成邮箱地址, 例如用户名称为若干个6或8的邮箱收到垃圾邮件的概率要大得多。因此, 用户一定要认真构思独特的用户名, 避免采用那些常见的数字、英文单词或汉语拼音, 可以考虑采用英文和数字的组合方式。

保护邮箱“隐私”

从某种意义上讲, 电子邮箱地址也是单位或个人的隐私, 因此应当采取适当措施予以保护。

保护邮箱隐私的首要措施是不随意公开邮箱地址。用户在日常工作和生活中必须注意, 不要向不信任的对象透漏邮箱地址, 例如应当避免随意分发带有邮箱地址的名片, 在各种可能被非法利用的表格上填写邮箱地址。在利用网络时, 不要随意订阅非正规网站的电子杂志, 也不要将邮箱地址随意地公布在论坛、博客或其他网页上。

当必需在网络上公开邮箱时, 可以用“以桃代李”的方法, 将地址中的@符号用#符号代替, 这是保护邮箱隐私的第二种重要方法。之所以这样做, 是因为别有用心的分子会使用一种特殊的软件来搜集邮箱地址, 这种软件能够对网页进行自动扫描分析, 根据是否带有@符号来判断邮箱地址, 当@被#代替后就干扰了软件判断, 从而避免邮箱地址被搜索。采用这个保护方法时, 必须同时向页面访问者说明“发信时请将#改换成@”, 否则可能给他人带来误解, 使得对方无法正确发送邮件。

自主设置过滤功能

虽然邮箱服务商能够提供垃圾邮件的过滤功能, 但未必能够满足用户多样化的需求。其实, 用户也可以根据自己所面临的垃圾邮件的具体情况, 来自主设置过滤功能, 从而让垃圾邮件没有空子可钻。

设置过滤功能的方法就是启用黑名单。所谓的“黑名单”, 其实就是一个邮箱地址列表, 垃圾邮件就是从这些地址发出的。启用黑名单之后, 邮箱系统自动根据这个列表对所收到的邮件进行筛选, 凡是列表中邮箱发来的邮件就会被自动拒收。用户可以根据自己的意愿和需要, 将任何邮箱地址列入黑名单, 以后系统就会自动拒收来自该邮箱的邮件。编辑黑名单, 只需要启动网络浏览器 (如IE) 登陆邮箱后, 在“设置”选项中找到相应的功能进行操作即可, 不同服务商邮箱的具体操作方法可能存在差异。

用户如果使用邮箱客户端软件来处理邮件, 那么可以通过设置客户端软件的过滤器来实现对垃圾邮件的屏蔽。所谓的“过滤器”, 其实就是列举出一系列条件特征, 软件会根据这些特征去判断邮件是否为垃圾邮件。常用的条件特征包括来源、主题、长度等, 例如不想收到关于产品营销的广告邮件, 那么就可以设置过滤主题中的字符为“广告 (或××产品) ”。由于客户端软件的种类比较多, 不同软件的具体设置方法也有所不同, 用户可以查阅相关资料, 此处不再赘述。

谨慎处理收到的垃圾邮件

尽管采取了以上多种措施, 但难免百密一疏, 如果收到了垃圾邮件, 一定要谨慎处理。处理的总原则是“三不一举报”, 即不看、不回、不存和举报。

收到垃圾邮件或来路不明的邮件, 要克服好奇心理, 绝不打开此类邮件, 防止木马病毒感染本地计算机。尤其是当邮件的主题是具有诱惑性或政治性词汇时, 更要避免打开邮件。

不要回复垃圾邮件。收到垃圾邮件后, 不少用户感到不快, 气愤之下可能会回复邮件对发件人进行谴责。其实大可不必这样做, 因为回复垃圾邮件相当于告知对方收件地址是真实的, 无意中帮助对方验证了地址的有效性。这里需要提醒的是, 如果邮箱采用了自动回复功能, 那么每次收到垃圾邮件也会自动回复, 作用就和人工回复是相同的, 使垃圾邮件发送者变本加厉地向该邮箱发送邮件, 这或许就是某些邮箱总是收到垃圾邮件的原因之一。

收到垃圾邮件后要立即将其删除, 不可长时间地保存在邮箱中。邮箱中的垃圾邮件如果过多, 就会占用大量的邮箱空间, 当邮箱空间耗尽后就无法正常接收新的邮件了。

收到垃圾邮件后要及时举报。打击垃圾邮件需要每一个电子邮箱用户共同参与, 只有这样才能有效降低垃圾邮件数量。举报垃圾邮件的方法其实非常简单, 最易用的方式就是向服务商举报。大多数服务商在邮件的列表界面、阅读界面都提供了举报链接, 用户直接点击该链接即可向服务商举报, 由服务商对邮件进行分析后, 加入到系统的过滤器数据库中。此外, 也可以向国家互联网管理部门的反垃圾邮件机构举报, 具体方法请查阅相关资料。

垃圾邮件绕发问题探析 第8篇

垃圾邮件可以说是互联网带给人类最具争议性的副产品,它的泛滥已经使整个互联网不堪重负。然而,由于商业驱动,垃圾邮件仍然以不同的形式增长于互联网中。在2007年第四季度反垃圾邮件调查报告中列出,个人邮箱平均每周收到垃圾邮件为16.71封。2007年垃圾邮件给中国造成的损失达到188.4亿人民币[1]。赛门铁克公布的2008年6月垃圾邮件报告指出,垃圾邮件占总邮件数量的80%。垃圾邮件正在以各种形式争取进入到每一个信箱。

随着垃圾邮件的泛滥,反垃圾邮件网关也大量涌现,一些致力于网络服务的企业都部署了反垃圾邮件网关,象网易、HOTMAIL等,使用该类信箱很少会收到垃圾邮件。然而很多高校和企业自己建立了邮件服务器,阻止垃圾邮件的任务就落到了反垃圾邮件网关上。但是事实证明即使架设了反垃圾邮件网关,用户仍然可能会收到相当数量的垃圾邮件。分析垃圾邮件原文后发现,这些信件并没有经过网关的过滤,而是直接发送到邮件服务器的。反垃圾邮件网关的工作原理,是根据网关在DNS中的MX记录的优先级比较高,来先于邮件服务器收取信件,再发送给邮件服务器。而如果垃圾邮件发送者不按照MX纪录来发信,就可以直接发信到邮件服务器,这也就是所谓的邮件绕发问题。

2. 反垃圾邮件网关的接入形式

垃圾邮件如洪水猛兽般的侵袭着我们的邮箱,应运而生的反垃圾邮件网关产品也比比皆是。但是其作用都是对发往邮件服务器的邮件进行过滤识别,根据相应的算法和策略,对认定为垃圾邮件的丢弃,对不能确定其性质的邮件标识别为隔离,对正常的邮件放行,继续送往邮件服务器。其在网络中的安装形式一般有两种。

2.1 网关和邮件服务器共用一个公网IP

图1中,只有一个公网IP,需要使用防火墙的NAT功能将公网IP(202.120.222.1)的25端口映射到网关(192.168.1.2)的25端口。这样外部信件发往test.com域的信件会先发送到邮件网关,再由网关送到邮件服务。这种安装方式不会产生绕发的问题。但是用户在外发送邮件时,网关必须支持SMTP认证。

2.2 网关与邮件服务器均有公网IP

图2中,网关与邮件服务器有独立的公网IP,这种情况在高校比较常见。发往test.com邮件会查看该域的MX记录,按照优先级别,一般都是发往网关(200.120.222.1),由网关再发送给邮件服务器(202.120.222.2)。但是这种情况下会产生垃圾邮件绕发现象。

3. 垃圾邮件绕发产生的原因及解决办法

3.1 IP地址暴露

垃圾邮件发送者通过各种方式获得邮件账号,其中采用自动收集是一种主要方式。垃圾邮件发送者通过程序解析后可能将用户的IP地址缓存,这样垃圾邮件发送者就可以直接向邮件服务器发送邮件。比如图2中,发送者不是解析test.com的MX纪录,而是,通过其它手段得到了邮件服务器的IP地址202.120.222.2,直接将垃圾邮件发往该地址,这样就避开了网关202.12.222.1。

在这种情况下更换邮件服务器的IP地址是一种解决办法。因为IP地址相对域名而言是可以经常更换的,垃圾邮件发送者可能不会经常更新其缓存。但垃圾邮件发送者可能定向的对邮件服务器进行垃圾发送。通过人工分析及端口扫描可以定位邮件服务器,从而对邮件服务器进行定向的攻击,例如进行字典式攻击等,或者仅仅是大量发送垃圾邮件。

3.2 多MX记录同时发送

一般情况下,架设了网关的网络中,其DNS会写有多条MX纪录,而网关在MX纪录中优先级是最高的,而邮件服务器次之。因此有些垃圾邮件发送者为了避免信件全部被网关过滤,会向所有的MX记录发送邮件,这种情况下,邮件服务器就会得不到网关的保护。

在上面的MX纪录中,邮件发送者会向MX为5、10、15的3条MX纪录对应的地址都发送垃圾邮件。这种情况下,解决办法是将指向邮件服务器的MX纪录删除即可。这里就是将优先级为10和15的2条指向邮件服务器的MX纪录删除即可。这样发送者只能在MX纪录中找到一条对应网关的MX纪录,也就是说邮件只能发送给网关。

对于很多有多个子域的邮件系统来说,正确的DNS相关配置是保证邮件系统正常工作的关键。例如,上海理工大学邮件系统有2个域,一个是教师域@usst.edu.cn,一个是学生域@student.usst.edu.cn,对于有子域的情况,可以配置成如下形式。

将教师和学生的MX纪录都指向了反垃圾邮件网关,这样即使垃圾发送者给所有的MX纪录发送邮件,事实上都是发给了网关。实验证明,这种配置形式下,@usst.edu.cn和@student.usst.edu.cn都能够正确的解析MX纪录,并成功的指向网关地址。

3.3 邮件服务器主机名与邮件域名相同

邮件在发送时,首先寻找DNS配置里的MX记录,如果查找MX记录失败,则直接利用A记录收发信。因此就给绕发邮件提供了可能。

下面是用nslookup模拟邮件发送者寻找发信IP地址的过程。

在上例中,set type=all,邮件发送程序得到两条记录。主机记录及MX记录,这里主机的名称与邮件域名都是mail.usst.edu.cn,这种情况下,许多邮件发送程序将直接发送信件到A记录中。也就是会将信件直接发到上例的202.120.222.2这个邮件服务器的地址。为了避免这种情况,应该更改邮件服务器的主机名,使之不与邮件域同名,比如在本例中修改成为mailserver.usst.edu.cn,或者将域的A记录放在MX记录之后。

3.4 使用防火墙进行准入控制

只要邮件服务器存在公网IP,垃圾邮件发送者就可能直接向该IP发送垃圾邮件,因此彻底的解决办法是屏蔽该IP的25端口,使垃圾邮件无法直接发到邮件服务器上。如果在网络入口处有防火墙,可以直接将防火墙的地址映射到反垃圾邮件网关。而如果网关和邮件服务器都有独立的公网IP,则在邮件服务器上要做访问地址限制,多数的邮件系统都是基于unix平台的,下面就介绍一下邮件系统搭建在linux的服务器的准入控制,这里使用系统自带的防火墙软件iptables[2]。

第一句是只允许地址为202.120.222.1的反垃圾邮件网关访问邮件服务器的25端口,第二句允许客户连接110端口收取信件,第三句是为了维护的方便加上ssh的准入。第四句是禁止所有其他的数据包进入,这样就做到了没有经过网关认证的邮件一概丢弃,从而充分保证了邮件服务器的安全。

4. 结束语

在上海理工大学,按常规方式部署了反垃圾邮件网关后(并联入网络),垃圾邮件拦截成功率仅为70%,采用了本文介绍的策略并做了准入控制后,拦截成功率提高到了95%以上,有效地阻击了绕发的垃圾邮件。对于目前很多地方部署网关后仍然有大量垃圾邮件存在的情况,可以参考本文,分析部署的策略是否给邮件绕发提供了可能性。只有保证所有发给用户的邮件都进行了过滤,才能真正体现反垃圾邮件网关的价值,在此基础上讨论过滤技术也才有意义。

参考文献

[1]2007年第四次中国反垃圾邮件状况调查报告[EB/OL].http://www.anti-spam.cn/.

智能垃圾邮件 第9篇

关键词:科技,垃圾邮件中转,邮件规则,DNS黑名单过滤

一、背景

随着Internet技术的普及与发展, 电子邮件已经成为大多数人必不可少的通信工具。企业和院校拥有自己的独立邮件系统平台, 已经随处可见, 而且非常必要。然而, 一个日益严重的问题却困扰着众多的系统管理员, 那就是如何有效地防止垃圾邮件。

垃圾邮件泛指未经主动请求而发送的电子邮件, 包括收件人事先没有提出要求或者同意接收的广告、电子刊物、各种形式的宣传品等宣传性的电子邮件;收件人无法拒绝的电子邮件;隐藏发件人身份、地址、标题等信息的电子邮件;含有虚假的信息源、发件人、路由等信息的电子邮件等。垃圾邮件的破坏性是显而易见的, 它不仅阻塞有限的网络带宽, 而且降低了邮件服务器的信誉度, 使得其他邮件服务器可能不接收此服务器发出的邮件。垃圾邮件可以说是互联网带给人类的最具争议性的副产品, 它的泛滥已经使整个互联网不堪重负。那么, 如何有效预防和限制垃圾邮件?在这方面, 基于Domino平台的邮件服务器设置提供了各种有效的途径和措施, 本文以某学校Domino平台邮件服务器的实际应用为例, 旨在探讨Domino平台下针对垃圾邮件防范的各种参数配置和方法。

二、解决方案

本解决方案的示意结构如图1所示, 一台Domino服务器主要负责内部用户的Notes路由邮件需求;另一台Domino服务器配置为SMTP邮件服务器端, 提供对外的SMTP邮件发送, 同时负责将SMTP外来邮件过滤后, 回送到内部的Domino服务器主机上。

相关说明:

Server1 (oaserver) 和Server2 (cserver) 服务器是同一个Notes域中的两台服务器, 共享一个通讯录, 且Server1设置为主服务器, Server2为附加服务器。

oaserver服务器为所有的内部用户服务, 用户收发邮件都用该服务器。

cserver服务器的主要作用是接收其他Internet SMTP服务器发送给本系统 (gzslits.com.cn) 的邮件, 然后转交给oaserver;单位用户向Internet发送的邮件由oaserver转发给cserver, 再由cserver发送到Internet;在cserver上做如下限制:仅接收发送到gzslits.com.cn的邮件, 只转发oaserver发送的外出邮件。

域名 (gzslits.com.cn) 的DNS设置中mx记录指向Server2服务器的IP地址。

上述解决方案的架构主要配置过程有:

1. 安装配置好Domino服务器的架构, 使oaserver和cserver两台Domino服务器共享一个通讯录域组织。

2. 分别设置好两台Domino服务器的服

务器文档中的相关选项, oaserver配置好只进行notes邮件路由, 而cserver配置成可以进行notes邮件路由和smtp邮件路由, 并能进行smtp侦听。

3. 在配置文档中, 设置好两台服务器的

邮件规则, 包括smtp外来控制、外出控制、通用邮件规则定义等, 做好防垃圾邮件设置。

4. 新增消息处理网络域文档, 设置Notes邮件地址和Internet邮件地址间的转换规则。

三、cserver转发主机上的防垃圾邮件配置

本文主要讨论Domino平台下邮件服务器的防垃圾邮件技术, 故重点阐述在cserver的邮件配置文档上对cserver邮件转发主机进行如下防垃圾邮件设置, 包括防垃圾邮件中转、验证收件人地址、服务器邮件规则、DNS黑名单过滤等。

当设置了如图2中所示的相应选项后, 就可以防止外部垃圾邮件中转转发。当有外部邮件主机连接进来时, 首先会进行中继控制, 和列表中的允许选项进行判断, 通过验证, 才能允许邮件中继, 否则就会出现下面所示的提示, 外部的SMTP Server可以连接, 但是O message[s]received, 拒绝接受它的信息。

在如图3中设置好cserver邮件转发主机的黑名单过滤器, 使用的是cbl.anti-spam.org.cn (中国反垃圾邮件联盟) 提供的实时黑名单服务器提供的站点列表。

实时黑名单实际上是一个可供查询的IP地址列表, 通过DNS的查询方式来查找一个IP地址的A记录是否存在来判断其是否被列入了该实时黑名单中。举例来说, 当有一个地址为111.222.333.444的外部smtp服务器连接上cserver时, 要判断该smtp服务器的IP地址是否被列入了黑名单, 那么使用黑名单服务的cserver会发出一个DNS查询到黑名单服务器 (中国反垃圾邮件联盟的实时黑名单服务器cbl.anti-spam.org.cn) :是否存在A记录?如果该地址被列入了黑名单, 那么服务器会返回一个有效地址的答案, 按照惯例, 这个地址是127.0.0.2 (有时候还用127.0.0.3等) 。如果没有列入黑名单, 那么查询会得到一个否定回答。

有时候由于邮件服务器非常繁忙, 而且这个查询结果是不缓存的, 那么对黑名单服务器的查询会非常多, 导致查询响应迟缓。在这种情况下, 可以使用DNS的区域传输, 将黑名单服务器的数据传输到本地的DNS服务器, 然后对本地的DNS服务器进行查询即可。区域传输可以设置为手工更新、定时更新或自动更新等方式, 这依赖于用户的应用。

黑名单服务器的DNS查询和区域传输, 并不是都可以随意使用的。有些服务器可供任何人查询和区域传输, 而有些只对特定的用户开放。

在cserver的邮件配置文档里再设置好如图4中所示的相关选项, 可以在接收到internet邮件时, 从通讯录里去验证收件人地址是否在【学校所有教职工】群组里, 如果在通讯录中时, 再转发到对应的个人邮箱中, 否则则拒绝接收。

在cserver的配置文档中, 定义类似图5的邮件规则, 则邮件路由时会按照上述规则来过滤所有邮件, 符合规则的邮件才能通过正确的路由发送到对应的个人邮箱。

Domino接收Internet邮件并将它邮递到用户邮箱的基本过程共包括3个主要步骤:

首先, SMTP侦听任务接收外来的Internet邮件。在此过程中Domino会根据SMTP外来控制中的设置进行检查, 拒绝不符合条件的邮件。

然后, SMTP服务器将所收到的邮件放到服务器的mail.box中。在此过程中Domino会根据服务器邮件规则对外来邮件进行检查, 按规则所定义的条件和操作处理邮件。

最后, Router将邮件邮递到用户的邮箱中。在此过程中会根据用户邮箱中定义的规则对邮件进行处理。

用户最终看到的邮件只有完全符合所有限制条件的邮件。

四、结束语

基于Domino平台邮件服务器的垃圾邮件防范技术能够较为稳定可靠地拒绝垃圾邮件的侵扰, 保证了oaserver上的内部OA用户能够正常的实现内外部通邮。

本方案的优点在于:设置了一台外部邮件转发主机, 在这台主机上应用了一系列的防垃圾邮件措施, 包括防垃圾邮件中转、邮件规则定义、DNS黑名单过滤、外来发件人验证、外来原定收件人验证等。而在物理上隔离了内部OA用户的oaserver主机, 但又通过Notes路由保证了其内部邮件的通畅, 通过转发主机的设置保证其和外部Internet邮件主机的正常SMTP邮件通信。本方案依托Domino平台的优势, 保证了内外通邮, 又避免了大部分垃圾邮件的干扰, 具有一定的推广应用价值。

参考文献

[1]兰雨晴等.Lotus Domino/Notes R6系统管理[M].机械工业出版社, 2003.

全球垃圾邮件比例略有上升 第10篇

此外,垃圾邮件不仅是一种区域经济现象,更涉及到国际上多个国家和地区。所有,要有效对其进行打击,必须跨越国界的限制。换句话说,只有不同国家的执法机关共同协作和努力,才能有效抑制其发展。

正因为如此,最近中国和美国决定携手共同打击垃圾邮件。双方将于3月份共同起草和发表一篇题为《打击垃圾邮件树立诚信》的研究报告和声明。我们希望这一举措能够鼓励其他更多国家加入到该行动中。

根据卡巴斯基实验室发布的2011年2月份垃圾邮件报告。2月份垃圾邮件占全部邮件数量的比例较上月上升了1.1%,平均比例为78.7%。预计到2011年4~5月期间,垃圾邮件比例会重新回到81~82%的水平。

印度仍然是最大的垃圾邮件输出国,其输出的垃圾邮件占全部垃圾邮件总量的8.83%,虽,然同1月份相比,下降了1.02个百分点。而俄罗斯则是排名第二的垃圾邮件输出国,其输出总量相当于印度的一半。同上月相比,源自俄罗斯的垃圾邮件比例下降了4.26%。巴西上升至第三名(+0.41个百分点)。

虽然美国本月在垃圾邮件输出国排名榜中仅排第八位,但需要注意的是源自美国的垃圾邮件数量正在稳步上升。2010年8月,Pushd0/Cutwail僵尸网络被关闭后,源自美国的垃圾邮件数量显著下降,并且在年末达到历史最低点(在10~12月期间,比例为1~1.5%)。但到今年2月份,垃圾邮件比例则达到四个月以来的最高点——4.27%,而且似乎还有增长的趋势。

2011年2月,包含恶意文件的垃圾邮件站全部邮件总量的3.18%,同上月相比,上升了0.43%。2月份垃圾邮件包含的恶意软件大多可以分为两类。第一类包括各种邮件蠕虫,第二类恶意软件则主要用来窃取机密信息,具有金融特征。排名前十位的垃圾邮件恶意软件如下:

两种反垃圾邮件技术分析 第11篇

根据中国互联网协会反垃圾邮件中心的《2008年第三季度中国反垃圾邮件调查报告》显示,中国网民平均每周收到垃圾邮件的数量为17.86封,所占比例为57.89%,.垃圾邮件仍然以高比例存在于电子邮件中。对于电子邮件这样一个有效通信资源的利用总是无时无刻地进行着,也就必然存在着符合或者违背收件人主观意愿的行为,其目的只有一个:让收件人知晓一些信息。站在反垃圾邮件的角度,我们自然希望是利用电子邮件解决通信双方正当、合法的通信需求,维护通信环境的高效、文明;而对于垃圾邮件制造者或者发送者来说,电子邮件却作为承载着利益甚至阻碍文明发展的工具被利用着,所以他们也会不惜一切代价地去规避现有的反、防措施,去制造一些新的手段多样化的垃圾邮件,不过无论垃圾邮件如何包装、掩饰,它始终都包含属于垃圾的部分,这点是我们反垃圾邮件的根本和着力点。

1 贝叶斯相关理论

贝叶斯方法以概率理论为基础,用于处理统计学中不确定性问题。

对于概率公式:

其中,A,B表示两个事件,且P(A)>0,该公式表示在事件A发生的前提下事件B发生的条件概率。

在此基础上,有贝叶斯(Bayes)公式如下:

其中B1,B2,…,Bn为一系列互不相容事件,且P(Bi)>0(i=1,2,…,n)。

一般而言,人们能根据历史经验或主观判断给出某些事件发生的概率,这样的概率没有经过检验,被称之为先验概率。贝叶斯方法则是利用贝叶斯公式,结合调查、统计、实验等方式获取新的信息,对先验概率进行修正,从而得到更符合实际的可能发生概率的预计。

基于贝叶斯的统计分析技术常常被应用于各行各业的分类应用系统中,因其模型塑造简单易行,运行效果良好而广受欢迎。

2 人工免疫系统(Artificial Immune System,AIS)[1]的相关理论

生物免疫系统是一个高度进化的生物系统,它旨在区分外部有害抗原和自身组织,从而清除病原并保持有机体的稳定[2]。而AIS则是以此为原型从计算的角度产生的面向应用的计算模型。

AIS的免疫算法一般步骤为:

1)定义抗原:将有待解决的问题抽象成抗原,抗体则对应为问题的求解。

2)产生初始抗体:抗体与抗原之间的亲和度对应问题的评估:亲和度越高,说明解越好。

3)计算亲和度:计算抗原与抗体之间的亲和度。

4)克隆选择:与抗原有较大亲和度的抗体即为问题的解,在这个过程中,要尽量抑制浓度过高的抗体即是避免局部解,也要淘汰低亲和度的抗体,同时为获得解的多样性以求最佳解,抗体在克隆时会经历变异(如高频变异等)。

5)评估新的抗体:若不能满足终止条件,则转向第3)步,重新开始;若满足终止条件,则当前的抗体为问题的最优解。

AIS因其复杂的仿生原理往往在实践应用中较难建模,但又因其强大的智能化、自学习、自适应等特性吸引着越来越多的研发者将其应用于各技术领域,以期在智能化发展上有新的突破。

3 两种技术在反垃圾邮件系统中的应用

纵观现有的反垃圾邮件技术,可谓百花齐放,层出不穷,归纳一下,大致有三种:1)基于IP的过滤;2)基于内容的过滤;3)基于行为的过滤。而研究人员也致力于研究这三种层次上的新技术新方法,或者对已有的技术进行整合、实践评测、改进。本文分析的技术是基于内容的过滤技术。

在反垃圾邮件过滤系统中我们常会使用朴素贝叶斯算法,其模型如图1所示。

该模型采用特征变量独立假设,即假设每个特征变量Xi都从属于同一个类别变量C,而它们彼此之间相互独立。

在反垃圾邮件过滤系统中,我们只考虑两个类别:一类为垃圾邮件,一类为非垃圾邮件,设c=1表示垃圾邮件,c=0表示非垃圾邮件,则应用朴素贝叶斯算法的目标是计算:

其中x是若干特征变量值(x1,x2,…,xn)构成的一个实例,在计算的过程中,属于垃圾邮件类情况下,特征变量xi出现的概率可以采用如下方式计算:

基于贝叶斯算法的反垃圾邮件过滤系统具有较强分类能力,但在识别时很大程度依赖于以往的统计结果,自适应能力较弱,且对已有样本的变异样本辨识效果不尽人意。

鉴于上述弱点,人工免疫系统以其良好的自适应、自学习和鲁棒性启示着反垃圾邮件技术的研发,依据此开发的反垃圾邮件过滤系统的运作原理如下:

当一封邮件到达时,提取邮件的特征向量,以此生成待定抗原,抗原首先通过记忆细胞检测器,与记忆细胞进行匹配,若出现匹配,则确认该邮件为垃圾邮件;若未出现匹配,则将抗原与未成熟细胞检测器中的抗体进行匹配,匹配程度用亲和度表示,若亲和度达到设定的阀值,则抗原为阳性,邮件被判为垃圾邮件;若亲和度小于阀值,则抗原为阴性,这时,邮件被判为正常邮件。

在将该技术进行实例应用时,决定系统性能的关键在于抗体、抗原、记忆细胞、未成熟细胞的定义以及亲和度的计算、阀值的设定等。

为测试两种技术在反垃圾邮件系统中的应用效果,我们进行了基于贝叶斯算法和基于贝叶斯及人工免疫系统综合算法的两种测试,使用了中、英文语料库,中文语料库选取的是中国教育和科研计算机网紧急相应组(CCERT)发布的数据集“2005-Jul”,包含20308条垃圾邮件和9042条正常邮件[3],英文语料库选用Spam Assassin语料,可从http://www.spamassassin.org获得,该语料包含了1897条垃圾邮件和4150条正常邮件。所进行的测试是把语料库中邮件分为10份,其中的9份作为训练集,另外1份作为测试集,如此交叉做10次,最后取10次实验的平均值作为最后的实验数据,得到了如图2所示的对比结果。

4 结束语

可见,在随着邮件数目增多的情况下,基于AIS的过滤系统比单纯基于贝叶斯的过滤系统更能保持稳定和较高的准确性,当然现在还没有一种可以称得上完美的技术方案来彻底解决垃圾邮件的问题,就基于AIS的反垃圾邮件技术而言,仍然还有很多值得探索和改进的地方,毕竟AIS的仿生机理是很复杂的,我们要能融会贯通灵活运用还需要时日,加之现有方案中,对于一些关键值,关键算法的测试也还不够完备,如此种种,这都将是我们今后继续研究的内容。

摘要:在基于内容的反垃圾邮件技术中,基于贝叶斯的反垃圾邮件技术显现了较强的分类能力和较高的准确性,而基于人工免疫系统的反垃圾邮件技术则具有良好的自适应、自学习和鲁棒性,两者的结合在实践测试中取得了良好的效果。

关键词:反垃圾邮件,贝叶斯,人工免疫系统

参考文献

[1]肖人彬,王磊.人工免疫系统-原理、模型、分析及展望[J].计算机学报,2002.12:1281-1293.

[2]陈国良,王煦法等.遗传算法及其应用[M].北京:人民邮电出版社,1996.

[3]蔡立军,施荣华.一种新的电子邮件过滤系统模型的设计[J].计算机工程2003.9:167-169.

[4]周济,查建中,肖人彬.智能设计[M].北京:高等教育出版社,1998.

[5]Dasgupta D,Forrest S.Artificial immune systems in industrial applications.In:Proc2nd International Conference on Intelligent Processing and Manufacturing of Materials[C],Honolulu,1999.257-267.

[6]莫宏伟.人工免疫系统原理与应用[M].哈尔滨:哈尔滨工业大学出版社,2002.11.

上一篇:人物思想下一篇:超高压线路保护