数字音频、远程监控

2024-08-17

数字音频、远程监控(精选7篇)

数字音频、远程监控 第1篇

AES/EBU信号用于专业广播,采样频率48kHz、量化24bit,遵循标准AES3-1992和AES-3id-2001,其中前者适用平衡传输(XLR, 110欧姆),后者适用不平衡传输(BNC, 75欧姆)。标准规定的帧格式相同,如图1。

其中,一个区块分成192个帧,每个帧分成子帧A和子帧B,每个子帧32bit。采用2的补码进行量化,采用BPM进行通道编码。

一般应用中,接收AES/EBU信号使用专业的接收芯片,如cirrus的CS841x系列、YAMAHA的YS922系列、philips的UDA15531系列,这些专业芯片使用PLL+VCO锁定住输入数据流,确定输入数据流的频率。如果需要采集16路AES信号,每路信号需要一个芯片,如图2。

多个CS8414和音频检测电路不但成本高,而且PCB制作复杂。所有音频的数据内容,以太网组播输出,需要增加网络板(ARM相同等实现),成本高,不灵活。

本方案直接使用FPGA芯片接收AES数据流,一块FPGA芯片集成多路AES音频数据接收模块、音频检测模块、指示电路模块、CPU、UART串口数据输出模块,降低了PCB制作复杂度和整体成本。

所有音频的PPM音量、音频内容、锁定状态、告警信息等通过以太网组播输出。FPGA实现AES/EBU数字音频的采样率转换和比特压缩,显著降低了网络流量,防止网络交换机阻塞。所有组播内的计算机可以通过终端软件播放每一路音频数据。多个设备可以通过交换机堆叠,整个组播网络可以监控任意多个音频。同时串口输出所有音频的PPM音量、锁定状态、告警信息等,方便监控应用。

2 方案设计

(1) AES/EBU数字音频接收

本方案直接使用FPGA芯片接收AES数据流,一块FPGA芯片集成16路AES音频数据接收模块和音频检测模块。每个AES/EBU音频检测子模块(AES-DET模块),实现的框图如图3。

(2) BPM数据接收解码模块

BPM编码在每个数据比特单元的开始都有一个转换,在每个比特1的中间有一个转换,比特0中间没有转换。这样,比特1用10或01两个比特表示,比特0用00或11两个比特表示,如图4。

本设备通过50MHz的时钟对接收的AES/EBU BPM数据进行过采样判别,解码出BPM数据。

(3)帧解码模块

一个区块分成192个帧,每个帧分成子帧A和子帧B,每个子帧32bit。解码出的同步信息和数据进入帧解码模块解码出两个通道的音频数据、V/U/C状态数据。

(4)音频音量检测单元模块

音频数据是经过2的补码编码的,音频数据输出处理单元负责进行转换。该单元将接收到的音频采样数据(电平)转换成dB值,并输出到FPGA内部数据总线。同时输出到数据总线上的信号还有AES LOCK(锁定指示)、接收错误、V/U/C数据、校验指示等状态量。

(5)音频压缩和数据输出模块

所有16路AES-DET模块将数据送到数据总线,CPU采集数据后,控制指示电路指示,同时驱动以太网组播模块,将采集到的数据输出。

测试表明,如果AES/EBU的48k抽样、24bit量化的数据全部通过以太网组播出去,30路AES/EBU数字音频将会阻塞普通千兆交换机,音频包会有部分丢失,客户端音频播放不连续。为了减小网络负担,本设备中加入了音频数据采样率转换模块和比特压缩模块。

采样率转换模块提供参数选择,将进入的AES/EBU数据从48k或32k抽样转换为16k。比特压缩模块将24bit压缩至8bit,客户端的声音播放没有明显的劣化,显著提高了效率。图5中描述了从48k抽样24bit量化到16k抽样8bit量化的过程。

(6)以太网组播输出模块

所有音频的音频内容、锁定状态、告警信息等通过以太网组播输出所有组播内的计算机可以通过终端软件播放每一路音频数据。

(7)同步

由于AES/EBU数字音频的时间和音频播放客户端(PC)的时间不同步,会产生音频播放超前或落后,增加缓冲不能完全解决问题。为了保证同步播放,本方案在每个组播包内加入时间戳,音频播放客户端只要按照该时间戳进行相应调整,就可以保证完全同步播放,实际测试表明该方法可靠有效。

(8)系统实现

整个系统包括16个AES音频数据接收模块和音频检测模块、指示电路模块、NIOS_CPU控制模块、以太网组播输出模块、串口输出模块等,降低了PCB制作复杂度和整体成本,提高了灵活性。如图6。

图7中显示的是FPGA顶层模块。

3 硬件实现和监控应用

(1)硬件实现

图8是16路AES/EBU采集板卡的实物照片。

AES/EBU数字音频通过接口转换芯片将422转换成TTL电平后接入FPGA, FPGA对数字音频进行解码处理和组播输出。

(2)监控应用

多个16路AES/EBU数字音频网络化监控设备,通过交换机和监控客户端连接,由于采用组播技术,任意多个客户端,不增加网络流量,显著提高工作效率。见图9。

图10中显示的是音频客户端计算机的监控画面,每路音频有彩条显示、丢失告警,点击任意一个彩条,系统播放当前音频内容。

4 方案总结

使用该方案,在一片ALTERA CY-CLONE 1C12上可以实现16路的AES/EBU数字音频的采集、音频压缩、以太网组播输出的全部功能,比用专业接收芯片路CS8414加音频解码电路实现的采集方案成本低很多、而且稳定可靠,PCB板实现也简单很多,不需要大量的元器件。

参考文献

[1]韩宪柱编著.数字音频技术与应用.中国广播电视出版社.

[2]张琦等编审.数字电视制播技术.中国广播电视出版社.

[3]Specification of the digital audio interface (The AES/EBU Interface) .Tech.3250-E-Second edition.August1992.

[4]EDA先锋工作室.ALTERA FPGA/CPLD设计.人民邮电出版社.

[5]夏宇闻.Verilog数字系统设计教程.北京航天航空大学出版社.

[6]Kyoungsoo Kim.Study on the S/PDIF receiver design and hardware implementation.Jusung Park.Byounggab choi.

模拟音频技术与数字音频技术研究 第2篇

尽管近年来数字音频技术的应用能够保证处理后的声音信号保持完善和无损, 并注重对调音台界面的逐渐改善, 更有利于自动化控制系统的实现。然而许多音频领域的技术人员并不认同将模拟音频技术向数字音频技术进行转化, 甚至在应用模拟音频技术方面坚持以“模拟永远辉煌”的观念, 这就成为制约音频技术发展的重要瓶颈。因此对模拟音频技术与数字音频技术的分析具有十分重要的意义。

1 模拟音频技术应用系统的具体概述

现阶段专业音频系统在分类上主要集中体现前期制作、播出制作以及扩音系统三方面。其中前期制作系统主要将记录声音信号作为目标, 完成相关作品如电视剧、专题片或音乐作品的制作等。播出制作系统在形式上可选择直播或录播形式, 多适用在音频系统播出以及同步制作视频等方面中。而扩音系统的应用目标在于对音频信号进行扩大。由此可判断, 音频系统的关键核心为调音台, 以模拟音频技术为基础的调音台在构成上主要表现为以下几方面。

1.1 模拟音频技术的相关指标分析

目前, 基于模拟音频技术的调音台在结构上多以同一型号的晶体管以及集成电路为主, 其中晶体管作用在于能够解决放大器增益不足的弊端, 而在低噪声、母线混合与均衡处理等方面也要求采用相应的放大器。但无论哪种调音台的生产, 都需考虑到运算放大器对调音台频率相应、噪声以及动态范围的制约作用, 所以即使模拟调音台中所采取参数存在一定的差异, 但应用的音频技术指标大体相同。

1.2 模拟调音台功能分析

基于模拟音频技术的调音台在规模相同的情况下, 也可能具有不同的功能。例如, 调音台应用于音乐录音设计过程中需具备自动混录的功能而且要求选择24路以上母线输出。但这些功能在扩音设计或演播室播出与制作过程中却不存在, 其应用的功能主要体现在矩阵与编组输出等方面。另外, 在推子工作形式方面也包括两种, 即直接摩擦型以及实质为数字技术的VCA电子控制类型[1]。

1.3 模拟调音台的内部器件分析

不同调音台在选择内部器件方面也需考虑到加多问题, 如存在7%左右误差的电阻与电容, 其中的电阻在介质应用方面可利用碳膜或金属膜, 而电容方面, 若其容量较小可利用无极性钽电容或极性电解电容。在选择电位器种类过程中, 可根据具体应用选择一般型或者高精度密封型的电位器, 以推子型电位器为典型代表, 其应用的材质关乎设备自身的使用寿命。由此可判断, 设备的稳定性以及可靠性很大程度上受内部器件的影响。从我国近年来模拟录音机与录像机应用的技术指标中也不难发现, 模拟音频系统整体效果的发挥很大程度上受模拟记录设备影响, 导致声音技术难以实现高保真的目标。另外, 也存在其他如节目复制或转录中声音质量下降等问题制约音频技术的发展, 因此要求向数字化方向发展[2]。

2 数字音频技术应用的特征与优势分析

2.1 产品的多样化特征

以数字音频技术为基础的数字音频设备在种类上极多, 尤其在调音台方面主要将数字方式作为控制系统, 处理信号过程中即可选择数控模拟调音台, 也可利用全数字调音台等。而在数字记录设备方面, 现阶段常用的如磁光盘MO、盒式或开盘式的录音机以及硬盘录音机等。同时处理音频效果的设备从功能以及种类等方面也是模拟音频应用设备难以比拟的, 其能够在音频工作站中将音频的处理与记录同时完成。另外, 数字音频技术中所应用的数字功率放大器也能够放大数字脉冲信号, 并利用低通滤波器对其进行处理以此得到模拟功率信号。

2.2 数字音频设备功能性的增强

以数字调音台为例, 其自动化控制系统的应用能够满足各种录音工序需求, 为录音师节约更多的操作时间。其中数字音频技术中能够对模拟录音工艺产生影响的主要为非线性编辑, 这种功能的实现主要得益于数字音频技术下的音频工作站, 最大程度上了改变了传统录音工艺的模式。从数字音频工作站应用原理方面, 在记录媒体方面选择的主要为基于计算机控制的评判, 通过计算机实现对数据的处理, 完成所有的录制、编辑以及存储等工序。同时, 现今录音工艺中也引入了数字音频处理器, 能够改变以往专门构建具有混响效果空间的情况, 逐渐取代弹簧混响器, 为节目的创作提供强有力的工具。另外, 在音频制作过程中数字音频网络化也是对传统模拟音频技术的很大攻击, 使音频信号的制作、存储与传播融于一体, 是现代广播电视业务的主要工作模式[3]。

2.3 数字音频技术应用的价格优势分析

传统音乐录音或制作过程中主要在录音棚内完成, 若乐队人数较多还需保证录音棚的容积。尽管在不断发展过程中开始采用以模拟音频技术为基础的24轨录音机, 但这种方式缺乏自动编辑与缩混功能, 面临极为繁琐的操作过程。而在数字技术应用下, 分轨录音工艺的完善使许多乐队录音过程中可直接采取分轨录音的形式。同时, 数字音频技术的设备在体积方面也占有一定的优势, 如70路输入模拟调音台, 其在长度上至少虚伪4米, 但数字技术下的调音台只需控制在1.5米范围内即可, 而且数字式24轨的录音机在体积上仅为4U, 既使控制室面积大幅度减少, 也改变了声音反射的情况。另外, 数字设备在价格方面也有不可比拟的优势, 其相比构建录音棚, 能够节约许多成本。

2.4 录音结构的改变

在利用数字音频技术的背景下, 节目的制作不仅要求相关人员掌握基本的数字音频技术, 还需了解计算机基础知识。同时, 由于所选用的合成器也将计算机技术以及数字音频技术融于其中, 能够替代传统乐器的一部分工序。这样, 要求录音工作中相关人员需具备技术技能以及艺术修养。

2.5 对模拟音频技术问题的解决

在音频制作过程中, 无论采取哪种技术革新措施, 其根本目的在于完成声音的采集、记录与回放工作, 并向高保真的方向发展。而传统模拟音频技术的用下很难实现声音的有效存储与复制, 且无法解决噪声的降低、信号动态范围的提高等难题。因此在数字音频技术的应用下, 使模拟音频的信号向不同媒质上记录, 采用的形式主要为0和1的数字形式, 使录音系统质量得到提高[4]。

3 结论

数字音频技术将成为未来音频制作中的重要手段, 能够保证录音系统质量的大幅度提高。然而该技术的应用对传统录音工艺流程也造成了一定的冲击, 要求相关人员在掌握基本专业技能的同时, 还需注重计算机技术知识的学习, 以此全方位理解数字音频技术, 促进数字音频技术应用效果的提高。

摘要:随着音频技术的不断发展, 对模拟音频与数字音频两种技术的研究也逐渐深入。然而关于二者在应用过程中的优势分析仍存在一定的差异, 其成为影响音频技术发展的关键性因素。本文主要对模拟音频技术、数字音频技术的优势与特点进行探析。

关键词:模拟音频技术,数字音频技术,差异

参考文献

[1]刘中胜.模拟音频技术与数字音频技术的探讨[J].现代电视技术, 2010, 11:38-43.

[2]周明, 吕瑞征, 陈新.数字音频技术在音像教材录音系统中的应用[J].西南师范大学学报 (自然科学版) , 2010, 6:164-169.

[3]侯晴.一款应用于音频播放系统中的数字音频处理器的设计与研究[D].西安电子科技大学, 2011.

数字音频及其在数字电视中应用 第3篇

数字音频信号的传送方式目前国际上主要有MPEG-1/2层2和杜比AC-3两种。我国的多声道数字音频编码标准DRA的适用范围也包括数字电视广播。目前开通的地面数字电视广播中,中央电视台的标清电视节目用MPEG-1/2层2音频编码标准播出,高清电视节目用杜比AC-3音频编码标准播出。

1.1 MPEG-1/2音频编码标准

MPEG-1标准第3部分(ISO/IEC 11172-3《信息技术具有1.5 Mbit/s数据传输率的数字存储媒体运动图像及其伴音的编码第3部分:音频》)为数字音频编码标准。MPEG-1压缩声音信号采用子带编码(SBC,Sub-band Coding)。先把时域中的声音数据变换到频域,再对频域内的子带分量分别进行量化和编码,然后根据心理声学模型确定量化精度,来压缩数据量。

按编码性能和复杂度的提升次序,MPEG-1声音信号编码分为3层(Layer1、Layer2、Layer3),高层兼容低层。

MPEG-2的音频(ISO/IEC 13818-3《信息技术运动图像及其伴音信号的通用编码第3部分:音频》)和MPEG-1音频都使用相同类的编解码器,Layer1/2/3的结构也相同,与MPEG-1标准相比,MPEG-2标准做了取样频率、输出码率范围和声道数方面的扩充。

1.2 杜比AC-3数字音频编码标准

杜比AC-3数字音频信号编码标准被美国ATTC制定的ATSC数字电视标准采用(ATSC A/52)。该算法基于知觉编码原理,其主要特点是将多通道处理成一个整体,AC-3能够将多个音频信道的信号编成一个码流。码率为32~640 kbit/s,取样频率为48 kHz,音频系统接收的基带音频输入,可做到每个音频节目的码流多达6个音频声道:中心、左、右、左环绕、右环绕和低频增强。

1.3 DRA数字音频编码标准

我国2008发布并实施GB/T 22726-2008《多声道数字音频编解码技术规范》(DRA)。规范面向有限容量的存储介质或有限带宽信道上保存或传送高质量多声道数字音频信号的多种需求,实现在不同码流下完成高品质、多声道数字音频的编解码。DRA能保证信号通道的精度达24 bit以上,支持立体声、5.1环绕声、6.1环绕声和7.1环绕声,声道数编码能力可达64.3环绕声。音频信号的取样频率范围为8~192 kHz,涵盖了44.1 kHz和48 kHz两个常用值。

2 数字电视码流

由于数字电视广播大多数采用MPEG-2标准进行图像和声音的复用,因此,数字电视的码流以MPEG-2码流为主。数字电视码流有多个层次和类型:ES、PES、TS。

2.1 基本码流

基本码流(Element Stream,ES)为包含视频、音频或数据的连续码流。ES的结构和内容是根据各种数据的编码格式而定的。

例如,MPEG音频的ES结构就根据MPEG-1的音频编码结构来组织。MPEG音频流的ES流的结构采用“数据流帧包装”。它实际上就是一个多路复合器,在MPEG-1的Layer2中,帧结构如图1所示。

2.2 PES流

ES流是无法直接送入传输系统和节目系统中的,需要经过数据分组后才能送出。数据分组也称为打包。ES流按照一定的要求和格式打包后的流称为打包的基本码流(Packet Elementary Stream,PES)。

在PES数据的前部有一个PES头数据,它包含了当前PES包的许多基本信息。PES包的起始码沿用了ES流的格式,其后紧跟的8 bit数据作为起始码的种类,在PES中称为流识别码(stream_id),它的取值范围在系统起始码(system start codes:0×B9_0×FF)中。

2.3 传输流

由一个或几个不同的PES按照它们之间的相互关系进行组织并加入各组成部分关系描述和节目组成信息,并进一步封装成传输包后的码流称为传输流(Transport Stream,TS)。

在数字电视系统中,传输流是各个PES数据流的再分组。在MPEG标准中引入节目专用信息(PSI)来确定各个PES数据包之间的关系。PSI的数据包包括节目关联表(PAT)、条件接收表(CAT)、节目映射表(PMT)、网络信息表(NIT)和私有段等。通过这些表格信息来建立各个不同数据流之间的关系。

MPEG-2中规定了一套对码流的PSI描述方法,主要分为表、段和描述符三个逻辑层次。

MPEG-2中的描述符可以提供有关视频流、音频流、采用的语言、层次、系统时钟、显示参数、码率等方面的信息,除MPEG-2规定的描述符外,也可以自己定义描述符。描述符有一个公共的格式:

{标志、长度、数据}

私有描述符的定义必须符合这样的格式,用户可以自己定义私有描述符的数据部分。

MPEG-2中的节目映射表提供各个节目(或服务)与实际的PES分组流之间的关系。就是说,该节目包含哪些流,以及这些流的基本属性(是视频流还是音频流,或是数据流),其中的stream_type(流类型)字段,表示流的数据类型。

3 数字音频在数字电视码流中的应用

3.1 MPEG音频在MPEG-2中的复用

3.1.1 流识别码

对于MPEG音频ES流,Sream_id的值应为110×××××,表示ISO/IEC 13818-3、ISO/IEC 111172-3、ISO/IEC 13818-7、ISO/IEC 14496-3的音频流。

3.1.2 流类型

对于MPEG-1音频ES流,Stream-Type的值应为0×03,表示ISO/IEC 11172音频流,MPGE-2音频ES流为0×04,表示ISO/IEC 13818-3音频流。

北京地区地面数字电视广播的标清节目CCTV-1音频采用的是MPEG-1层2单声道音频编码,取样频率48 kHz,Stream_id为192,Stream_type为4。

3.2 DRA音频在MPEG-2中的复用

复用的DRA音频ES流的必要项包括:Stream_id,Stream_type,DRA注册描述符(DRA,registration descriptor)和DRA音频流描述符(DRA audio stream descriptor)。

Stream_id被包含在PES头中,Stream_Type、DRA registration descriptor和DRA audio stream descriptor都被包含在节目映射表PMT中,其中DRA registration descriptor紧随ES_info_length字段,DRA audio stream descriptor在DRA registration descriptor之后。

3.2.1 流识别码

对于DRA音频ES流,Stream_id的值应为0×BD,表示private_stream_1。多个音频流可以使用相同的Stream_id值,这是因为当MPEG-2传输流中是多路节目复用时,每个流指派一个特定的包识别码PID。

3.2.2 流类型

对于DR A音频ES流,Stream_Type的值应为0×06,表示PES中包含私有数据。

3.2.3 DRA注册描述符

为了唯一地识别本标准的音频流,PMT中应使用注册描述符,如表1所示:

其中,descriptor_tag=0×05,descriptor-length=0×04,format_identifier=0×445241 31(“DRA1”)。

3.2.4 DRA音频流描述符

DRA音频流描述符的目的是为综合解码接收机(IRD,Integrated Receiver-Decoder)提供音频解码配置信息。

该描述符位于PSI的PMT中,同MPEG-2描述符的语法一致,其语法参见文献[3]GB/T 22726-2008《多声道数字音频编解码规范》的C.4。

3.3 AC-3音频在MPEG-2中的复用

AC-3在MPEG-2中的复用有两种方式,分别适用于ATSC系统和DVB系统。我国目前试播的CCTV-高清频道中AC-3音频采用的是DVB的复用方式。

在ATSC中复用的AC-3音频ES流的必要项包括:Stream_id、StreamType、AC-3注册描述符(AC-3registration descriptor)和AC-3音频流描述符(AC-3 audio stream descriptor)。

在DVB中复用的AC-3音频ES流的必要项包括:Stream_id、Stream_Type、AC-3描述符。

3.3.1 流识别码

对于AC-3音频ES流,在ATSC和DVB系统中Stream_id的值均为0×BD,表示private_stream_1。

3.3.2 流类型

对于AC-3音频ES流,在ATSC系统中Stream_Type的值为0×81,在DVB中Stream_Type的值为0×06,表示PES中包含私有数据。

3.3.3 AC-3注册描述符

为了唯一地识别AC-3的音频流,PMT中应使用注册描述符,语法结构与表1DRA注册描述符相同。

其中,descriptor_tag=0×05,descriptor-Iength=0×04,format_identifier=0×41432D33 (“AC-3”)。

3.3.4 AC-3音频流描述符

AC-3 audio_stream_descriptor的目的是为解码器(IRD)提供音频解码配置信息。

该描述符位于PSI的PMT中,同MPEG-2描述符的语法一致,其语法参见参考文献4的附件2“ITU-R建议书BS.1196-1-2001”附录1的3.4。

3.3.5 AC-3描述符

AC-3描述符标明按照附件2“ITU-R建议书BS.1196-1-2001”编码的AC-3音频基本流,旨在为IRD提供配置信息。

对于含有按照ITU-R BS.1 196建议编码的AC-3音频流,该描述符位于PSI的PMT中,并在节目映射段中相关的ES_info_length字段后使用一次。

描述符标签提供了AC-3基本流存在的唯一标识。AC-3描述符用在PSI PMT中以标明携带AC-3音频的流。AC-3描述符的语法参见文献4的附件2“ITU-R建议书BS.1196-1-2001”附录1的4.3.2。

北京地区地面数字电视广播的高清节目CCTV-高清,音频采用的是杜比AC-3的5.1声道环绕声音频编码,码率448 kbit/s,取样频率48 kHz,Stream_id为1 89(0×BD),Stream_Type为6(0×06)。

4 结语

高清晰度数字电视不仅需要高质量的图像,也要求CD质量的声音。在丰富多彩的数字电视节目中,以杜比AC-3和DRA编码的多通道、环绕声音频技术的开发,大大增强了观众临场体验的效果。数字音频技术为人们提供了家庭影院的临场体验。将改善后的图像质量与环绕声结合在一起,给观众带来的是震撼人心的感受,使观众完全融入到观看节目之中。

参考文献

[1]惠新标,郑志航.数字电视技术基础[M].北京:电子工业出版社,2005.

[2]中国电子视像行业协会.解读数字电视[M].北京:人民邮电出版社,2008.

[3]游余立,张新刚,徐茂,等.GB/T 22726-2008多声道数字音频编解码技术规范[S].北京:中国标准出版社,2008.

数字音频水印技术研究 第4篇

近年来, 随着数字多媒体作品在互联网上的传播和复制变得越来越方便快捷, 其版权保护的需求也在不断增长。这些需求促使研究者去研究阻止版权侵犯的方法。最有希望解决这一挑战性问题的思路是运用信息隐藏技术。[1]信息隐藏是将信息嵌入到数字媒体中的过程。嵌入的信息应当是不被察觉的;同时, 被嵌入信息的数字媒体的保真度必须不受影响。

信息隐藏技术的两个重要类型是隐写术与水印。[2]隐写术的主要目的是隐藏通信的事实 (而不仅仅是隐藏通信的内容) 。发送者将秘密信息嵌入到数字媒体中, 只有特定的接收者才能提取到这个秘密信息。通信信道的监管人也许会察觉到传输的媒体, 但是他不会察觉到隐藏于其中的秘密信息。

水印和隐写术的目的都是在载体中隐藏信息。其中, 隐写术应用于两方之间点对点的秘密通信。因此, 隐写术通常只有有限的鲁棒性, 它要防止嵌入的信息在传输过程中被改动。另一方面, 当很多人知道媒体中存在嵌入信息, 而且有意图移除此信息时, 就需要使用水印技术而不是隐写术。因此, 水印技术对鲁棒性的要求更高。一个理想的水印系统要确保嵌入的信息不能被移除或改变, 并且嵌入的信息不能影响载体的保真度。

学术界已经对数字水印技术表现出了极大的研究兴趣。然而, 大多数的研究都集中在图像水印和视频水印方面, 有关音频水印的研究还很少。音频水印是将水印嵌入到音频信号中的过程。因为人类听觉系统 (Human Auditory System, HAS) 的敏感性, 制作音频水印是一个很困难的过程。

1 数字音频水印的系统模型

一个数字音频水印系统包括三个基本模块:水印生成模块、水印嵌入模块和水印检测模块。[3]水印信号通过一个不可逆的过程生成。音频水印生成的时候也会考虑原始音频信号的特点, 这将有助于生成不易感知的水印。

水印嵌入采用某种恰当的嵌入规则 (例如, 加法或乘法) , 在时域或频域中完成。最后, 水印检测可以在借助或者不借助原始音频信号的情况下, 通过某些相关检波器或统计假设检验实现。

2 数字音频水印的应用

对水印系统的要求总是基于它的应用。因此, 在研究对数字音频水印的要求和设计要素之前, 我们需要先讨论它的应用。[3][4][5]

2.1 版权保护

版权保护是水印技术最重要的应用。目标是嵌入能够识别数字音频作品版权所有者的信息, 防止发生版权争议。这个应用需要很高的鲁棒性, 以确保嵌入的水印不会被移除。

2.2 数字指纹

这个应用的目的是传输有关合法接收者的信息, 确保数字音频作品每个副本的合法性。这非常类似于软件产品的序列号。在这个应用中, 不同的水印被嵌入到每个副本中。而在版权保护应用中, 只有一个水印嵌入到数字音频作品的所有副本中。与音频水印的版权保护应用一样, 数字指纹也需要很高的鲁棒性。

2.3 内容认证

这个应用的目的是检测音频数据的改动。这可以用所谓的脆弱性水印来实现。脆弱性水印对某些修改 (例如, 压缩) 具有很低的鲁棒性。

2.4 复制保护

这个应用试图阻止数字音频作品的非法复制。可以利用水印来指示数字音频作品的复制状态 (例如, 复制一次或者没有复制过) 。同时, 用来进行复制操作的软件或设备必须能够检测水印, 并且根据作品的复制状态来允许或者阻止操作请求。

2.5 广播监控

数字音频作品的制作商希望确保他们的作品能够在他们购买的时间内按时播出。广播监控的老办法是要有人监听广播频道, 记录他们听到的内容。这个办法既昂贵而且容易产生误差。最好的解决方案是自动监控。其中一种自动广播监控的方法是使用水印技术。我们可以嵌入一个标识码到要广播的作品中, 通过监控系统来检测嵌入的水印, 以此来确保所购买的广播时间是否全部得到利用。

3 数字音频水印的属性

数字音频水印系统具有某些属性。每一个属性的重要性取决于对水印应用的需求。[3,6]]

3.1 嵌入效率

水印系统的效率是指输出音频信号被嵌入水印的可能性。当输出信号被检测器检测到相应的反应时, 才可以说音频信号已被嵌入了水印。输出信号被检测到相应反应的百分比就是音频水印系统的效率。

3.2 保真度

一般而言, 音频水印系统的保真度是指数字音频的原始版本以及嵌入水印版本之间的感知相似度。但是, 嵌入水印的音频有可能在被接收者感知之前在传输过程中衰减。因此, 需要对保真度有一个更恰当的定义。我们可以将音频水印系统保真度定义为接收者感知到的未嵌入水印音频信号和嵌入水印音频信号之间的相似度。

3.3 数据负载

数据负载是指水印在单位时间内嵌入的比特数。对音频而言, 数据负载是指每秒钟传输的嵌入比特数。不同的水印应用需要不同的数据负载。例如, 版权保护应用就只需要在数字音频中嵌入少量的比特。

3.4 盲检测或知情检测

我们将需要原始音频信号的水印检测称为知情检测。知情检测需要来源于原始信号的信息。与之相对, 不需要原始音频信号的检测被称为盲检测。知情检测在水印检测时具有良好的性能, 但是这需要存储大量的原始信号。

3.5 鲁棒性、安全性和成本

鲁棒性是指水印不受常用信号处理技术影响的能力。音频水印需要在时域滤波、数模转换以及比例缩放等方面表现出鲁棒性。并不是所有的水印应用都需要各种形式的鲁棒性。这依赖于水印系统的应用性质。

水印的安全性是指对抗恶意攻击的能力。恶意攻击是指明确的阻止水印目的的过程。攻击可以分为三种类型:非法移除、非法嵌入以及非法检测。

水印系统的成本是指水印嵌入和检测的速度以及必须部署的嵌入器和检测器的数量。其他问题还包括检测器和嵌入器是通过硬件设备、软件应用, 还是通过插件来实现的。

4 数字音频水印技术概述

可以根据水印的作用域将数字音频水印技术分为三类, 下面分别进行讨论。

4.1 频域音频水印

频域音频水印技术利用HAS的音频掩蔽特性, 将人耳听不见的水印信号嵌入到数字音频中。将音频信号从时域转换到频域使得嵌入的水印成为音频信号重要的组成部分。这使得水印系统具有更高水平的鲁棒性, 因为任何移除水印的企图都会对原始音频信号的保真度造成严重的影响。

输入的音频信号首先变换到频域, 在频域中嵌入水印信号, 接着, 合成的信号通过反频率变换, 最后得到嵌入水印的音频信号作为输出。如图1所示。

水印可以通过多种方法嵌入到频域中。例如, 在频域中应用扩展频谱 (Spread Spectrum) 技术。[7][8]在扩频通信中, 传输信号的带宽远大于信号本身的带宽, 以至于在每个频率上的信号能量几乎感觉不到。与之类似, 水印分布于众多的频率分量中, 任何分量上的能量都是非常微小的, 因此水印信号的隐蔽性很强。在这种方法中, 载体信号的频域被看作是一个通信信道, 水印则是通过其传输的信号。各种有意或无意的干扰信号就被看作噪声。水印检测过程知道水印的位置和内容, 它能将许多微弱的信号集中起来形成具有较高信噪比的输出值, 要破坏水印需要很强的噪声信号加入所有频率分量中。但是, 破坏水印的同时也造成载体信号保真度严重下降。因此, 利用扩频技术的数字水印技术具有很高的鲁棒性和安全性。

另一种常用的频域音频水印技术是采用Patchwork算法, 这是一种统计算法, 即在原始音频信号中嵌入特定的统计特性。[3][9]该方法包括两个主要步骤: (1) 选择两个伪随机序列的插入码; (2) 插入码A加上一小常数d, 另一插入码B减去同一常数d。这样, 原始采样变量就会略有改变。检测过程从两插入码样本值的差入手, 采样值的差值期望值决定了是否含有水印信息。由于采用了两个而非一个插入码, 因此, 检测过程无需原始信号, 即可检测出水印。

4.2 时域音频水印

在时域水印技术中, 水印直接嵌入到音频信号。在这个过程中不需要域转换。在嵌入操作之前, 水印信号需要整形, 以确保信号的透明性, 如图2所示。与频域水印相比, 时域水印相对容易实现且需要较少的计算资源, 但对一般信号处理如音频压缩和滤波等的抵抗能力较差。[10]

最不重要位 (Least Significant Bits, LSB) 方法是一种典型的时域水印算法。[4][10]LSB通过将每个采样值的最不重要位, 多数情况下为最低位, 用代表水印信息的二进制位替换, 以达到在音频信号中嵌入水印信息的目的。为了提高水印的鲁棒性, 可以采用一段伪随机序列来控制嵌入二进制位的位置。伪随机信号可由伪随机序列发生器的初始值来产生, 这样在收发双方只需要秘密地传送这个初始值作为密钥, 而不需要传送整个伪随机序列值。LSB算法简单易实现, 信息嵌入和提取的速度快, 数据负载大, 但是其安全性很差, 攻击者只需要对信道简单地加上噪声干扰或者对数据进行重采样和压缩编码等处理都会造成整个水印信息的丢失。

4.3 压缩域音频水印

频域和时域水印算法大都是直接将水印添加到非压缩的音频格式中, 由于没有考虑到音频编码中的压缩系数与水印参数之间的优化匹配, 对音频压缩的鲁棒性一般不高, 所以难以起到压缩音乐版权保护的作用。近年来, 针对逐渐成熟的例如MP3、AAC等音频感知编码标准, 研究者提出了一些MPEG编码的压缩域音频算法, 大致分为三类:[8] (1) 在非压缩域进行, 即先向非压缩原始音频中加入水印, 然后再压缩。 (2) 在压缩域进行, 水印直接加到MPEG音频比特流上, 直接形成含水印的压缩音频文件。这使水印嵌入非常迅速, 但鲁棒性较差, 任何解压缩——再压缩的处理都可以轻易除去水印。 (3) 首先将压缩音频解压, 然后将水印嵌入到非压缩域, 最后带水印的音频内容再被重新压缩成带水印的压缩格式音频。该方法可以提高水印的鲁棒性, 但时间开销太大, 因为压缩过程要花费很长时间, 不适合在线交易和分发。

总的来说, 压缩域音频水印算法的编解码系统过于复杂, 受格式化编码带来的限制很大, 另外由于在压缩域已经滤掉了音频信号的大部分冗余信息, 使得水印信息嵌入的难度很大。压缩域音频水印技术还有待于进一步的深入研究。

结语

所有的音频水印系统都被设计来实现同一个目标:在数字音频中嵌入一个隐蔽的、稳健的水印。音频水印系统必须满足两个相矛盾的设计要求。第一, 水印必须要抵抗有意和无意的移除企图, 要具有良好的鲁棒性。第二, 嵌入水印的音频信号必须保持良好的保真度, 即水印必须是人感知不到的。为了满足这些要求, 不同的方法被开发出来, 使用不同的域来实现水印的某种应用, 同时提高嵌入水印的音频信号的保真度和鲁棒性。

然而, 不同的音频水印系统也有一些区别。在评价水印系统的效果以及完成某项应用的适用性时, 要考虑到这些区别。这些区别包括:

(1) 一些音频水印系统的检测过程不需要使用原始音频信号。而另一些音频水印系统在检测过程中需要原始音频信号, 这将会导致在检测过程中需要存储和搜索大量的原始材料。需要原始音频信号的系统不适用于某些应用, 在这些应用中, 检测过程无法使用原始材料。

(2) 在水印嵌入过程中, 原始音频信号被分成不同的帧, 然后每一帧被分别嵌入水印。一些水印系统在所有帧中嵌入同样的水印, 以提高水印的鲁棒性。但是, 在另外一些系统中, 每一帧嵌入不同的水印。

(3) 因为HAS的敏感性, 水印信号应该通过整形来实现透明化。音频信号的掩蔽特性可以用来实现这个目的。还有一些音频水印系统采用了不同的技术。这些技术在调制水印时使用了原始音频信号。因此, 水印信号的幅值被音频信号的幅值所控制。

当前, 数字音频水印的研究已经取得了许多成果, 但是数字音频水印技术仍需要改进和提高, 许多研究还有待开展。例如:

(1) 目前大多数的音频水印算法都只针对常见的音频信号处理手段或者只针对一种或几种水印攻击有鲁棒性, 而在抵抗多重攻击时, 水印性能大大降低。

(2) 音频水印自身的性能还有可提高的空间, 例如计算的复杂度、嵌入强度、是否盲检测、能否做到自适应调整等。

(3) 深入研究与新一代压缩标准如MP3、AAC相适应的音频水印算法, 这样才能更好地将数字音频水印技术应用到实际中。

摘要:本文首先介绍了数字音频水印的应用与属性, 分别阐述了频域、时域以及压缩域的数字音频水印技术。最后, 总结了现有数字音频水印技术的异同点以及今后的研究方向。

关键词:数字音频水印,版权保护,鲁棒性

参考文献

[1]乔明亮, 宋莉.信息隐藏技术在通信中的应用研究[J].图书与情报, 2011 (4) :62~65.

[2]李友, 张定会.基于隐写术的信息隐藏技术[J].信息技术, 2010 (7) :119~122.

[3]王向阳, 杨红颖.数字音频水印技术研究综述[J].曲阜师范大学学报, 2005, 31 (4) :119~125.

[4]方健华.数字音频水印技术[J].信息技术, 2007 (4) :75~78.

[5]N.Cvejic and T.Seppanen.Digital Audio Watermarking Techniques and Technologies:Applications and Benchmarks[M].IGI Publishing Hershey, PA, USA, 2007.

[6]吴迪, 朱冰莲.数字音频水印技术研究综述[J].电声技术, 2009 (2) :55~58.

[7]D.Kirovski and H.S.Malvar.Spread-Spectrum Watermarking of Audio Signals[J].IEEE Transactions on Signal Processing, 2003, 51 (4) :1020~1033.

[8]李伟, 袁一群, 李晓强等.数字音频水印技术综述[J].通信学报, 2005, 26 (2) :100~111.

[9]刘海燕, 郑雪峰, 王颖.数字音频水印主要算法的研究与比较[J].计算机应用研究, 2007, 24 (9) :136~139.

FM广播音频监控告警器 第5篇

目前,对FM广播的检测主要分为两种监控方式:一种为软件检测监控,是用电脑通过软件对音频电平进行比对,这种方式最大不足是有干扰大和不稳定因素多存在电脑死机现象。一种为硬件监控,是通过电路进行电平比对,这种方式电路少、故障少,不存在死机现象,十分可靠。

FM广播音频监控告警器简单、实用、可靠,它通过无线开路接收方式最能反映发射机工作的真实状况,并实时监控8套FM立体声广播的音频丢失、音频过低/过高、载频丢失。告警器监控到音频丢失、音频过低/过高、载频丢失以后发出光电告警并延时10s (时间1~999s可调)声音告警,每一通道声音告警都可以单独关断。FM广播音频监控告警器分为两个机箱,一个为8路电调谐立体声FM广播接收机,一个为8×2通道音频告警器。

原理图如下:

FM接收机部分是由8S003F3P6八位微控制器和KT0830EG数字式立体声FM收音芯片和LCD1602液晶显示屏构成,具有高灵敏度、抗干扰能力强、失真小的特点,最大的亮点是该芯片内部具有接收场强指示和自适应噪声抑制(市场上很少有类似功能),为在复杂电磁环境中作为告警器的接收机创造了条件,能把接收某套节目的FM接收机静噪灵敏度电平调整到最佳状态,确保报警器不出现误报警和不报警。

单片机处理电路由STC15F204EA系列的SKDIP28封装构成双声道/12段电平指示电路,单片机中包含中央处理器(CPU)、程序存储器(Flash)、数据存储器(SRAM)、定时器、I/O口、高速A/D转换、看门狗、片内高精度R/C振荡时钟及高可靠复位,抗干扰能力强,程序固化后电路可以直接对音频信号的幅值进行采样(输入音频电平可调),并根据幅值的大小,驱动LED指示灯显示音频电平,并在没有信号或电平过低时能提供一个相当于5V的电压,这个电压可以用来作为反相比较器的过低比较电压与4.5V基准电压比较,音频电平过高时提供一个相当于2.7V电压,可以用来作为同相比较器的过高比较电压与3.2V基准电压比较。

比较器用两块LM324构成8路反相比较器监测音频消失或音频过低时告警,用两块LM324构成8路同相比较器监测音频过高时告警。告警输出高电平提供每一路的光电告警指示和经过隔离输出后去触发单片机延时触发电路,经延时后声音告警。

单片机延时触发电路在高电平触发后延时10s (可调)输出声音告警,触发电平消失(每一路的触发电平可单独关断)告警消失,在延时时间结束之前触发电平消失触发电路重新计时,进入下一次的触发等待。

本系统在我台成功使用了半年多,可以准确地在音频丢失(发射机工作正常但信号源中断)、载频丢失(发射机异常)、音频过低/过高时及时监控报警。对发射台站和检测台来说,在使用较少的硬件设备下,可较理想地完成多套调频广播实行自动监测。本系统使用至今已半年多,运行良好,真正起到了“四两拨千斤”的作用,为安全播出提供了实实在在的一层报警保障和极大减轻值班人员监听任务和负担,是广播电视安全播出的倍增器。

摘要:FM广播音频监控告警器通过无线开路接收方式实时监控8套FM立体声广播的音频丢失、音频过低/过高、载频丢失,最能反映发射机工作的真实状况,并通过光电报警和延时(可调)声音报警让值班员时刻了解发射机的工作状态,是广播电视安全播出的倍增器.

世界卫星数字音频广播简析 第6篇

最近10年来, 有许多得到巨额资金支持并被广泛熟知的科技产品最终却以失败或濒临失败而告终。《时代》周刊网站于2009年公布了过去10年来的十大失败科技产品, 微软Vista和谷歌YouTube等一批知名科技产品榜上有名, 美国的卫星数字音频广播 (SDARS) 业务也列在第6位:Sirius XM的卫星数字音频广播曾经一度被认为是有史以来最为成功的消费电子设备之一。2000年, Sirius的股价为63美元左右, 而今年则跌至0.05美元。

这份黑名单引起了我们一系列的思考:卫星数字音频广播被列入黑名单, 是否就等于被判了死刑?它为什么会失败?Sirius XM公司还有没有翻盘的可能?卫星数字音频广播到底是馅饼?还是陷阱?

2 什么是卫星数字音频广播

我们很多人可能都会有这样的经验:我们将自己喜欢的某些广播电台, 预先设定在汽车收音机中, 但是当走得离电台太远时, 信号会逐渐减弱, 噪声增大, 最后中断。尤其是调频广播, 一旦离开城市一定距离, 就再也收听不到了。中波广播的情况会稍好一点, 但接收效果却是差强人意。长途旅行时穿越不同的城市, 就必须经常调整频率, 而在各种噪声中搜台是毫无乐趣可言的。没有了心仪的广播, 长途旅行会让人感到枯燥和乏味。

卫星数字音频广播 (SDARS, Satellite Digital Audio Radio Service) 将改变这一切, 它可以将信号传播3.5万公里, 最后极其清晰地传送到收音机里。您可以开车纵横几千公里而不需要换台!您可以接收几百套节目, 不同风格的音乐应有尽有。

与过去调幅AM及调频FM均采用模拟技术不同, 卫星数字音频广播是利用卫星传递数字音频节目或数据到接收端的一种无线广播服务, 由于其可透过卫星或地面发射站发射数字信号, 能够抗噪声干扰, 不受电波传输衰落影响, 提供近乎零失真的音质, 听众在收听时间与节目内容的选择都更具主导性, 广播业者也因此可产生更多元化的销售模式, 而不再局限于贩卖广告的模式。

卫星广播相较于传统广播具有四大优势: (1) 接近CD的音质; (2) 提供没有或极少广告的节目; (3) 覆盖区域广大, 用户移动接收时不必随着不同地区而转换频道; (4) 涵盖人口众多。

卫星数字音频广播系统由卫星、地面中继站、无线电接收器等三个主要部分组成。

地面站向卫星发射数字音频信号和数据, 卫星再将信号反射到地面的无线电接收器。卫星广播接收器使用一种小型的汽车电话大小的天线来接收卫星信号, 并将数字音频和数据进行解密和解码。在都市, 高楼林立可能会遮蔽卫星信号, 可以设置地面发射器 (ground transmitter) 作为辅助传输手段, 先由地面发射器接收, 再转播到都市用户的接收器。

3 卫星数字音频广播的源起

世界上最早开通卫星数字音频广播服务的是WorldSpace, 该公司于1999年在非洲开始提供服务。之后, XM Satellite Radio和SIRIUS Satellite Radio分别于2001年与2002年开始在美国本土推出此种服务。这三家公司推出的广播服务均采用收费制。

1990年, Satellite CD Radio公司看到SDARS的商机, 并希望在美国推出SDARS, 向FCC和美国国会请愿开放SDARS。经过7年的努力和等待之后, FCC终于在1997年3月6日发布公告, 决定发放2张SDARS执照:EBN001和EBN002, 频谱分别是2320~2332.5MHz和2332.5~2345MHz, 各12.5MHz, 并于1997年4月1日至4月2日举行执照拍卖竞标。4家公司参加竞拍, 最终由American Mobile Radio Corporation (即是后来的XM Satellite Radio) 以最高价8988.8888万美元、CD Radio (即是后来的SIRIUS Satellite Radio) 以第二高价8334.6万美元的第二高价分别获得两张SDARS特许执照。

两家公司不仅为执照付出了高额的许可费, 还被FCC实施了严格的时间约束, 如果未能如期实现约定, FCC有权收回执照。

SIRIUS发现, 如果按照FCC发放的SDARS执照规定, 使用距地35800公里的同步卫星轨道GEO, 需要建1000座地面中继站, 而如果使用长椭圆轨道HEO, 大约100座地面中继站就够了。为此SIRIUS向FCC申请变更卫星轨道, 并获得FCC批准。

SIRIUS在1998年和SSL (Space Systems/Loral) 签约, 由SSL负责卫星的设计与建造及发射。第一颗卫星 (Radiosat-1) 在2000年6月30日发射升空, 第二颗卫星Radiosat-2在2000年9月5日发射升空, 第三颗卫星Radiosat-3在2000年11月30日发射升空。此外, SIRIUS在地面上还有第四颗待命, 作为备份。每颗卫星的建造及其发射的费用大约2.5亿美元。

SIRIUS原本计划于2001年中开始提供服务, 于2005年中达到400万订户后实现当月盈亏平衡, 之后则开始获利。但是由于接收芯片开发进展不顺, 导致于2002年2月14日才在特定城市提供服务, 而直到2002年7月1日才于全美国本土正式推出服务, 比预定计划晚了整整一年。

XM在1998年和休斯电子 (Hughes Electronics) 签约, 由Hughes负责卫星的设计、建造及发射, 原来计划采用2颗HS 702卫星, 分别称为XM-1和XM-2。卫星位于与地球同步的轨道上。XM的第一颗卫星XM-2是在2001年3月18日发射升空, 而XM-1也于2001年5月8日发射升空。

之后, 由于XM-1和XM-2的太阳能板未如预期提供足够的电力导致卫星使用寿命大幅减少, 这迫使XM必须再发射新卫星取代旧卫星。XM于2005年3月1日将XM-3 (Rhythm) 发射升空取代XM-1。2006年10月30日, XM-4 (Blues) 发射取代XM-2。之后XM-1和XM-2陆续关机, XM-2作为XM-4的备用卫星, 而XM-1作为XM-3的备用卫星。

XM采用GEO卫星计划, 需要建造1000座地面中继站。XM和Alcatel于1999年签约, 在2000年完成建设, 之后又相继增减地面中继站的数量, 至2006年12月31日, 营运中的地面中继站共有894座。

XM的营运试点选在Dallas/Fort Worth和San Diego, 使用者反应良好。XM最终于2001年11月1 2日在全美本土正式推出此项服务。虽然比预定计划晚了几个月, 但比竞争对手SIRIUS还是早了将近9个月。

WorldSpace于1990年在美国成立, 其目的就是要推动SDARS。不过有别于SIRIUS和XM, WorldSpace着眼的市场是美国境外, 是非洲和亚洲及南美洲等尚未开通AM或FM广播服务的地区, 超过40亿人居住在WorldSpace规划的广播区域内。

WorldSpace的第1颗卫星AfriStar在1998年10月28日发射, 并在1999年10月19日在非洲的几个特定国家与地区如南非约翰内斯堡和开普敦等城市开始推出服务。第2颗卫星AsiaStar在2000年3月21日发射, 并在2000年9月12日开始在亚洲地区提供服务, 主要的国家是印象。第3颗卫星AmeriStar原计划在2003年发射, 并在2003年底前开始在南美洲地区提供服务。但由于其使用L波段 (1467MHz至1492MHz) 亦为美国空军所用, 美国空军担心会造成无线电波的干扰, 要求ITU提出解决方案。因ITU尚未就此事提出可能的解决方案, AmeriStar到目前为止仍未发射。

截至2007年3月31日, WorldSpace全球的总订户数尚不足20万户。

4 卫星数字音频广播的发展

卫星数字广播产业链涉及不同的产业角色:需要SDARS运营商提供总体运营服务, 需要卫星提供商进行卫星设计、建造和发射, 需要技术提供商提供编解码和加解密的技术和芯片, 需要设备提供商制造接收机, 需要节目商提供节目, 需要分销商协助运营商分销和推广。

SIRIUS与Lucent签约, 由Lucent代为设计卫星收音机用的关键芯;SIRIUS和Alpine、Antenna Specialists等厂商合作制造卫星接收机。此外SIRIUS还直接下单给韩国和台湾地区的工厂去生产以SIRIUS为品牌的卫星收音机, 利用台湾工厂的高效率和低成本来降低产品的成本, 并缩短交货期;SIRIUS与全国性和区域性的超市合作, 建立了25000个销售点, 如Best Buy、Wal-Mar等。与汽车和卡车的制造商及其销售商合作, 实现车用卫星接收机的销售、改装或预装, 合作的汽车品牌有132个, 卡车品牌有十几个。

订户每月只要向SIRIUS支付12.95美元的费用, 就可享受有130多个频道的广播节目, 其中有69个音乐频道, 有65个频道的体育、新闻、谈话、娱乐、交通、气象和信息节目。SIRIUS与国家足球联盟、全国运动汽车竞赛协会、职业篮球联盟和冰上曲棍球联盟的合作, 可以现场转播相关比赛。所有的音乐频道都没有广告, 新闻以及谈话性频道有广告。除此之外, SIRIUS另有额外付费的Premium频道。

再来看XM的情况。XM与STMicroelectronics签约, 由STMicroelectronics代为设计卫星中收音机芯片组;与XM合作生产卫星接收机的厂家有Alpine, Antenna specialists等;XM也同样利用大型超市构建了20000个零售点, 与XM合作的汽车品牌有140个, 重型机车品牌12个。

XM开始营运时的收费是每月9.99美元, 音乐频道也有广告, 后来采用与SIRIUS相同的方式即音乐频道不再插播广告, 收费也改为每月12.95美元, 提供爵士乐、摇滚乐、新闻、体育等170多个频道的卫星广播节目。除XM自营的音乐频道之外, XM的内容供应商包括CNN、BBC、CNBC、ABC、NLB、USA Today, 以及The Weather Channel和Traffic Channel等。

两家公司的订户数增长十分迅速, 表1是历年年底的用户数及增长速度。

虽然两公司的用户数量增加迅速, 但两公司也为此付出了高昂的代价。两公司的经营状况十分糟糕, 2006年, 已经资不抵债, 到了破产的边缘。

SIRIUS的经营数据见表2。从表2数据可以看出, SIRIUS的营收逐年大幅增加, 然而营运成本增加幅太大, 特别是2006年, 成本增幅太大, 以至于造成当年净亏损达11亿美元。历年的亏损, 导致SIRIUS的负债逐年大幅增加, 至2006年, 已经资不抵债, 公司净值为负。SIRIUS的净现金逐年下降, 不断恶化, 2006年净现金流量变为负数。

XM的经营数据见表3。XM的情况与SIRIUS大同小异。相同之处是:虽然营收逐年大幅增加, 但亏损也越来越重, 2006年已经资不抵债。不同之处在于:XM毛利一直在增加, 这样假以时日, 还有可能扭亏为盈。但2006年7.3亿美元的亏损导致现金流的严重恶化。

2007年2月17日, 这两家盈利困难的企业最终宣布合并。美国联邦通信委员会 (FCC) 为此进行了长达13个月的审查, 最终批准了两家公司的合并, 新公司名称为Sirius XM Radio。

2009年Sirius XM Radio公布第一财季季报, 净亏损从上年同期的1.04亿美元降至5040万美元。扣除一次性项目后, 该公司当季运营业绩从上年同期的亏损7020万美元转为盈利1.09亿美元。用户获得成本从上年同期的每个用户82美元降至61美元, 下降26%, Sirius XM还将2009财年调整后运营盈利预期从超过3亿美元上调至超过3.50亿美元。

随着苹果iPod和智能手机等新型消费电子设备的兴起, Sirius XM的注册用户增速也开始放缓。截至2009年第一季末, 该公司拥有1860万个用户, 较上年同期试算额基础上的1800万个增加了3%, 但低于2008年底的1900万个。

5 卫星数字音频广播巨亏试析

卫星数字音频广播的发生、发展历程让人不胜唏嘘的同时, 也发人深省。它再次说明由技术创新到形成产业是一项富有挑战性且不容易成功的工作, 政府的政策、经济的好坏、社会的变迁、需求的确立、应用的培植、产业链的成熟与大众化的价格都将决定新产业的成功或失败。思考总结美国卫星数字音频广播巨亏的原因, 我们认为有以下几个方面:

第一、美国FCC难辞其咎。FCC错误地估计了广播业的竞争格局, 对卫星数字音频广播的发展估计过于乐观, 过分强调要在卫星数字音频广播业内制造竞争而发放两张执照, 忽视了卫星数字音频广播在整个大广播业内的竞争地位, 导致了过度竞争的严重后果。实际上, 美国AM和FM电台的听众高达1.8亿人, 而SIRIUS和XM合并后, 其听众不过1365万人, 合并后的市场占有率仅为7.58%;从营收来看, SIRIUS-XM合并后营收合计15.7亿美元, 而所有AM/FM电台的年度总营收约为200亿美元, SIRIUS XM合并的市场占有率只有7.28%。如此看来, 即使只发一张执照, 也不会引发垄断。而两张执照的发放, 成了一切祸端的诱因。

第二, 两张执照使得势均力敌的对手陷入了“囚徒困境”, 导致了恶性竞争, 使SDARS运营商在产业链中处于不利地位。首先, 两家公司为了拓展用户, 尽力说服汽车制造商和销售商以及其他销售伙伴尽可能作为自己的独家合作伙伴, 为此, 开出的条件越来越优惠。争夺的结果就是相当的利润转移给了渠道伙伴。其次, 为了吸引订户, 降低用户收听卫星广播的门槛, 两家公司都针对订户购买卫星接收机实施了一定的补贴。这在一定程度上扩大了两公司的用户拓展成本, 降低了公司的收益。

第三, 两公司都意识到丰富的内容是决定消费者是否订购卫星广播的决定性因素, 因此两公司除了一些自办节目之外, 加大了对优秀节目的争夺, 付出了高昂的代价。

第四, 两家公司为了开展业务, 必须各自发射自己的卫星, 这是一笔十几亿美元的庞大支出, 而且两家公司在与卫星提供商的议价之中并不占任何优势。如果只批一张执照的话, 则无疑会节省一笔巨大的开支, 避免重复建设和资源的巨大浪费。

第五, 两家公司和技术提供商的关系, 与同卫星公司的关系有些类似, 议价能力并不强。

总而言之, 在卫星数字音频广播的整个产业链中, 只有运营商是亏损的, 其他的角色都赚了钱。残酷的事实教育了两家公司, 迫使两家公司走向了合并。理论上, 合并应该能够改善公司的竞争地位和议价能力, 如公司不必为了取悦客户而加大卫星接收机的补贴, 只需考虑如何将用户从其他形式的广播或其他广播的替代形式之中吸引过来。不需再在节目商面前恶性竞争, 只需和节目商进行正常的商务洽谈即可。渠道商也不能再从两公司的鹬蚌相争当中渔利了, 公司的营销费用会大大降低。所有这些累积起来, 会降低公司的运营成本, 改善公司的盈利能力。事实上, 合并以后的实践证明, 公司经营正朝着好的方向转化, 但究竟能不能扭亏为盈, 何时能够扭亏为盈, 卫星数字音频广播究竟是馅饼还是陷阱, 尚需一段时日, 大家可以拭目以待。

(需要说明的是, 本文写作得益于台湾刘孟贤先生的大力支持。他专门做过关于SIRIUS和XM竞合的案例研究, 资料十分翔实。本文关于美国卫星数字音频广播的大部分数据和信息即引自他的研究, 在此表示感谢。)

摘要:本文简要回顾了世界卫星数字音频广播的源起和发展历程, 并解析了卫星数字音频广播陷入困境的原因。

关键词:卫星数字广播,XM,SIRIUS

参考文献

[1]刘孟贤.美国卫星数位音讯广播产业分析:SIRIUS和XM的竞争与合作个案研究[R], 台湾大学EMBA论文.2007.

[2]王彦广, 杨墚, 张海歆.美国XM公司卫星音频广播业务发展启示[J].卫星与网络, 2006 (11) .

全数字音频功率放大器 第7篇

关键词:数字功放,DDX技术,PWM

全球音视频领域的数字化浪潮以及人们对音视频设备节能环保的要求, 迫使人们尽快研究开发高效、节能、易于与数字化设备接口的音频功率放大器。数字音频放大器就是在这样的背景下兴起的[1]。进入21世纪以后, 随着平板电视与便携式音乐播放器的普及化, 市场上对窄小音箱与桌面音响系统的需求不断增长。随着生活质量提升, 消费者对音视产品的音效及音质亦有所提升, 在外观设计上, 亦要求体积细小或纤薄。但由于产品的内部空间的限制, 音频放大器及其音质亦同时受到限制[2]。因此, 产品必需用上数字音频处理器去提升音质及纯数字音频放大器来减少对散热空间的要求。

1 基于DDX技术的数字功放

直接数字放大 (DDX) 是一种直接把数字信号转换成功率信号而无需数模转换 (DAC) 的高效率音频放大器技术[3]。主要包括两个部分:a.把数字音频接口或A/D转换器得到的PCM数字音频数据进行异步采样率转换和重采样, 然后通过先进的数字信号处理技术转换成DDX专利的三态调制信号输出;b.经过DDX调制之后的数字信号控制三态驱动逻辑电路, 产生相应的开关控制信号来控制半桥电路中功率管的导通与截止, 经过低通滤波之后, 在负载上得到放大的音频输出, 如图1所示。

2 整体设计框图

整机信号的流程是:输入USB信号经PCM2706接收处理芯片得到PCM数据流, 后送入主功放芯片STA323, 进行PCM到PWM信号转换和功率放大, 输出功率PWM信号经过LPF滤波, 再分别送到功率音频输出接口, 推动扬声器发声。在这里51单片机用于整机控制, 主要工作有:

2.1 按键输入检测。

2.2 控制显示屏显示工作状态。

2.3 控制STA323, 进行音频的增益 (音量) 调节, 音频EQ调节, 低音/高音音调调节, 静音控制等。

3 硬件设计

3.1 USB转换电路模块

本电路的功能是将USB输出的音频信号转换成主功放能识别的信号, 转换出来的信号包括模拟信号、同轴信号、IIS信号[4], 因此选用USB解码芯片PCM2706, 它具有极高的信噪比 (90d B) 和动态范围 (98d B) , 能接收32k、44.1k、48k采样率、16bit采样精度的数字信号, 能够满足高品质音乐的要求。

3.2 主功放电路模块

主芯片STA323W电路比较复杂, 外围元件比较多, 原理图分两部分如图3所示。STA323W内部锁相环电路的提供滤波作用的, 锁相环得到电源由+3.3V经过L3/L4、C14~C17组成的∏形滤波电路进行滤波, 保证锁相环供电的稳定[5]。同时锁相环压控振荡器的PLL端接了R10、C18~C21组成的阻容滤波电路, 保证锁相电压的稳定。

STA323W主电路中, 左边是IIS输入、IIC总线输入, 中间电容C35~C41是+18V电源滤波电容, 采用大容量电解电容 (820u F) +小容量瓷片电容 (0.1u F) 组合的方式, 尽量减小电源各个频段的内阻, 给芯片充沛的电源供电。右边由L7~L10、C47~C55等组成LC低通滤波器[3], 滤除将调制的功放PWM信号 (382k Hz的高频脉冲) 滤除, 得到音频信号传输到扬声器中。因为音频成分是20Hz~20k Hz的低频信号, 因此这个LC低通滤波器的截止频率可以在40k Hz左右[6]。

如果截止频率高, 则有更多高频成分进入扬声器, 使扬声器消耗更多无用功, 降低了数字功放的效率;如果截止频率低, 则音频成分也被滤除, 导致音频的失真, 但此时通过扬声器的都是音频信号, 因而功放效率高。

3.3 单片机控制电路模块

单片机控制板包括+5V的电源接口, 128*64液晶屏接口, 单片机接口等。单片机最小系统电路, 包括复位电路、12M晶振电路、单片机AT89S51。电路中AT24C16存储器、下载口、独立按键, 分别与单片机对应的I/O口相连。

4 软件设计

主函数首先开机初始化, 包括:a.单片机初始化, 如定时器和一些显示变量的初始化;b.主功放板初始化, 从存储器中读出上次数据送到主功放板, 使主功放板按照上次关机前的输入选择和音量等的设置进行播放;c.液晶屏初始化, 并显示存储器中保存的信息。然后进入大循环, 大循环中先执行按键扫描函数, 得到按键值, 再判断菜单标志status的值, 根据菜单标志值转到相应菜单的显示, 再在菜单显示里面进行按键键值处理等操作, 最后返回大循环重新开始。总程序的主函数流程图如图4所示。

5 结论

本文介绍了一种基于单片机控制的数字功放, 以STA323W数字芯片为核心, 加上相应的信号转换电路和控制电路, 实现了对数字音频信号的处理和放大, 在较低的失真水平下具有很高的效率, 比传统功放更加节能环保。

参考文献

[1]邹天汉.数字功放和音箱设计与制作[M].北京:人民邮电出版社, 2004:1-12, 30-38.

[2]张自江.51单片机基础及编程应用[M].北京:中国电力出版社, 2012:168-182, 186-198.

[3] (日) 森荣二.薛培鼎译.LC滤波器设计与制作[M].北京:科学出版社, 2005.

[4]STA323W Datasheet, ST.2005.

[5]王新贤.通用集成电路速查手册[M].济南:山东科学技术出版社, 2002.

上一篇:服装图案设计下一篇:日常思想政治教育