CN1758333A - 嵌入声场控制因子的方法以及处理声场的方法 - Google Patents
嵌入声场控制因子的方法以及处理声场的方法 Download PDFInfo
- Publication number
- CN1758333A CN1758333A CNA2005100984410A CN200510098441A CN1758333A CN 1758333 A CN1758333 A CN 1758333A CN A2005100984410 A CNA2005100984410 A CN A2005100984410A CN 200510098441 A CN200510098441 A CN 200510098441A CN 1758333 A CN1758333 A CN 1758333A
- Authority
- CN
- China
- Prior art keywords
- sound field
- sound
- voice signal
- controlling elements
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/913—Television signal processing therefor for scrambling ; for copy protection
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00992—Circuits for stereophonic or quadraphonic recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00891—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00913—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm based on a spread spectrum technique
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/002—Programmed access in sequence to a plurality of record carriers or indexed parts, e.g. tracks, thereof, e.g. for editing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/28—Arrangements for simultaneous broadcast of plural pieces of information
- H04H20/30—Arrangements for simultaneous broadcast of plural pieces of information by a single channel
- H04H20/31—Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H2201/00—Aspects of broadcast communication
- H04H2201/50—Aspects of broadcast communication characterised by the use of watermarks
Abstract
本发明提供了一种将声场控制因子(SFC因子)嵌入声源中的方法。该方法包括:对声场因子和声场信息编码以获得二进制数据类型的用于声源的声场控制因子,声场因子代表声源的音响特性,声场信息表示声源被记录的环境;和给进入声源之内的声场控制因子加水印而不压缩声源。在这种方法中,使用数字水印技术将表示声源特性的SFC因子嵌入声源本身。因此,用户不需要手动设置SFC因子。另外,SFC因子能够被可靠传输而不管由格式变换和压缩的声源的传输所引起的头的破坏。
Description
本申请要求于2004年9月14日在韩国知识产权局提交的第2004-73367号韩国专利申请的优先权,该申请完全公开于此以资参考。
技术领域
本发明总体构思涉及一种控制声场的方法,更具体地讲,涉及一种将声场因子和声场信息嵌入声源中的方法以及一种处理声源因子和声场信息的方法。
背景技术
通常,传输用于声场处理的声场信息要求用户直接指定声场信息。另外,声场信息通常被插入具有压缩的声源的包的头中。声场信息也可以从声源本身提取。
用户通过具有声场处理器的音频设备的输入来指定声场信息。这种传统方法的缺点是,要求用户根据声源的特性指定声场信息。在克服这个缺点的尝试中,已经公开了一种将关于介质和存储在其上的音轨的信息与已输入的声场信息匹配的方法。
图1是示出控制声场的传统方法的流程图。图1中示出的方法在第1998-03133号韩国专利公开中被公开(1998年7月25日出版)。
控制声场的方法包括:操作S21,设置并存储关于CD号码或轨道的声场信息;操作S22,确定CD是否在播放;操作S23,输入当前正在播放的CD的号码和轨道信息;操作S24,确定声场信息是否已经被存储;操作S25,当关于给定的CD和轨道的声场信息已经被存储时,基于关于给定的CD和轨道的声场信息来控制声场;操作S26,当关于给定的CD和轨道的声场信息没有被存储时,存储由用户选择的声场信息;和操作S27,基于由用户选择的声场信息来控制声场。
根据图1中示出的控制声场的适合于CD的传统方法,基于最初播放CD时所存储的声场信息来控制声场。或者,可以预先存储声场信息。在这种情况下,当播放给定的CD或轨道时,可以基于存储的声场信息来控制声场。
然而,图1中示出的控制声场的方法要求用户设置声场信息至少一次。另外,即使声场特性在轨道的部分中不同,声场信息也只能被设置为整个轨道声场特性的平均值。因此,这种方法可以被用于其上记录有分段声源(例如,文件、音乐轨道和音乐视频)的介质。然而,这种方法可能不被用于具有诸如肥皂剧或电影的连续声源的介质。
另外,当声场信息被插入具有压缩声源(例如,MPEG压缩声源)的音频包的头中时,每当头被诸如格式变换的变换和/或传输破坏时,声场信息就可能被破坏。另外,当从声源本身提取声场信息时,问题是:不能保证精度、可能无法实现实时处理,以及对于大多数类型的介质声场特性显著地不同。因此,这种方法很难实现。
发明内容
本发明的总体构思提供了一种将表示声源特性的声场控制(SFC)因子和表示节目场景、节目类型和声场模式等的声场信息嵌入未压缩的声源中的方法。
本发明的总体构思还提供了一种根据嵌入SFC因子的方法来处理声场的方法。
本发明总体构思的另外方面和优点将会部分地在如下的描述中被阐述,并且部分地从描述中是显而易见的,或者可通过本发明总体构思的实施理解。
本发明总体构思的前述和/或其他方面和优点通过提供一种嵌入声场控制(SFC)因子的方法被实现,该方法包括:将声场因子和声场信息编码以获得二进制数据类型的用于声源的SFC因子,其中,声场因子表示声源的音响特性,声场信息表示声源被记录的环境;和给进入声源内的SFC因子加水印而不压缩声源。
可以使用水印将表示声场因子和声场信息的SFC因子嵌入未压缩的声源中。可以根据帧单位而将未压缩的声源分段而成为多个帧,并且SFC因子可以被包括在每个帧中。另外,帧分段可以在声场特性显著变化的位置开始。
可以使用数字水印技术将表示声源特性的SFC因子嵌入未压缩的声源本身。因此,用户不要求手动地一个接一个设置SFC因子。另外,SFC因子能够被可靠传输而不管由压缩的声源的格式变换和传输所引起的头的破坏。
本发明总体构思的前述和/或其他方面和优点也可以通过提供一种处理声场的方法来被实现,该方法包括:接收具有加水印的SFC因子的声源;从声源对加水印的SFC因子解码;和基于解码的SFC因子对声源执行声场处理。
过渡处理,诸如淡入和淡出处理,能够基于当前帧中的SFC因子和下一个帧中的其他SFC因子被执行。因此,这样能够执行的声场处理可以具有现场感。
附图说明
通过下面结合附图对实施例进行的描述,本发明总体构思的这些和/或其他方面和优点将会变得清楚和更加容易理解,其中:
图1是示出控制声场的传统方法的流程图;
图2是示出根据本发明总体构思的嵌入声场控制(SFC)因子的设备的方框图;
图3是示出根据本发明总体构思的嵌入SFC因子的方法;
图4是示出表示声源的音响特性的声场因子的示意图;
图5是示出图3的嵌入SFC因子的方法的水印编码器的操作的示意图;
图6是示出从被图5的水印编码器编码的声源提取SFC因子的操作的示意图;
图7是示出图6的提取SFC因子的操作的水印解码操作的示意图;和
图8是示出根据本发明总体构思的嵌入SFC因子并处理声场的方法的流程图。
具体实施方式
现在,将详细描述本发明总体构思的实施例,其示例在附图中示出,其中,相同的标号始终表示相同的部件。下面通过参考附图来描述实施例以解释本发明总体构思。
本发明的总体构思提供一种使用水印来嵌入声场控制因子(以下,称作“SFC因子”)的方法,所述声场控制因子表示未压缩的声源的声场特性。即使SFC因子被嵌入其中,加水印的声源也能够保持其声音性质。另外,SFC因子被用于处理声场,所述SFC因子通过与嵌入方法相应的提取方法被解码。
图2是示出根据本发明总体构思的将SFC因子嵌入声源中的设备的方框图。该设备包括:水印编码器202和SFC因子数据库204。水印编码器202使用相应的SFC因子来执行给原始声源So加水印的操作。SFC因子是指嵌入声场因子和声场信息的编码数据。声场因子(SF因子)表示声源的音响特性,包括混响时间(RT)、清晰度(C)和早反射模式(PER)。其他音响特性也可以被包括在声场因子中。另一方面,声场信息包括节目场景、节目类型和声场模式(SF模式),声场模式表示声源被记录的地点,诸如森林、平原、洞穴等等。
SF因子、SF模式、节目场景和节目类型被嵌入声源So中并被存储在SFC因子数据库204中。可以直接从声源So信号提取SF因子。用户可以在声源So被记录的时刻指定SF模式、节目场景和节目类型。
图3示出了根据本发明的总体构思的嵌入SFC因子的方法。
声源So被分段而成为多个帧。SFC因子被嵌入声源So的每个帧中。可以基于声源So的声场特性能够被清晰地辨认出的位置来将所述多个帧分段。例如,可以基于SF模式、节目场景或节目类型变化的位置或SF因子能够被显著地辨认出的位置来获得所述多个帧。
声源So被分段而成为包括fo、f1、f2、...,和fN-1的多个帧。对于所述的多个帧fo、f1、f2、...,和fN-1中的每个,相应的SFC因子SFCF0、SFCF1、SFCF2、...,和SFCFN-1被嵌入声源So的各个帧。
包含编码的数字信息的SFC因子SFCF包括诸如RT-混响时间、C80-清晰度和PER-早反射模式的相应的SF因子和其他声场信息。
作为使用水印编码器202采用SFC因子SFCF对声源So编码的结果,得到了包括f’o、f’1、f’2,...、f’N-1的嵌入的结果。
图4是示出表示声源的音响特性的声场因子的示意图。混响时间RT表示声音强度从初始强度降低60dB所经历的时间段。清晰度表示包括第一能量和第二能量的能量比,所述第一能量是从产生声音的时刻到80ms的能量,所述第二能量是从80ms到声音强度降低60dB的时刻的能量。早反射模式PER表示声音被产生后的反射模式。
图5是示出图3的嵌入SFC因子的方法的水印编码器的操作的示意图。在本发明的总体构思中,可以使用时间展宽回声方法来将SFC因子加到声源中。
可以用下面的等式来表示时间展宽回声方法的核心。
k(n)=δ(n)+α·p(n-Δ)
其中,δ(n)是狄拉克d函数,p(n)是伪噪声(PN)序列,α是幅值、Δ是时间延迟。时间展宽回声方法通过使用不同的时间延迟或不同的PN序列p(n)来将不同的信息(二进制数据)加到声源。
此外,p(n)用作可以用其提取嵌入的信息的加密密钥或解密密钥。因此,可以根据系统规格来使用加密密钥或解密密钥类型。例如,密钥的类型可以取决于嵌入的信息的控制访问。
参考图5,用下面的等式表示加水印的声源W(n)。
W(n)=s(n)*k(n)
其中,*表示线性卷积。
图6是示出从被图5的由水印编码器编码的声源提取SFC因子的操作的示意图。
当前帧fpresent和下一个帧fnext通过独立的解码过程被解码。因此,当前帧的SFC因子SFCFpresent和下一个帧的SFC因子SFCFnext被解码。声场处理器参考解码的SFC因子。
在声场处理的操作中,当前帧中的SFC因子被参考来用于处理下一个帧。例如,当当前帧的SF模式是洞穴模式并且下一个帧的SF模式是平原(即,没有树木的广阔区域)模式时,执行淡出(fade-out)处理以防止适合洞穴SF模式的混响声音影响适合平原SF模式的混响声音。
图7是示出图6的提取SFC因子的操作的水印解码操作的示意图。
根据本发明的总体构思,使用时间展宽回声(TSE)方法将如图5中示出的编码的SFC因子解码。参考图7,倒谱分析器702被用来增加加水印的声源W(n)的清晰度。在图7的中心,示出了加水印的声源W(n)的时间-幅值特性
。
用下面的等式来表示从图7中示出的操作获得的解码的声源d(n)。
d(n)=F-1[log[F[W(n)]]]LPN
其中,F[]和F-1[]分别表示傅立叶变换和傅立叶反变换,log[]表示对数函数,表示互相关函数,LPN表示PN序列。
图8是示出根据本发明总体构思的嵌入SFC因子并处理声场的方法的流程图。首先,在操作S802,给SFC因子加水印并将其嵌入声源中。通过参考SFC因子数据库204(见图2)来设置SFC因子,所述SFC因子是编码的声场因子和声场信息的数据。为SFC因子加水印的操作S802在上文参考图4和图5被描述。
在操作S804,从加水印的声源来对SFC因子解码。上面参考图6和图7描述了从加水印的声源来对SFC因子解码的操作S804。
在操作S806,确定SFC因子是否被提取。如果SFC因子被提取,那么在操作S808,通过参考SFC因子数据库204(见图2)来获得与被嵌入的SFC因子相应的声场因子和声场信息。
在操作S810,通过参考在操作S808中获得的声场因子和声场信息来执行声场处理。在操作S810执行声场处理的操作中,通过参考当前帧和下一个帧的SFC因子来控制下一个帧的声场处理。例如,通过参考当前帧和下一个帧的声场信息来执行淡入(fade-in)和淡出处理和其他过渡处理。因此,这样执行的声场处理可以具有现场感。
另外,为了方便用户,在操作S808,由用户输入的声场因子和声场信息以及从该提取获得的声场因子和声场信息都可以被参考。
在操作S806,如果SFC因子未被提取,那么处理进行到操作S812。在操作S812,通过参考由用户输入的声场因子和声场信息执行声场处理。
根据本发明总体构思的嵌入SFC因子的方法,通过使用数字水印技术将表示声源特性的SFC因子嵌入声源本身。因此,不要求用户指定声源的SFC因子中的每个。
另外,根据本发明总体构思的嵌入SFC因子的方法,SFC因子没有在具有压缩的声源的包的头中被传输。而是,使用数字水印技术将SFC因子嵌入未压缩的声源中的声音内容之中并在未压缩的声源中的声音内容之中传输SFC因子。因此,即使头被压缩的声源的格式变换和传输破坏,SFC因子也能被可靠传输。
另外,根据本发明总体构思的嵌入SFC因子的方法,未被压缩的声源被分段而成为帧。此外,SFC因子被嵌入声源的每个帧中。因此,SFC因子适合分段的声源的特性并能够被实时传输。换句话说,由于声源可以以未压缩的形式被传输,因此,当声源被声音处理器接收时,声源和嵌入到其中的SFC因子可以被实时处理。此外,帧的分段在声源中声场控制的特性清楚可辨别的位置被执行。因此,SFC因子能够被更高效地传输。
另外,根据本发明总体构思的处理声场的方法,能够基于当前帧和下一个帧中的声场控制(SFC)因子执行诸如淡入和淡出处理的过渡处理。因此,这样执行的声场处理可以具有现场感。
如上所述,根据本发明总体构思的嵌入SFC因子的方法,通过使用数字水印技术,能够将表示声源特性的SFC因子嵌入声源本身,而不降低声音质量。另外,在再现声源的时候,提取并使用SFC因子从而能够可靠地执行声场处理并保持声源特性。
尽管已经显示和描述了本发明总体构思的一些实施例,但是本领域的技术人员应该理解,在不脱离本发明总体构思的原理和精神的情况下,可以对这些实施例进行改变,本发明总体构思的范围由权利要求及其等同物来限定。
Claims (64)
1、一种嵌入声场控制因子的方法,该方法包括:
对声场因子和声场信息编码,以获得二进制数据类型的所述声源的声场控制因子,所述声场因子表示声源的音响特性,所述声场信息表示声源被记录的环境;和
将所述声场控制因子加水印进入处于未压缩状态的声源。
2、如权利要求1所述的方法,其中,所述将所述声场控制因子加水印进入处于未压缩状态的声源的步骤包括执行时间展宽回声编码。
3、如权利要求2所述的方法,其中,使用延迟时间和伪噪声序列中的至少一个来对所述声场控制因子编码。
4、如权利要求1所述的方法,还包括:
将所述未压缩的声源分段而成为多个帧,
其中,所述将所述声场控制因子加水印进入处于未压缩状态的声源的步骤包括以帧为单位来对所述声场控制因子编码。
5、如权利要求4所述的方法,其中,所述将所述未压缩的声源分段而成为多个帧的步骤包括:基于所述包含在声场控制因子中的声场信息或声场因子被显著改变的位置来初始帧分段。
6、如权利要求1所述的方法,其中,所述声源是连续的。
7、如权利要求1所述的方法,还包括:
将所述加水印的处于未压缩状态的声源传输到声音处理器。
8、一种处理声场的方法,该方法包括:
接收具有加水印的声场控制因子的声源;
从所述声源对所述加水印的声场控制因子解码;和
基于所述解码的声场控制因子来对所述声源执行声场处理。
9、如权利要求8所述的方法,其中,所述声场控制因子每个包括表示所述声源的音响特性的声场因子和表示记录所述声源的环境的声场信息,并且还包括步骤:
提供基于声场控制因子数据库而被解码的所述声场控制因子,所述声场控制因子数据库具有声场控制因子以及相应的声场因子和声场信息;和
根据所述解码的声场控制因子来表示获得所述声源的环境。
10、如权利要求9所述的方法,还包括:
从用户接收所述声场因子和所述声场信息。
11、一种处理声音的方法,该方法包括:
对声音信号编码并将关于所述声音信号的至少一个声场的声音信息嵌入处于未压缩状态的所述声音信号中;和
处理声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息。
12、如权利要求11所述的方法,其中,关于所述至少一个声场的声音信息包括声场因子、声场模式、节目类型和节目场景中的一个或更多个。
13、如权利要求12所述的方法,其中,所述声场因子直接从所述声音信号被提取,并且所述声场模式、所述节目类型和所述节目场景由用户在所述声音信号被记录的时刻指定。
14、如权利要求12所述的方法,其中,所述声场因子包括混响时间、清晰度和早反射模式中的一个或更多个。
15、如权利要求12所述的方法,其中,所述声场模式表示所述声音信号被记录的位置的特性。
16、如权利要求11所述的方法,其中,所述声音信号的编码并嵌入关于所述声音信号的至少一个声场的声音信息的步骤包括:将所述声音信号分段而成为多个帧并将相应的声音信息嵌入所述多个帧中的每个。
17、如权利要求16所述的方法,其中,所述多个帧根据声音信号中关于所述声音信号的至少一个声场的声音信息改变的位置被分段。
18、如权利要求11所述的方法,其中,使用水印方法嵌入所述声音信息,所述水印方法根据所述声音信号S(n)和时间展宽回声方法的核函数K(n)之间的线性卷积被执行。
19、如权利要求18所述的方法,其中,所述核函数K(n)由k(n)=δ(n)+α·p(n-Δ)定义,
其中,δ(n)表示狄拉克d函数、α表示幅值、p(n)表示伪噪声序列、Δ表示时间延迟。
20、如权利要求19所述的方法,其中,p(n)是解密密钥和加密密钥之一,用于从所述声音信号提取所述嵌入的关于所述声音信号的至少一个声场的声音信息。
21、如权利要求11所述的方法,其中,所述声音信号和嵌入的关于所述声音信号的至少一个声场的声音信息的处理包括:根据下式来对所述嵌入的关于声音信号的至少一个声场的声音信息解码,
d(n)=F-1[log[F[W(n)]]]LPN
其中,W(n)表示具有所述嵌入的声音信息的所述声音信号,F-1[]表示傅立叶反变换,F[]表示傅立叶变换,log[]表示对数函数,表示互相关函数,LPN表示伪噪声序列。
22、如权利要求11所述的方法,其中,所述的对所述声音信号的编码并嵌入关于所述声音信号的至少一个声场的声音信息的步骤包括:
将关于所述至少一个声场的声音信息映射到一个或更多个存储在数据库中的声场控制因子;和
将所述一个或更多个声场控制因子嵌入所述声音信号中,所述一个或更多个声场控制因子与关于所述声音信号的至少一个声场的声音信息相应。
23、如权利要求11所述的方法,其中,所述的处理所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息的步骤包括:通过独立地对所述声音信号的多个帧解码来对所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息解码,所述声音信号的多个帧包括嵌入其中的相应的声音信息。
24、如权利要求23所述的方法,其中,所述的处理所述声音信号和所述嵌入的关于声音信号的至少一个声场的声音信息的步骤还包括:根据当前帧的声场控制因子和先前帧的声场控制因子来处理与所述声音信号的当前帧相应的声音信息。
25、如权利要求23所述的方法,其中,所述的处理所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息的步骤还包括:根据所述嵌入其中的相应的声音信息,在所述多个帧中的相邻帧中执行过渡处理。
26、如权利要求25所述的方法,其中,所述过渡处理包括淡入处理和淡出处理中的一个或更多个。
27、如权利要求24所述的方法,其中,所述过渡处理解决所述相邻帧之间的声场的变化。
28、如权利要求11所述的方法,其中,所述声音信号中被嵌入的关于声音信号的至少一个声场的声音信息被数字地加水印在所述声音信号中。
29、如权利要求11所述的方法,其中,所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息的处理当所述声音信号被声音处理器接收时实时地发生。
30、一种传输关于声源的声音特性的信息的方法,该方法包括:
当声源被记录时,将关于所述声源的声音特性的数字信息存储在所述声源的声音内容之中;和
将所述声源传输到声音处理器。
31、如权利要求30所述的方法,其中,关于所述声音特性的数字信息被加水印在所述声源的声音内容中,并且所述声音内容以未压缩的形式被传输。
32、如权利要求31所述的方法,其中,所述的将关于所述声源的声音特性的数字信息存储在所述声源的声音内容之中的步骤包括:根据声场中察觉到的变化将所述声音内容分为多个声音帧,并将关于各个声音帧的数字信息存储在所述多个声音帧之中。
33、如权利要求32所述的方法,还包括:
接收所述声源并实时处理所述多个声音帧和所述存储的关于各个声音帧的数字信息。
34、一种将声场控制因子嵌入声源中的设备,包括:
声场控制因子数据库,使声场因子和声场信息与二进制数据类型的声源的所述声场控制因子相互关联,所述声场因子表示所述声源的音响特性,所述声场信息表示所述声源被记录的环境;和
水印编码器,将所述声场控制因子加水印进入处于未压缩状态的声源。
35、如权利要求34所述的设备,其中,所述水印编码器执行时间展宽回声编码。
36、如权利要求35所述的设备,其中,使用延迟时间和伪噪声序列中的至少一个来对所述声场控制因子编码。
37、如权利要求35所述的设备,其中,所述水印编码器通过将所述未压缩的声源分段而成为多个帧并以帧为单位对所述声场控制因子编码来将所述声场控制因子加水印进入声源。
38、如权利要求37所述的设备,其中,所述水印编码器通过基于所述声场控制因子中包括的声场信息或声场因子被显著改变的位置初始帧分段来将将所述未压缩的声源分段而成为多个帧。
39、一种处理声场的设备,包括:
解码器,接收具有加水印的声场控制因子的声源并从所述声源对所述加水印的声场控制因子解码;和
声音处理器,基于所述解码的声场控制因子来处理所述声源的声场。
40、如权利要求39所述的设备,其中,所述声场控制因子每个包括表示声源的音响特性的声场因子和表示获得所述声源的环境的声场信息;和
所述声音处理器还提供基于声场控制因子数据库而被解码的所述声场控制因子,所述声场控制因子数据库具有声场控制因子和相应的声场因子和声场信息,并根据所述解码的声场控制因子来表示获得所述声源的环境。
41、如权利要求40所述的设备,其中,所述声音处理器从用户接收声场因子与声场信息。
42、一种处理声音的设备,包括:
编码器,将关于声音信号的至少一个声场的声音信息嵌入处于未压缩状态的声音信号中;和
声音处理器,处理所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息。
43、如权利要求42所述的设备,其中,关于所述至少一个声场的声音信息包括声场因子、声场模式、节目类型和节目场景中的一个或更多。
44、如权利要求43所述的设备,其中,所述声场因子从所述声音信号直接被提取,所述声场模式、所述节目类型和所述节目场景由用户在所述声音信号被记录的时候指定。
45、如权利要求43所述的设备,其中,所述声场因子包括混响时间、清晰度和早反射模式中的一个或更多。
46、如权利要求43所述的设备,其中,所述声场模式表示所述声音信号被记录的地点的特性。
47、如权利要求42所述的设备,其中,所述编码器通过将所述声音信号分段而成为多个帧并将相应的声音信息嵌入所述多个帧中的每个中来对所述声音信号编码并嵌入关于所述声音信号的至少一个声场的声音信息。
48、如权利要求47所述的设备,其中,根据所述声音信号中关于所述声音信号的至少一个声场的声音信息变化的位置来将所述多个帧分段。
49、如权利要求42所述的设备,其中,使用水印方法嵌入所述声音信号,所述水印方法根据所述声音信号S(n)和时间展宽回声方法的核函数K(n)之间的线性卷积由编码器执行。
50、如权利要求49所述的设备,其中,所述核函数K(n)由k(n)=δ(n)+α·p(n-Δ)定义,
其中,δ(n)表示狄拉克d函数、α表示幅值、p(n)表示伪噪声序列、Δ表示时间延迟。
51、如权利要求50所述的设备,其中,p(n)是解密密钥和加密密钥之一,用于从所述声音信号提取所述嵌入的关于所述声音信号的至少一个声场的声音信息。
52、如权利要求42所述的设备,其中,所述声音处理器根据下式来对所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息解码,
d(n)=F-1[log[F[W(n)]]]LPN
其中,W(n)表示具有所述嵌入的声音信息的所述声音信号,F-1[]表示傅立叶反变换,F[]表示傅立叶变换,log[]表示对数函数,表示互相关函数,LPN表示伪噪声序列。
53、如权利要求42所述的设备,其中,所述编码器通过将关于所述至少一个声场的声音信息映射到一个或更多个存储在数据库中的声场控制因子,并将与关于所述声音信号的至少一个声场的声音信息相应的所述一个或更多个声场控制因子嵌入所述声音信号,来对所述声音信号编码并嵌入关于所述声音信号的至少一个声场的声音信息。
54、如权利要求42所述的设备,其中,所述声音处理器通过独立地对所述声音信号的多个帧解码来对所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息解码,所述声音信号的多个帧包括嵌入其中的相应的声音信息。
55、如权利要求54所述的设备,其中,所述声音处理器根据当前帧的声场控制因子和先前帧的声场控制因子来处理与所述声音信号的当前帧相应的声音信息。
56、如权利要求54所述的设备,其中,所述声音处理器根据所述嵌入其中的相应的声音信息,在所述多个帧中的相邻帧中执行过渡处理。
57、如权利要求56所述的设备,其中,所述过渡处理包括淡入处理和淡出处理中的一个或更多个。
58、如权利要求56所述的设备,其中,所述过渡处理解决所述相邻帧之间的声场的变化。
59、如权利要求42所述的设备,其中,关于所述声音信号的至少一个声场的声音信息被数字加水印在所述声音信号中。
60、如权利要求42所述的设备,其中,当所述声音信号被所述声音处理器接收时,所述声音处理器实时处理所述声音信号和所述嵌入的关于所述声音信号的至少一个声场的声音信息。
61、一种传输关于声源的声音特性的信息的设备,该设备包括:
编码器,当声源被记录时,将关于所述声源的声音特性的数字信息存储在所述声源的声音内容之中,并将所述声源传输到声音处理器。
62、如权利要求61所述的设备,其中,关于所述声音特性的数字信息被加水印在所述声源的声音内容中,并且所述声音内容以未压缩的形式被传输。
63、如权利要求62所述的设备,其中,所述编码器通过根据声场中察觉到的变化将所述声音内容分为多个声音帧并将关于各个声音帧的所述数字信息存储在所述多个声音帧之中来将关于所述声源的声音特性的数字信息存储在所述声源的声音内容之中。
64、如权利要求63所述的设备,还包括:
声音处理器,接收所述声源并实时处理所述多个声音帧和所述存储的关于各个声音帧的数字信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040073367 | 2004-09-14 | ||
KR1020040073367A KR100644627B1 (ko) | 2004-09-14 | 2004-09-14 | 음장 제어 정보 부호화 방법 및 이에 적합한 음장 처리 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1758333A true CN1758333A (zh) | 2006-04-12 |
Family
ID=36163668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005100984410A Pending CN1758333A (zh) | 2004-09-14 | 2005-09-07 | 嵌入声场控制因子的方法以及处理声场的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20060059001A1 (zh) |
EP (1) | EP1635348A3 (zh) |
JP (1) | JP2006085164A (zh) |
KR (1) | KR100644627B1 (zh) |
CN (1) | CN1758333A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881290A (zh) * | 2008-05-29 | 2013-01-16 | 因特拉松尼克斯有限公司 | 用于恢复嵌入在音频信号中的数据消息的方法和装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007049777A1 (ja) * | 2005-10-25 | 2007-05-03 | Nec Corporation | 携帯電話機、該携帯電話機に用いられるコーデック回路及び受話音量自動調整方法 |
EP2083422A1 (en) * | 2008-01-28 | 2009-07-29 | Fortium Technologies Ltd. | Media modelling |
FR2940498B1 (fr) * | 2008-12-23 | 2011-04-15 | Thales Sa | Procede et systeme pour authentifier un utilisateur et/ou une donnee cryptographique |
EP2362387A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding |
CN102522089B (zh) * | 2011-12-02 | 2013-03-27 | 华中科技大学 | 用于g.723.1语音编码器的信息嵌入和提取方法 |
EP2909971B1 (en) | 2012-10-18 | 2020-09-02 | Dolby Laboratories Licensing Corporation | Systems and methods for initiating conferences using external devices |
CN111537058B (zh) * | 2020-04-16 | 2022-04-29 | 哈尔滨工程大学 | 一种基于Helmholtz方程最小二乘法的声场分离方法 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63183495A (ja) * | 1987-01-27 | 1988-07-28 | ヤマハ株式会社 | 音場制御装置 |
JPH03239100A (ja) * | 1990-02-16 | 1991-10-24 | Pioneer Electron Corp | 記録媒体演奏装置 |
JP3330621B2 (ja) * | 1991-09-02 | 2002-09-30 | パイオニア株式会社 | 記録媒体演奏装置及びこれを含む複合av装置 |
US5680481A (en) * | 1992-05-26 | 1997-10-21 | Ricoh Corporation | Facial feature extraction method and apparatus for a neural network acoustic and visual speech recognition system |
JP2951502B2 (ja) * | 1993-05-26 | 1999-09-20 | パイオニア株式会社 | カラオケ装置 |
US5832119C1 (en) * | 1993-11-18 | 2002-03-05 | Digimarc Corp | Methods for controlling systems using control signals embedded in empirical data |
JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
US6041020A (en) * | 1997-04-21 | 2000-03-21 | University Of Delaware | Gas-coupled laser acoustic detection |
JP2942923B2 (ja) * | 1997-11-27 | 1999-08-30 | 株式会社ジーデイーエス | ランダムパルス型レーダー装置 |
US6175602B1 (en) * | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
JP4712934B2 (ja) * | 2000-03-06 | 2011-06-29 | ソニー株式会社 | 情報信号再生装置 |
JP2002042423A (ja) * | 2000-07-27 | 2002-02-08 | Pioneer Electronic Corp | オーディオ再生装置 |
AT410597B (de) * | 2000-12-04 | 2003-06-25 | Vatter Acoustic Technologies V | Verfahren, computersystem und computerprodukt zur messung akustischer raumeigenschaften |
US20040059918A1 (en) * | 2000-12-15 | 2004-03-25 | Changsheng Xu | Method and system of digital watermarking for compressed audio |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
JP3554825B2 (ja) * | 2002-03-11 | 2004-08-18 | 東北大学長 | 電子透かしシステム |
KR101033558B1 (ko) * | 2003-09-30 | 2011-05-11 | 엘지전자 주식회사 | 개인용 비디오 녹화기 및 개인용 비디오 녹화기의 하이라이트 재생 방법. |
KR100595202B1 (ko) * | 2003-12-27 | 2006-06-30 | 엘지전자 주식회사 | 디지털 오디오 워터마크 삽입/검출 장치 및 방법 |
-
2004
- 2004-09-14 KR KR1020040073367A patent/KR100644627B1/ko not_active IP Right Cessation
-
2005
- 2005-04-07 US US11/100,446 patent/US20060059001A1/en not_active Abandoned
- 2005-08-25 JP JP2005244945A patent/JP2006085164A/ja not_active Withdrawn
- 2005-09-07 CN CNA2005100984410A patent/CN1758333A/zh active Pending
- 2005-09-13 EP EP05108382A patent/EP1635348A3/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881290A (zh) * | 2008-05-29 | 2013-01-16 | 因特拉松尼克斯有限公司 | 用于恢复嵌入在音频信号中的数据消息的方法和装置 |
CN102881290B (zh) * | 2008-05-29 | 2015-06-10 | 因特拉松尼克斯有限公司 | 用于恢复嵌入在音频信号中的数据消息的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US20060059001A1 (en) | 2006-03-16 |
JP2006085164A (ja) | 2006-03-30 |
KR20060024567A (ko) | 2006-03-17 |
EP1635348A3 (en) | 2006-04-19 |
KR100644627B1 (ko) | 2006-11-10 |
EP1635348A2 (en) | 2006-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1758333A (zh) | 嵌入声场控制因子的方法以及处理声场的方法 | |
CN1272911C (zh) | 音频信号解码装置及音频信号编码装置 | |
US7546173B2 (en) | Apparatus and method for audio content analysis, marking and summing | |
US7196641B2 (en) | System and method for audio data compression and decompression using discrete wavelet transform (DWT) | |
CN1262990C (zh) | 利用谐波提取的音频编码方法和设备 | |
CA2717584A1 (en) | Method and apparatus for processing an audio signal | |
CN1663281A (zh) | 用于从压缩多媒体内容中生成散列的方法 | |
CN1867970A (zh) | 信号编码 | |
EP1569203A3 (en) | Lossless audio decoding/encoding method and apparatus | |
RU2004133032A (ru) | Кодирование стереофонических сигналов | |
CN1288624C (zh) | 感觉噪声替换的方法和装置 | |
CN1134990C (zh) | 着重区编码方法和系统 | |
CN1795494A (zh) | 位流水印嵌入 | |
JP3466080B2 (ja) | デジタルデータの符号化/復号化方法及び装置 | |
CN1266672C (zh) | 用较少的计算量重构高频分量的声频解码方法和装置 | |
CN1792096A (zh) | 在载体信号中嵌入二进制有效数据片断的设备和方法 | |
US20030161469A1 (en) | Method and apparatus for embedding data in compressed audio data stream | |
KR101381602B1 (ko) | 계층적 부호화 및 복호화 방법 및 장치 | |
CN1310238C (zh) | 发送数字信息信号的发射机和方法及接收信号的接收机 | |
CN1722277A (zh) | 直接由编码器硬件生成dvd数据流的系统及方法 | |
US20140037110A1 (en) | Method and device for forming a digital audio mixed signal, method and device for separating signals, and corresponding signal | |
CN1291596C (zh) | 图像处理设备和方法以及图像处理系统 | |
CN1532808A (zh) | 采用带宽扩展技术编码和/或解码音频数据的方法和装置 | |
CN1742290A (zh) | 可察觉的可逆水印 | |
Lancini et al. | Embedding indexing information in audio signal using watermarking technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |