심리청각특성, 오디오 신호의 압축방식

Multimedia/압축기술 2015. 10. 4. 19:14

오디오 또는 음성신호를 압축할 수 있게 하는 심리청각 특성을 설명하고 오디오 신호의 압축방식을 설명하시오

1. 개요

- 아날로그 오디오 신호를 디지털 변환하기 위해 표본화, 양자화, 부호화 과정을 거침

- 원음의 충실도를 최대한 유지하면서 부호화된 데이터 양을 줄이기 위한 기술이 압축임

- 압축 방식에는 무손실 압축 기술과 심리청각 특성을 이용한 압축 기술이 사용됨

2. 심리청각특성

- 인간의 감각특성은 최소가청한계와 마스킹 특성이 있음

가. 마스킹 특성

- 강한 음과 약한 음이 동시에 발생되면 약한 음을 들을 수 없는 현상

- 마스커란 것은 방해하는 음을 말하는 것이고 마스키는 방해받는 음

- 방해음때문에 목적음의 최소가청한계가 높아지게 됨

- 동시적 마스킹(Simultaneous Masking, 주파수영역에서 마스킹), 순시적 마스킹(Temporal Masking, 시간영역에서 마스킹)

나. 최소가청한계

- 최소가청한계는 잡음이 없는 환경에서 인간이 감지할 수 있는 최소음압레벨임

- 인간의 청음대역: 20Hz~20kHz, 1~4kHz 대역에서 가장 민감

3. 오디오 압축 원리

가. 가변장 부호화(엔트로피 부호화)

- 신호의 통계적 중복성을 제거하여 정보를 효율적으로 압축

- 원신호와 재생신호가 동일하기 때문에 정보의 손실이 전혀 없음(Lossless)

나. 지각부호화(Perceptual coding)

- 신호를 받아들이는 인간의 감각특성을 이용해서 감도가 낮은 세부의 정보를 생략하여 부호량을 절감

- 지각부호화에서는 원신호와 재생신호가 다르지만 인간의 귀로 듣는 경우에는 동일하게 들림

- 지각적 오디오 파형 부호기

- 청각심리를 효율적으로 이용하기 위하여 서브밴드로 오디오 주파수 대역을 세분화함

- 다음 각 대역별로 청각심리모델을 적용하여 양자화함

- 양자화된 결과에 대해서 최종적으로 부호화

4. Digital 오디오 표준 규격

구분			표준	오디오 지원 채널	기타
MPEG	MPEG-1	Layer-1	MPEG-1 Part 3	스테레오
		Layer-2		스테레오
		Layer-3		스테레오	mp3
	MPEG-2		MPEG-2 Part 3, MPEG-2 BC(Backward Compatible)	5.1 채널
	MPEG-2 AAC (Advanced Audio Coding)		MPEG-2 Part 7, MPEG-2 NBC(Non-Backward Compatible)	48채널까지 확장 가능	mp4
	MPEG-4 AAC		MPEG-4 Part 3 여러개의 Sub part 있음		MPEG-4 HE AAC: 대역폭 확장기술의 하나인 SBR(Spectral Band Replication) 알고리즘을 MPEG AAC와 결합
Dolby	AC-2			스테레오
	AC-3			5.1채널	지상파DTV
	Dolby-E			8개 채널	돌비에서 다채널 전송용으로 개발

단답형 예상>LKFS(Loudness K-scale below Full Scale) (0)	2016.01.14
단답형>MPEG-21 (0)	2015.10.26
단답형>SVC(Scalable Video Coding) (0)	2015.10.04
단답형>HEVC (0)	2015.09.22
단답형>MMT(MPEG Media Transport) 계층 구조 (0)	2015.09.21

Posted by 둔탱이

지금 이 순간