오디오 또는 음성신호를 압축할 수 있게 하는 심리청각 특성을 설명하고 오디오 신호의 압축방식을 설명하시오
1. 개요
- 아날로그 오디오 신호를 디지털 변환하기 위해 표본화, 양자화, 부호화 과정을 거침
- 원음의 충실도를 최대한 유지하면서 부호화된 데이터 양을 줄이기 위한 기술이 압축임
- 압축 방식에는 무손실 압축 기술과 심리청각 특성을 이용한 압축 기술이 사용됨
2. 심리청각특성
- 인간의 감각특성은 최소가청한계와 마스킹 특성이 있음
가. 마스킹 특성
- 강한 음과 약한 음이 동시에 발생되면 약한 음을 들을 수 없는 현상
- 마스커란 것은 방해하는 음을 말하는 것이고 마스키는 방해받는 음
- 방해음때문에 목적음의 최소가청한계가 높아지게 됨
- 동시적 마스킹(Simultaneous Masking, 주파수영역에서 마스킹), 순시적 마스킹(Temporal Masking, 시간영역에서 마스킹)
http://blog.naver.com/PostView.nhn?blogId=chester_kor&logNo=50119821955
나. 최소가청한계
- 최소가청한계는 잡음이 없는 환경에서 인간이 감지할 수 있는 최소음압레벨임
- 인간의 청음대역: 20Hz~20kHz, 1~4kHz 대역에서 가장 민감
3. 오디오 압축 원리
가. 가변장 부호화(엔트로피 부호화)
- 신호의 통계적 중복성을 제거하여 정보를 효율적으로 압축
- 원신호와 재생신호가 동일하기 때문에 정보의 손실이 전혀 없음(Lossless)
나. 지각부호화(Perceptual coding)
- 신호를 받아들이는 인간의 감각특성을 이용해서 감도가 낮은 세부의 정보를 생략하여 부호량을 절감
- 지각부호화에서는 원신호와 재생신호가 다르지만 인간의 귀로 듣는 경우에는 동일하게 들림
- 지각적 오디오 파형 부호기
- 청각심리를 효율적으로 이용하기 위하여 서브밴드로 오디오 주파수 대역을 세분화함
- 다음 각 대역별로 청각심리모델을 적용하여 양자화함
- 양자화된 결과에 대해서 최종적으로 부호화
4. Digital 오디오 표준 규격
구분 |
표준 |
오디오 지원 채널 |
기타 | ||
MPEG |
MPEG-1 |
Layer-1 |
MPEG-1 Part 3 |
스테레오 |
|
Layer-2 |
스테레오 |
||||
Layer-3 |
스테레오 |
mp3 | |||
MPEG-2 |
MPEG-2 Part 3, MPEG-2 BC(Backward Compatible) |
5.1 채널 |
|||
MPEG-2 AAC (Advanced Audio Coding) |
MPEG-2 Part 7, MPEG-2 NBC(Non-Backward Compatible) |
48채널까지 확장 가능 |
mp4 | ||
MPEG-4 AAC |
MPEG-4 Part 3 여러개의 Sub part 있음 |
MPEG-4 HE AAC: 대역폭 확장기술의 하나인 SBR(Spectral Band Replication) 알고리즘을 MPEG AAC와 결합
| |||
Dolby |
AC-2 |
|
스테레오 |
||
AC-3 |
|
5.1채널 |
지상파DTV | ||
Dolby-E |
8개 채널 |
돌비에서 다채널 전송용으로 개발 |
'Multimedia > 압축기술' 카테고리의 다른 글
단답형 예상>LKFS(Loudness K-scale below Full Scale) (0) | 2016.01.14 |
---|---|
단답형>MPEG-21 (0) | 2015.10.26 |
단답형>SVC(Scalable Video Coding) (0) | 2015.10.04 |
단답형>HEVC (0) | 2015.09.22 |
단답형>MMT(MPEG Media Transport) 계층 구조 (0) | 2015.09.21 |