오디오 또는 음성신호를 압축할 수 있게 하는 심리청각 특성을 설명하고 오디오 신호의 압축방식을 설명하시오

 

1. 개요

- 아날로그 오디오 신호를 디지털 변환하기 위해 표본화, 양자화, 부호화 과정을 거침

     - 원음의 충실도를 최대한 유지하면서 부호화된 데이터 양을 줄이기 위한 기술이 압축임

     - 압축 방식에는 무손실 압축 기술과 심리청각 특성을 이용한 압축 기술이 사용됨

 

 

2. 심리청각특성

  - 인간의 감각특성은 최소가청한계와 마스킹 특성이 있음

  가. 마스킹 특성

     - 강한 음과 약한 음이 동시에 발생되면 약한 음을 들을 수 없는 현상

     - 마스커란 것은 방해하는 음을 말하는 것이고 마스키는 방해받는 음

     - 방해음때문에 목적음의 최소가청한계가 높아지게 됨

     - 동시적 마스킹(Simultaneous Masking, 주파수영역에서 마스킹), 순시적 마스킹(Temporal Masking, 시간영역에서 마스킹)

http://blog.naver.com/PostView.nhn?blogId=chester_kor&logNo=50119821955

  나. 최소가청한계 

     - 최소가청한계는 잡음이 없는 환경에서 인간이 감지할 수 있는 최소음압레벨임

     - 인간의 청음대역: 20Hz~20kHz, 1~4kHz 대역에서 가장 민감

 

 

3. 오디오 압축 원리

 

  가. 가변장 부호화(엔트로피 부호화)

      - 신호의 통계적 중복성을 제거하여 정보를 효율적으로 압축

      - 원신호와 재생신호가 동일하기 때문에 정보의 손실이 전혀 없음(Lossless)

  나. 지각부호화(Perceptual coding)

      - 신호를 받아들이는 인간의 감각특성을 이용해서 감도가 낮은 세부의 정보를 생략하여 부호량을 절감

      - 지각부호화에서는 원신호와 재생신호가 다르지만 인간의 귀로 듣는 경우에는 동일하게 들림

      - 지각적 오디오 파형 부호기

 

 

   - 청각심리를 효율적으로 이용하기 위하여 서브밴드로 오디오 주파수 대역을 세분화함

   - 다음 각 대역별로 청각심리모델을 적용하여 양자화함

   - 양자화된 결과에 대해서 최종적으로 부호

 

4. Digital 오디오 표준 규격

구분 

 표준

 오디오 지원 채널

 기타

 MPEG

 MPEG-1

 Layer-1

 MPEG-1 Part 3

 스테레오

 

 Layer-2

 스테레오

 

 Layer-3

 스테레오

 mp3

 MPEG-2 

 MPEG-2 Part 3, MPEG-2 BC(Backward Compatible)

 5.1 채널

 

 MPEG-2 AAC

(Advanced Audio Coding)

 MPEG-2 Part 7,

MPEG-2 NBC(Non-Backward Compatible)

 48채널까지 확장 가능

 mp4

 MPEG-4 AAC

 MPEG-4 Part 3

 여러개의 Sub part  있음

 

MPEG-4 HE AAC:

대역폭 확장기술의 하나인 SBR(Spectral Band Replication) 알고리즘을 MPEG AAC와 결합

 

Dolby 

 AC-2

 

 스테레오

 

 AC-3

 

 5.1채널

 지상파DTV

 Dolby-E

 

 8개 채널

 돌비에서 다채널 전송용으로 개발

 

 

 

 

MP4_HE-AAC.pdf

 

Posted by 둔탱이
,