< Previous김동현, 변기훈, 김재수, 신기철 한국음향학회지 제 43 권 제 2 호 (2024) 192 부터 수신된 신호벡터간의 간섭에 의해 펄스 압축이 완벽히 이루어지지 않음을 확인할 수 있다. Fig. 5(c) ~ (d)는 Eq. (3)을 통해 계산된 적응 시역전 처리 기반의 가중치 벡터 w  w   w   w  를 이용한 수치 실험 결과이다. 기존의 시역전 처리 결과와 동 일하게 Fig. 5(a)는 21개의 모든 TRM 센서를 사용한 결과이며, Fig. 5(b) 4개의 TRM 센서만을 사용한 집속 결과를 나타낸다. 여기에서 공분산 행렬의 역행렬 계산을 위한 대각 부하 값은 공분산 행렬의 대각성 분의 합을 센서 개수로 나눈 값의 10 % 정도를 대각 성분에 더해주는 것이 일반적이다. [14] Fig. 5(d)를 통 해 센서의 개수가 적을수록 집속된 신호의 펄스 압 축이 완벽히 구현되지 않고 잔여의 간섭 신호가 발 생하는 것을 알 수 있으며, 그 이유는 다음과 같은 수 식 전개를 통해 확인할 수 있다. 편의상 Eq. (13)과 같이 음원의 위치    에서의 집 속 및    및    위치에 널을 형성하는 경우에 대해 서만 살펴보도록 한다. w   g n † R    g n R    g n  R   g n g n †  g n g n †    I  A  g n g n †  (13) A  g n g n †    I  여기에서 행렬 R    은 역행렬 정리의 특수한 경우인 Woodbury’s identity를 이용하여 다음과 같이 전개할 수 있다. [24] R     A  g n g n †    A      g n † A   g n A   g n g n † A    (14) Eq. (14)에서의 A 의 역행렬을 구하기 위해 다시 한번 Woodbury’s identity를 사용하면 Eq. (15)와 같이 나타 낼 수 있으며, 계산된 A   를 Eq. (14)에 대입한 후 정 리하면 아래 Eq. (16)과 같이 R    에 관한 식으로 나 타낼 수 있다. A         I    ∥ g n ∥  g n g n †    (15) R          I    ∥ g n ∥  g n g n †       g n †        I     ∥ g n ∥  g n g n †     g n      I     ∥ g n ∥  g n g n †   g n g n †   I     ∥ g n ∥  g n g n †    (16) Eq. (13)에서의 w  의 분모 항을   g n † R    g n   라 고 정의할 때, Eq. (16)을 통한 가중치 벡터 w  는 최종 적으로 다음과 같이 나타낼 수 있다. w         g n      ∥ g n ∥  g n † g n g n      ∥ g n ∥      ∥ g n ∥  g n † g n    g n    ∥ g n ∥  g n † g n g n † g n  g n    ∥ g n ∥  g n † g n g n       (17) Eq. (17)과 같이 전개된 가중치 벡터 w  와의 비교를 위해 Eq. (10)에서의 그람-슈미트 과정을 통해 계산 된 v  ′ 를 다시 전개하여 정리하면 Eq. (18)과 같이 나 타낼 수 있다. v  ′  g n    ∥ g n ∥  g n † g n g n    ∥ g n ∥   ∥ g n ∥  g n † g n    g n  ∥ g n ∥  g n † g n g n † g n g n  ∥ g n ∥  g n † g n g n    (18) 계산된 재 전파 벡터 w  와 v  ′ 를 비교해봤을 때, 그 람-슈미트 과정 기반의 벡터 v  ′와 달리 벡터 w  의 각 항의 분모 항에 대각 부하   가 포함되어 있는 것을 확인할 수 있다. 만약 동일한 대각 부하가 적용된 상 황에서 사용되는 TRM 센서의 개수가 작아질 경우, 정사영 벡터의 분모 항에서의   의 영향이 널을 형그람슈미트 과정 기반의 적응형 시역전 처리 The Journal of the Acoustical Society of Korea Vol.43, No.2 (2024) 193 성할 간섭자 위치로부터 TRM 센서로 전파되는 전달 함수(i.e., g n , g n )보다 상대적으로 우세해져 정사영 벡터의 성질을 만족하지 못함을 알 수 있다. 이는 결 과적으로 채널 간 간섭을 제거하기 위한 널 형성의 성능에 영향을 미치게 되며, Fig. 5(d)에서 나타나는 부엽을 통해 확인된다. 이론적인 관점에서는 Eq. (3) 에 의해 설계된 가중치 벡터가 Eq. (5)에서 표기한 바 와 같이 원하는 음원이 아닌 간섭자에 대해 정확한 널이 아닌, 널에 가깝게 형성되도록 설계되었기 때 문이라고 할 수 있다. 반대로 만약 사용되는 TRM 센서의 개수가 고정된 상황을 고려한다면 대각 부하의 값에 따라 성능이 변화될 수 있음을 의미하며, 대각 부하가 커질수록 재래식 시역전 처리에 가까워진다. [19,25,26] 하지만, 그 람-슈미트 과정을 통해 계산된 벡터 v  ′ 는 Eq. (18)에 서와 같이   의 영향을 받지 않으므로 적은 센서의 개수에도 왜곡 없는 다중 집속이 가능함을 Fig. 5(c) 를 통해 확인할 수 있다. IV. 수동 시역전 처리로의 적용 4.1 해상 실험 환경 2005년 Elba 섬의 북쪽에서 시역전 처리를 위한 실 험 FAF-05 해상 실험이 수행되었으며, 모식도는 Fig. 6(a)와 같다. [18] 송신기의 위치는 88 m, 101 m 및 113 m 깊이에 수직으로 배열되어 있고, 수직 선 배열은 48 m ~ 110 m 깊이에 2 m 간격으로 32개가 수직으로 위 치해있다. 송·수신기 사이의 거리는 대략 20 km이며, 실험 해역의 평균적인 수심은 120 m로 평탄한 지역 으로 되어있다. Fig. 6(b)는 Fig. 2(b)와 마찬가지로 음선 기반 전파 모델인 BELLHOP model [21] 을 통해 구현한 고유 음선 이며, 25도 이내의 각도로 제한하였다. Fig. 6(a)에 보 여지는 것과 같이 FAF-05 해상 실험 역시 천해 환경 에 해당되므로, 음속 구조에서 수온약층이 형성되는 것을 알 수 있다. FAF-05 해상 실험 당시 수온약층은 약 20 m부터 60 m까지 형성되었다. Fig. 6(b)는 3개의 음원 깊이 중 101 m 일 때의 고유 음선으로, 고유 음 선을 통해 FAF-05 해상 실험은 SWellEx-96 해상 실험 과 달리 해수면 반사파가 존재하지 않고 직접파와 해저면 반사파가 지배적인 환경임을 알 수 있다. 본 논문에서는 따로 출력하지 않았지만, 다른 음원의 깊이들(i.e., 88 m and 113 m)에서의 고유 음선이 유사 한 패턴을 보였다. 즉, FAF-05 해상 실험 환경에서는 음향 신호 트랩핑 효과가 나타나고 있음을 알 수 있 다. 이러한 음향 신호 트랩핑 효과는 3.1절에서 언급 한 바와 같이 전체 수심 중 수온약층의 두께가 두꺼 워져서 생긴 것이라 할 수 있으며, 이는 장거리 전파 에 있어 효과적이다. [22,23] 4.2 해상 실험 데이터 분석 송신 신호의 데이터 패킷 구조는 Fig. 7과 같다. 채 널 응답 특성(Channel Impulse Response, CIR)을 측정 하기 위해 사용된 탐침 신호는 중심 주파수 3.5 kHz, 샘플링 주파수 12 kHz 및 대역폭 2 kHz를 갖는 LFM 신호를 사용하였다. 각 음원으로부터의 LFM 신호 (a) (b) Fig. 6. (Color available online) (a) Schematic of the FAF-05 experiment. (b) Set of eigenrays propagating between the source (at a depth of 101 m) and the center of the vertical line array (at a depth of 79 m) located 3105 m apart.김동현, 변기훈, 김재수, 신기철 한국음향학회지 제 43 권 제 2 호 (2024) 194 는 Fig. 7에서 알 수 있듯이 시간 영역에서 분리되어 있는데, 이는 각 음원으로부터의 전달 함수를 추정 하기 위함이다. LFM 신호 이후 일정 무음 구간 뒤에 2 kbps 및 16,000개의 비트로 구성된 8 s길이의 통신 신호가 설계되였으며, 모든 음원으로부터의 통신 신 호가 겹치도록 동일 시간대에 통신 신호들을 송신하 였다. 적응 시역전 처리 및 그람-슈미트 과정 기반의 시 역전 처리 적용에 앞서, 먼저 재래식 시역전 처리를 이용한 다중 음원 환경에서의 통신 성능 분석 결과 를 살펴보기로 한다. 본 논문에서는 나타내지 않았 지만, 모든 유저에 대한 결과의 경향은 유사하므로, 여기서는 3번 유저를 대표적으로 선택하여 도시하 기로 한다. Fig. 8은 TRM 센서 개수에 따른 재래식 시 역전 처리 결과를 나타내며, Fig. 8(a)는 32개에 해당 하는 모든 TRM 센서를 활용한 결과이다. Fig. 8(b)는 모든 TRM 센서를 활용했을 때와 거의 동일한 센서 길이를 갖도록 1번 수신기부터 세 개의 수신기 간격 으로 31번 수신기까지 총 11개의 TRM 센서를 활용 한 결과이다. 모든 센서를 활용하여 재래식 시역전 처리를 수 행할 경우, 전체 비트 중 705개 비트에서 오류가 나 타났으며 비트오류율(Bit Error Rate, BER)로 표현하 면 4.41 %와 같다[Fig. 8(a)]. 하지만, 11개 센서만 활용 할 경우 오류 비트수는 두 배 가까이 증가한 1201개 (BER = 7.51 %)였으며, 이러한 오류의 증가는 Fig. 8(b)에서도 육안으로 확인할 수 있다. 다중 음원 환경 에서 재래식 시역전 처리 시, Fig. 5(a) ~ (b)의 부엽과 같이 간섭자에 의한 영향이 남아 심볼 간 간섭을 야 기한다. 특히, 센서 개수가 적을수록 비트 오류율이 증가하게 되는데, 이는 Fig. 5(a)와 Fig. 5(b)의 비교를 통해 알 수 있듯이 적은 수의 센서 개수를 사용할 경 우 주엽의 크기 대비 주요 부엽의 크기가 증가하기 때문이다. 또한, 결합하는 센서의 개수가 증가할수 록 배경 소음의 영향은 평준화되어 감소하게 되며, 이는 Fig. 5(a) ~ (b)에서 주요 부엽 주변의 값을 통해 확인할 수 있다. 적응 시역전 처리의 경우 Eq. (17)에서 나타난 바와 같이 대각 부하에 관한 항이 존재하며, 구체적으로는 대각 부하 항은 간섭자와 TRM 센서 사이 전달함수의 크기의 제곱(i.e., ∥ g n ∥ , ∥ g n ∥ )에 더해진 형태 로 구성되어있다. 따라서, 본 논문에서는 적응 시역 전 처리 시 대각 부하에 대한 영향을 알아보기 위해, 모든 센서로 수신했을 때의 ∥ g n ∥  (or ∥ g n ∥  )를 기준으로 점차 감소하는 방향으로 대각 부하를 반영 한 결과를 살펴보고자 한다. 여기서, n 와 n 은 각각 1번과 2번 유저로 설정하였다. 해상 실험 데이터로부터 계산한 주파수에 따른 Fig. 7. (Color available online) Configuration of the transmitted signal packets in the FAF-05 experiment (multiuser communications in passive TRP). (a) (b) Fig. 8. (Color available online) Communication per- formance using conventional TRP in the (a) full and (b) eleven TRM sensors.그람슈미트 과정 기반의 적응형 시역전 처리 The Journal of the Acoustical Society of Korea Vol.43, No.2 (2024) 195 ∥ g n ∥ 와 ∥ g n ∥ 는 Fig. 9(e)에 각각 파란색과 빨 간색으로 나타냈으며, 중심 주파수에서 모두 약 25 dB로 나타났다. 이를 기준으로, 25 dB, 20 dB, 그리고 15 dB의 대각 부하의 값을 적용하여 통신 성능을 비 교하였다. Fig. 9(a) ~ (c)는 다중 음원 환경에서의 대각 부하 의 변화에 따른 적응 시역전 처리 기반 통신 성능 분 석 결과를 나타낸다. Fig. 9(a)부터 Fig. 9(c)까지는 순 서대로 15 dB, 20 dB, 그리고 25 dB의 대각 부하가 적 용된 결과이며, 각각 비트 오류율은 0.03 %(5/16000), 0.13 %(20/16000), 그리고 0.69 %(111/16000)이다. 대각 부하는 적응 신호처리의 민감도를 낮추기 위해 데이터에 백색 잡음을 부과하는 것과 같은 기 능을 하게 된다. [27] 대각 부하의 값이 15 dB일 경우 ∥ g n ∥  와 ∥ g n ∥  이 대각 부하보다 약 10 dB 만큼 크며, 이는 데이터에 비해 충분히 작은 잡음이 부과 되는 것과 같으므로 데이터의 신호 대 잡음비에 큰 영향을 끼치지 않는다. 즉, 대각 부하가 통신 성능에 는 영향을 끼치지 않으므로, 간섭자에 대해 널을 효 과적으로 형성하게 된다. 하지만, 대각 부하를 증가 한다는 것은 데이터에 백색 잡음을 크게 부과하는 것 과 같으므로, ∥ g n ∥ 와 ∥ g n ∥ 의 값과 유사할 정 도인 25 dB의 대각 부하를 적용할 경우 데이터의 신 호 대 잡음비가 낮아지는 것과 같은 영향이 나타난다. 이는 곧 성상도에서 추정된 심볼들이 퍼지게 됨을 의 미하며, [6] 또한 비트 오류율의 증가를 야기한다. 적응 시역전 처리와 달리, 그람-슈미트 과정 기반 의 시역전 처리의 경우 대각 부하 항이 존재하지 않 으며, 직접적으로 생성된 간섭자에 대한 직교 벡터 를 가중치 벡터로써 활용한다[Eqs.(6) ~ (8)]. Fig. 9(d) 는 다중 음원 환경에서 모든 센서를 활용했을 때의 그 람-슈미트 과정 기반 통신 성능 분석 결과이다. Fig. 8(a)에 나타난 재래식 결과와 비교했을 때, 추정된 심 볼들이 모여드는 것으로부터 간섭자의 전달함수에 대해 널이 효과적으로 형성되는 것을 알 수 있다. 또 한, Fig. 9(d)의 결과는 적응 시역전 처리 중 가장 성능 (a)(b)(c) (d)(e) Fig. 9. (Color available online) Communication performance with the full TRM sensors. (a-c) Adaptive TRP with the diagonal loadings of (a) 15 dB, (b) 20 dB, and (c) 25 dB. (d) Gram-Schmidt process based TRP. (e) Comparison of the magnitude of the Green's function induced by two interferers with diagonal loadings.김동현, 변기훈, 김재수, 신기철 한국음향학회지 제 43 권 제 2 호 (2024) 196 이 좋은 15 dB의 대각 부하가 적용된 경우[Fig. 9(a)]와 시각적으로나 비트 오류율이 매우 유사함[0.04 % (7/16000)]을 확인할 수 있다. 앞서 언급한 바와 같이, 그람-슈미트 과정 기반의 시역전 처리는 비트 오류 율을 야기할 수도 있는 대각 부하 항이 존재하지 않 으면서도 널 형성이 매우 뛰어난 알고리즘임이 확인 된다. Fig. 10은 11개의 TRM 센서를 활용했을 때의 적응 시역전 처리 및 그람-슈미트 과정 기반의 시역전 처 리 결과를 보여주며, Fig. 10 내의 순서는 Fig. 9의 순 서와 동일하다. 센서 개수 변화에 따른 성능 비교를 위해 Fig. 10(a) ~ (c)에 적용된 대각 부하는 Fig. 9(a) ~ (c)와 동일하게 설정하였다[Fig. 10(e)]. Fig. 10으로부 터 가장 먼저 확인할 수 있는 사실은 Fig. 8를 통해서 도 예상할 수 있듯이, Fig. 10의 결과는 Fig. 9에 비해 전체적으로 성능이 저하되었다는 것이다. 이는 센서 개수 감소로 인한 배경 소음의 평준화가 덜 이루어 진 결과라 할 수 있다. 구체적으로, 그람-슈미트 과정 기반의 통신 성능 분석 결과인 Fig. 10(d)의 경우, 모든 TRM 센서를 활 용했을 때보다 오류 비트 개수가 증가(69개, 비트 오 류율 = 0.43 %)하였지만 추정된 심볼들의 퍼진 정도 로부터 널이 잘 형성됨을 확인할 수 있다. 대각 부하(i.e., 15 dB)가 ∥ g n ∥  와 ∥ g n ∥  보다 작 은 Fig. 10(a)의 경우, 효과적으로 널이 잘 형성되었지 만 Fig. 10(d)보다는 많은 비트 오류(113개, 비트 오류 율 = 0.71 %)가 발생하였다. 이는 Fig. 5(c) ~ (e)를 통 해서 해석해 볼 때, 센서 개수 변화에 따른 두 기법의 널 형성 정도의 차이에 기인한 결과라고 할 수 있다. 나아가, 대각 부하가 증가할수록 통신 성능이 저하되 어 재래식 시역전 처리에 가까워지는 결과가 나타난 다. 대각 부하가 ∥ g n ∥ 와 ∥ g n ∥  유사한 20 dB인 경우에는 305개의 비트 오류가 발생하였으며(비트 오류율 = 1.91 %), 대각 부하가 25 dB인 경우에는 660 개의 비트 오류가 발생하였다(비트 오류율 = 4.13 %). 위와 같은 결과들을 종합해볼 때, 적응 시역전 처리 (a)(b)(c) (d)(e) Fig. 10. (Color available online) Communication performance with the eleven TRM sensors. (a-c) Adaptive TRP with the diagonal loadings of (a) 15 dB, (b) 20 dB, and (c) 25 dB. (d) Gram-Schmidt process based TRP. (e) Comparison of the magnitude of the Green's function induced by two interferers with diagonal loadings.그람슈미트 과정 기반의 적응형 시역전 처리 The Journal of the Acoustical Society of Korea Vol.43, No.2 (2024) 197 에 비해 그람-슈미트 기반의 시역전 처리가 효과적으 로 채널 간 간섭 영향을 완화할 수 있음이 확인되었다. V. 결 론 본 논문에서는 그람-슈미트 과정을 시역전 처리에 적용하여, 직교 성질 기반의 채널 간 간섭 완화에 대 한 연구를 능·수동 시역전 처리 관점에서 수행하였 다. 다수의 음원이 존재하는 환경에서의 직교성을 기 반으로 한 널 형성 및 서로 다른 음원의 위치에서의 각기 다른 정보를 가지는 신호의 집속에 대한 방법을 제안하였으며, 수치 실험을 통해 이를 검증하였다. 또한, 센서 개수에 따른 널 형성의 성능 변화에 대 한 연구를 추가적으로 수행하였으며, 실제 해상 실 험 데이터를 이용하여 수동 다중 입·출력 수중 통신 환경에서의 채널 간 간섭 완화에 대한 성능 비교 분 석을 수행하였다. 결과적으로, 그람-슈미트 기반의 시역전 처리 방법이 기존의 시역전 처리 및 적응 시 역전 처리 방법에 비해 강인한 널 형성 및 집속에 대 한 향상된 효과를 얻을 수 있었다. 감사의 글 이 논문은 2023년도 정부(교육부)의 재원으로 한 국연구재단의 지원을 받아 수행된 기초연구사업임 (No. RS-2023-00271645). FAF05 및 SWellEx-96의 해양실험 자료를 사용할 수 있도록 허용해준 미국 스크립스 해양연구소(Scripps Institution of Oceanography, SIO)의 물리연구부(Marine Physical Lab., MPL)에 감사드립니다. 부 록(Appendix) Appendix A: Eq. (6)의 일반화 2.2절에서는 3개의 음원이 존재할 때, 그람-슈미트 과정을 이용하여 특정 위치에 신호를 집속함과 동시 에 다른 두 위치에서는 널을 형성하는 가중치 벡터 를 Eq. (6)을 통해 소개하였다. 본 절에서는, Eq. (6)을 확장하여 일반화된 집속 및 널 형성 가중치 벡터를 소개한다. Eq. (A1)는 일반화를 위한 규칙을 찾기 위해, 3개의 음원이 존재하는 상황에서 표현된 Eq. (6)을 다시 가 져와서 일부 수정한 식이다. v   g   v   g   ∥ v  ∥  〈 g   v  〉 v   (A1) v   g     ∥ v  ∥  〈 g   v  〉 v   ∥ v  ∥  〈 g   v  〉 v     여기에서 g  , g  , 그리고 g  은 각각 3개의 음원과 수 직 선 배열 사이의 전달 함수를 나타내며, 나머지는 Eq. (6)과 동일하다. v  는 3개의 음원 상황에서 하나의 음원(i.e., 3) 위치 는 집속하면서 나머지 두 위치에 대해서 널을 형성 하는 최종적인 가중치 벡터를 의미하며, Eq. (A1)에 서 나타난 일련의 과정을 통해 Eq. (A2)와 같은 규칙 이 나타남을 알 수 있다. v   g        ∥ v  ∥  〈 g   v  〉 v   (A2) 위와 같은 규칙을 통해 Eq. (A2)를 일반화한다면, Eq. (A3)과 같이 나타낼 수 있다. v   g          ∥ v  ∥  〈 g   v  〉 v   (A3) 여기에서  은 음원의 개수를 나타낸다. 이러한 일반화된 벡터에서의 음원의 개수는 TRM 센서 개수에 의해 제한된다. 만약, TRM 센서가  개 라면 표현할 수 있는 차원은  차원이며, 이는 그람- 슈미트 과정에서 표현할 수 있는 기저 벡터의 개수 가  개임을 의미한다. 따라서, 이론적으로 가능한 음원의 개수(  )는 TRM 센서의 개수(  )보다 작거나 같으며, 실용적인 관점에서는 더 적어질 수 있다. Appendix B: Eq. (10)의 일반화 Eq. (10)은 3개의 음원이 존재하는 상황에서 그람- 슈미트 과정을 다중 시역전 처리로 확장한 가중치 김동현, 변기훈, 김재수, 신기철 한국음향학회지 제 43 권 제 2 호 (2024) 198 벡터들을 나타내며, 일반화를 위해 Eq. (B1)에 다시 표현하였다. v  ′  g     ∥ v  ∥  〈 g   v  〉 v   ∥ v  ∥  〈 g   v  〉 v     v  ′  g     ∥ v  ∥  〈 g   v  〉 v   ∥ v  ∥  〈 g   v  〉 v     (B1) v  ′  g     ∥ v  ∥  〈 g   v  〉 v   ∥ v  ∥  〈 g   v  〉 v     여기에서 g  , g  , 그리고 g  은 Eq. (A1)과 동일하다. 일반화 규칙을 찾기 위해 Eq. (B1)에서 v  ′를 기준 으로 살펴본다. v  ′ 는 집속시키고자 하는 음원(i.e., 3) 에 대응하는 전달 함수(i.e., g  )에서 해당 전달 함수 와 다른 기저 벡터들(i.e., v  와 v  )로의 정사영 벡터들 을 빼는 구조이다. 다른 벡터들도 동일한 구조를 가 지고 있으며, 이를 정리하면 다중 시역전 처리에서 의 일반화된 수식을 다음과 같이 얻을 수 있다: v  ′  g        ≠  ∥ v  ∥  〈 g   v  〉 v   ≤≤  (B2) 여기에서  과  는 각각 음원의 개수와 음원의 번호 를 나타낸다. Eq. (A3)과 Eq. (B2)를 비교해볼 때, 우변의 두 번째 항에 표현된  의 구조만 조금 다른 매우 유사한 구 조로 나타낼 수 있다. References 1.D. R. Jackson and D. R. Dowling, “Phase conjugation in underwater acoustics,” J. Acoust. Soc. Am. 89, 171-181 (1991). 2.M. Fink, “Time-reversal mirrors,” J. Phys. D, 26, 1330-1350 (1993). 3.M. Fink, “Time-reversed acoustics,” Phys. Today, 50, 34-40 (1997). 4.W. A. Kuperman, W. S. Hodgkiss, and H. C. Song, “Phase conjugation in the ocean: Experimental de- monstration of an acoustic time-reversal mirror,” J. Acoust. Soc. Am. 103, 25-40 (1997). 5.W. S. Hodgkiss, H. C. Song, and W. A. Kuperman, “A long-range and variable focus phase-conjugation experiment in shallow water,” J. Acoust. Soc. Am. 105, 1597-1604 (1998). 6.H. C. Song, W. S. Hodgkiss, W. A. Kuperman, W. J. Higley, K. Raghukumar, T. Akal, and M. Stevenson, “Spatial diversity in passive time reversal communi- cations,” J. Acoust. Soc. Am. 120, 2067-2076 (2006). 7.J. R. Yoon, M. K. Park, and Y. J. Ro, “Bit error parameters on passive phase conjugation underwater acoustic communication” (in Korean), J. Acoust. Soc. Kr. 24, 454-461 (2005). 8.M. J. Eom, J. S. Kim, J.-H. Cho, H. Kim, and I. Sung, “Algorithm and experimental verification of under- water acoustic communication based on passive time- reversal mirror” (in Korean), J. Acoust. Soc. Kr. 33, 392-399 (2014). 9.S. C. Walker, P. Roux, and W. A. Kuperman, “Syn- chronized time-reversal focusing with application to remote imaging from a distant virtual source array,” J. Acoust. Soc. Am. 125, 3828-3834 (2009). 10.Z. B. Yu, H. F. Zaho, X. Y. Gong, and N. R. Chapman, “Time-reversal mirror-virtual source array method for acoustic imaging of proud and buried targets,” IEEE J. Ocean Eng. 41, 382-394 (2016). 11.G. H. Byun and J. S. Kim, “Robust focusing in time- reversal mirror with a virtual source array,” J. Acoust. Soc. Am. 136, 2148 (2014). 12.G. H. Byun and J. S. Kim, “Robust variable range focusing with a virtual source array using the wave- guide invariant in underwater” (in Korean), J. Acoust. Soc. Kr. 36, 23-29 (2017). 13.J. S. Kim, H. C. Song, and W. A. Kuperman, “Adaptive time-reversal mirror,” J. Acoust. Soc. Am. 109, 1817- 1825 (2001). 14.H. C. Song, “Equivalence of adaptive time reversal and least squares for cross talk mitigation,” J. Acoust. Soc. Am. 135, EL154-EL158 (2014). 15.J. S. Kim and K. C. Shin, “Multiple focusing with adaptive time-reversal mirror,” J. Acoust. Soc. Am. 115, 600-606 (2004). 16.S. Kim, W. A. Kuperman, W. S. Hodgkiss, H. C. Song, G. F. Edelmann, and T. Akal, “Robust time reversal focusing in the ocean,” J. Acoust. Soc. Am. 114, 145- 157 (2003). 17.G. H. Byun and J. S. Kim, “Improved multiple focusing with adaptive time-reversal mirror in the ocean,” J. Acoust. Soc. Am. 138, 1948 (2015). 18.H. C. Song, J. S. Kim, W. S. Hodgkiss, and J. H. Joo, “Cross talk mitigation using adaptive time reversal,” J. Acoust. Soc. Am. 127, EL19-EL22 (2010). 19.N. O. Booth, T. Abawi, P. W. Schey, and W. S. Hodgkiss, “Detectability of low-level broad-band signals using 그람슈미트 과정 기반의 적응형 시역전 처리 The Journal of the Acoustical Society of Korea Vol.43, No.2 (2024) 199 adaptive matched-field processing with vertical aperture arrays,” IEEE J. Ocean. Eng. 25, 296-313 (2000). 20.M. B. Porter, “The KRAKEN normal mode program (SM-245),” Naval Research Laboratory Memorandum, Tec. Rep., 6920, 1991. 21.M. Porter, The Bellhop Manual and User’s Guide: Preliminary Draft, http://oalib.hlsresearch.com/Rays/ HLS-2010-1.pdf, (Last viewed January 13, 2024). 22.S. H. Byun, S. M. Kim, and Y. K. Lim, “Long-range sound transmission characteristics in shallow-water channel with thermocline” (in Korean), J. Acoust. Soc. Kr. 33, 273-281 (2014). 23.D. Y. Jeong, S. M. Kim, S. H. Byun, and Y. K. Lim, “A study on the characteristics of underwater sound transmission by short-term variation of sound speed profiles in shallow-water channel with thermocline” (in Korean), J. Acoust. Soc. Kr. 34, 20-35 (2015). 24.H. L. Van, Optimum Array Processing (Wiley, New York, 2002), pp. 1348. 25.H. Cox, R. M. Zeskind, and M. M. Owen, “Robust adaptive beamforming,” IEEE Trans. Acoust. Speech Sign. Process. 10, 1365-1376 (1987). 26.H. Cox and R. Pitre, “Robust DMR and multi-rate adaptive beamforming,” Proc. IEEE 31 st ACSSC, 920-924 (1997). 27.F. B. Jensen, W. A. Kuperman, M. B. Porter, and H. Schmidt, Computational Ocean Acoustics (Springer, New York, 2011), pp. 723-724. 저자 약력 ▸김 동 현 (Donghyeon Kim) 2014년 2월 : 한국해양대학교 해양공학과 (공학사) 2016년 2월 : 한국해양대학교 해양공학과 (공학석사) 2023년 2월 : 한국해양대학교 해양과학기 술융합학과(공학박사) 2023년 3월 ~ 현재 : 한국해양대학교 수중 운동체특화연구센터 학연연구교수 ▸변 기 훈 (Gihoon Byun) 2013년 2월 : 한국해양대학교 해양공학과 (공학사) 2015년 2월 : 한국해양대학교 해양공학과 (공학석사) 2018년 2월 : 한국해양대학교 해양과학기 술융합학과(공학박사) 2018년 3월 ~ 2022년 8월 : 미국 Scripps 해 양연구소 Research Associate 2022년 9월 ~ 현재 : 한국해양대학교 해양 과학기술융합학과 조교수 ▸김 재 수 (J. S. Kim) 1981년 : 서울대학교 조선공학과(공학사) 1984년 : 미국 University of Florida, 해양공 학(공학석사) 1989년 : 미국 MIT, 해양공학, 수중음향(공 학박사) 1990년 ~ 1991년 : 국방과학연구소 선임 연구원 1999년 ~ 2001년 : 미국 Scripps 해양연구 소 Visiting Scientist 2009년 ~ 2010년 : 미국 Scripps 해양연구 소 Visiting Scientist 1991년 ~ 현재 : 한국해양대학교 해양공 학과 교수 ▸신 기 철 (Kee‒Cheol Shin) 1996년 2월 : 한국해양대학교 해양공학과 (공학사) 1998년 2월 : 한국해양대학교 해양공학과 (공학석사) 2003년 8월 : 한국해양대학교 해양개발공 학과(공학박사) 2003년 9월 ~ 2004년 12월 : 한국과학재단 신진연구원, BB21 박사 후 과정 2005년 1월 ~ 현재 : LIG넥스원(주) 해양연 구소 수석연구원 팀장I. 서 론 컴퓨터 및 데이터 저장장치, 통신 네트워크, 정보 처리 기기의 발달에 따라서 온라인 음악 유통 시장 의 규모가 커지고 있다. 따라서 대규모 음원 데이터 베이스 에서 사용자의 요구에 맞추어 음악을 빠르고 신뢰성 있게 찾아서 제공해 줄 수 있는 검색 기술의 필요성이 커지고 있으며, 관련 연구들이 활발히 수 행되어 왔다. 본 논문은 다양한 음악 검색 문제 중에 서 커버곡 검색의 성능을 높이기 위한 음악 유사도 비교 방법에 관해서 다룬다. 커버곡은 콘서트 현장 에서 라이브 녹음, 편집이나 리메이크 등을 통해서 재녹음된 음악을 가리킨다. [1-3] 커버곡 검색 기술은 웹하드 및 유튜브 등 데이터 공유 서비스에서 저작 권 보호, 중복된 음원을 가진 음악 아카이브 정리 등 에 활용될 수 있을 것으로 기대된다. 커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도 A relevance-based pairwise chromagram similarity for improving cover song retrieval accuracy 서진수 1† (Jin Soo Seo 1† ) 1 강릉원주대학교 전자공학과 (Received October 11, 2023; accepted January 9, 2024) 초 록: 음악 유사도 계산은 음악 검색 서비스 구현에서 중요한 구성 요소 중 하나이다. 본 논문은 커버곡 검색 성능을 제고하기 위해서, 크로마그램 벡터 별로 커버곡 검색 적합도를 구하여 음악 유사도 계산 시 가중치로 활용한다. 커버곡 검색 적합도는 확률 적합도 모델을 이용하여 구한다. 커버곡 검색에 도움이 될 수 있는 분별도가 높은 벡터에 높은 가중 치를 부여하고, 흔하게 존재하여 분별도가 떨어지는 벡터에 낮은 가중치를 부여하는 방식으로 음악 유사도 함수를 유 도한다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여 제안한 음악 유사도 함수가 커버곡 검색 성능을 개선 시킬 수 있음을 보였다. 핵심용어: 커버곡 검색, 음악 유사도, 확률 적합도 모델, 검색 가중치 ABSTRACT: Computing music similarity is an indispensable component in developing music search service. This paper proposes a relevance weight of each chromagram vector for cover song identification in computing a music similarity function in order to boost identification accuracy. We derive a music similarity function using the relevance weight based on the probabilistic relevance model, where higher relevance weights are assigned to less frequently-occurring discriminant chromagram vectors while lower weights to more frequently-occurring ones. Experimental results performed on two cover music datasets show that the proposed music similarity improves the cover song identification performance. Keywords: Cover song identification, Music similarity, Probabilistic relevance model, Search weight PACS numbers: 43.75.Zz, 43.60.Uv 한국음향학회지 제43권 제2호 pp. 200~206 (2024) The Journal of the Acoustical Society of Korea Vol.43, No.2 (2024) https://doi.org/10.7776/ASK.2024.43.2.200 pISSN : 1225-4428 eISSN : 2287-3775 †Corresponding author: Jin Soo Seo (jsseo@gwnu.ac.kr) Department of Electronic Engineering, Gangneung-Wonju National University, 7 Jukhun-gil, Gangneung, Gangwon-Do 25457, Republic of Korea (Tel: 82-33-640-2428, Fax: 82-33-656-0740) Copyrightⓒ2024 The Acoustical Society of Korea. This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited. 200커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도 The Journal of the Acoustical Society of Korea Vol.43, No.2 (2024) 201 음악 검색은 목적에 따라서 다양한 유사도 기준을 적용하게 되어 사용하는 특징과 음악 유사도 비교 방법이 달라진다. 다양한 음악 검색 문제 중에서 본 논문은 커버곡 검색을 다루며, 특히 커버곡 검색을 위한 음악 유사도 비교 방법에 관해서 연구한다. 커 버곡 검색을 위한 음악 유사도 함수를 찾기 위해서 는 원곡과 커버곡 간의 공유되는 특성을 찾아야 한 다. 커버곡을 만드는 편집이나 녹음 과정에서 가수 와 악기의 차이로 인한 음색 변화, 연주 속도 및 스타 일 차이로 인한 템포, 리듬, 음악 키 변조 등 다양한 종류의 변형이 발생하므로, 커버곡 검색을 위한 음 악 특징을 찾고 유사도 함수를 정의하는 것은 여전 히 어려운 문제로 남아있다. 현재 가장 널리 사용되고 있는 원곡과 커버곡 간 의 공통점은 음들의 시간적 연결을 의미하는 선율 (멜로디)이다. 선율을 표현하는 스펙트럼 특징에는 대표적으로 크로마그램이 있다. 크로마그램은 음악 신호를 짧은 길이의 프레임 단위로 나누고 각 프레 임에서 스펙트럼을 구하고 옥타브 차이나는 음악 스 펙트럼 성분들을 가산하여 음악의 전체 스펙트럼 성 분들을 하나의 옥타브 안으로 접어서 표현한 것이 다. 일반적으로 커버곡 검색은 전곡 단위 입력에 대 해서 이루어지며, 음악 신호로부터 얻어지는 특징인 크로마그램 수열을 직접 비교하여 시간축 상에서 정 합하는 수열 직접 비교 방법 [2] 과 특징 벡터 수열을 가 공하여 검색에 용이한 고정된 길이의 전곡 특징 [4] 을 구하는 방법으로 나눌 수 있다. 본 논문은 커버곡 검 색 방법들 중에서 음악 신호로부터 얻어지는 크로마 그램 수열을 쌍별로 직접 비교하여 시간축 상에서 정 합을 구하는 수열 직접 비교 방법에 대해서 다룬다. 이런 수열 직접 비교 방법은 음성 인식과 deoxyribo- nucleic acid(DNA) 수열 분석에서 사용해왔던 dynamic time warping이나 Smith-Waterman(SW) 알고리즘 [5] 등 을 활용한다. 수열 직접 비교에서 가장 핵심이 되는 부분은 쌍별 크로마그램 유사도를 정의하는 것인데, 기존 연구들에서는 쌍별 크로마그램 유사도를 정합 과 부정합 시에 각각 양과 음의 상수로 미리 정해진 고정값을 사용하였다. [2] 최근 커버곡 검색 성능을 개 선하기 위해서 개별 크로그마그램 벡터의 허브 지수 를 고려하여 쌍별 유사도를 정규화하는 방법이 제안 되었고, 커버곡 검색 성능을 높일 수 있음을 보였 다. [6] 하지만 허브 지수가 임의로 정의되어 있어서 실험적으로는 좋은 성능을 보였으나, 이론적인 근거 가 부족한 단점이 있었다. 본 논문에서는 확률 적합 도 모델 [7-9] 에 기반하여 각 크로마그램 벡터의 커버 곡 검색 적합도를 구하고, 크로마그램 쌍별 유사도 가중치로 사용하는 방법을 제안한다. 또한 본 논문 에서 제안한 확률 적합도 기반 가중치와 허브 지수 기반 가중치 [6] 를 특수 경우로 포함함을 보였다. 쌍별 크로마그램 유사도에 기존 고정값을 사용하는 방법 과 가변 가중치를 사용하는 제안한 방법의 커버곡 검색 성능을 실험을 통해서 비교하였다. 본 논문은 커버곡 검색을 위한 크로마그램 쌍별 유사도 함수에 관한 연구이다. II장에서 크로마그램 특징 추출 및 쌍별 비교 방법을 살펴보고, 적합도를 기반으로 유사도 함수를 제안한다. III장에서 제안된 방법의 성능을 실험하고 결과를 비교 분석한다. II. 커버곡 검색 적합도 기반 크로마그램 쌍별 유사도 크로마그램 쌍별 유사도를 이용한 커버곡 검색 방 법으로 SW에 기반한 수열 직접 비교 방법을 살펴보 고, 쌍별 유사도를 고정된 값으로 사용하는 기존 방 법을 개선하기 위해서 쌍별 유사도 가중치를 확률 적합도 모델에 기반하여 유도하는 방법을 제안한다. 2.1 크로마그램 쌍별 유사도를 이용한 SW 기반 커버곡 검색 커버곡 검색은 음악 신호 전체에서 얻은 특징에 대해서 이루어지며, 수열 직접 비교 방법은 Fig. 1에 도시한 바와 같이 특징 벡터 수열 간의 쌍별 유사도 Fig. 1. (Color available online) Overview of the music similarity computation for cover song identification based on the proposed relevance weight.Next >