< Previous이경원, 이지현, 오단비, 라형인, 김기만 한국음향학회지 제 44 권 제 4 호 (2025) 330 ▸이 지 현 (Ji‑hyun Lee) 2024년 8월 : 국립한국해양대학교 전파공 학과(공학사) 2024년 9월 ~ 현재 : 국립한국해양대학교 전파공학과 석사과정 <관심분야> 음향 신호처리, 배열 신호처 리, 텔레메트리 등 ▸오 단 비 (Dan‑bi Ou) 2024년 2월 : 국립한국해양대학교 전파공 학과(공학사) 2024년 3월 ~ 현재 : 국립한국해양대학교 전파공학과 석사과정 <관심분야> 통신신호처리, 수중통신, 음 향 신호처리 등 ▸라 형 인 (Hyung‑in Ra) 2019년 2월 : 국립한국해양대학교 전파공 학과(공학사) 2022년 8월 : 국립한국해양대학교 전파공 학과(공학석사) 2023년 3월 ~ 현재 : 국립한국해양대학교 전파공학과 박사과정 <관심분야> 소나 신호처리, 수중통신, 음 향 신호처리, 텔레메트리 등 ▸김 기 만 (Ki‑man Kim) 1988년 2월 : 연세대학교 전자공학과(공 학사) 1990년 8월 : 연세대학교 전자공학과(공 학석사) 1995년 2월 : 연세대학교 전자공학과(공 학박사) 1995년 3월 ~ 1996년 8월 : 연세대학교 의 과대학 의용공학교실(Fellow) 1996년 9월 ~ 현재 : 국립한국해양대학교 전자전기정보공학부 교수 <관심분야> 배열 신호처리, 수중통신, 소 나 신호처리, 텔레메트리 등I. 서 론 오늘날 생활수준이 높아지면서 냉장고는 점차 대 형화되는 추세이다. 특히 가정용 냉장고에 장착된 제빙기(Ice maker)와 물을 취수해서 마실 수 있는 디 스펜서(Dispenser)는 세계적으로 인기를 끌고 있다. 다구찌 방법을 이용한 냉장고 급수펌프의 진동 전달경로 개선 및 소음 저감 Improvement of vibration transmission path and noise reduction of refrigerator water pump using Taguchi method 이우진, 1 김원진 1† (Woo-Jin Lee 1 and Won-Jin Kim 1 † ) 1 계명대학교 기계공학과 (Received February 5, 2025; revised March 13, 2025; accepted May 2, 2025) 초 록: 무배관(Non-plumbing) 냉장고에서 디스펜서와 제빙기로의 급수 과정에서 발생하는 펌프 소음을 분석하고, 이를 저감하기 위한 대책을 수립하고 적용하였다. 펌프 작동으로 발생하는 진동이 펌프 케이스 및 내부 배관, 냉장고 내 벽에 전달되어 발생하는 구조 소음 저감을 대상으로 하였다. 그리고 기준 실험 조건을 결정하기 위하여 급수통 물의 양, 펌프 케이스와 냉장고 내벽 체결 볼트의 토크 값, 펌프와 펌프 케이스의체결 볼트의 토크, 세 가지 실험변수 수준에 따른 소음 레벨을 측정하였다. 기준 실험조건에서 펌프 케이스와 냉장고 내벽 사이의 방진 테이프 두께 및 체결 볼트 방진고무 의 높이, 펌프 방진고무의 높이, 급수관의 길이를 실험인자로 선정하고, 다구찌 기법을 적용하였다. 그리고 다구찌 기법 의 분석을 이용하여 소음 레벨을 최소로 하는 최적의 조건을 도출하였다. 마지막으로 최적 조건을 냉장고에 적용하여 성능을 검증하였다. 핵심용어: 무배관 냉장고, 급수펌프, 구조전달음, 다구찌 기법 ABSTRACT: This study analyzes the pump noise generated during the water supply process to the dispenser and ice maker in a non-plumbing refrigerator and proposes effective noise reduction methods. The focus is on minimizing structural noise caused by pump-induced vibrations transmitted to the pump case, internal piping, and refrigerator walls. To establish standard experimental conditions, noise levels were measured based on three key variables: the amount of water in the supply tank, the torque of bolts securing the pump case to the refrigerator wall, and the torque of bolts securing the pump to the pump case. Under these standard conditions, critical experimental factors were identified, including the thickness of anti-vibration tape between the pump case and refrigerator wall, the height of anti-vibration rubber on securing bolts, the height of the pump’s anti-vibration rubber, and the length of the water supply pipe. The Taguchi method was applied to optimize these factors. Through Taguchi analysis, the optimal conditions for minimizing noise levels were derived. These optimized conditions were then implemented in the refrigerator, and performance validation confirmed their effectiveness in noise reduction. Keywords: Non-plumping refrigerator, Water supply pump, Air borne noise, Taguchi method PACS numbers: 43.40.Tm, 43.50.Gf 한국음향학회지 제44권 제4호 pp. 331~337 (2025) The Journal of the Acoustical Society of Korea Vol.44, No.4 (2025) https://doi.org/10.7776/ASK.2025.44.4.331 pISSN : 1225-4428 eISSN : 2287-3775 †Corresponding author: Won-Jin Kim (wjkim@kmu.ac.kr) Department of Mechanical and Automotive Engineering, Keimyung University, 1095, Dalgubeol-daero, Dalseo-gu, Daegu 42601, Republic of Korea (Tel: 82-53-580-5265, Fax: 82-53-580-5165) Copyrightⓒ 2025 The Acoustical Society of Korea. This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited. 331이우진, 김원진 한국음향학회지 제 44 권 제 4 호 (2025) 332 개발도상국에서도 디스펜서와 제빙기가 있는 냉장 고의 수요가 증가함에 따라 관련 기술 개발이 활발 히 진행되고 있다. 그러나 개발도상국의 상수도 환 경은 선진국에 비해 열악하기 때문에 기존 정수 필 터(Water filter)만으로는 디스펜서 사용이 어렵다. 그 래서 상수도를 직접 연결하지 않아도 되는 무배관 (Non-plumbing) 모델이 높은 인기를 끌고 있다. [1] 무 배관 모델은 디스펜서와 제빙기를 상수도 대신 냉 장고 내부의 급수통에 연결하여 사용한다. 그러나 급수펌프의 동작으로 기존 냉장고 모델에서는 없는 소음이 발생한다. 소비자 불편을 없애고 제품에 대 한 만족감을 높이기 위해서는 저소음 설계가 필수 적이다. 펌프에서 발생하는 소음은 유동기인소음과 구조 기인소음으로 구분할 수 있다. 펌프 동작에서 유동 기인소음은 관로 내의 유체를 타고 전파되는 소음 이며, 구조기인소음은 펌프에 연결되어 있는 구조 물로 전달되는 소음이다. [2] 유동기인소음과 구조기 인소음 저감을 위해서는 다양한 설계 요소를 고려 해야 한다. 제품 설계 시 다구찌 방법을 사용하면 적 은 실험 횟수로 설계 요소의 기여도를 평가하고 최 적 조건을 찾을 수 있다. 이를 통해 비용을 절감하고 개발 기간을 단축할 수 있다는 장점이 있어 널리 활 용되고 있다. [3] 펌프 소음과 관련하여 진행된 연구 중에 Yang et al. [4] 은 급수펌프 토출배관의 고유 모드와 펌프 회전 주파수와의 공진을 저감하는 연구를 진행하였다. Yen et al. [5] 는 피스톤 펌프의 소음, 진동 문제를 해결 하기 위해 펌프 쉘과 밸브 플레이트의 구조를 최적 화하는 방식을 적용하는 연구를 하였다. 그리고 Metalsi Tani와 Bourdim [6] 은 기어 펌프의 소음을 줄이 기 위해 플라스틱 기어를 사용하였을 때의 소음저 감 수준을 평가하는 연구를 진행하였다. 다구찌 방법을 이용한 소음저감에 관한 선행연구 로는, Kwon et al. [7] 이 에스컬레이터에서 발생하는 소 음을 다구찌 방법을 적용하여 소음원과 설계인자를 분석하고 최적화 조건을 도출하여 소음을 저감했 다. Kim et al. [8] 은 다구찌 방법을 이용하여 펌프의 유 로형상을 최적화하여 파워스티어링 시스템에 사용 되는 펌프의 소음을 줄이는 연구를 수행하였다. 또 한, Seo와 Jeon [9] 는 주방과 거실을 유한요소모델로 구현하고, 설계 물성치와 형상 관련인자들을 설계 인자로 선정하여 바닥충격음을 저감하는 연구를 진 행하였다. 본 연구에서는 디스펜서와 제빙기가 작동할 때, 급수통의 물을 이송하기 위해 동작하는 급수펌프에 의한 소음 저감 방법을 연구하였다. 먼저, 소음에 영 향을 미치는 주요 인자들을 도출하였다. 그리고 다 구찌 기법을 이용하여 소음을 최소화할 수 있는 최 적 조건을 도출하였다. 마지막으로 최적 조건을 냉 장고에 적용하여 소음 저감 효과를 입증하였다. II. 급수펌프 소음의 기준조건 선정 연구의 대상인 무배관 냉장고의 급수펌프 및 관련 부품들은 Fig. 1과 같이 구성되어 있다. 급수펌프는 펌프 케이스의 안쪽 면에 고정되어 있으며, 펌프 케 이스는 냉장고 내벽에 볼트로 체결된다. 디스펜서 와 제빙기를 작동하면 급수를 위해 급수펌프가 동 작한다. 이 때 펌프에서 발생한 진동이 펌프 케이스 와 디스펜서 또는 제빙기까지 연결된 배관을 가진 하게 된다. 이를 확인하기 위해 냉장고의 컴프레서(Compressor) 와 팬(Fan)의 동작을 모두 정지한 상태에서 펌프만 작동하였다. 냉장고 전면(거리 1 m, 높이 1.5 m 지점) 에서 마이크로폰을 이용해 소음을 측정하고, 펌프 에는 단축 가속도계를 부착하여 진동을 측정하였 Fig. 1. (Color available online) The structure of Non- Plumbing refrigerator.다구찌 방법을 이용한 냉장고 급수펌프의 진동 전달경로 개선 및 소음 저감 The Journal of the Acoustical Society of Korea Vol.44, No.4 (2025) 333 다. Table 1에 측정 장비와 신호 처리 조건을 정리하 였으며, 전체 측정 시간 중 펌프의 작동 상태가 가장 안정적인 구간의 데이터를 사용하였다. Figs. 2와 3은 일반 냉장고 조건에서 디스펜서와 제 빙기로 각각 독립적으로 급수할 때 펌프에서 측정 된 진동 및 소음의 스펙트럼 결과이다. 디스펜서로 급수 시 펌프의 회전 주파수는 약 34 Hz이며, 제빙기 의 경우 약 26 Hz의 회전 주파수로 동작한다. 다만, 펌프 작동 시 조건 변화에 따라 1 Hz ~ 2 Hz의 범위에 서 변동할 수 있다. 진동과 소음은 디스펜서와 제빙 기 모두 10차 조화 성분 가장 높게 나타났다. 디스펜 서는 320 Hz ~ 350 Hz 범위, 제빙기는 250 Hz ~ 280 Hz 범위에서 크게 측정되었다. 펌프의 진동과 소음은 측정 조건에 따라 달라질 수 있으므로, 세 가지 조건을 선정하여 소음을 측정 하였다. 실험 조건으로 선정한 인자는 급수통 내 물 의 양, 펌프 케이스를 냉장고 내벽에 체결할 때 사용 하는 볼트의 토크 값, 그리고 펌프를 펌프 케이스에 체결할 때 사용하는 볼트의 토크 값이다. 각 인자의 영향을 독립적으로 확인하기 위해 하나의 인자를 변경할 때 나머지 두 인자는 실험 수준 중 가장 높은 수준으로 고정하였다. 이 때 나머지 조건들은 추후 수행할 다구찌 실험의 기준조건과 동일하게 설정하 였다. 즉, 펌프 방진 고무 높이는 7 mm, 급수관의 길 이는 1.25 m로 고정하였으며, 펌프 케이스와 냉장고 내벽 사이의 방진 테이프 및 펌프 케이스 체결 볼트 의 방진 고무는 적용하지 않았다. 각 조건별 소음 측 정 결과는 Tables 2 ~ 4에 나타내었다. 측정 결과, 급수통 내 물의 양에 따른 소음 특성은 디스펜서와 제빙기에서 서로 다른 양상을 나타냈 다. 디스펜서의 경우 급수통 내 물의 양이 가장 적은 1 L 조건에서 최대 소음이 발생했고, 최대 용량인 4.5 L일 때 두 번째로 높은 소음이 발생했다. 이는 급수 통 내 물의 양이 적을 때 펌프 작동 시 물의 요동이 심 해지고 펌프 유입부에서 물의 흐름이 불안정해지기 때문으로 해석된다. 제빙기의 경우에는 펌프의 회 전속도와 유량이 디스펜서보다 상대적으로 낮다. 또한 급수가 간헐적으로 이루어지는 작동 특성을 Table 1. Information of signal processing and equip- ment. Measured time [s]5 Frequency resolution [Hz]1 Sampling frequency [Hz]2048 Time interval [s]1 Window functionRectangular AnalyzerLMS SCADAS AccelerometerPCB 333B30 MicrophonePCB 378B02 (a) Vibration spectrum (b) Sound spectrum Fig. 2. (Color available online) Vibration and sound spectrum data during dispenser operation. (a) Vibration spectrum (b) Sound spectrum Fig. 3. (Color available online) Vibration and sound spectrum data during ice maker operation.이우진, 김원진 한국음향학회지 제 44 권 제 4 호 (2025) 334 가진다. 따라서 급수통 내 물의 양 변화가 소음에 일 정한 영향을 미치지 않고 불규칙한 특성을 보였다. 펌프 케이스와 냉장고 내벽 간 볼트 체결 토크의 변화에 따라서는 최대와 최소 소음 간 약 2 dB의 차 이가 났다. 그리고 펌프와 펌프 케이스 간 볼트 체결 토크의 변화에 따라서는 최대와 최저 소음의 차이 가 약 4 dB의 차이를 보였다. 기준 조건은 실제 제품 사용 환경을 고려하여 소 음 발생 가능성이 높은 조건을 기준으로 선정하였 다. 특히, 디스펜서와 제빙기 중 소음 수준이 상대적 으로 높았던 디스펜서 작동 조건을 우선으로 고려 하였다. 급수통 내 물의 양은 소비자 사용 환경에서 빈번히 경험하고 소음 수준도 비교적 높게 나타난 최대 물 용량인 4.5 L로 선정하였다. 또한, 볼트 체결 토크 값은 실제 제품 양산 조립 조건인 6 kgf·cm을 기 준 조건으로 선정하였다. III. 다구찌 기법을 이용한 소음분석 및 최적안 도출 펌프 진동이 펌프 케이스 및 내부 배관에 전달되 어 발생하는 구조 소음을 저감하기 위해 다구찌 기 법을 적용하였다. Table 5와 Fig. 4에 제시된 바와 같 이 네 가지 실험 인자를 3-수준으로 선정하였다. 실 험 인자는 펌프의 진동이 구조물을 통해 냉장고 전 체로 전달되는 경로에서 진동 전달 특성을 변화시 킬 수 있는 주요 설계변수를 선정하였다. 실험은 각 인자에 대하여 3-수준으로 구성된 L 9 직교배열표 (Table 6)를 사용하여 수행하였다. 실험 결과로부터 얻은 소음 데이터를 바탕으로, Eq. (1)의 망소 특성을 이용하여 S/N 비를 계산하고, 주요 인자의 수준별 S/N 비를 Fig. 5에 나타내었다. ,(1) 여기서 는 특성치의 결과이며 n은 각 실험의 반복 측정 횟수이다. S/N 비의 최대값과 최소값 차이가 큰 인자는 소음 변화에 미치는 영향이 크다는 것을 의 미한다. [10] Table 7과 Fig. 5에서 민감도가 큰 실험인 자부터 작은 순으로 나열하면 (a) 펌프 케이스와 냉 장고 내벽 사이의 방진 테이프 두께, (d) 펌프에서 디 스펜서 또는 제빙기까지의 배관길이, (c) 펌프 케이 스 체결볼트의 방진고무의 높이, (b) 펌프 방진고무 의 높이 순으로 나타났다. Table 8은 각 실험인자 별로 S/N 비가 가장 큰 수준 을 조합한 최적 조건을 초기 기준조건과 비교한 결 Table 2. Sound pressure level based on the water volume in the water tank. Water volume [L] Sound pressure level [dB(A)] DispenserIce maker 145.643.0 242.341.9 341.341.5 439.743.6 4.544.341.9 Table 3. Sound pressure level based on fastening torque values between pump case and refrigerator inner wall. Torque [kgf·cm] Sound pressure level [dB(A)] DispenserIce maker 344.839.7 445.540.4 544.240.1 644.641.7 Table 4. Sound pressure level based on fastening torque values between pump and pump case. Torque [kgf·cm] Sound pressure level [dB(A)] DispenserIce maker 343.641.1 445.744.4 544.340.4 644.841.6 Table 5. 3-level values of experimental factors. Factors Level 123 amm00.71.4 bmm7911 cmm02.55 dm1.251.351.45다구찌 방법을 이용한 냉장고 급수펌프의 진동 전달경로 개선 및 소음 저감 The Journal of the Acoustical Society of Korea Vol.44, No.4 (2025) 335 과이다. 여기서는 3개의 급수펌프를 대상으로 각 조 건에서 디스펜서와 제빙기로 각각 독립적으로 급수 할 때 소음을 10회씩 측정하여 소음레벨을 산술평균 하였다. 도출된 최적 조건은 다음과 같다. 펌프 케이 스와 냉장고 내벽 사이에 적용하는 방진 테이프의 두께는 1.4 mm로 설정하고, 펌프 케이스 체결볼트 (a) Thickness of vibration-damping tape between pump case and refrigerator inner wall (b) Height of pump mounting rubber (c) Height of vibration-damping rubber on the top of fastening bolt (d) Length of water supply pipe Fig. 4. (Color available online) Four experimental factors applied in the Taguchi method. Table 6. 3-level orthogonal array (L 9 ) for noise re- duction of the pump in the non-plumbing refrigerator. Experiment No. Factors abcd 11111 21222 31333 42123 52231 62312 73132 83213 93321 Fig. 5. (Color available online) Response of S/N ratios. Table 7. S/N ratio analysis. S/N ratio abcd Level 1-32.61-32.24-32.10-32.08 2-32.05-32.16-32.31-32.35 3-31.87-32.14-32.13-32.10 Contributions1432 Optimum level3311 a : Thickness of vibration-damping tape between pump case and refrigerator inner wall b : Height of pump mounting rubber c : Height of vibration-damping rubber on the top of fastening bolt d : Length of water supply pipe이우진, 김원진 한국음향학회지 제 44 권 제 4 호 (2025) 336 방진고무는 사용하지 않는다. 또한, 펌프 마운트 고 무의 두께는 11 mm, 펌프로부터 디스펜서 또는 제빙 기까지의 배관길이는 1.25 m이다. Fig. 6은 디스펜서 와 제빙기 작동 시 펌프가 작동하는 5초간 기준 조건 과 최적 조건에서의 소음 레벨을 측정한 결과이다. 디스펜서로 급수 시에 평균 5.1 dB, 제빙기로 급수 시 에는 평균 2.8 dB의 소음 저감 효과가 확인되었다. IV. 결 론 무배관 냉장고 급수펌프의 소음을 저감하기 위해 두 단계의 실험을 수행하였다. 먼저, 기준 실험 조건 을 결정하기 위하여 급수통 내 물의 양, 펌프 케이스 와 냉장고 내벽 간 볼트 체결 토크 값, 펌프와 펌프 케 이스 간 볼트 체결 토크 값의 세 가지 실험 변수 수준 에 따른 소음 레벨을 측정 및 분석하였다. 이어서 다 구찌 기법을 적용하여 구조 소음을 최소화하는 실 험을 수행하였다. 실험 인자로는 펌프 케이스와 냉 장고 내벽 사이의 방진테이프 두께, 펌프 마운트 방 진고무 높이 등 네 가지 인자를 선정하였다. 망소 특성의 S/N 비 분석을 통해 각 인자의 소음 저 감 기여도를 분석하였다. 분석결과, 방진 테이프의 두께가 소음 저감에 가장 큰 기여도를 나타냈다. 이 는 방진 테이프가 펌프의 진동이 냉장고 내벽으로 직접 전달되는 경로를 효과적으로 차단하거나 감소 시키기 때문이다. 즉, 방진 테이프의 두께가 증가할 수록 구조물 간의 진동 전달률이 낮아져 소음 저감 효과가 커진 것으로 나타났다. 반면, 펌프 방진 고무 의 높이는 진동 전달률 감소에 미치는 영향이 상대 적으로 미미하여, 소음 저감 효과는 제한적이었다. 최적 조건을 실제 냉장고에 적용하여 소음을 측정 한 결과, 디스펜서와 제빙기 작동 시 펌프에 의한 급 수 소음이 모두 저감됨을 확인하였다. 본 연구에서 는 다구찌 기법을 통해 소음 저감에 미치는 각 인자 의 기여도를 정량적으로 평가하였다. 이를 바탕으 로 구조 소음 저감을 위한 최적 설계 조건을 제시하 였다. 도출된 설계조건은 펌프 진동이 냉장고 구조 물로 전달되는 것을 효율적으로 억제하여 소비자가 인지하는 소음 수준을 효과적으로 낮추었다. References 1.J. M. Kim, The study for pump pressure characteristic by differential head in non-plumbing refrigerator, (M.A. thesis, Pusan National University, 2016). 2.M. G. Kang and S. R. Choi, “Review on ISO standards for measuring noise & flow/pressure ripple in hydraulic pump and motors,” J. Fluid Power and Systems, 7, 29-39 (2010). 3. W. K. Park and G. E. Yang, “ The robust design for drum noise reduction using Taguchi method,” J. Korean Soc. Mech. Technol. 15, 201-210 (2013). 4.K. H. Yang, C. H. Cho, and C. H. Bae, “Acoustic investigation on BFP piping system in a power plant” (in Korean), Trans. Korean Soc. Noise Vib. Eng. 21, 1029-1035 (2011). 5.S. G. Yen, J. H. Zhang, and B. Xu, “Noise reduction Table 8. Pump noise between the reference condition and optimal condition. Sound pressure level [dB(A)] DispenserIce maker Pump No.#1#2#3#1#2#3 Reference condition 44.949.848.441.744.143.9 Optimal condition 39.844.34.637.741.841.7 Noise reduction 5.15.54.84.02.32.2 (a) Dispenser (b) Ice maker Fig. 6. (Color available online) Pump noise between the reference condition and optimal condition Graph.다구찌 방법을 이용한 냉장고 급수펌프의 진동 전달경로 개선 및 소음 저감 The Journal of the Acoustical Society of Korea Vol.44, No.4 (2025) 337 of an Axial piston pump by valve plate optimization” (in Chinese), J. Mech. Eng. 31, 31-57 (2018). 6.F. Metalsi Tani and A. Bourdim, “Study of feasibility of plastic gear to reduce noise in a gear pump,” J. Advances in Production Eng. Management, 7, 143- 149 (2012). 7.Y. S. Kwon, S. R. Park, S. D. Kim, J. W. Seo, S. G. Kim, and C. W. Lee, “A study on the noise reduction of escalator using Taguchi Method,” Proc. Korean Soc. Noise Vib Eng. Spring Conf. 142-147 (1996). 8.C. K. Kim, Y. R. Kim, D. W. Seo, S. C. Park, and S. J. Son, “Application of Taguchi method to improve noise of power steering,” Proc. Korean Soc. Automotive Eng. Fall Conf. 1011-1016(2004). 9. S. H. Seo and J. Y. Jeon, “Application of finite element method and Taguchi method to reduce floor impact vibration in apartment buildings,” Proc. Korean Soc. Noise Vib Eng. Fall Conf. 385-388 (2005). 10.J. K. Kim, S. H. Oh, and E. G. Na, “Optimum design of flow-path system for a low noise indoor package air-conditioner,” Proc. Korean Soc. Mechanical Eng. Spring Conf. 123-126 (2013). 저자 약력 ▸이 우 진 (Woo‑Jin Lee) 2023년 2월 : 계명대학교 기계공학과 학사 2023년 9월 ~ 현재 : 계명대학교 기계공학 과 석사과정 ▸김 원 진 (Won‑Jin Kim) 1987년 2월 : 부산대 정밀기계공학과 학사 1989년 2월 : KAIST 기계공학과 석사 1993년 8월 : KAIST 기계공학과 박사 1991년 9월 : 삼성중공업 기계전자연구소 1997년 3월 ~ 현재 : 계명대학교 기계공학 과 교수 I. Introduction A chromagram is among the well-established features in music information retrieval. [1-3] Assuming an equal- tempered scale, chroma correspond to the set of twelve pitch spelling attributes used in Western music notation. In this scale, different pitch spellings, corresponding to musical note labels, can refer to the same chroma. A chroma vector is typically represented as a 12-dimensional vector, where each element corresponds to a specific chroma. Chromagrams are invariant to octave shifts, meaning they focus on relative pitch rather than absolute frequency, making them robust to transpositions. Moreover, chromagrams are independent of timbre and loudness. These characteristics have been widely utilized in Cover Song Identification (CSI), [4-6] which refers to the Salient chromagram extraction by using temporal smoothing and soft decision for cover song identification 커버곡 검색을 위한 시간축 방향 평탄화 및 연판정을 이용한 강인한 크로마그램 추출 Jin Soo Seo 1 † (서진수 1† ) 1 Department of Electronic and Semiconductor Engineering, Gangneung-Wonju National University (Received March 7, 2025; revised April 28, 2025; accepted May 20, 2025) ABSTRACT: Extracting a salient chromagram is crucial for cover song identification, where a cover refers to a live performance, remix, or re-recording of an original track. This paper enhances chromagram saliency through preprocessing and postprocessing techniques. Temporal smoothing is applied as preprocessing to reduce noise and fluctuations introduced during cover song generation, improving continuity and mitigating pitch estimation errors. Additionally, a soft decision of chroma activation is proposed as postprocessing to reliably determine pitch-class presence. Experimental results on two datasets demonstrate that the temporal smoothing and the soft decision improve cover song identification accuracy. Keywords: Chromagram, Cover song, Temporal smoothing, Soft decision PACS numbers: 43.75.Zz, 43.60.Uv 초 록: 커버곡 검색을 위해서는 강인한 크로마그램 추출이 중요하다. 라이브 녹음 또는 리메이크를 통한 재편집을 통해서 얻은 음악을 원곡의 커버곡이라 부른다. 본 논문은 전처리와 후처리를 통해 크로마그램의 강인성을 향상시킨다. 커버곡 생성 과정에서 발생하는 노이즈와 변동을 줄여 연속성을 향상시키고 피치 추정 오류를 완화하기 위해 전처리로 시간축 방향 평탄화를 적용한다. 또한, 후처리 단계에서 크로마 활성화 연판정을 통해서 음고류 존재 여부를 신뢰성 있 게 판별한다. 두 가지 음악 데이터셋에서 커버곡 검색 실험을 수행하여 시간축 방향 평탄화와 연판정이 커버곡 검색 성 능을 개선함을 확인하였다. 핵심용어: 크로마그램, 커버곡, 시간축 방향 평탄화, 연판정 한국음향학회지 제44권 제4호 pp. 338~345 (2025) The Journal of the Acoustical Society of Korea Vol.44, No.4 (2025) https://doi.org/10.7776/ASK.2025.44.4.338 pISSN : 1225-4428 eISSN : 2287-3775 †Corresponding author: Jin Soo Seo (jsseo@gwnu.ac.kr) Department of Electronic and Semiconductor Engineering, Gangneung-Wonju National University, 7 Jukhun-gil, Gangneung, Gangwon-Do 25457, Republic of Korea (Tel: 82-33-640-2428, Fax: 82-33-656-0740) Copyrightⓒ 2025 The Acoustical Society of Korea. This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited. 338Salient chromagram extraction by using temporal smoothing and soft decision for cover song identification The Journal of the Acoustical Society of Korea Vol.44, No.4 (2025) 339 process of identifying live performances, remixes, or new recordings of previously recorded tracks. CSI is particularly challenging because variations in timbre, rhythm, song structure, key, and lyrics introduced during cover song generation can result in significantly different cover versions, [4] making chromagram saliency crucial for identifying them. A chromagram vector is extracted over short time intervals (called frames) by quantifying the spectral energy of octave-folded subbands. By aggregating spectral energy into a single octave, chromagrams focus on relative pitch rather than absolute frequency, making them invariant to octave shifts and robust to transpositions, which is essential for cover song analysis. To further improve chromagram saliency, several efforts have been made by focusing on robustness against timbre variations, which are caused by changing singer or instrumentation. Muller and Ewert [1] proposed the chroma DCT-reduced log pitch (CRP), where DCT refers to the discrete cosine transform. The CRP employs higher-order DCT coefficients of the spectral energy, under the assumption that lower-order components are more closely related to timbre and should be suppressed. In Reference [3], the Chroma Trend-removed log Pitch (CTP) was introduced, where trend estimation filters such as the moving average and the Hodrick-Prescott filter [7] were employed to remove the smoothly varying spectral energy component assumed to be timbre-related. Previous work on salient chromagrams has primarily focused on frame-level saliency, typically by suppressing low-frequency components. As a key contribution of this paper, we incorporate segment- and song-level spectral information by introducing dedicated preprocessing and postprocessing steps into the chromagram extraction pipeline. As a preprocessing step, we apply temporal smoothing, which reduces noise and fluctuations intro- duced during cover song generation, thereby improving chromagram continuity and mitigating pitch estimation errors. Various temporal smoothing methods have been evaluated for salient chromagram extraction. As a postprocessing step, we introduce a soft decision of chroma activation to determine pitch-class presence more reliably, allowing a gradual transition between inactive and active states. The soft decision function is designed by applying a sigmoid transformation to the modified Z-score of the spectral energy, ensuring resilience to outliers while providing a smooth activation transition. The effectiveness of the proposed temporal smoothing and soft decision is evaluated on the CSI task. Experimental validation is conducted using two CSI approaches across two cover song datasets. This paper is organized as follows. Section 2 describes chromagram extraction with temporal smoothing and soft decision for CSI. Section 3 presents experimental vali- dation of the preprocessing and postprocessing steps. Finally, Section 4 concludes the paper. II. Temporal smoothing and soft decision for extracting salient chromagram 2.1 Pitch representation and chromagram extraction Chromagram extraction is a technique used in music analysis to represent the pitch content of music, focusing on the 12 pitch classes of the chromatic scale. Chroma- based audio features are obtained by pooling a signal’s spectrum into 12 bins, corresponding to the 12 pitch classes (chroma) of the equal-tempered scale. By identifying pitches that differ by an octave, chroma features exhibit robustness to timbral variations and are well-suited for the analysis of Western music, which is characterized by prominent harmonic progressions. [1] To show the validity of the proposed pre- and post- processing steps, we employ two baseline chromagram methods, CRP [1] and CTP. [3] Both baselines are based on decomposing a music signal into 88 frequency bands with center frequencies corresponding to MIDI pitches p = 21 to p = 108. Further details on frequency band positions and bandwidths are provided in Reference [2]. At each of the Next >