< Previous임준석 한국음향학회지 제 44 권 제 5 호 (2025) 466 ∇ w n w n T n g n r n T g n (4) Eq. (4)에 Eq. (2)를 대입하면 Eq. (5)와 같이 된다. ∇ w n wn T ngn ngn T ngn rn T g n (5) Eq. (5)를 스텝 사이즈 에 대해서 다시 정리하여 Eq. (6)과 같은 스텝 사이즈 갱신식을 구한다. [7] g n T n g n w n T n r n T g n g n T n g n g n T g n (6) 앞에 기술한 Eqs.(2)부터 (6)이 Xi와 Liu가 제안한 IWF이다. [7] III. 이중 슬라이딩 윈도우 IWF IWF 알고리즘 보면 알고리즘의 수렴 속도는 스텝 사이즈를 비용 함수를 최소화하는 방향으로 계속 갱신하면서 얻는 것을 알 수 있다. RLS 알고리즘 중 에는 데이터 윈도우 길이를 이용하여 수렴 속도에 대응하는 Sliding Window Recursive Least Square(SW- RLS)가 있다. [15] SW-RLS는 긴 길이 윈도우로써 정상 상태에서 정확도를 확보하고, 짧은 길이 윈도우로 써 시변 추적 성능을 추구한다. 그러나 단일 윈도우 를 사용하는 일반 SW-RLS로는 시변 추적성과 정상 상태 성능을 동시에 달성하기 어려웠다. Reference [14]에서 두 개 윈도우를 사용하는 SW-RLS를 제안 하여 위와 같은 문제를 완화할 수 있음을 보였다. 본 논문에서 IWF를 두 개 윈도우를 사용하도록 수정하 고, 그로부터 정상 상태 정확도와 시변 추적성을 동 시에 확보할 수 있도록 한다. IWF 알고리즘이 유한 길이 윈도우를 사용할 수 있 도록 하게 위해서 Eq. (3)의 n 갱신식과 rn 갱신 식을 다음과 같이 수정한다. pre n n x n x n T n pre n L s xnL s xnL s T (7) r pre n rn xnyn r n r pre n L s x n L s y n L s (8) Fig. 1. Window selection logic. Table 1. Dual Length Sliding Window-IWF (DLSW- IWF). Initialize w ⋯ T ∈ R M ≥ Loop n =1, ... x T n w n y n pre n n x n x n T n pre n L s xnL s xnL s T r pre n rn xnyn rnr pre n L s xnL s ynL s g n n w n r n gn T ngn gn T gn wn wn ngn Select the length of window from the window selection logic in Fig. 1 as or . If Select to long window elseif Select to short window , n , r n else Keep current window setting endif end시변 시스템 추정 성능 향상을 위한 이중 슬라이딩 윈도우 Iterative Wiener Filter The Journal of the Acoustical Society of Korea Vol.44, No.5 (2025) 467 여기서 L s 는 윈도우 길이이다. 그리고 윈도우 길이를 자동으로 조정하기 위한 척도로써 Reference [14]와 같은 척도를 사용한다. Reference [14]에서는 Park [10] 이 제안한 가변 망각 계수 max ⋅ − ek , (단 e k 는 데이터 윈도우 내의 추정 오차 평균 에너 지, e k y k − w T k x k , max 는 최대 망각 계 수, 는 스케일 상수),를 윈도우 길이 조절 척도로 사 용했다. Fig. 1에 망각 계수를 이용하여 두 개의 데이 터 윈도우를 운용하는 논리를 정리하였다. [14] 단 는 윈도우 길이 선택 척도로만 사용되고, Eq. (7)과 Eq. (8)에서 사용하는 망각인자 는 IWF 알고리즘 상 의 본래 용도로 사용한다. Eqs. (7), (8) 및 Fig. 1을 적 용한 이중 윈도우 IWF 알고리즘(DLSW-IWF, Dual Length Sliding Window–IWF)을 Table 1에 정리하였다. IV. 성능 확인을 위한 모의실험 4.1 급격한 시스템 변화가 있는 시스템의 추정 본 실험에서는 Li et al. [12] 등이 제안한 가변 망각 계수 논문에서와 같은 가변 시스템 환경에서 여러 알고리즘의 성능을 서로 비교하였다. 급격한 시스템 변화를 위해서 임펄스 응답 w 1 = [1.0, 0.5, 2.0, 0.3, 0.7]이 500번째 스텝에서, w 2 = [–0.2, –0.5, –1.0, –0.4, –2.0]으로 갑자기 바뀌는 경우를 모사 하였다. 이런 급격한 변화를 가진 시스템 환경에서 긴 길이 단일 윈도우 IWF와 짧은 길이 단일 윈도우 IWF와 제안한 알고리즘의 시스템 추정 성능을 비교 하였다. 짧은 길이 단일 윈도우는 시스템 임펄스 응 답 w 1 또는 w 2 의 길이의 2배로 정해서 시변 환경에 잘 적응하도록 하고, 긴 길이 단일 윈도우는 200으로 정 하여 최근 데이터뿐만 아니라 오래된 데이터도 사 용하여 시스템을 추정하기 때문에 정적인 환경에 잘 적응하도록 하였다. 따라서 제안한 방법이 정적 인 환경에서는 긴 길이 윈도우를 쓰는 IWF의 성능과 유사하고, 시변 환경에서는 짧은 길이 윈도우를 쓰 는 IWF의 성능과 유사함을 보인다. 시스템 추적을 목적으로 하는 알고리즘들은 주로 비교적 높은 신호 대 잡음 비에서 사용된다. 따라서 본 논문에서는 각 알고리즘 간의 비교 실험을 높은 신 호 대 잡음비인 20 dB와 중간 수준 신호 대 잡음비인 10 dB인 경우에서 각각 1000번씩 반복 실험하였다. 추정 성능을 수치화하기 위해서 시스템 추정 척도 로 추정 시스템의 평균 표준 편차(Mean Standard De- viation, MSD)를 사용하였다. MSD Mean log w true w true − w estim (9) 여기서 w true 는 시스템 파라미터 참값이고, w estim 은 추 정한 시스템 파라미터이다. Fig. 2에는 급변하는 시스템 환경에서 각 알고리즘 이 추정한 시스템의 MSD를 도시한 것이다. 신호 대 (a) SNR: 20 dB (b) SNR: 10 dB Fig. 2. (Color available online) MSD comparison results in the abruptly changed system case (red and -o-: the proposed algorithm, black and -x-: long single window IWF, black and -△-: short single window IWF).임준석 한국음향학회지 제 44 권 제 5 호 (2025) 468 잡음비 20 dB뿐만 아니라 신호 대 잡음비 10 dB에서 도 제안한 DLSW-IWF는 변화가 적은 환경에선 긴 길 이 단일 윈도우를 쓰는 IWF와 유사한 성능을 내고, 변화가 발생하면 짧은 길이 단일 윈도우를 쓰는 IWF 와 유사한 성능을 내어서 변화에 빠르게 따라가는 것을 확인할 수 있다. Fig. 3에는 DLSW-IWF 내부에서 윈도우 길이 선택 을 돕는 망각 계수 의 변화 추이를 신호 대 잡음 비 20 dB과 신호 대 잡음비 10 dB에서 각각 도시하였 다. Fig. 3을 보면 앞에서 언급한 것같이 시스템이 변 하는 시점인 500번째 샘플에서 망각 계수 가 매 우 작아지는 것을 확인할 수 있고 또 시스템 변화가 적어지는 시점에서는 다시 값이 커지는 것을 확인할 수 있다. Figs. 2와 3을 통해서 변화 시점인 500번째 샘 플을 기준으로 긴 윈도우에서 짧은 길이 윈도우로 바뀌고, 그 후에 Fig. 1의 윈도우 선택 논리에 의해서 다시 긴 윈도우로 바뀌었다는 것을 알 수 있다. 4.2 점진적인 시스템 변화가 있는 시스템의 추정 본 비교 실험에서는 시스템의 임펄스 응답이 3.1 절에 사용한 w 1 에서 w 2 로 300 스텝에서 시작하여 500 스텝까지 각 파라미터가 시간에 선형으로 점진적으 로 변하는 시변 시스템 환경을 만들고, 3.1절과 같이 긴 길이와 짧은 길이를 각각 사용하는 단일 윈도우 IWF와 제안한 알고리즘의 시스템 추정 성능을 서로 비교하였다. 나머지는 3.1절의 실험 조건과 같다. Fig. 4에는 점진적으로 변하는 시스템 환경에서 각 (a) SNR: 20 dB (b) SNR: 10 dB Fig. 3. Forgetting factor variation comparison results in the abruptly changed system case. (a) SNR: 20 dB (b) SNR: 10 dB Fig. 4. (Color available online) MSD comparison results in the gradually changed system case (red and -o-: the proposed algorithm, black and -x-: long single window IWF, black and -△-: short single window IWF).시변 시스템 추정 성능 향상을 위한 이중 슬라이딩 윈도우 Iterative Wiener Filter The Journal of the Acoustical Society of Korea Vol.44, No.5 (2025) 469 알고리즘이 추정한 시스템의 MSD를 도시한 것이 다. Fig. 4에 청색 수직선은 시스템 변화가 시작되고 끝나는 구간을 표시한다. Fig. 4(a)은 신호 대 잡음 비 20 dB일 때 3가지 알고 리즘의 시스템 추정 정확도를 비교한 결과이다. 결 과를 보면 시스템이 시스템이 선형적으로 변동하는 구간에서, 긴 길이 단일 윈도우를 쓰는 IWF는 변화 에 매우 느리게 적응하고 있다. 짧은 길이 단일 윈도 우를 쓰는 IWF는 시스템이 변하는 구간에서 조금 변 했다가 원상 복귀한 것을 관찰할 수 있다. 이는 윈도 우 길이가 짧아서 변화에 빨리 적응하였음을 의미 한다. 그러나 변화가 완료된 후 MSD는 셋 중 제일 나 빴다. DLSW-IWF는 시스템 변화가 시작되면 MSD가 나빠지지만, 그 수준이 두 단일 윈도우 IWF의 중간 정도를 유지하고 변화가 끝나면 가장 빠르게 MSD 가 개선되어 그 수준이 변화가 일어나기 이전의 수 준으로 회복됨을 확인할 수 있다. 그림4(b)은 신호 대 잡음 비가 10 dB일 때 3가지 알고리즘의 시스템 추정 정확도를 비교한 결과이다. 이 경우도 신호 대 잡음 비 20 dB일 때 3가지 알고리즘의 시스템 추정 양상과 유사한 결과가 나왔다. Fig. 5에는 신호 대 잡음비 20 dB과 신호 대 잡음비 10 dB에서 DLSW-IWF의 윈도우 선택을 위한 망각 계 수 의 추이를 도시하고 있다. Fig. 5를 보면 앞에 서 언급한 것같이 시스템이 변하는 시점인 300 샘플 에서 망각 계수 값이 작아지기 시작해서 시스템이 변화가 끝나는 시점인 500 샘플에서 망각 계수 값이 다시 커지는 것을 확인할 수 있다. 그리고 신호대 잡 음비가 상대적으로 낮은 10 dB에서는 망각 계수 변 화 민감도가 저하되는 것도 함께 확인할 수 있다. V. 결 론 본 논문에서는 RLS와 유사한 수렴 성능을 나타내 지만, 역행렬을 쓰지 않아서 수치적으로 안정성을 보이는 적응 알고리즘인 IWF 알고리즘에 적용 가능 한 이중 윈도우 알고리즘을 제안하였다. 이중 윈도 우를 IWF에 적용함으로써 시스템 변화에 따라서 추 정에 사용할 데이터 길이를 조절하게 되어서, 정적 시스템 추정뿐만 아니라, 시변 시스템 추정에도 추 정 성능을 보장하게 되어, 다양한 경우에 IWF 알고 리즘을 적용할 수 있게 되었다. 향후 연구에서는 시변 환경에서 더 향상된 추정 결과를 얻기 위해서 본 논문과 같이 긴 윈도우와 짧 은 윈도우, 두 개 윈도우만으로 충분한지 또는 다른 길이의 윈도우가 추가로 요구되는지 등의 후속 연 구가 필요하다. References 1.S. Haykin, Adaptive Filter Theory, 4th ed. (Prentice Hall, Upper Saddle River, NJ, 2002), pp. 35-93. 2.C. V. Sinn and J. Gotze, “Comparative stuy of tech- niques to compute FIR filter weights in adaptive channel equalization,” Proc. IEEE ICASSP, 217-220 (2003). (a) SNR: 20 dB (b) SNR: 10 dB Fig. 5. Forgetting factor variation comparison results in the gradually changed system case.임준석 한국음향학회지 제 44 권 제 5 호 (2025) 470 3.X. Guan, X. Chen, and G. Wu, “QX-LMS adaptive FIR filters for system identification,” Proc. 2 nd CISP, 1-5 (2009). 4.B. Allen and M. Ghavami, Adaptive Array Systems: Fundamentals and Applications (John Wiley & Sons Ltd., West Sussex, England, 2005), pp.1-30. 5.C. R. South, C. E. Hoppitt, and A. V. Lewis, “Adaptive filters to improve loudspeaker telephone,” Electron. Lett. 15, 673-674 (1979). 6.S. Haykin, A. H. Sayed, J. R. Zeidler, P. Yee, and P. C. Wei, “Adaptive tracking of linear time-variant systems by extended RLS algorithms,” IEEE Trans. Signal Process. 45, 1118-1128 (1997). 7.B. Xi and Y. Liu, “Iterative wiener filter,” Electron. Lett. 49, 343-344 (2013). 8.M. S. Ahmad, O. Kukrer, and A. Hocanin, “Recursive inverse adaptive filtering algorithm,” Digit. Signal Process. 21, 491-496 (2011). 9.M. S. Salman, O. Kukrer, and A. Hocanin, “Recursive inverse adaptive algorithm: a second-order version, a fast implementation technique, and further results,” Signal Image Viedo Process. 9, 665-673 (2015). 10.D. Park, B. Jun, and J. Kim, “Fast tracking RLS Algorithm using novel variable forgetting factor with unity zone,” Electron. Lett. 27, 2150-2151 (1991). 11.C. Paleologu, J. Benesty, and S. Ciochina, “A robust variable forgetting factor recursive least-squares algorithm for system identification,” IEEE Signal Process. Lett. 15, 597-600 (2008). 12.K. Li, J. Xiao, J. Xie, and R. Wu, “A novel adaptive variable forgetting factor RLS algorithm,” Proc. ICINC, 228-232 (2022). 13.J. Lim, S. Lee, and H. Pang, “Low complexity adaptive forgetting factor for online sequential extreme learning machine (OS-ELM) for application to nonstationary system estimations,” Neural Comput. 22, 569-576 (2013). 14.J. Lim, “A dual sliding window recursive least squares algorithm to improve estimation performance in time-varying system,” J. KIIT, 23, 153-158 (2025). 15.K. Nishiyama, “A new formalism of the sliding window recursive least squares algorithm and Its fast version,” IEICE Trans. Fundamentals, E94-A, 1394- 1400 (2011). 저자 약력 ▸임 준 석 (Jun‑Seok Lim) 1986년 : 서울대학교 전자공학과 학사 졸업 1988년 : 서울대학교 전자공학과 석사 졸업 1996년 : 서울대학교 전자공학과 박사 졸업 1996년 7월 ~ 1997년 10월 : LG종합기술원 1998년 ~ 현재 : 세종대학교 AI융합전자공 학과 교수한국음향학회지 제44권 제5호 pp. 471~481 (2025) The Journal of the Acoustical Society of Korea Vol.44, No.5 (2025) https://doi.org/10.7776/ASK.2025.44.5.471 pISSN : 1225-4428 eISSN : 2287-3775 †Corresponding author: Ji-won Jung (jwjung@kmou.ac.kr) Department of Radio Communication Engineering, Korea Maritime and Ocean University, 727 Taejong-ro, Yeongdo-Gu, Busan 49112, Republic of Korea (Tel: 82-51-410-4424, Fax: 82-51-404-3986) Copyrightⓒ 2025 The Acoustical Society of Korea. This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited. An optimal adaptive coding and modulation mode selection method based on machine learning for underwater acoustic communication 수중 음향 통신을 위한 머신러닝 기반의 최적의 적응형 부호 및 변조 모드 선택 방식 Hyun-Woo Jeong, 1 Ji-Won Jung, 1 † Jun-ho Kim, 2 and Byoung-sun Ahn 2 (정현우, 1 정지원, 1† 김준호, 2 안병선 2 ) 1 Korea Maritime and Ocean University 2 LIG NEX1 (Received July 24, 2025; revised September 1, 2025; accepted September 23, 2025) ABSTRACT: This paper proposes a Machine Learning (ML) based Adaptive Coding and Modulation (ACM) scheme that dynamically selects the optimal transmission mode in Underwater Acoustic Communication (UAC) environments with highly time-varying characteristics and high propagation loss. The proposed method uses four types of Channel Quality Indicators (CQI) as input features, including Input Signal-to-Noise Ratio (ISNR), Received Signal-to-Noise Ratio (RSNR), Pilot Bit Error Rate (P-BER), and Channel Impulse Response (CIR), to predict the optimal ACM mode while maintaining both communication success probability and transmission efficiency. To improve the reliability of the classifier, only received data set that meet a specific estimated coded bit error rate (EC-BER) threshold are used for training. A random forest classifier is employed to implement the ACM system, achieving an accuracy of approximately 98.7 % in simulations. Compared to conventional fixed transmission schemes, the proposed method which adaptivel y selects the optimal mode achieves up to twice the transmission rate under various channel conditions. Keywords: Machine Learning (ML), Adaptive Coding and Modulation (ACM), Underwater Acoustic Communication (UAC), Channel Quality Indicator (CQI), Estimated Coded-Bit Error Rate (EC-BER) PACS numbers: 43.60.Ac, 43.60.Mn, 43.60.Dh 초 록: 본 논문에서는 시변성이 큰 수중 음향 통신 환경에서 채널 부호화율과 변조 방식을 적응적으로 변경하여 최적의 전송 모드를 선택하는 기계 학습 기반의 Adaptive Coding and Modulation(ACM )방식을 제안한다. 제안한 방식은 Input Signal to Noise Ratio(ISNR), Received Signal to Noise Ratio(RSNR), Pilot-Bit Error Rate(P-BER), Channel Impulse Response(CIR) 등 4가지 Channel Quality Indicator(CQI)를 입력으로 사용하여, 통신 성공 가능성 과 전송률을 동시에 고려한 최적의 ACM 모드를 분류기로 예측한다. 특히, Estimated Coded Bit Error Rate (EC-BER) 를 기준으로 복호 가능성이 확보된 데이터만을 선별하여 학습 데이터로 활용함으로써, 분류기의 성능과 신뢰성을 높였 다. 제안한 방식은 랜덤 포레스트 분류기를 기반으로 구현되었으며, 실험 결과 약 98.7%의 높은 정확도를 보였다. 또한 기존의 고정 전송 방식과 비교하여 제안한 방식은 다양한 채널 조건에서 항상 최적의 모드를 선택하며, 최대 2배 이상의 전송률 향상을 달성하였다. 핵심용어: 기계 학습, 적응형 부호 및 변조, 수중 음향 통신, 채널 품질 지시자, 부호화 비트 추정 오류율 471Hyun-woo Jeong, Ji-won Jung, Jun-ho Kim, and Byoung-sun Ahn 한국음향학회지 제 44 권 제 5 호 (2025) 472 I. Introduction Traditional Underwater Acoustic Communication (UAC) systems are generally use a fixed set of a single modulation and coding scheme. However, since UAC environments exhibit rapidly changing channel charac- teristics due to factors such as multipath delay spread and Doppler shift, it is challenging to cope with a large variety underwater channel only using fixed scheme. To the end, the Adaptive Coding and Modulation (ACM) schemes which adaptively switching among different modulation and coding scheme according to current channel conditions are essential to achieve high transmission efficiency. [1] However, setting selection criteria for ACM modes, defined by combinations of coding rate and modulation order, is particularly challenging in such environments. This paper analyzes four transmission modes with different data rates and modulation formats. To address the challenge of mode selection under time-varying channel conditions, we propose a Machine Learning (ML) based classifier that predicts the optimal ACM mode by learning from CQI. [2,3] Conventional ACM selection methods rely on static thresholds of Received Signal-to-Noise Ratio (RSNR) or predefined LUT (Look Up Tables). [4] These approaches are unable to adapt to the time-varying nature of underwater acoustic channels. Recently, various ML based ACM prediction methods have been applied to dynamic channel environments. Recent studies have introduced a variety of ML based ACM mode selection methods, including reinforcement learning using CQI and Hybrid Automatic Repeat reQuest (HARQ) feedback via Deep Q-Networks (DQN), [5] Deep Neural Network (DNN) regression models based on Signal-to-Interference-plus-Noise Ratio (SINR) and dis- tance, [6] and random forest classifiers trained on real-world channel measurements. [7] These approaches outperform static table based methods in terms of adaptability and responsiveness to dynamic environments. However, existing methods still have notable limitations. First, many rely solely on prediction accuracy as the evaluation metric, without accounting for actual communication success or effective throughput. Second, regression based approaches that apply thresholds after prediction often misclassify samples near decision boundaries, potentially leading to communication failure. To overcome these limitations, this paper proposes a ML based ACM mode selection strategy that jointly considers both reliability and trans- mission efficiency. In this paper, we assume that channel variation between the CQI measurement and the data transmission within a frame is negligible. We applied Estimated Coded Bit Error Rate (EC-BER) [8] for decoding reliability. By training only with samples that meet EC-BER thresholds, the classifier’s performance is improved. The classifier is trained using four CQI including Input SNR (ISNR), RSNR, Pilot-Bit Error Rate (P-BER), and Channel Im- pulse Response (CIR), each representing a distinct aspect of underwater channel quality. We analyze the effect of EC-BER threshold filtering and demonstrate that this method improves the classification accuracy. II. System model The proposed system is designed to select the optimal ACM mode in real time based on CQI in a UAC environment. It consists of two primary components: a transmitter-receiver architecture and a ML based ACM classifier. Fig. 1 shows the overall block diagram of ML based ACM system. It consists of two primary components: a transmitter–receiver architecture and ACM classifier. The proposed system is designed to select the optimal ACM mode in real time based on CQI in a UAC environment. At the transmitter, a bitstream of length is encoded using a turbo encoder, generating a coded bit sequence . A pilot sequence of length is in- serted, resulting in a total of bits. These bits are modulated to form the transmitted signal , where is the number of An optimal adaptive coding and modulation mode selection method based on machine learning for underwater acoustic communication The Journal of the Acoustical Society of Korea Vol.44, No.5 (2025) 473 modulation symbols. The received signal at the receiver is expressed in Eq. (1) as: ∙ ,(1) Where: : Number of multipath components, : Channel coefficient for the l-th path, : Additive white Gaussian noise (AWGN). To enable ACM mode selection, the packet is structured in two formats, as shown in Fig. 2. Fig. 2(a) shows the initial pre-transmission packet, which contains a Linear Frequency Modulated (LFM) signal and a pilot signal. [9] This packet is used solely for channel estimation, without transmitting any data. Fig. 2(b) shows the ACM data packet, which consists of an LFM preamble, a mode index, 200 pilot symbols, and 600 data symbols. The mode index serves as a unique identifier of the ACM mode selected at the transmitter, enabling the receiver to perform demo- dulation and decoding according to the selected mode. With a sampling frequency of 192 kHz and 96 samples per symbol( ), the symbol rate is 2 ksps. The LFM signal serves for synchronization and indicates the modulation type: up-chirp represents to QPSK(Quadrature Phase Shift Keying) and down-chirp represents to BPSK(Binary PSK). Based on this structure, the receiver estimates CIR, RSNR, and P-BER from the pilot. The transmitter then selects the appropriate ACM mode and transmits the data accordingly. Table 1 shows the four ACM mode configurations. Each mode varies in input data size, modulation, and coding rate. We consider QPSK and BPSK modulation and turbo codes with coding rates of 1/2 and 1/3. Without loss of generality in analyzing performance, all modes have same length of pilot and modulated data symbols. The proposed ML-based ACM classifier is located at the transmitter, as shown in Fig. 1, Table 1. ACM mode configurations. Mode Input bits Pilot bits Modu lation Coding rate Data symbol Pilot symbol Relative TR 1600400QPSK1/26002001.000 2400400QPSK1/36002000.667 3300200BPSK1/26002000.500 4200200BPSK1/36002000.333 Fig. 1. (Color available online) ML based ACM communication system. (a) Initial packet(b) ACM packet Fig. 2. (Color available online) Packet structure for ACM. Hyun-woo Jeong, Ji-won Jung, Jun-ho Kim, and Byoung-sun Ahn 한국음향학회지 제 44 권 제 5 호 (2025) 474 since the transmitter must determine the coding and modulation schemes before data transmission. The receiver estimates the CQI from the pilot symbols, and then feeds them back to the transmitter. Based on feedback information, ML- based ACM classifier determine which mode is optimal in current underwater environments. ML-based ACM classifier is carried out using a random forest classifier. This ensemble learning method constructs multiple decision trees using a bootstrap aggregation strategy. [10] The selection of the optimal transmission mode is carried out using a random forest classifier. It is characterized by fast training and strong resistance to overfitting, which makes it particularly suitable for the proposed method. This is because the classification task in proposed system involves input features (ISNR, RSNR, P-BER, CIR) with non-linear relationships to the optimal ACM mode. Random forest can effectively handle such diverse features without requiring feature normalization, and its ensemble structure ensures stable performance even with a limited training dataset. Moreover, the feature importance analysis provided by random forest allows intuitive interpretation of which CQI metrics most influence the ACM decision. III. Proposed ACM mode classifier 3.1 Input parameters for classifier training Due to the highly time-varying and complex nature of underwater channels, an adaptive mechanism for selecting suitable ACM modes becomes indispensable. Therefore, this study proposes a ML based classifier that selects the optimal ACM mode using the following four key input parameters: - ISNR (Input Signal-to-Noise Ratio) - RSNR (Received SNR) - P-BER (Pilot Bit Error Rate) - CIR (Channel Impulse Response) ISNR is defined as the baseline symbol energy–to–noise density ratio ( ). We normalize the symbol energy to and use samples per symbol. AWGN is then added after the multipath filtering with its per–sample variance calibrated so that the average SNR per symbol equals the target ISNR. It is defined in Eq. (2) as: × ,(2) Where, denotes the variance of the zero-mean Gaussian noise samples added to each received sample. RSNR is estimated using known pilot signal exchanged between the transmitter and receiver. It is defined in Eq. (3) as: ,(3) Where, denotes the received pilot signal, the segment of in Eq. (1) corresponding to the pilot symbols, and denotes the corresponding ideal transmitted pilot signal. is the average power of the transmitted pilot symbols, while represents the mean squared error between the received and the ideal pilot signals. Prior to computing RSNR, we estimate a pilot-based complex gain and normalize the received pilot to the reference . A higher RSNR indicates that the received pilot more closely matches the ideal pilot, reflecting more accurate channel estimation and thus improved decoding per- formance. [11] P-BER is calculated from the demodulated pilot signal and serves as an indirect indicator of synchronization accuracy and channel estimation quality. [12] Because pilot signal are transmitted without coding and undergo the same channel impairments as the data payload, P-BER is highly correlated with the data error rate. According to References [13, 14], when employing a turbo code with a 1/2 coding rate, reliable decoding is generally achievable when P-BER is below 10 %. Conversely, a P-BER An optimal adaptive coding and modulation mode selection method based on machine learning for underwater acoustic communication The Journal of the Acoustical Society of Korea Vol.44, No.5 (2025) 475 exceeding this threshold leads to a significant degradation in decoding performance and a higher likelihood of data errors. CIR characterizes the time-domain response of the underwater channel and includes important attributes such as the number of multipath components, path delays, and attenuation. [15] To illustrate the scenario considered in this paper, we use three example CIRs (Fig. 3) with a transmitter–receiver separation of 1 km. -CIR 1: Ideal single-path scenario with no multipath. -CIR 2: Moderate multipath scenario with two paths (delay = 5 ms, attenuation = 0.8). -CIR 3: Severe multipath scenario with three paths (delay = 5 ms, 10 ms; attenuation = 0.8, 0.6). These four parameters are all measurable in real time, and these effectively reflect the current channel condition and possiblity of successful communication. Therefore, they are used as input features to train the ACM classifier. In the simulation, four ACM modes (Mode 1 ~ 4) were evaluated under three multipath channel scenarios(CIR 1 ~ 3) across an input SNR range from –25 dB to 20 dB with 0.5 dB increments. For each channel condition, 10,000 independent packet transmissions were simulated, resulting in a dataset of approximately 10.9 million labeled samples. Among them, 70 % were used for training, 15 % for validation, and 15 % for testing. Each sample consisted of four CQI(ISNR, RSNR, P-BER, CIR) as input features and the optimal ACM mode as the label determined by the performance score criterion. 3.2 Learning based ACM mode selection Conventional ACM selection methods typically rely on fixed RSNR thresholds or predefined lookup tables. A LUT (Look Up Table)-based ACM method is simple and practical when only a few CQI with fixed thresholds are used, but it faces structural limitations as CQI (e.g., Doppler, multipath) increase tables and decision boun- daries remain discontinuous. We propose a method that learns from LUT-derived labels on the same dataset under identical EC-BER filtering, reproducing LUT perfor- mance while providing continuous decision boundaries and natural extensibility to higher-dimensional CQI. The proposed method assumes negligible channel variation between CQI estimation and data transmission. Fig. 4 shows the label generation and classifier training process for ACM mode selection. The overall process includes the following five steps: Step 1: Data Collection: A simulation based dataset is built, containing various SNR levels and combinations of the three CIRs for each ACM mode. For each transmission, CQIs such as ISNR, RSNR, CIR, P-BER, and EC-BER are collected. EC-BER evaluates the accuracy of the decoding process. Step 2: The EC-BER is used to evaluate the reliability of received data by comparing the re-encoded bits with the hard-decision output from the demodulator. Fig. 3. (Color available online) Channel impulse responses scenarios. Fig. 4. Label generation and classifier training process for ACM mode selection.Next >