□ 대중교통의 이용 수요와 편의성에 대한 사회적 관심이 증가하고 있음. □ 울산광역시를 포함한 지역에서 교통 정책을 시행하고 있지만 고정적인 배차 방식으로 인해 대기시간 증가와 노선 비효율 문제가 발생하고 있음. □ 기존 방식의 한계를 개선할 수 있는 데이터 기반, 상황 적응형 배차 시스템의 필요성이 대두됨.
목표 및 내용
□ 강화학습 기반의 효율적인 버스 배차 시스템을 설계하고 구현함. □ Q-Learning 알고리즘을 활용해 시간대, 승객 수, 남은 배차 횟수 등 복합적인 요소를 반영한 정책을 학습함. □ 환경은 양자화된 상태 값으로 구성되며 예시로 시간대를 4개(출근, 낮, 퇴근, 야간)로 나누고 대기 승객 수를 단계별로 분류함. □ 슬롯 기반 배차 구조를 도입하여 잔여 배차 횟수를 상태값에 포함시킴. □ 가변적인 교통 수요에 적응하기 위해 환경 파라미터를 조정하며 정책 학습을 고도화함.
수행결과
□ 정책 학습 결과 기존 고정 배차 방식 대비 성능이 우수함을 확인함. □ 데이터 밀도가 증가할수록 시스템의 개선률이 더욱 높아지는 경향이 나타남. □ 기업 자문을 통해 환경 적응력 강화를 위한 가변 계수 설계를 도입하고 파라미터 튜닝을 수행함.