22.08.23

쏘카, 세계 최고 권위 데이터학회서 차량 오염·파손 탐지 AI기술 소개

모빌리티 혁신 플랫폼 (주)쏘카가 데이터 마이닝·인공지능 분야 최우수학회로 꼽히는 KDD에서 주최하는 워크샵 `DLP-KDD 2022`에서 차량 오염과 파손을 탐지하는 AI 기술을 소개했다.


- DLP-KDD서 고차원 데이터 효율적으로 학습하는 머신러닝 사례 발표

- 카셰어링 서비스 이미지 데이터를 이용한 차량의 파손과 오염 탐지

- “모빌리티 운영 혁신 통해 안전하고 편리한 이동경험 제공”


[2022-08-23] 모빌리티 혁신 플랫폼 (주)쏘카가 데이터 마이닝·인공지능 분야 최우수학회로 꼽히는 KDD에서 주최하는 워크샵 `DLP-KDD 2022`에서 차량 오염과 파손을 탐지하는 AI 기술을 소개했다.

 

쏘카 AI팀(박경호 팀장, 정현희 매니저, 권순우 인턴사원)은 지난 16일 미국 워싱턴 D.C.에서 진행된 DLP-KDD 2022에 참석, 카셰어링 서비스를 통해 수집되는 차량 이미지 데이터를 이용해 차량의 파손과 오염을 방지하는 기술과 실제 이를 서비스에 배포하고 운영한 사례를 발표했다.

 

쏘카 AI팀은 이번 연구인 ‘효율적인 머신러닝 시스템을 향하여: 대규모 카셰어링 플랫폼에서의 작업 정확도 및 엔지니어링 효율성 사이의 상충관계 (Towards Efficient ML System: Unveiling a Trade-off between Task Accuracy and Engineering Efficiency in a Large-scale Car Sharing Platform)’을 통해 일반적으로 사용되는 이미지 인식(Image Recognition)의 비효율성을 개선할 수 있는 효율성 중심의 머신러닝(Efficiency-centric ML) 패러다임을 새롭게 제시했다.

 

대용량의 지도 학습을 기반으로 하는 기존 이미지 인식 모델은 높은 성능을 보장하지만 풀어야하는 문제가 늘어나는 만큼 모델의 개수가 늘어나는 현실적인 문제를 안고 있다. 모델의 개수가 늘어남에 따라 실무자가 관리해야하는 아티팩트가 증가함에 따라 머신러닝 엔지니어링(MLOps)의 부하를 발생시키는 단점 또한 존재한다.

 

쏘카 AI팀은 이를 해결하기 위해 실무 영역에 존재하는 수많은 데이터셋, 모델 분류기, 이상 데이터 탐지, 예측 테이블 등을 단일 머신러닝 파이프라인으로 연결하는 시스템을 개발했다. 이를 적용해 차량의 오염과 파손을 탐지한 결과, 기존 이미지 인식 모델들보다 최소 2%, 최대 7%의 더 높은 정확도를 얻어낼 수 있었다.


 

`DLP-KDD`는 여러 소스를 통해 수집되는 고차원의 데이터를 AI에 효율적으로 학습시키는 딥 러닝 사례에 대해 주로 다루고 있다. 이번 워크샵에는 알리바바, 텐센트, 아마존 알렉사, 메타, 네이버 등 세계적으로 유명한 테크 기업들의 발표도 포함됐다.

 

박경호 쏘카 AI팀장은 “세계적으로 대규모의 플릿을 직접 운영하고 있는 쏘카에서 직접 배포하고 적용한 연구 사례인 만큼 학회에서도 많은 관심을 받았고, 유수의 연구자들과 토론할 수 있는 좋은 기회였다”며 “해당 연구를 기반으로 모빌리티 서비스에 AI를 적극적으로 접목하고 운영 효율화를 이뤄내는 동시에 이용자들에게는 더 편안하고 안전한 이동 경험을 제공할 수 있도록 하겠다”고 말했다.

 

한편, 쏘카는 1만 8천여대의 차량과 800만명의 이용자로부터 얻는 수많은 데이터를 AI, IoT와 같은 기술과 결합해 FMS(Fleet Management System), 차량 유지보수 관리, 차량 파손 탐지, 세차 인증 자동화, 온디맨드 세차, 예약 최적화 등 여러 부분에 새로운 기술을 적용하고 있다.