-
도로표지판 인지 dataset 구축을 위한 AI Hub 활용법 [자동운전 프로젝트] 객체 인식 (1) - 신호등카테고리 없음 2021. 12. 4. 17:36
#AIHUB #인공지능 #오브젝트인식 #신호등인식 #도로표지판인식
[0] 출처 : https://aihub.or.kr/aidata 데이터 셋명 신호기 도로표지판 인지영상(수도권외) 데이터 분야 자율주행 데이터 유형 비디오 구축기관 ㈜라이드플럭스 구축기관 연락처 담당자명 박준희 구축연도 2020년 전화번호 064-749-8039 구축 데이터량 95만 전자우편 contact@rideflux.com 버전 1.0 최종 수정일 등 소개 ㈜라이드플럭스 구축기관 연락처 담당자명 박준희 구축연도 2020년 전화번호 064-749-8039 구축데이터량 aihub.or.kr aihub.or.kr 고속도 인지 영상물량 95만 전자우편물 contact@rideflux.com contact@rideflux.com contact@rideflux.com 버전1.05만 개체 및 최종 수정일 2021.06.18
[1] 개요 : 자율주행 프로젝트에서 카메라를 이용한 주변 환경 인지 중 신호기의 classification, 도로표지판의 classification 문제를 풀기 위해 data driven approach를 적용해야 한다.
따라서 dataset의 확보가 1순위로 중요한 부분인데 국가가 이 dataset을 활용할 수 있도록 수집하여 제공해 주는 사업 덕분에 해당 dataset(신호, 도로표지 등)을 사용할 수 있게 되었다. 이 활용법 부분을 이 포스팅에서 기술하겠다.
덧붙여, 한층 더 AIHUB에서 제공하는 네트워크의 부분도 간략화해 소개하는 느낌으로 간다(자동운전 관련 dataset 뿐만이 아니라, 타분야의 dataset도 획득할 수 있다.)
[2] AIHUB: (1) 개요: 인공지능의 발전은 ImageNet과 같은 거대한 데이터셋 구축을 trigger에서 시작되었기 때문에 국내에서도 독자적인 대규모 dataset 수집을 통해 국내 인공지능의 발전을 이룩하는 것을 목적으로 사업이 시작되었다.
traffic light, traffic sign 각각 80,000장 이상이다.(사전에 프로젝트를 진행하기 위해 수집한 traffic light data는 10,000장이며, traffic sign은 없었다.)
(2) 학습용 데이터 소개
출처 : https://www.youtube.c omwatch?v=SzphN5-6ml Aimage에 boundingbox형태로 문제를 풀고자 하는 객체의 정보가 json 파일로 들어있다. 이를 활용하면 우리의 용도에 맞게 데이터를 가공 할 수 있다. 파이썬의 파일 시스템을 활용해서 우리가 사용하는 Yolov4 annotation 정보에 맞게 추출할 수 있을 것 같다. #1
혹은 사전에 우리가 훈련한 모델로서 대량의 dataset에 대해 unsupervised learning인 pseudolabeling을 추진하고, annotation에 대한 비용도 절감할 수 있다. #2
#1, #2를 활용하는 게 나을 것 같아 (update 예정)
(3) generative model을 이용하여 도로 환경의 낮 배경을 밤으로 바꾸는 모델을 활용하여 데이터를 증강하는 모델
거창하게 제목을 붙였지만 사실 별거 없이 GAN 모델을 이용해 낮을 밤으로, 혹은 맑은 날을 비오는 날로 바꾸는 모델을 활용하는 방법이 홈페이지에서 제공되고 있다. 활용할지에 대해서는 미정이다. 비오는 날, 눈오는 날처럼 구하기 힘든 dataset을 증강시키고 싶을 때 해당 모델을 사용하면 된다. 만약 우리의 플랫폼에 적용할 필요가 있다고 판단되면 그 내용을 포스팅할 것이다.
https://www.youtube.com/watch?v=SzphN5-6mlA
위 영상에는 처음에 dataset에 대한 개요와 이를 활용하는 부분에 대해 기술하는 흐름이 포함되어 있는데 [2] 작성한 내용을 확인한다면 그 뒤는 보지 않아도 될 것이다.
(3) dataset 사용방법 : 계정을 만들고 홈페이지에 들어가 다운로드 링크를 클릭한 후 신청하면 된다. 주말인데도 2시간 만에 승인돼 깜짝 놀랐다. 다음 포스팅에서는 해당 dataset을 이용해 yolov4 모델에서 사용할 수 있도록 가공하는 과정을 다루도록 한다.