이미지·영상의 내용과 의미를 이해하는 시각지능SW
시각지능은 사람이 눈으로 사물을 인지하고 시공간적 상황을 파악할 수 있는 능력을 의미한다. 이는 학습 (경험)에 의해 사물의 특징과 내용을 이해하는 직관적 사물 인식 능력과 낯선 장면이나 감춰진 사물을 인식 하기 위해 주변 상황을 유추하는 심층적 사고에 의한 인지능력으로 구분된다.
딥뷰는 이러한 시각지능 능력을 갖춘 시각지능 분석 플랫폼을 개발하기 위한 주요기술로 객체의 학습 및인식, 직관적 사물의 인식, 심층적 상황인식을 꼽는다.
객체의 학습 및 인식 기술은 한 종류의 객체를 인식하기 위해서는 훈련(학습)의 과정을 거쳐야 한다. 사람과 비슷한 수준으로 사물을 인식하기 위해서는 2만 가지 이상의 사물을 구분할 수 있도록 하는 학습이 필요하다.
직관적 사물의 인식 기술은 객체의 학습을 통해 인식기(recognizer)는 사물을 즉시적으로 판단할 수 있다. 직관적 사물의 인식은 이러한 인식을 바탕으로 동작이나 장면을 이해하는 기술이다.
심층적 상황 인식 기술은 객체의 일부가 가려지거나 처음 접하는 객체인 경우 직관적 객체 인식이 어렵다. 이때 주변 상황이나 외부 데이터와 연계하여 추론하는 심층적 상황 인식이 필요하다. 또한 심층적 상황 인식 기술을 통해 다양한 객체들이 만들어내는 상황을 이해할 수 있다.
딥뷰의 연구개발 목표 및 기술
딥뷰는 1단계에 핵심기술 개발로 다중객체·행동을 동시에 분석하는 시각지능SW를 개발한다.
2단계는 응용기술 개발로 영상 내용을 이해하는 기술을 통해 도시 규모의 영상을 이해하는 시각지능SW 개발을 목표로 한다. 3단계는 글로벌기술 개발로 복합상황 이해 및 예측 기술을 갖춘 시각지능SW를 개발하여 글로벌 시장에 진출하는 것을 목표로 한다.
딥뷰 과제는 각 단계를 수행하기 위한 시각지능 기술은 1계층인 시각-이해 지능 기술과 2계층인 시각-분석 지능 기술로 구분된다.
사람의 눈을 대신하는 서비스 제공
세계 최대의 동영상 사이트 유튜브(YouTube)에는 1분마다 300시간 분량의 새로운 동영상이 추가로 업로드 된다. IMS Research에 따르면 2017년 전 세계에 설치되어 있는 비디오감시카메라(video surveillance camera)는 약 1억개로 추산된다. 딥뷰 과제는 이처럼 스마트기기, CCTV, 드론카메라 등에서 생성되는 수많은 이미지·영상 데이터 분석을 통해 도심에서 발생할 수 있는 위험으로부터‘ 국민을 보호 하는 눈’을 실현하고자 한다.
또한 딥뷰를 통해 개발된 시각지능 원천기술은 산업체의 품질검사, 의료영상 분석, 자율주행 자동차, 지능형 로봇 등 다양한 산업 분야에 적용되어 사람의 눈을 대신할 수 있다.
딥뷰 진행사항
현재1단계로 시각지능 핵심기술 개발중이다. 이미지/동영상의 내용을 읽고 이해하는 시각지능 핵심 기술 개발이다.
2단계는 시각지능 응용기술 개발이다. 시각 데이터 기반 의미론적 분석, 상황 추론 응용 기술 개발이다. 도시 규모 영상 데이터를 대규모로 분석하는 심층 분석 플랫폼 개발과 공공분야 현안 문제들을 해결하는 기술 개발, 오픈 API를 통한 국내외 산업 생태계 조성 및 기술사업화가 지원된다.
3단계는 글로벌시장 진출 기술 개발로 도심 위험을 조기 감지할 수 있는 시공간 복합상황 예측 기술 개발이다.
글로벌 수준의 시공간 복합상황 예측 기술 개발 및 예측형 통합관제 시스템을 구축해 진행할 예정이다. 특히, 이동형 물체(드론, 항공기 등)의 영상 데이터와 연동한 관심객체 분석 기술 개발 진행중이다.
자료: AI사업단, 지능정보산업협회
한승균 기자/ 전자공학 박사
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>