[분석]인공지능 활용 연구③: 사람의 행위나 동작을 흉내 내는 강화학습

추형석 소프트웨어정책연구소 선임연구원

2017-12-14 07:10:00

사람의 행위나 동작을 흉내 내는 강화학습

구글 딥마인드는 2017년 7월 사람의 행동을 흉내 내는 인공지능 개발 결과를 공개했다.

이 기술에는 알파고의 자체대국을 구현했던 기술로도 각광받은 강화학습이 활용됐다. 강화학습은 수많은 시행 착오를 통해 최적의 전략을 도출하는 인공지능 기술로, 목표가 분명한 게임 인공지능에 주로 활용된다.

그러나 사람의 행위는 목표가 불분명하다. 예를 들어 몸의 균형을 잡는 움직임은 게임처럼 승패로 논의하기 어렵다. 움직임은 적절하거나 올바른 행위는 있을 수 있으나 반드시 맞고 틀리다의 개념이 아니기 때문이다. 딥마인드 연구진은 강화학습의 보상함수를 개선하여 동작을 흉내 내는 인공지능을 개발하는데 성공했다.
보행 능력을 학습하는 인공지능, 자료 : DeepMind, Producing flexible behaviours in simulated environments, 2017년
보행 능력을 학습하는 인공지능, 자료 : DeepMind, Producing flexible behaviours in simulated environments, 2017년


사람 또는 물체의 움직임을 묘사하는 것은 다양한 활용 잠재성을 내포한다. 사람과 같은 보행능력을 구현함으로써 컴퓨터 애니메이션이나 게임에서 더욱 자연스러운 움직임을 표현할 수있고, 멸종한 동물의 구조적 특징을 바탕으로 움직임을 묘사할 수도 있을 것이다. 동작을 흉내 내는 인공지능은 나아가 생물역학(Biomechanics)에 새로운 가능성을 제시한다.

생물역학은 생물의 구조와 운동 역학을 분석해 그 결과를 응용하는 분야인데, 이번 연구결과로 인간이 보행능력을 어떻게 습득하는지에 대한 단서를 발견하게 되었다. 이를 통해 사람처럼 움직이는 로봇인 휴머노이드(Humanoid)분야에 적용함으로써 스스로 학습하여 장애물을 피하는 재난 구조 로봇 등으로 충분히 활용될 수 있을 것이다.

앞으로의 인공지능 R&D 방향

인공지능 R&D는 발전 속도가 매우 빠르기 때문에 그 미래를 예측하거나 전망하기 어려운 것이 현실이다. 그러나 지금과 같은 속도라면 스스로 학습하는 인공지능의 출현이 먼 미래는 아닐 것이다. 지난 2017년 10월, 구글 딥마인드는 알파고 제로를 공개하며 인공지능 분야에 새로운 패러다임을 제시했다.

알파고 제로는 바둑기보 데이터 없이 스스로 학습한다는 점에서 데이터가 많이 필요한 현대 인공지능의 한계를 뒤엎었기 때문이다.

미국의 방위고등연구계획국(DARPA)은 심층신경망의 인과관계를 설명하기 위한 연구(Explainable AI, XAI)를 시작했다. 설명 가능한 인공지능 연구는 우리가 미래의 인공지능과 공존하기 위해 필수적으로 선행돼야 하는 분야이다. 인공지능 오작동에 대한 원인 규명이 불분명하다면 인공지능과 함께할 수 있는 사회적 합의를 도출할 수 없을 것이기 때문이다

참고자료: AI사업단 X 지능정보산업협회 Journal Vol.2 Artificial Intelligence Companion Project

관련기사
[분석]인공지능 활용 연구①: 적대적 생성신경망(GAN)
[분석]인공지능 활용 연구②: 미분가능한 신경 컴퓨터(DNC)

추형석 소프트웨어정책연구소 선임연구원
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>