일본 오끼나와과학기술연구소 인지신경로보트팀은 새로운 구조를 가진 구신(具身)지능모델을 개발했다. 이 구신지능모델은 과학자들이 신경망의 각종 내부 상태에 접근할 수 있도록 허용하고 아동과 비슷한 방식으로 학습을 일반화할 수 있었는바 과학자들은 이를 통해 신경망에서의 인지 발전과 정보처리의 관건적인 정보를 밝혀냈다. 이 연구 성과는 최근 《과학·로보트학》저널에 발표됐다.
인공지능(AI)에 가장 중요한 대형언어모델(LLM)은 주로 대규모 데이터에 의존하지만 인간처럼 제한된 정보로부터 효과적으로 일반화된 것을 도출할 수는 없다. 그러나 구신지능은 물리적 실체를 바탕으로 감지하고 행동하는 지능 시스템으로서 지능체와 환경의 상호작용을 통해 정보를 얻고 문제를 리해하며 결정을 내리고 행동을 수행할 수 있다.
이번에 일본 오끼나와과학기술연구소 인지신경로보트팀에서 개발한 구신지능모델은 예측코딩 계발을 바탕으로 역귀신경망(RNN) 구조로 변화 분리돼 시각집성, 본체감각, 언어지령 등 3가지 감각기관 입력을 통합해 훈련한다. 구체적으로 말하자면 이 모델은 아래와 같은 입력을 차례로 완성했다. 로보트 팔이 채색 블록을 이동하는 비디오를 보고 인체의 사지 운동의 감각과 로보트 팔이 움직일 때의 관절 각도를 감지한 후 “파란색 물체 우에 빨간색 물체를 올려”와 같은 언어 명령을 내린 것이다.
이 모델은 뇌가 과거의 경험을 바탕으로 감각기관의 입력을 끊임없이 예측하고 예측과 관찰 사이의 차이를 최소화하기 위한 행동에서 령감을 얻었다. 뇌의 작업 기억과 주의력은 제한되여있기 때문에 모든 정보를 한번에 처리하지 않고 입력을 순서대로 처리하고 예측을 업데이트해야 한다.
연구에 따르면 이 모델은 더 적은 훈련과 컴퓨팅 자원만으로 일반화 학습을 실현할 수 있다. 비록 대형 언어모델보다 더 많은 실수를 하지만 이러한 실수는 인간의 실수와 류사하다. 이는 언어와 행동을 결합하는 것이 어린이의 빠른 언어 학습에 중요한 요소가 될 수 있다는 것을 의미한다. 이런 구신지능은 투명도를 높였을 뿐만 아니라 AI의 행위 효과도 더욱 잘 료해할 수 있어 앞으로 더욱 안전하고 도덕 기준에 부합되는 AI의 발전을 위해 방향을 가리켜주었다.
이 연구는 인간의 인식을 리해하고 시뮬레이션하는 데 새로운 시각을 제공했으며 다양한 감각기관의 입력을 통합하여 효률적인 일반화 능력을 달성하는 방법을 보여주었는바 앞으로 더욱 지능적이고 령활한 AI 시스템 개발에 도움이 될 뿐만 아니라 인지과학에 귀중한 참고적 가치를 제공하고 있다.
/과기넷