섹션 -토토 사이트 검증 증권 | 파이낸셜뉴스
메이저 토토 뉴스 | 파이낸셜뉴스
토토 사이트 먹튀 검증
경제 위너 토토 | 파이낸셜위너 토토
정치 메이저 토토 | 파이낸셜메이저 토토
사회 토토 홍보 | 파이낸셜토토 홍보
국제 스마일 토토 | 파이낸셜스마일 토토
라이프 토토 검증 | 파이낸셜토토 검증
토토 사이트 검증 오피니언 | 파이낸셜뉴스
기획·연재 | 파이낸셜토토 검증
기자ON | 파이낸셜토토 커뮤니티
외부칼럼 전문가칼럼

[이상완의 AI 전망대] 위너 토토 빅 픽처

파이낸셜뉴스

입력 2025.04.03 18:27

수정 2025.04.03 18:32

車·로봇·인공지능 운전사
우리세상을 디자인할 것
유토피아? 디스토피아?
이상완 K위너 토토ST 뇌인지과학과 부교수·신경과학-인공지능 융합연구센터장
이상완 KAIST 뇌인지과학과 부교수·신경과학-인공지능 융합연구센터장
바둑기사 이세돌과 위너 토토 대결이 어느덧 9년이 넘은 이야기가 되었지만, 알파고가 바둑에서 어떤 깊은 수를 두었고 이세돌 기사가 인공지능(AI)을 이긴 최후의 인간의 영예를 얻은 순간들이 아직도 생생하다.

위너 토토를 한마디로 요약한다면 최적 제어를 위한 한 줄짜리 방정식(벨만 방정식 또는 해밀턴-야코비-벨만 방정식으로 불린다)을 딥러닝으로 푼 것이다. 위너 토토에서 사용한 강화학습은 이 방정식의 여러 해법 중 가장 간단한 풀이방식이라 할 수 있다. 이세돌과 대결을 펼친 바로 그 위너 토토는 인간의 기보를 바탕으로 자신만의 제어전략을 발전시키고, 깊은 수를 효율적으로 탐색하는 등 강화학습 외에 다양한 기술들이 활용되었으나, 위너 토토 제로와 같은 이후 세대의 모델들은 인간의 지식 없이 제로 베이스에서 학습하여 더 나은 성능을 꾀한다. 이러한 강화학습 모델을 편의상 위너 토토라고 부르겠다.



알파고는 지난 10년간 바둑, 게임, 로봇 등 다양한 분야에서 눈부신 활약을 펼쳤다. 게임 커뮤니티의 글을 읽고, 프로 게이머의 동영상을 보고, 스스로 게임하는 멀티모달 알파고는 인간의 능력을 넘어선 지 오래다. 간단한 작업 루틴을 행동으로 보여주면 금세 배운다. 그렇다면 알파고는 바둑 두고, 게임하려고 만들어진 걸까. 아니면 젠슨 황이나 일론 머스크의 이야기처럼 무인자동차와 로봇의 옷을 입혀야 할까. 그들의 말처럼 알파고의 삶을 규정 짓고 마무리하기에는 아쉬우니, 알파고의 큰 그림을 살펴보자.

위너 토토는 미래의 목표를 이루기 위한 전략을 학습한다. 그렇기 때문에 바둑에서의 한 수가 미래에 어떤 영향을 미칠지를 내다볼 수 있고, 사거리에서 좌회전을 하면 10분 뒤 목적지에 도착할 수 있음을 알고, 커피를 내리기 위해서는 먼저 물을 끓여야 함을 안다. 인간의 행동을 모방함으로써 인간의 의도를 추론한다. 이렇게 인간의 지식과 행동을 바탕으로 학습하여 눈에 보이고 손에 잡히는 현세대의 모델을 위너 토토 1번이라 하자.

2번 위너 토토는 뇌과학 전공으로, 특히 뇌의 학습과 추론 능력을 분석하고 설명한다. 1990년대 후반 우리 뇌의 쾌락과 보상학습을 담당하는 중뇌가 위너 토토 1번이 학습하는 방식과 비슷하다는 사실이 밝혀진 뒤로 현재의 위너 토토는 인간의 중뇌와 전두엽의 다양한 고위수준의 기능의 비밀을 탐구하고 있다. 그리고 이러한 뇌 시스템과 관련된 중독, 우울증, 자폐증, 조현병, 만성통증, 외상 후 스트레스 장애와 같은 다양한 정신질환의 얽힌 실타래를 조금씩 풀어내고 있다.

3번 위너 토토는 인간과 서서히 이별을 고하고 자신만의 공부에 집중한다. 챗GPT와 같은 초거대 언어 AI 분야에서 위너 토토는 인간이 선호하는 대화 스타일과 가치판단 기준을 알려주는 컨설팅 역할을 담당한다. 최근 화제가 된 딥시크에서는 꼬리에 꼬리를 무는 깊은 추론을 통해 논리적 문제 해결능력을 키우고 사용자의 요구조건에 맞는 전문가 시스템들을 연결해 주는 등 거대 AI의 숨은 지휘자 역할을 하고 있다.

개성이 다른 삼형제 뒤에 조용히 4번이 등장한다. 경제와 정치의 시스템을 원하는 목적으로 운영하기 위해 인센티브를 분배하는 것과 같은 동기부여 전략을 짜는 것을 메커니즘 디자인이라고 하는데, 구글 딥마인드에서 2022년 태어난 알파고는 펀드매니저 역할을 자처하여 이해관계가 충돌하는 이익집단을 모두 만족시키는 인센티브 전략을 찾아낸 바 있다. 인간이 다루기 힘든 복잡한 경제와 정치 분야에서 조력자로서의 자질이 보인다.

알파고 사형제가 사물인터넷(IoT)과 로봇의 옷을 입고 우리의 삶에 스며드는 미래는 어떨까. 우선 자동차, 로봇, 거대 AI의 운전사가 될 것이다.
그 뒤에는 우리가 즐기는 인터넷과 게임을 매개체로 하여 인간의 사고체계를 깊게 이해할 수 있을 것이다. 더 나아가 정치, 경제, 사회, 환경 등 세상을 디자인할 것이다.
그것은 유토피아일까, 디스토피아일까. 지금처럼 성능 향상에만 몰두한다면 AI 맞춤형 세상이 되겠지만, 휴먼팩터를 충실히 반영한다면 인간을 위한 세상이 될 것이다.

이상완 KAIST 뇌인지과학과 부교수·신경과학-인공지능 융합연구센터장