AI 자본주의 시대, 우리는 누구와 놀 것인가

ChatGPT와 DallE가 만든 이미지

챗GPT, 미드 저니, 스테이블 디퓨전, DallE, 등 최근 몇 년 동안 생성 AI의 바람이 전지구의 사회경제 부문을 강타하고 있다. 컴퓨터 공학자 한스 모라벡이 1970년대에 제기한 모라벡의 역설은 이제야 뜨거운 화두가 되는 모양새다. 인간이 하기 쉬운 것은 컴퓨터가 못하고, 인간에게 어려운 것은 컴퓨터가 잘한다. 떨어진 물건을 줍는 행동은 인간에게 쉽지만 컴퓨터에게는 센서와 로봇암, 구동계, 에너지변환에 이르는 복잡한 연산을 요구한다. 다음 달의 날씨를 알기 위해 인간은 점성술에 의존해야 하는 반면 컴퓨터는 지난 수백 년의 기후 데이터 분석을 통해 이를 쉽게 예측할 수 있다. ‘모라벡의 역설을 자본주의의 입장에서 재구성해보자. 굳이 물리적 작업을 대체하기 위해 값비싸고 비효율적인 로봇을 도입할 필요가 없다. 육체적인 노동 부문은 지금까지 그랬듯이 인간 노동자를 착취하면 된다. 값싼 노동력과 잉여인구는 여전히 지구상에 많기 때문이다. 그런데 사무, 행정, 문화 창조 영역이 생성 AI에 의해 대량생산이 가능해진다면 어떨까? 19세기 산업자본주의의 축적과 자동화 경향을 자본의 유기적 구성으로 정리한 마르크스의 아이디어는 AI시대에 다시 소환되고 있다. 생성 AI는 인간의 인지, 감각, 사유에 연결된 삶을 죽은 노동에 접속시키는 기계이자, ‘인지자동화를 가속하는 유기적 구성의 새 다이나믹이다.

아직까지 우리는 ‘AI 자본주의라고 할만큼의 궤도에 도달하지는 않았다. 따라서 현재는 ‘AI 프론티어라고 할 수 있다. 서부에 도착한 유럽인들이 광활한 자연과 선주민들을 자유자재로 강탈하지만 아직 체계가 잡혀 있지 않아 개척이라는 그럴싸한 표현으로 대충 얼버무리는 그런 시대 말이다. 프론티어 단계에서는 자본도, 노동도 어찌할 바를 모른 채 말을 타고 정처 없이 길을 갈 수밖에 없다. 자본가들에게 이 시대는 너무 쉽다. 기술권력을 거머쥔 채 하고 싶은 모든 실험을 하면서 잉여가치 축적이라는 하나의 법칙을 발견하기만 하면 된다. 그러나 진보좌파의 상상력은 토대뿐만 아니라 상부구조가 어떻게 만들어질 것인가에까지 닿아야 한다. 예컨대 어떻게 노동하게 될 것인가뿐 아니라 어떻게 놀게 될 것인가를 상상하는 것도 당면 과제이다.

놀이(play)는 연합(association)과 교차성(intersectionality)을 동반한다. 놀이의 영토로 들어온 사람들은 엄격한 규칙을 중시한다. 놀이에서 사람들은 한 팀이 되어야 하고, 그들과 연합을 만들어야 한다. 연합이 유대감을 만들었다면 존재의 조건(연령, 성별, 정체성 등)을 넘어서 목표를 이루기 위해 함께 협력이 가동된다. 이 때문에 놀이와 공동체를 탐구한 네덜란드의 인류학자 요한 하위징아는 놀이가 문화나 예술 이전의 원형이며, 민주주의의 원칙을 만드는 토대라고 규정한다. 그는 더 나아가 권위적인 사회의 권력자들이 가장 먼저 통제하고 싶어하는 영역이 놀이와 여가였음을 논증한다.

전 지구적 생성 AI의 오픈서비스가 우리에게 보여주는 풍경은 뭘까? 규칙도, 연대도, 자유도 잊은 채 간질병처럼 발작만 할 따름인 놀이의 살풍경이다. 수많은 사람들이 소셜미디어에서 제각기 프롬프팅하면서 AI와 유희하는 모습은 일론 머스크나 마크 주커버그 같은 테크 고리대금업자들에게 하나의 시뮬레이션에 불과하다. 생성 AI에서 돈이 되는 기능과 그렇지 않은 기능이 무엇인지 판별하는 테스트의 일환인 것이다. 사람들은 생성 AI로 지금까지 존재하지 않았던 놀이들을 하고 있다. 만들어진 인간의 이미지, 만들어진 음악, 만들어진 영상, 만들어진 텍스트 등. 기존에는 대상성(objectivity)에 속했고 미메시스(mimesis)였던 이미지, 텍스트, 사운드의 세계가 이제는 생성적(generative)이고 메텍시스(methexis)적인 층위로 옮겨가는 중이다. 이 흐름이 계속되면 AI는 결국 대상을 넘어 주체를 스스로 생성하는 디지털 휴머니티에 닿게 된다.

이와 관련해 가장 괄목할 만한 기술혁신을 이뤄내고 있는 테크기업은 구글이나 아마존 등이 아닌 그래픽카드 제조업체인 엔비디아다. 엔비디아는 무어의 법칙의 산증인과 같은 기업이다. 1980년대 빌 게이츠는 평범한 사람들에게 64킬로바이트 이상의 메모리가 필요 없을 것이라 단언했고, 실제로 많은 컴퓨터공학자들도 그리 믿었다. 그러나 우리는 지금 1테라바이트 이상의 개인용 저장 메모리뿐 아니라 클라우드까지 사용한다. 이전에는 존재하지 않았던 그래픽 연산 전용 반도체(GPU)를 쓰고 있다. 무엇을 위해서? 놀기 위해서다. 90년대 중반부터 사람들은 PCGPU를 장착하기 시작했는데 그 목적은 단 하나, 디지털 게임을 구동시키기 위해서였다. 밀도가 높고 정교한 디지털 게임을 가지고 놀려는 수많은 사람들의 욕망이 이론상으로만 존재하던 무어의 법칙을 실현시켰다.

엔비디아에서 공개한 생성 AI 기반 ACE(Avatar Cloud Engine)의 파일럿 프로그램. 출처: 엔비디아

엔비디아는 최근 두 가지 기술혁신 프로젝트를 대중에 공개했는데, 하나는 거대언어모델(LLM)을 구동시키기 위한 AI 반도체(정확히는, 가속기)이고 다른 하나는 생성 AI를 사용해 디지털 휴먼을 창조하는 ACE(Avatar Cloud Engine)이다. ACE는 디지털 게임에 등장하는 NPC(Non Playable Character)에 생명을 불어넣는 파일럿 프로그램으로 지난해에 처음 선보였다. 결과물은 충격적이다. ACE는 인간의 커뮤니케이션, 대화, 전사, 세계관, 설정, 행동양식에 관한 다양한 모듈을 탑재한 LLM을 작동시키며 게임 속 캐릭터를 살아있는 사람처럼 말하고 행동하게 만들었다. 기존의 게임 속 캐릭터들은 플레이어의 선택에 반응해 개발자들이 삽입한 대화나 행동을 정해진 대로 출력하는 스크립트 아웃풋 방식이었다. 그러나 ACE로 생성된 캐릭터는 매개변수의 변화를 능동적으로 포착하고 매번 변화무쌍하게 상호작용을 한다. 플레이어의 목소리가 떨리면 반문을 하고 시선을 다른 곳에 두면 사무적으로 답하는 식이다. 게임 속 ACE 기반 디지털 휴먼은 말 그대로 비트로 빚어진 인간이자, 비인간이면서 인간처럼 능동적으로 행동하는 행위자이다. 이 모든 상호작용(정보의 교환)이 기계언어가 아니라 자연언어로 이뤄진다는 점에서 이 모델은 향후 10년간 게이밍뿐 아니라 인간의 여가와 문화산업의 근간 자체를 바꿔놓을 것이다.

스탠포드대학교 연구진과 구글의 협업으로 창조된 생성 행위자 커뮤니티 스몰빌 

비슷한 시기에 스탠포드대학교의 AI 연구자들은 구글과 협업, GPT로 생성한 디지털 휴먼들로만 이뤄진 비인간 사회 실험에 성공했다. 롤플레잉 게임의 작은 마을과 같은 공동체 스몰빌을 만들고, 그 안의 게임 캐릭터들의 기억과 성격을 프롬프팅해 살아있는 비인간 행위자를 창조한 뒤 말 그대로 그냥 두었다’. 캐릭터들은 인간의 명령이나 상호작용 없이도 아침에 일어나 출근하고, 카페에 가서 차를 마시며, 투표로 지도자를 뽑거나 특정 인물을 험담하는 등 스스로 행동하고 성장했다. 이는 영화 <블레이드러너>에서 인간보다 더 인간다운레플리컨트를 창조하기 위해 기억을 인위적으로 주입하는 기업의 이야기를 연상케 한다. 그렇게 해서 창조된 레플리컨트 레이첼은 아무 위화감 없이 인간 사회에 섞여 살아간다.

무서울 정도로 확산하는 AI와 디지털 휴먼 혁신에서 마주해야만 하는 첫 번째 문제는 주체와 신체의 비인간적 존재양식이다. ‘인간만이 사고하고, 감각할 수 있다라는 근대 인식론적 테마가 도전받는 것이다. 본래부터 만물은 생동하고 있었고 인간은 이제 객체들의 네트워크 뒤로 그 역사를 한 발짝 물러서야 한다는 식의 신유물론적 접근은 여기에서 별로 도움이 안 된다. 인간과 같은 물리적 신체를 가지지 않아도(그것이 사이보그건, 로봇이건) 문화적인 행위에 참여할 수 있는 존재가 만들어진다는 것은 결국 그들과 어떻게 어울리고, 놀고, 교류할지에 대한 문제, 즉 문화 이전의 행위인 놀이가 어떻게 구성될 수 있을 것인가에 대한 문제로 결부된다. 앞선 ACE스몰빌실험이 게임이라는 형식으로 접근한 이유는 이건 게임이야, 게임이 끝나면 우린 모두 일상으로 돌아올 거야라고 사람들을 안심시키고자 함일 것이다.

하지만 이것을 더 이상 게임이라고만 부를 수 있을까? 게임 속에서 나와 일상을 함께하던 디지털 휴먼이 나의 실수로 죽거나 돌아서게 된다면, 우리는 그 죄책감이나 배덕감을 어떻게 받아들여야 할까? 고양이 행동의 의미가 무엇인지 알아내고자 커뮤니티에서 포스팅을 올리고 토론하는 것처럼 사람들은 디지털 휴먼의 행위와 소통 양식에 대해 질문할 것이고, 그 답조차도 인간이 아닌 생성 AI가 제공하는 기이한 루프가 만들어진다. 디지털 휴먼을 학대하거나 악용하는 행위에 대한 윤리적 규범도 만들어야하지만, 그보다 더 모호하고 복잡한 영역인 죄책감이나 유대감, 갈등과 봉합 등은 전혀 다른 문제다. 엔비디아나 구글 같은 빅테크 자본이 이런 문제를 어떤 방향으로 해결할지에 대한 독점적인 결정 권한을 갖고 있는 것이 매우 위험하다. 시민사회의 공통감각과 전혀 다른 기업가적 오버마인드가 이 프롬프팅의 회로를 결정하게 된다면? 디지털 휴먼이 갈등과 논박을 피하기 위해 사람들에게 항상 다정하게 대하고, 적당히 놀아주면서 즐거움만 제공하는 존재가 된다면 어떨까? 갈등 자체가 발생하지 않으며, 파문을 일으키는 사람이 이상한 사람이 되고, 부정성이 완전히 소멸한 사회가 전면화되리라는 상상은 전혀 이상하지 않다. 실제 생성 AI는 그런 방향으로 가고 있다. GPT는 매우 훌륭하지만, 맹점이나 쟁점을 제공하지는 않는다. 즉 교차성에서 창발되는 갈등을 허용하지 않는다.

그렇다면 생성 AI는 왜 이런 식으로 매끄럽고, 평평한 존재들을 만들어가는 방식으로 가고 있는 것일까? 답은 엔비디아 ACE를 전제하는 물적 조건, AI 반도체의 등장과 연관이 있다. AI 자본주의에서는 노동력만큼이나 컴퓨팅 파워가 큰 지분으로 자리매김한다. 열역학 법칙이다. 더 실감나고 우아한 디지털 휴먼을 구현하기 위해서는 더 큰 LLM 연산이 필요하다. CPUGPU로는 한계가 있다. 현재의 PC 기준으로 LLM을 구동하면 약 10초의 시간동안 4-5달러에 해당하는 자원이 소모된다. 이 자원은 노동력으로만 표시될 수 없다. 마르크스의 시대 산업자본주의가 인간 노동력에 가격표를 매기는 추상화 작업을 진행했다면, AI 자본주의는 그보다 더 정교한 추상화를 자연언어를 잘개 쪼갠 토큰의 수준에서부터 이뤄낸다. 엄청난 컴퓨팅 파워가 소모되는 LLM 연산에서 갈등이나 죄책감, 연민 등의 감각은 너무 가성비가 떨어진다. 최대한 효율을 높이기 위해서는 더 평평하고 부드럽고 인자한 인간, 의문을 제기하거나 부정변증법을 동원하지 않는 인간상을 구현해야만 한다. 자본주의의 목표는 잉여가치의 생산이지 인간 정신의 진보 같은 거창한 철학적 주제가 아니기 때문이다.

만 개 단위의 GPU의 연산능력을 합친 AI 데이터센터에서 중앙집중형으로 LLM을 운영하고, AI 반도체는 LLMSLM(Small Language Model)사이의 점들을 선분으로 만드는 토대가 된다. 이런 과정을 거쳐 창조된 디지털 휴먼은 인간의 노동력으로부터 가치를 뽑아내는 축적을 넘어, 인간의 놀이와 유희로부터 가치를 뽑아내는 자본의 골렘으로 현상된다. 인간의 유희와 사회적 상호작용에 대한 전에 없는 상품화는 계몽주의 시대부터 이어졌던 데카르트적 기획에 종언을 고하고, 다시 중세로 돌아가는 전조로 읽힐 수 있다. 슈테판 츠바이크의 소설 <체스 이야기>에서, 게슈타포는 주인공 박사로부터 진술을 받아내기 위해 그를 호텔 방에 가두고 수개월 동안 아무 조치도 하지 않았다. 고문이나 학대도 없었고 가혹한 심문은 더더욱 없었다. 그러나 놀이도, 상호작용도 없이 시간이 멈춰진 방 안에서 B박사의 정신은 서서히 무너져 내렸다. 그를 살린 건 우연히 훔쳐낸 신문에 실린 체스 대국이었다. B 박사는 이 대국을 바탕으로 상상 속에서 수많은 상대와 체스를 두며 버틴 끝에 생존할 수 있었다. AI 자본주의 국면에서 새 진지전이 요청되는 가운데, 우리는 어떻게, 누구와 놀 것인가? 이것이 진보 좌파 진영의 주요한 테마가 될 것이다.

덧붙이는 말

신현우는 마르크스주의의 시각에서 기술과 문화, 예술을 탐구하는 문화연구자이다. 기술비판이론과 미디어 정치경제학을 공부했고, 서울과학기술대학교와 한국예술종합학교에서 강의하고 있다.

태그
태그를 한개 입력할 때마다 엔터키를 누르면 새로운 입력창이 나옵니다.

의견 쓰기

댓글 0

맨위로