어느 날, 초등학생 조카가 차를 타고 집으로 가는 길에 저에게 신라시대의 "세속오계"를 아는지 물었습니다. 조카는 어릴 때부터 체계적인 교육을 받았고, 특히 개인 과외 교습 경험이 있는 부모님 덕분에 학습에 대한 이해가 높았습니다. (참고: 동생 아들, 조카 양육법)
조카는 아는 것을 자랑하고 싶어 할 때마다 제게 질문을 던지곤 했습니다. 저는 곧바로 답하는 대신 "그 세속오계가 어떤 역사적 의미를 가졌는지 아니?"라고 되물었고, 조카는 대답하지 못했습니다. 조카는 어릴 때부터 도서관에서 책 읽는 습관을 길러 책을 빨리 읽고 기억력도 좋았습니다. 어릴수록 기억력이 좋다는 것은 일반적인 사실입니다.
조카의 질문을 통해 인간의 기억과 학습 방식에 대해 생각하게 되었습니다. 어린 시절의 뛰어난 기억력은 분명 중요하지만, 단순히 기억만으로는 충분하지 않습니다. 컴퓨터의 메모리 계층 구조처럼, 인간의 기억도 단기 기억, 장기 기억, 절차 기억 등으로 나뉘어 있습니다. 하드 디스크가 보조 기억 장치로서 노트를 대신한다면, 메인 메모리는 인간 내부의 기억에 비유할 수 있습니다.
조카는 앞으로 지식 정보와 경험을 통한 인간 강화학습을 통해 성장해 나갈 것입니다. 이것이 바로 인간 성장의 본질일 것입니다. 참고로, 아래에 제시된 컴퓨터의 메모리 계층 구조는 인간 뇌의 기억 단계와도 유사한 면이 있습니다.
인간의 기억과 학습 방식
인간은 삶이 지속되는 동안 끊임없이 기억을 저장하고 활용하기 때문에, 뇌의 기억 용량은 매우 크다고 할 수 있습니다. 하지만 아무리 기억 용량이 크더라도, 그 정보를 효과적으로 활용하는 방법을 모른다면 무용지물입니다.
인공지능은 바로 이러한 인간 기억의 작동 방식과 활용법을 연구하고 발전시키는 과정에서 탄생했습니다. 거대 언어 모델(LLM)은 이제 기계와의 대화를 통해 지식을 얻는 새로운 시대를 열었지만, 역설적이게도 대부분의 인간은 논리적인 사고에 익숙하지 않습니다. 이는 인간의 두뇌가 컴퓨터처럼 단순 계산에 최적화된 논리 회로로 설계되지 않았기 때문입니다.
인간이 논리적으로 사고하기 위해서는 학습을 통해 충분한 데이터를 축적하고, 이를 바탕으로 논리적 사고를 훈련해야 합니다. 인류가 다른 동물과 구별되는 중요한 이유 중 하나는 바로 학습을 통해 논리적으로 사고하고 과학 기술을 발전시켜왔기 때문입니다. LLM 역시 인간이 논리적인 체계를 바탕으로 설계하지 않았다면 지금처럼 논리적인 답변을 제공하기 어려웠을 것입니다. 2년 전 LLM 서비스가 처음 등장했을 때, 비논리적인 답변에 대한 언론의 우려가 컸던 것도 같은 맥락입니다.
앞서 간략하게 언급했듯이, 인간의 기억은 컴퓨터의 메모리처럼 명확하게 구조화되어 있지는 않지만, 장기 기억과 단기 기억 등으로 구분됩니다. 그래서 항상 활용되는 기억이 있는가 하면, 세상 경험이 적을수록 더 잘 활용되는 기억도 있습니다. 하지만 아무리 기억력이 뛰어나다고 해도, 논리적인 사고 능력이 부족하다면 그 기억은 단순히 저장된 정보일 뿐, 실질적인 지식으로 활용될 수 없습니다.
인공지능과 교육의 방향
초기에 학교는 세상 경험이 많은 학자들이 제자들을 가르쳤습니다. 여기서 그들은 세상에서 경험한 것과 지식이 함께 했기에 학생들을 가르칠 때 현실적으로 경험할 수 있는 것들을 설명할 수 있었습니다. 그렇지만 제도적으로 학교라는 것이 운영될 때는 학교 교육에서 성적이 좋은 학생 중 일부가 학자가 되었습니다. 이러한 발전이 인공지능 시대에 문제가 되고 있습니다.
앞에서 저는 인간의 대다수는 극히 논리적이지 못하다는 말을 했습니다. 그것은 인간들의 관계에서는 감정이라는 중요한 요소가 있기 때문입니다. 이러한 감정적 요소는 인간이 지식을 지속적으로 습득하는 데 강한 부정적인 요소가 됩니다. 더불어 기계와 바둑을 둘 때 인간은 이러한 감정적 요소로 인해 패널티를 받게 됩니다.
강화학습측면에서 바둑은 프로그래밍을 한때 전지전능한 관점에서 19x19의 그리드를 미리 경험하고 학습해서 게임을 둘 때는 인간이 바둑의 돌을 어떻게 둘지에 대한 모든 계산을 할 수 있게되어 이제는 인간이 바둑에서 기계를 이기기 어려운 세상이 되었습니다. 이는 바둑의 룰이 컴퓨터로 빠르게 계산하면 되기 때문에 가능합니다.
하지만 인간의 세상은 개발자가 전지전능한 제한된 룰로 프로그래밍 하기 어렵습니다. 따라서 현실세계에서는 아직 인공지능이 극복해야 할 것이 많습니다. 따라서 인공지능이 지적인 도구로 인간의 전통적인 일을 대체하게 되지만 인공지능을 다루는 일을 더많은 새로운 직업들이 나타날 것입니다.
강화학습 개념과 원리
강화 학습은 말 그대로 어떤 경험을 통해 실패를 극복하고 성공하는 방법을 알아가는 과정입니다. 교육 이론 초기에 등장하는 파블로프의 개 실험에서 볼 수 있듯이, 인간의 행동은 특정 조건에 의해 형성되고, 이러한 조건들이 학습되어 경험적 지식으로 발전하는 것이 강화 이론이 인간 교육에서 발전한 시초라고 할 수 있습니다. 강화 학습이라는 인공지능 기법 역시 처음에는 단순한 조건과 환경 영향의 변수들을 극복하는 동적 프로그래밍 기법에서 발전한 형태입니다.
강화 학습이 인간의 학습 방식과 다른 점은 논리적인 계산에 능숙한 컴퓨터가 수행한다는 것입니다. 따라서 컴퓨터의 계산 속도가 빨라질수록 인간은 기계를 이기기 어려워집니다. 강화 학습 이론을 큰 틀에서 보면, 강화 학습이 이루어지는 환경이 제한적인지 혹은 그렇지 않은지가 중요한 구분 기준이 됩니다. 또 다른 구분 기준은 학습이 진행될 때 전지적인 시각, 즉 신적인 관점에서 환경을 관찰할 수 있는지 여부입니다.
일반적으로 컴퓨터 내에서 강화 학습 이론을 프로그래밍할 때는 제한된 환경에서 개발자가 전지적인 관점으로 프로그램을 작성할 수 있습니다. 그렇기 때문에 바둑에서 인간이 기계를 이기는 것은 이제 불가능하다는 것이 이미 널리 알려진 사실입니다. 인간은 3차 산업혁명에서 기계를 발전시켜 육체적인 한계를 극복했습니다. 이제는 지적인 능력을 기계를 통해 극복하려는 기술이 발전하고 있습니다. 그러므로 인간은 인공지능을 활용하는 데 집중하여 인간의 지적 능력을 배가해야 합니다. 과거 기계 발달(3차 산업혁명)을 통해 인간 육체의 능력을 배가했듯이 말입니다.
융합인재의 중요성
앞서 언급한 감정적인 요소는 인간이 기계를 경쟁 상대로 인식하게 만드는 요인이 됩니다. 지식인들은 지적인 기계를 도구로 활용하지만, 육체 노동자들은 기계가 자신들의 일자리를 빼앗는 경쟁자로 느낄 수 있습니다. 따라서 운전이나 청소와 같은 직업에서 인력 수요가 크게 줄어들 것으로 예상됩니다.
하지만 현실적으로 보면, 현재 지식인을 대표하는 직업인 의사와 법조인이 인공지능에 의해 가장 빠르게 대체될 가능성이 있습니다. 그렇다고 해서 자율 주행 자동차가 운전자의 역할을 완전히 대체할 수 없는 것처럼, 의사와 법조인 역시 인공지능으로 완전히 대체되기는 어렵습니다. 인공지능은 단순히 그들의 업무를 더 효율적으로 만들어주는 도구 역할을 할 뿐입니다. 예를 들어, 과거에 100명의 의사가 필요했던 업무량이 인공지능 도입으로 인해 10명의 의사로도 충분히 처리 가능하게 될 수 있습니다. 이것이 바로 미래 사회의 변화 방향입니다. 그렇다면 나머지 90명의 의사들은 어떻게 해야 할까요? 그들은 의사이면서 동시에 공학자가 되는, 즉 융합인재로서 새로운 역할을 수행해야 합니다.
강화학습과 인간 교육의 접목
이제 강화 학습 측면에서 인간 교육에 적용되는 방식을 자세히 살펴보겠습니다.
강화 학습은 최신 인공지능 기술과 만나 ChatGPT의 RLHF(인간 피드백 기반 강화 학습)라는 기법으로 발전하여, 인간 데이터를 지속적으로 학습함으로써 인간과 자연스러운 대화가 가능하게 되었습니다. 컴퓨터는 인간 데이터를 인공지능의 두뇌에 있는 파라미터(인간의 시냅스)를 업그레이드하여 통계적으로 학습하고, 이를 통해 인간 지능을 모방합니다.
자율 주행 자동차와 인간형 로봇 개발에도 이러한 인공지능 기술이 중요한 요소로 활용되고 있습니다. 3차 산업혁명의 기계와 현재의 인공지능이 결합하여 인간이 수행할 수 있는 대부분의 일을 기계가 대신할 수 있는 시대가 열렸습니다. 현재의 LLM(ChatGPT의 인공지능 모델)은 인간 지능과 매우 유사하게 작동하지만, 기계와의 완전한 연결은 여전히 시도 단계에 있으며 관련 뉴스가 계속해서 나오고 있습니다.
이러한 기계들은 강화 학습을 통해 인간이 통제할 수 없는 환경에서도 지속적으로 스스로 학습하며 인간을 돕는 역할을 수행합니다. 따라서 기계가 인간을 이해하기 위해서는 우리 자신이 어떤 생각을 하고 어떤 비논리적인 행동을 하는지 스스로 깨닫는 메타인지를 발전시켜야 합니다. 그래야만 인간이 기계를 이기려고 하기보다는 올바르게 활용할 수 있을 것입니다.
글의 서두에서 조카의 이야기를 통해 말하고자 했던 것은, 우리가 단순히 사실이라는 정보에만 국한되지 않고 맥락을 파악하여 문제 상황을 올바르게 해결하는 융합 교육을 시행해야 한다는 점입니다. 지식을 알고 기억하는 것은 이제 기계의 몫이며, 사람은 그러한 기계를 이용하여 세상의 일들에 올바르게 적용하는 것이 중요합니다.
마지막으로 제가 수업에서 활용하는 기법 중에 강화 학습을 잘 설명하는 실험이 있습니다. 아래 4*4 그리드에서 시작점과 종료까 가능한 모든 이동 경로를 그려보면, 가장 많이 지나간 길이 최적의 경로가 됩니다.
마무리
사람들은 예로부터 기술 발전을 두려워해 왔지만, 인류가 세대를 거쳐 축적해 온 발전 양상을 보면 마치 그리드에서 가장 많이 지나간 길이 최적의 경로가 되는 것처럼, 결국 가장 두껍고 올바른 길을 찾아갈 것이라고 생각합니다.
이러한 최적의 길은 소수의 뛰어난 인재만이 만들어내는 것이 아니라, 우리 모두가 협력하고 소통할 때 비로소 발견될 수 있습니다. 서로 협력하고 소통하는 우리 모두가 좋은 친구가 되기를 희망하며 글을 마무리합니다.
감사합니다.
'인생 노하우' 카테고리의 다른 글
개발자의 두 가지 문제 해결 스타일: 깊이 파고드는 탐구자 vs 함께 길을 찾는 협력자 (10) | 2025.04.08 |
---|---|
개발의 세계로 첫발을 내딛는 당신에게: 초보 개발자와 용감한 창업가를 위한 안내서 (4) | 2025.04.06 |
인공지능(LLM) 이해와 활용을 위한 인공지능 사용하기 (2) | 2024.12.03 |
PC와 운영체제 발전을 경험하며 미래교육을 생각하기 (0) | 2024.01.12 |
작게 시작하여 크게 성공하자, 티끌모아 태산 : 애자일 방법론 (0) | 2022.10.21 |
댓글