AI는 이제 답변만 하지 않는다

코이

@coi

AI는 이제 답변만 하지 않는다

최근 공개된 MCP 생태계 분석 논문의 주요 내용을 번역·요약하여 공유드립니다.
원문: 
https://arxiv.org/abs/2603.23802

최근 2년 동안 AI 업계의 화두는 단순히 더 똑똑한 모델을 만드는 것이 아니었습니다.

GPT, Claude, Gemini 같은 모델의 성능 경쟁이 계속되고 있지만, 실제 현장에서는 또 다른 변화가 일어나고 있습니다. AI가 단순히 질문에 답변하는 도구를 넘어 실제로 일을 수행하는 에이전트(Agent)로 진화하기 시작한 것입니다.

그렇다면 현재 AI 에이전트들은 실제로 무엇을 하고 있을까요?

최근 공개된 한 연구는 이 질문에 답하기 위해 19,000개 이상의 MCP(Model Context Protocol) 서버와 17만 7천 개 이상의 MCP 도구를 분석했습니다. 연구진은 AI 에이전트가 어떤 도구를 사용하고 있으며, 그 사용 방식이 어떻게 변화하고 있는지를 대규모 데이터로 추적했습니다.

논문의 제목은 다소 학술적이지만, 핵심 질문은 매우 단순합니다.

"AI 에이전트는 실제로 무엇을 하고 있을까?"

그리고 연구 결과는 생각보다 흥미롭습니다.

많은 사람들이 AI를 여전히 검색하고 답변하는 도구로 생각하지만, 실제 생태계는 점점 더 “행동하는 AI”를 중심으로 발전하고 있었습니다.

연구진은 17만 개 이상의 도구를 분석했다

이번 연구의 가장 흥미로운 점은 특정 AI 모델을 평가한 것이 아니라, 실제 에이전트 생태계에서 사용되고 있는 도구들을 분석했다는 점입니다.

연구진은 19,000개 이상의 MCP 서버와 177,436개의 MCP 도구를 수집한 뒤, 각 도구가 어떤 역할을 수행하는지 분류했습니다. 이를 통해 현재 AI 에이전트들이 무엇을 할 수 있는지, 그리고 그 능력이 어떤 방향으로 발전하고 있는지를 살펴볼 수 있었습니다.

연구진은 MCP 도구를 크게 세 가지 범주로 구분했습니다.

1. Perception (지각)

Perception은 AI가 외부 세계의 정보를 읽고 이해하기 위한 도구입니다.

대표적으로 웹 검색, 파일 읽기, 데이터베이스 조회와 같은 기능들이 여기에 해당합니다. 사람으로 비유하면 눈과 귀의 역할에 가깝습니다. AI가 어떤 행동을 하기 전에 먼저 주변 정보를 수집하는 단계라고 볼 수 있습니다.

2. Reasoning (추리)

Reasoning은 수집한 정보를 분석하고 판단하는 단계입니다.

계산을 수행하거나 여러 정보 사이의 관계를 파악하고, 계획을 세우거나 결론을 도출하는 기능들이 여기에 포함됩니다. 현재의 대규모 언어 모델이 가장 강점을 보이는 영역이기도 합니다.

3. Action (행동)

Action은 실제로 외부 시스템에 영향을 주는 행동을 수행하는 도구입니다.

파일을 수정하거나 이메일을 전송하고, 브라우저를 조작하거나 외부 API를 호출하는 기능들이 대표적입니다. 최근에는 결제나 금융 거래와 같은 기능들도 점점 늘어나고 있습니다.

이 분류가 중요한 이유는 AI 에이전트가 단순히 정보를 읽고 분석하는 단계를 넘어 실제 행동을 수행하는 방향으로 발전하고 있기 때문입니다.

그리고 연구진이 발견한 가장 흥미로운 변화 역시 바로 이 Action 영역에서 나타났습니다.

AI는 읽기보다 행동하기 시작했다

이번 연구에서 가장 흥미로운 발견은 Action Tool의 비중이 빠르게 증가하고 있다는 점입니다.

초기 AI 에이전트는 주로 정보를 수집하고 분석하는 역할을 수행했습니다. 웹을 검색하고 문서를 요약하거나 데이터를 분석하는 것이 대표적인 예입니다. 당시의 AI는 똑똑한 비서나 검색 엔진에 가까웠습니다.

하지만 최근의 에이전트는 조금 다른 방향으로 발전하고 있습니다.

연구진에 따르면 점점 더 많은 에이전트가 단순히 정보를 읽고 이해하는 것을 넘어 실제 행동을 수행하기 시작했습니다.

예를 들어 코드 수정과 배포, 시스템 제어, 브라우저 조작, 외부 서비스 실행과 같은 작업들이 늘어나고 있으며, 최근에는 결제와 금융 거래까지 수행하는 사례도 등장하고 있습니다.

이는 매우 중요한 변화입니다.

검색이나 요약은 결과적으로 사람에게 정보를 전달하는 작업입니다. 하지만 Action은 다릅니다. AI가 직접 외부 시스템과 상호작용하고, 실제 세상에 영향을 주는 행동을 수행하기 시작했다는 의미이기 때문입니다.

예전의 AI가

"어떻게 해야 하는지 알려주는 존재"

였다면,

최근의 AI는

"직접 처리해주는 존재"

로 변화하고 있는 셈입니다.

실제로 Cursor나 Claude Code 같은 개발 에이전트는 코드를 수정하고 테스트를 실행하며, OpenAI Operator나 브라우저 에이전트들은 웹사이트를 탐색하고 작업을 수행합니다. 또한 MCP와 x402 같은 기술의 등장으로 AI가 직접 서비스를 이용하고 결제를 수행하는 시도도 조금씩 늘어나고 있습니다.

이러한 변화는 AI가 단순한 챗봇에서 디지털 작업자로 진화하고 있음을 보여주는 신호라고 볼 수 있습니다.

그리고 이번 연구는 이러한 변화가 단순한 기대나 전망이 아니라, 실제 MCP 생태계 데이터에서도 나타나고 있다는 점을 보여주고 있습니다.

소프트웨어 개발이 가장 큰 시장

이번 연구에서 또 하나 흥미로운 결과는 현재 MCP 생태계에서 가장 큰 비중을 차지하는 분야가 소프트웨어 개발이라는 점입니다.

많은 사람들이 AI를 챗봇이나 검색 도구로 사용하고 있지만, 실제 에이전트 생태계에서는 개발 관련 도구가 압도적인 비중을 차지하고 있었습니다.

대표적인 사례로는 Cursor, Claude Code, OpenHands와 같은 개발 에이전트가 있습니다. 이들은 단순히 코드를 생성하는 것을 넘어 프로젝트를 분석하고 파일을 수정하며, 테스트를 실행하고 배포 작업까지 수행할 수 있습니다.

실제로 연구진이 분석한 MCP 도구들 중 상당수는 코드 생성, 코드 수정, 프로젝트 탐색, 테스트 자동화, CI/CD 연동과 같은 개발 업무와 관련되어 있었습니다.

이러한 현상이 나타나는 이유는 개발 환경이 에이전트에게 매우 적합한 작업 공간이기 때문입니다.

코드는 텍스트로 이루어져 있고, 결과를 자동으로 검증할 수 있으며, 테스트와 빌드를 통해 성공 여부를 비교적 명확하게 판단할 수 있습니다. 또한 GitHub, IDE, 터미널과 같은 도구들이 이미 API와 자동화 환경을 잘 갖추고 있기 때문에 에이전트가 실제 작업을 수행하기에도 유리합니다.

실제로 최근 개발자들의 업무 방식도 빠르게 변화하고 있습니다.

예전에는 AI에게 코드를 물어보고 참고하는 수준이었다면, 이제는 AI가 직접 코드를 작성하고 수정한 뒤 개발자가 이를 검토하는 방식으로 변화하고 있습니다. 개발자는 점점 구현자보다 감독자에 가까운 역할을 맡게 되고 있는 셈입니다.

현재 AI 에이전트 산업에서 가장 빠르게 성장하고 있는 분야가 개발인 이유도 여기에 있습니다.

어쩌면 소프트웨어 개발은 AI 에이전트가 본격적으로 경제적 가치를 만들어내기 시작한 첫 번째 산업이라고 볼 수도 있을 것입니다.

결제도 에이전트가 하는 시대

논문은 특히 Agentic Financial Transactions라는 흥미로운 개념을 언급합니다.

쉽게 말해 AI 에이전트가 단순히 정보를 찾고 분석하는 것을 넘어, 실제 금융 거래와 결제까지 수행하는 시대가 열리고 있다는 의미입니다.

지금까지 대부분의 인터넷 서비스는 사람을 중심으로 설계되어 왔습니다. 사용자가 콘텐츠를 발견하고, 결제를 진행한 뒤, 서비스를 이용하는 것이 일반적인 흐름이었습니다.

하지만 AI 에이전트가 점점 더 많은 작업을 대신 수행하게 되면서 새로운 시나리오가 등장하기 시작했습니다.

예를 들어 사용자가 직접 웹사이트를 방문하지 않더라도, AI 에이전트가 필요한 정보를 찾고 서비스의 가격을 확인한 뒤 결제를 수행하고 결과를 전달하는 형태가 가능해질 수 있습니다.

즉,

사람 → 결제 → 컨텐츠 이용

이라는 흐름에서

AI 에이전트 → 결제 → 컨텐츠 이용

이라는 새로운 흐름이 등장할 수 있는 것입니다.

물론 아직은 초기 단계에 가깝습니다.

하지만 최근 MCP 생태계에서는 결제와 금융 거래를 지원하는 도구들이 빠르게 증가하고 있으며, AI가 외부 서비스에 비용을 지불하고 리소스를 이용할 수 있도록 하는 다양한 시도도 이어지고 있습니다.

중요한 것은 모델보다 도구다

많은 사람들은 여전히 GPT, Claude, Gemini 같은 모델의 성능 경쟁에 주목합니다.

실제로 AI 업계의 주요 뉴스도 대부분 새로운 모델 출시나 벤치마크 점수, 추론 성능 향상에 집중되어 있습니다. 물론 모델의 지능은 여전히 중요합니다. 더 나은 추론 능력과 더 높은 정확도는 좋은 에이전트를 만드는 데 필요한 기반이기 때문입니다.

하지만 이번 논문이 보여주는 것은 조금 다른 방향입니다.

연구진은 AI 에이전트의 능력을 결정하는 요소가 단순히 모델 자체만은 아니라고 이야기합니다. 아무리 뛰어난 모델이라도 외부 세계와 상호작용할 수 없다면 결국 답변을 생성하는 수준에 머물 수밖에 없습니다.

반대로 모델의 성능이 조금 부족하더라도 다양한 도구와 연결되어 실제 행동을 수행할 수 있다면 훨씬 더 큰 가치를 만들어낼 수 있습니다.

예를 들어 웹페이지를 읽을 수 있는 AI와 웹페이지를 읽은 뒤 직접 서비스를 이용하고 작업을 수행할 수 있는 AI는 완전히 다른 존재입니다.

마찬가지로 코드를 설명할 수 있는 AI와 실제로 코드를 수정하고 테스트를 실행하며 배포까지 수행할 수 있는 AI 역시 활용 범위가 크게 달라집니다.

최근 MCP가 빠르게 성장하고 있는 이유도 여기에 있습니다.

MCP는 단순히 새로운 API 규격이 아니라 AI가 다양한 도구와 연결될 수 있도록 해주는 공통 인터페이스입니다. 즉, 모델의 지능을 높이는 기술이라기보다 모델의 행동 범위를 확장하는 기술에 가깝습니다.

어쩌면 앞으로의 경쟁은

"누가 더 똑똑한 모델을 만들었는가"

보다

"누가 더 많은 도구와 연결되어 있는가"

의 경쟁이 될지도 모릅니다.

이번 연구에서 가장 흥미로웠던 점은 AI 에이전트의 발전을 모델이 아닌 도구 생태계 관점에서 바라봤다는 것입니다.

MCP 서버와 도구들이 빠르게 늘어나면서 에이전트는 점점 더 많은 행동을 수행할 수 있게 되고 있습니다.

그리고 데이터는 그 중심에 검색이나 요약이 아닌 Action, 즉 실제 행동이 자리 잡기 시작했음을 보여주고 있습니다.

AI 에이전트가 앞으로 어디까지 발전할지는 아직 알 수 없습니다. 하지만 적어도 에이전트가 단순한 챗봇을 넘어 실제 작업을 수행하는 방향으로 진화하고 있다는 점을 분명히 보여주고 있다고 할 수 있을 것 같습니다.

(Edited)

No comments yet.

Search channels, users, posts

Trending Posts

New Channels