일각선 “AI 코딩 도구, 생각보단 빠르지 못해 비효율적”
‘세계 코딩 챔피언십’에선 베테랑 인간 코더, AI 모델에 겨우 이겨
그러나 세계 정상급 10명의 프로그래머 제치고 AI가 전체 2위
“결국 AI와의 경쟁보다 AI와 함께 경쟁하는 경우 많아질 것”
[애플경제 이윤순 기자] 지난 몇 년 동안 AI 모델의 코딩 능력이 획기적으로 발달하면서 인간 개발자를 보조하거나, 아예 대체하는 상황까지 벌어지고 있다. 예를 들어, 스탠퍼드 대학교의 2025 AI 지수 보고서는 코딩 능력을 측정하는 벤치마크인 ‘SWE-bench’를 인용해, “AI 시스템은 2023년에 코딩 문제의 4.4%만 해결할 수 있었지만, 2024년에는 71.7%로 급증했다”고 할 정도다.
이미 다수 개발자에겐 필수 도구
이에 인간 개발자와 AI코딩 간의 ‘긴장’ 관계마저 형성되고 있다. 이미 AI코딩은 오픈AI, 앤스로픽, 구글, 메타 등이 가장 많이 사용되는 분야 중 하나다. 깃허브 코파일럿과 커서(Cursor) 등은 다수의 전문 개발자들에겐 이제 필수로 여겨지는 표준 도구가 되었다.
실제로 2024년 깃허브 설문 조사에 따르면 현재 개발자의 90% 이상이 워크플로에서 AI 코딩 도구를 사용하고 있다. 하지만 최근 연구에선 또 다른 결과도 있다. 이에 따르면 “AI 코딩 도구가 개발자들이 생각하는 것만큼 시간을 절약해 주지 못할 수도 있다”는 것이다. 그럼에도 불구하고 AI코딩은 인간 코더의 능력을 부지런히 따라잡고 있다.
실제로 최근 ‘인간 vs AI’ 간의 코딩 경기에서도 이는 입증되고 있다. 인간이 그야말로 어렵사리 AI코딩을 능가할 정도로 기계의 실력이 엄청난 발전을 이뤘음을 알게 한다.
인간 코더, 오픈AI ‘o3’와 10시간 ‘사투’ 끝 승리
최근 연린 ‘2025 AtCoder World Finals 휴리스틱 콘테스트’에서 인간이 코딩 분야에서 일단 AI를 제치고, 상을 받았다. “인류가 (일단은) 승리했습니다!”-. 오픈AI와의 10시간 코딩 경기를 펼친 ‘마라톤 우승자’가 남긴 글이다.
AtCoder World Tour Finals는 경쟁 프로그래밍 분야에서 가장 독점적인 행사 중 하나다. 전년도 성적을 기준으로 전 세계 상위 12명의 프로그래머만 초대한다. 휴리스틱 부문은 "NP-hard" 최적화 문제에 중점을 둔다. 프로그래밍에서 ‘휴리스틱’은 완벽한 답을 신속히 계산하기 위한 것이다. 답을 찾는 데 너무 오랜 시간이 걸릴 때 지름길과 경험에 기반한 추측을 통해 좋은 해결책을 찾는 문제 해결 기법이다.
이 경기에서 당사자인 폴란드 프로그래머 프셰미스와프 뎅비악은 오픈AI의 고급 AI 모델과 코딩 시합을 벌여 이겼다. 그러나 10시간 가량 이어진 경기 끝에 그는 완전히 녹초가 되었다. 이 행사에서 오픈AI는 제작사를 스폰서로 참여도록 했다. 그 결과 ‘인간 vs. AI’라는 제목의 특별 시범 경기에도 해당 AI 모델을 출전시켰습니다.
승리를 한 뎅비악은 “인류가 승리했습니다(지금은요!)”라고 X에 글을 남겼으며, 3일 동안 여러 대회에 참가하는 동안 거의 잠을 자지 못했다고 밝혔다. 그럼에도 그는 결국 AI에 대항한 ‘인간 승리’를 일군 것이다.
이 대회는 참가자들이 복잡한 최적화 문제 하나를 600분 이상 풀어야 하는 대회였다. 이 대회는 1870년대 증기 기관차와 경쟁했던 ‘강철’ 운반인 존 헨리의 미국 설화를 떠올리게 합니다. 산업 자동화에 맞선 헨리의 전설적인 싸움을 연상케 하는 것이다. 그처럼, 뎅비악의 승리는 AI가 발전하는 시대에도 인간의 능력이 여전히 중요하다는 것을 증명하기에 충분하다.
AI 코딩, 인간 코더보다 9.5% 뒤져
경기가 끝난 후 최종 판정 결과를 보면 뎅비악은 1,812,272,558,909점을 기록했고, 오픈AI의 모델(OpenAIAHC)은 1,654,675,725,406점을 획득하는데 그쳤다. 약 9.5%의 차이를 기록한 것이다. 그럼에도 오픈AI의 인공신경망 모델인 ‘o3’와 유사한 맞춤형 시뮬레이션 추론 모델은 날고 긴다는 다른 10명의 인간 프로그래머를 제치고 전체 2위를 차지, 참가자들을 경악하게 했다.
오픈AI는 이에 “‘o3’는 이번 2위 달성을 경쟁 프로그래밍 분야에서 AI 모델이 이룬 중요한 이정표”라고 했다. 그에 따르면 ‘o3’와 같은 모델은 코딩/수학 경진대회에서 상위 100위 안에 들 정도다. 그러다가 마침내 국제적 권위의 코딩/수학 경진대회에서 상위 3위에 오른 것이다.
“인간 vs AI코더, 긴 궤적으로 판단해야”
그럼에도 불구하고, AI 모델이 코딩과 같은 작업에 더욱 능숙해짐에 따라, 뎅비악의 승리는 영구적인 승리라기보다는 (인간과 AI가 보이는) 더 긴 궤적에서 주목할 만한 데이터 포인트라는 해석도 가능하다. 과거의 여느 기술 선구자들처럼 다음에는 더 빠른 기계와 경쟁하게 될지도 모른다. 그 때의 승자 역시 인간이 될 것이라고 장담할 수 없다.
지금으로서는 예상치 못한, 임의로운 접근법을 찾아내는 능력은 인간만이 지닌 독보적인 특성이다. 그러나 오픈AI를 비롯한 여러 기업들이 모델을 지속적으로 개선해 나가고 있다. 다만 미래의 개발자들은 AI와의 경쟁보다는 AI와 함께 경쟁하는 경우가 더 많아질 수도 있다. 아니면 아예 경쟁하지 않게 될 수도 있다. 즉 “개발자의 일자리를 AI에게 넘겨줄 수도 있다”는 뜻이다.
