본문 바로가기
IT

스탠퍼드 법학 교수들이 AI를 선택했다: 법학 교육의 균열이 시작됐다

by 안드뽀개기 2026. 6. 4.
반응형

법학은 AI가 쉽게 넘볼 수 없는 마지막 인간 영역 중 하나로 꼽혀왔다. 판례 해석, 모순되는 논거 사이의 균형, 법적 판단의 미묘한 맥락—이런 것들은 수십 년의 훈련과 경험에서 나온다고 여겨졌다. 스탠퍼드 법학대학원이 발표한 연구는 그 가정에 정면으로 균열을 냈다.

A cinematic wide shot of an ancient marble courtroom fused with a futuristic AI interface — glowing neural network patterns overlaid on classical law books and wooden gavels, holographic legal texts floating in the air, dramatic lighting with cool blue and gold accents, photorealistic style, 8k resolution


숫자가 말하는 것: 75%라는 충격적 격차

스탠퍼드 법대 Julian Nyarko 교수가 이끈 이번 연구는 단순한 설문이 아니다. 미국 법학대학원 16명의 교수가 참여해 계약법 수업과 관련된 학생 질문 40개에 직접 답변을 작성했다. 그 답변과 대형 언어 모델(LLM)의 답변을 무작위로 섞어 익명으로 평가하게 했다. 평가 건수만 약 3,000건에 달했다.

결과는 명확했다. 교수들은 AI 답변을 75%의 대결에서 동료 교수 답변보다 높게 평가했다. 더 주목할 수치는 "교육적으로 해롭다"고 판정된 비율이다. AI 답변에 그 딱지가 붙은 비율은 3.5%에 불과했지만, 동료 교수 답변에는 12%가 붙었다. 단순 선호도가 아니라 실질적인 교육 품질 평가에서도 AI가 앞선 것이다.


왜 법학인가: AI 평가의 새로운 기준점

A dramatic split-screen visualization — on one side, a human professor surrounded by towering stacks of law textbooks in warm amber light; on the other side, an AI neural network forming the shape of the scales of justice in cool electric blue, both sides converging at the center in a symbolic clash, minimalist 3D render style

기존 AI 성능 평가는 대부분 명확한 정답이 존재하는 영역에서 이루어졌다. 수학 문제, 코딩, 의학 지식 퀴즈 같은 것들이다. 이 연구가 특별한 이유는 법학이라는 도메인을 선택했기 때문이다.

법학은 "맞고 틀림"의 세계가 아니다. 같은 사실관계를 두고 원고와 피고 모두 설득력 있는 논리를 구성할 수 있어야 한다. 공동 저자인 예일대 Sarath Sanga 교수는 이를 명확히 짚었다. "법에서는 서로 반대되는 두 주장이 모두 훌륭할 수 있다. 우리가 알고자 한 것은 AI가 변호사들이 서로의 논거를 평가하는 잠재적 전문가 기준을 충족하는가였다."

이 기준을 AI가 통과했다는 것은 단순히 법학 교육의 문제가 아니다. 판단력과 모호성 탐색이 핵심인 모든 전문직 교육에 AI 튜터를 도입할 수 있다는 신호다.


연구의 맥락: 이것이 처음이 아니다

AI와 전문가 비교 연구는 이전에도 있었다. 2023년 여러 연구에서 GPT-4가 미국 의사 자격시험(USMLE)을 합격 수준으로 통과했고, 같은 해 법학적성시험(LSAT)과 미국 변호사 시험(BAR)에서도 상위 10% 수준의 성적을 보인 바 있다.

A photorealistic timeline visualization stretching across a sleek dark background — glowing milestone markers showing AI achievements in medicine, law, and finance from 2022 to 2026, each node connected by an accelerating curved light trail suggesting exponential progress, cyberpunk style with deep purples and electric cyan

그러나 이번 연구는 결정적으로 다른 지점이 있다. 시험 통과가 아니라 실제 교육 현장에서의 성과를 측정했다는 것이다. 학생이 수업 후 교수 연구실에 찾아가서 묻는 질문들, 즉 교과서에 없는 혼란과 오해를 푸는 질문들에 대한 답변 품질이다. 이는 지식 재현 능력이 아니라 교육적 커뮤니케이션 능력의 평가다.

스탠퍼드 liftlab의 Alejandro Salinas 연구원은 "AI 튜터가 판단력이 중요한 분야에서도 고품질의 온디맨드 지원을 제공할 수 있다는 것을 보여준다"고 강조했다.


파장: 법학 교육이 흔들리면 무엇이 달라지는가

A futuristic law school lecture hall where half the seats are filled with students looking at holographic AI tutors — each AI represented as a luminous humanoid figure made of flowing text and legal citations, warm golden classroom light mixing with cool digital blue glows, realistic photography style, ultra-wide angle

이 연구의 파급은 세 가지 층위에서 생각해볼 수 있다.

첫째, 로스쿨의 경제적 구조다. 미국 로스쿨 등록금은 연간 6만~8만 달러에 달한다. 교수 1인당 학생 비율이 낮고, 오피스아워 접근성이 제한적인 것이 현실이다. AI 튜터가 언제든 수준 높은 답변을 제공할 수 있다면, 수업료 대비 가치 논쟁이 불가피해진다.

둘째, 한국 법학교육에 대한 시사점이다. 국내 법학전문대학원(로스쿨)은 2009년 도입 이후 고비용 구조와 강사 수급 불균형 문제를 안고 있다. AI 기반 튜터링이 보조 도구로 공식화된다면, 지방 로스쿨이나 중소형 기관의 교육 격차를 줄이는 실질적 수단이 될 수 있다.

셋째, AI 신뢰성 논쟁의 전환점이다. "AI는 사실을 그럴듯하게 지어낸다"는 할루시네이션 비판은 여전히 유효하다. 그러나 이번 연구팀은 AI 답변을 인간 답변과 길이·구조를 맞춰 calibration하고, 오해 가능성을 별도로 평가하는 등 엄격한 방법론을 적용했다. 그 조건에서도 AI가 우위를 보였다는 것은 단순히 "더 길고 그럴듯한 답변"을 쓴 게 아님을 의미한다.


지금 당장 주목해야 할 신호

이 연구는 발표(2026년 6월)로 끝나는 이슈가 아니다. 다음 지표들을 추적하면 이 흐름이 어디로 가는지 파악할 수 있다.

스탠퍼드 liftlab의 후속 연구 발표 여부를 확인하라. 이번 연구는 계약법 단일 과목에 한정됐다. 헌법, 형사법, 국제법 등 더 복잡한 영역으로 확장될 경우 결과가 달라질 수 있다. 반대로 유사한 결과가 반복된다면 AI 법학 튜터의 상용화는 현실적 논의 단계에 진입한다.

미국 ABA(법학교육인증위원회)와 한국 법학전문대학원협의회의 AI 교육 도구 관련 가이드라인 논의가 언제 시작되는지 보라. 인증 기관이 AI 활용을 공식 교육 자원으로 인정하거나 제한하는 결정이 나오는 시점이 실질적 전환점이 된다.

마지막으로 Harvey, Casetext(CoCounsel), 그리고 국내 로앤컴퍼니의 유렉스 같은 법률 AI 플랫폼들이 이 연구를 어떻게 활용하는지 보라. B2B 법률 서비스에서 B2C 법학 교육 시장으로 이들이 피벗하는 속도가 이 연구의 실질적 영향력을 가늠하는 바로미터가 된다.

태그: AI법학교육, 스탠퍼드로스쿨, LLM교육활용, 법률AI, AI튜터링

※ 본 글은 정보 제공 목적이며 특정 제품·서비스의 추천이 아닙니다.

반응형