NEW 인문과학연구소, AI로 조선시대 호적대장 복원
- 디지털 역사학 연구 성과
- <사이언티픽 데이터(Scientific Data)> 12월호 게재

아주대학교 인문과학연구소 연구팀이 조선시대의 대표적 인구·사회 자료인 ‘호적대장’을 인공지능(AI) 기술을 활용해 복원했다. 역사학 빅데이터를 인공지능 도구를 활용해 연구에 필요한 정보로 정제하고 복원하는 방법을 제시했다는 점에서 디지털 역사학 연구의 중요한 성과다.
인문과학연구소(소장 이상국 사학과 교수)는 인공지능(AI) 기술을 활용해 조선시대의 대표적 인구·사회 자료인 대구부 호적대장(1681~1876)을 복원한 연구성과를 네이쳐 계열 저명 학술지 <사이언티픽 데이터(Scientific Data)> 12월호에 게재했다고 밝혔다.
해당 논문의 제목은 ‘한국 역사를 다시 엮다 : AI를 활용한 대구부 호적 복원(Reweaving the Threads of Korean History: AI-Driven Restoration of the Daegu-bu Household Registers(1681–1876))’이다. 우리 학교 인문과학연구소 이동규 연구교수와 경북대 문성민 교수(영어영문)가 공동 제1저자로 참여했고, 우리 학교 유재인 교수(금융공학)와 이상국 교수(사학)가 공동 교신저자로 참여했다.
이번 연구는 기존에 엑셀 파일 형식으로 제공되어 온 조선시대 대구부(Daegu-bu)의 호적대장 빅데이터를 활용해, 호적대장 기록에 존재하는 불완전성을 인공지능으로 추론·복원하는 방법론을 제시했다. 조선시대 호적대장은 개인과 가구, 직업과 신분, 가족 관계 등이 복합적으로 기록된 사료로, 전근대 한국 사회의 구조를 장기적으로 분석할 수 있는 핵심적 자료로 평가받아 왔다. 그러나 기록과 전승 과정에서 발생한 누락과 훼손으로 인해, 실제 연구에의 활용에는 상당한 제약과 한계가 있었다.
아주대 연구팀은 이러한 문제를 해결하기 위해 마스크 언어 모델(Masked Language Model, MLM) 기반의 인공지능 기법을 적용해, 호적 데이터의 기록과 구조를 학습시키고 누락된 정보를 확률적으로 추론·복원했다. 이는 인공지능을 활용해 전통적인 역사 사료 데이터의 불완전성을 보완하고 분석 가능성을 확장했다는 점에서 디지털 역사학 연구의 중요한 사례다.
더불어 2000년대 이후 축적되어 온 ‘역사학 빅데이터’를 인공지능 도구를 활용해 연구에 필요한 정보로 정제 및 복원하는 과정과 방법을 구체적으로 제시했다는 점에서도 의의가 있다. 복원된 대구부 호적대장의 데이터셋은 앞으로 전근대 한국 사회의 ▲인구 구조 ▲직업 구성 ▲사회 계층의 장기적 변동 등을 보다 정밀하게 분석할 수 있는 기초자료로 활용될 수 있을 전망이다.
이번 연구는 한국연구재단 <인문사회연구소 지원사업>의 일환으로 수행됐다. 아주대 연구팀은 ‘디지털 역사학의 정립과 확산(연구책임 이상국 교수)’이라는 주제로 지난 2022년부터 연구를 진행해왔다. 사업기간은 6년으로, 현재는 2단계 1년 차에 해당한다.
연구팀은 그동안 디지털 역사학과 연구방법론을 주제로 <히스토리 오브 더 패밀리(History of the Family)> 등의 국내외 학술지에 다수의 논문을 발표해 왔다. 더불어 인재 양성 측면에서도 여러 성과가 이어져, 인문과학연구소에서 연구교수로 활동한 김한신 박사가 충북대 사학과에 문성민 박사가 경북대 영어영문학과에 전임 교원으로 임용됐다.
인문과학연구소 연구팀은 앞으로도 AI 기반 역사 데이터 연구를 이어나갈 계획이다. 연구팀은 ▲전근대 한국 사회의 사회 이동성 ▲권력 구조와 불평등 ▲가문 및 가족사 등의 연구를 장기적으로 수행하기 위해 ‘HAVNet(Historical Archives Visualization Net)’이라는 데이터 허브를 구축하고 있다. 이를 통해 다양한 역사 사료를 연결하고, 인공지능 분석이 가능한 연구 인프라를 단계적으로 확장해 디지털 역사학의 방법론적 기반을 강화하고 전통 사료의 새로운 활용 가능성을 모색해 나갈 계획이다.
인문과학연구소는 또한 디지털 역사학과 인공지능 기반 연구 방법을 주제로 학부 및 대학원 교과과정을 운영하며, 연구 성과를 교육 현장으로 확산시키는 데에도 힘쓰고 있다. 이를 통해 데이터 기반 역사 연구에 대한 학생들의 이해를 높이고, 차세대 연구 인력을 체계적으로 키워내겠다는 목표다.