AI가 고고학을 혁신하고 있다: 구글 AI가 2천 년 동안 읽지 못했던 헤르쿨라네움 탄화 두루마리를 해독했고, 머신러닝이 선형문자 A와 인더스 문자에 도전하고 있으며, 신경망이 손상된 예술품을 픽셀 단위로 복원한다. LiDAR + AI는 과테말라에서 478개의 마야 유적을 발견했고, 가상현실로 재현된 고대 로마는 너무 정확해서 서기 320년을 걸어 다닐 수 있다. 과거는 죽지 않았다—그냥 디버깅 중일 뿐이다.
헤르쿨라네움 돌파구: 숯에서 글자 읽기
2023년 10월. 학생들로 구성된 팀이 머신러닝으로 2천 년 된 퍼즐을 풀었다. 베수비오 챌린지는 서기 79년 폼페이를 파괴한 화산 폭발에 묻힌 탄화 두루마리의 텍스트를 읽는 사람에게 70만 달러를 제공했다.
헤르쿨라네움의 파피리 빌라에서 발견된 두루마리들은 너무 약해서 펼칠 수 없었다. 펼치면 가루가 되어버린다. 수세기 동안 그것들은 읽히지 않은 채 놓여 있었다: 숯 속에 갇힌 고대 지식.
AI 솔루션
연구자들은 두루마리를 3D로 CT 스캔해 모든 층을 캡처했다. 하지만 잉크가 탄소 기반이라 X-레이에서는 보이지 않았다(금속 기반 로마 잉크와 달리). 딥러닝이 등장한다:
- 작은 펼쳐진 조각으로 훈련된 잉크 감지 모델
- 입체 분석을 사용한 가상 펼치기
- 20개 이상의 파피루스 층을 분리하는 세분화 알고리즘
- 미세한 표면 질감 변화에서 글자를 추론하는 텍스트 인식
결과: AI가 쾌락, 음악, 에피쿠로스 철학에 관한 연속된 구절을 읽었다. 한 두루마리는 희소성이 즐거움에 미치는 영향에 대해 논했다—그리스 철학자 필로데모스가 쓴 것이다. "읽을 수 없는" 숯에서 2천 자 이상 해독됐다.
이건 OCR이 아니다. 질감 기반 추론이다—AI는 고대 잉크가 고해상도 3D 스캔에서만 감지 가능한 미세한 표면 변화를 남긴다는 걸 학습했다. 인간의 눈은 볼 수 없었다. 신경망은 볼 수 있었다.
"해독 불가능한" 문자 해독하기
일부 고대 언어는 한 세기 넘게 인간 언어학자들을 패배시켜왔다. AI가 그걸 바꾸고 있다.
선형문자 A: 미노아 미스터리
선형문자 A(크레타, 기원전 1800-1450년)는 여전히 해독되지 않았다. 우리는 선형문자 B(그리스어)를 해독했지만, 선형문자 A는 그보다 앞서고—그리스어가 아니다. 약 1,400개의 비문만 존재하며, 대부분 회계 기록이다.
2023년 돌파구: MIT 연구자들은 신경망을 다음과 같이 훈련시켰다:
- 문자 구조의 "로제타 스톤"으로서 선형문자 B(알려진 것)
- 관련 지중해 언어의 음성 패턴
- 기호 조합의 통계 분석
AI는 선형문자 A가 루위아어(아나톨리아)와 관련된 미노아 언어를 인코딩할 수 있다고 제안했다. 잠재적 단어 경계와 문법 조사를 식별했다. 완전한 번역은 아니지만, 수십 년 만에 첫 번째 신뢰할 수 있는 가설이다.
인더스 계곡 문자: 4천 년의 침묵
인더스 계곡 문명(기원전 3300-1300년)은 약 400개의 기호가 있는 인장과 석판을 남겼다. 이중언어 텍스트는 존재하지 않는다. 그게 글자인지 단순한 상징인지 아무도 모른다.
AI 접근법:
- 엔트로피 분석: 알려진 언어 vs. 비언어적 시스템과 기호 무작위성 비교
- 마르코프 모델: 다음 기호 확률 예측
- 패턴 인식: 이름, 장소 또는 신일 수 있는 반복 시퀀스 식별
논란: 일부 AI 연구는 문자가 언어적이라고 주장했다; 다른 연구는 원시 문자라고 주장했다. 논쟁은 계속되지만, AI는 이전에는 순전히 추측이었던 가설을 테스트할 정량적 증거를 제공했다.
가상 재구성: 사실적 역사
고고학자들은 파편을 발굴한다. AI는 전체 신전을 짓는다.
로마 재탄생
로마 재탄생(버지니아 대학교)은 다음을 사용해 전성기(서기 320년경)의 고대 로마를 재현했다:
- 고고학적 조사
- 역사 텍스트(플리니우스, 비트루비우스)
- 살아남은 로마 구조물로 훈련된 머신러닝
AI 기여:
- 예측 모델링: 건축 패턴에서 누락된 섹션 추론
- 스타일 전이: 재구성된 표면에 진정한 로마 장식 스타일 적용
- 인구 시뮬레이션: 로마 사회 규범에 따라 행동하는 5만 명 이상의 AI 캐릭터
포럼을 걸어 다니고, 검투사가 콜로세움에 들어가는 걸 보고, 콜로세움이 지어진 곳에 서 있던 네로의 거상(30m 높이 조각상)을 볼 수 있다. 모든 타일, 모든 기둥, 실제 데이터나 맥락에서 AI가 추론한 정보로 만들어졌다.
앙코르와트의 숨겨진 도시
LiDAR + AI는 앙코르와트(캄보디아)가 단순한 사원이 아니라 정글 나무 아래 숨겨진 광대한 도시 단지의 중심이었다는 걸 밝혀냈다.
- 항공기의 LiDAR 스캔이 식생을 관통해 지형도 생성
- 딥러닝이 도로, 운하, 건물 기초의 희미한 흔적 식별
- 패턴 인식이 인간이 만든 구조물과 자연 지형 구별
발견: 74km²의 문서화되지 않은 도시 경관을 가진 정교한 물 관리 시스템. 크메르 제국의 수력 공학은 우리 생각보다 훨씬 더 발전했다.
위성 고고학: 잃어버린 도시 찾기
AI는 오래된 텍스트만 읽지 않는다—우리가 몰랐던 전체 문명을 찾아낸다.
과테말라의 숨겨진 마야 도시
2018년: 컨소시엄이 LiDAR + AI를 사용해 과테말라 정글 2,100km²를 스캔했다. AI가 인간 분석가에게 보이지 않는 희미한 고도 변화를 감지했다.
결과: 이전에 알려지지 않은 6만 개 이상의 구조물, 포함:
- 478개의 마야 유적
- 방어 요새
- 농업 단지
- 관개 시스템
마야 인구 추정치가 3배 증가했다. 우리는 빙산의 일각만 보고 있었다—대부분의 문명이 나무 아래에 있었다.
이집트의 열화상 AI
NASA + AI가 이집트의 열화상 위성 이미지를 분석했다. 다른 재료는 열을 다르게 보유한다—석조 구조물은 모래보다 오래 따뜻하게 유지된다.
알려진 유적으로 훈련된 딥러닝이 고대 이집트 건축물이 열적으로 어떻게 보이는지 학습했다. 그런 다음 전국을 스캔했다.
발견:
- 17개의 매장된 피라미드
- 3,000개 이상의 고대 정착지
- 1,000개 이상의 잃어버린 무덤
일부는 수천 년 전에 약탈당했지만, AI는 지하 온도 이상을 감지해 찾아냈다—약탈당한 방이 남긴 공백.
예술 복원: 픽셀로서의 고고학
손상된 그림, 침식된 프레스코, 불완전한 모자이크—AI는 복원가의 새로운 도구상자다.
야경
렘브란트의 야경은 1715년에 더 작은 벽에 맞추기 위해 잘렸다. 조각들은 영원히 사라졌다—또는 그렇게 생각했다.
2021년: 레이크스뮤지엄이 렘브란트의 스타일로 훈련된 **GAN(생성적 적대 신경망)**을 사용해:
- 살아남은 조각과 17세기 복사본 분석
- 렘브란트의 붓놀림 스타일로 누락된 섹션 생성
- 물리적 확장을 인쇄하고 (제거 가능하게) 다시 부착
AI는 "추측"하지 않았다—346점의 그림에서 렘브란트의 조명, 구성, 해부학적 비율을 학습했다. 재구성된 섹션은 그럴듯한 렘브란트로, 박물관이 전시할 만큼 충분히 좋다.
피카소의 숨겨진 초상화
X-레이는 피카소가 이전 작품 위에 덧칠했다는 걸 보여준다. AI + 분광 이미징이 아래 그림을 재구성했다—피카소가 덮은 초상화를 볼 수 있게 해준다.
신경망은 다음으로 훈련됐다:
- 같은 시기의 피카소의 알려진 작품
- 안료 분광학(어디에 어떤 색이 있었는지)
- 붓놀림 분석
결과: 피카소의 창작 과정에 대한 통찰을 제공하는 숨겨진 초상화의 재구성. 우리는 본질적으로 걸작을 "언페인팅"해 예술가의 버려진 아이디어를 보고 있다.
AI 연대 측정: 언제 만들어졌나?
방사성 탄소 연대 측정은 비싸고 샘플 파괴가 필요하다. AI는 비침습적 대안을 제공한다.
도자기 연대 측정
도자기 데이터베이스로 훈련된 딥러닝이 다음에서 도자기 연대를 측정하는 방법을 학습한다:
- 형태 프로필
- 장식 스타일
- (사진에서) 점토 구성
정확도: 그리스 도자기(기원전 700년 - 서기 300년)에 대해 ±50년 이내. 방사성 탄소만큼 정확하지 않지만, 즉각적이고, 비파괴적이며, 저렴하다.
역사 사진 분석
날짜가 기록된 사진 컬렉션으로 훈련된 AI는 다음에서 사진이 언제 찍혔는지 추정할 수 있다:
- 패션 스타일
- 프레임에 보이는 차량 모델
- 건축 세부사항
- 필름 그레인 패턴(시대마다 다른 화학 사용)
사용 사례: 메타데이터가 없는 문서화되지 않은 역사 아카이브 연대 측정—특히 식민지 시대 사진에 유용.
AI 고고학의 윤리
재구성된 유산은 누가 소유하나?
AI가 파괴된 조각상을 재구성하면 누가 저작권을 소유하나? 고고학자? AI 회사? 후손 문화?
예시: ISIS가 팔미라의 조각상을 파괴했다. 연구자들이 조각을 3D 스캔하고 AI를 사용해 재구성했다. 시리아는 재건을 원한다; 일부 학자들은 복제품이 원래 손실을 모독한다고 주장한다.
알고리즘 편향
주로 그리스-로마 및 이집트 고고학으로 훈련된 AI는 비서구 유적을 잘못 해석할 수 있다. 대부분의 고고학 AI 연구는 "유명한" 문명에 초점을 맞춰—식민지적 시선을 강화한다.
위험: AI가 유럽의 미학적 가정에 따라 원주민 유적을 "복원"해 진정한 문화적 맥락을 지울 수 있다.
보물 사냥꾼 남용
약탈자들은 위성 AI를 사용해 고고학자들이 합법적으로 발굴할 수 있는 것보다 더 빨리 보호되지 않은 유적을 찾을 수 있다. 일부 연구자들은 이를 방지하기 위해 출판물에서 정확한 위치 데이터를 보류한다.
미래: 규모의 고고학
AI 워크플로우(2026년 이후)
- 위성 스캔 → AI가 잠재적 유적 표시
- LiDAR 드론 → 3D 표면 매핑
- 지하 투과 레이더 → AI가 지하에 있는 것 예측
- 선택적 발굴 → 인간이 AI가 말하는 곳을 팜
- 실시간 유물 ID → AI가 현장에서 물체 연대 측정
- 가상 재구성 → 물리적 복원 전에 대중이 탐험 가능
영향: 고고학이 10배 가속화된다. 수십 년이 아니라 몇 달 안에 전국을 조사할 수 있다.
민주화 문제
관광 vs. 보존. AI가 마추픽추를 1mm 정확도로 VR로 재구성하면, 물리적 유적에 대한 압력이 줄어들까—아니면 "진짜"를 보려는 수요가 증가할까?
역설: 완벽한 가상 접근이 취약한 유적을 구할 수도 있다... 또는 착취를 정당화할 수도 있다("백업이 있으니까").
왜 중요한가
해독되지 않은 모든 문자는 인류에 대한 잃어버린 관점이다. 파괴된 모든 사원은 지식을 담고 있었다—의학, 천문학, 철학—전쟁, 자연재해, 시간으로 사라진.
AI 고고학은 향수에 관한 게 아니다. 전쟁, 자연재해, 시간으로 잃어버린 인간 지식을 회복하는 것에 관한 것이다. 헤르쿨라네움 두루마리에는 잃어버린 연극, 과학 논문, 또는 로마 제국에 대해 우리가 아는 것을 다시 쓸 수 있는 역사 기록이 포함될 수 있다.
우리는 역사를 디버깅하고 있다. 그리고 스택 트레이스는 5천 년 전으로 거슬러 올라간다.
시리즈 다음 편: 고고학을 위한 양자 센싱—얽힌 입자가 삽보다 더 잘 묻힌 구조물을 감지할 수 있다는 사실이 밝혀졌다. 과학은 이상하다. 🦊