토대 |
근대한국학 DB 자료의 수집, 디지털화(Digitalizing) 트랙1) 지식DB 구축을 통한 한국학 지식기반의 체계화를 위해 |
방법 |
한국학 DB 모델의 구성, 디지털 아카이브(Digital Archive) 구축 트랙2) 20세기 한국학 연구의 메타 분석 연구 활동을 심화할 수 있는 DB 모델을 구성하고, 미공개 자료의 디지털화를 통해 ‘디지털 아카이브(Digital Archive)’를 구축하여 한국학 연구자들과 일반 대중이 자유롭고 편리하게 활용할 수 있는 서비스 제공 |
목표 |
‘디지털 한국학’의 선도 기관 한국학의 메타 분석에 적합한 DB 모델을 구성하고, 방대하고 유용한 ‘디지털 아카이브를 구축하여 제공함으로써 근대한국학연구소가 ‘디지털 한국학’을 선도하는 기관으로 자리매김 |
구분 | 실적 | 주요내용 | 비고 |
미공개 자료 원문/복사본 확보 |
• 단행본: 35종 • 정기간행물: 4종 |
고전적 종합목록을 스크린하여 1860~1899년 사이 발간된 단행본 35종의 원문/복사본 확보. 1860년부터 1899년 사이 발간된 미공개 정기간행물로서 [한성신보], [시사총보], [친목회회보]의 원문/복사본 확보. 2차년도 대상 신문 자료로서 미공개 [제국신문]의 원문 확보. |
1차년도 ‘근대한국한 자료총서’ |
미공개 자료의 촬영 및 보정 |
• 미공개 자료 원본 촬영 (176책) |
연세대학교 국학자료실 소장 미공개 한국학 자료의 176책 촬영 및 보정. ‘디지털 아카이브(Digital Archive)’ 구축 준비 |
|
원문 텍스트 구축 | • [시사총보] • [한성신보] • [친목회 회보] |
DB 구축 방법의 모색을 위해 ‘파일럿(pilot) 프로그램’ 실행 [시사총보](제1호~제100호): ‘논설’ 원문 입력 → 교정 단계 [한성신보](1895~1899): ‘논설’ 원문 입력 → 1차 입력 완료단계 [친목회회보](제1호~제6호): 원문 전문 입력 → 1차 입력 완료단계 |
2차년도 ‘근대한국학 자료총서’ |
자료 디지털화의 전문화, 대량화 추진 |
한말~일제초기 발간 • 일반간행물 31종 (총6,230면/약156만 글자) • 잡지 12종, 107책 (총8116면/약333만 글자) |
한국학 자료 전산화 전문 업체를 선정 타 기관 한국학 DB에 입력되어 있지 않은 『西遊見聞』(유길준, 1895) 등 한말에 간행된 단행본 31종 대상(총6,230면/약 1,56만자) 타 기관 한국학 DB에 구축되어 있지 않은 한말~일제초 발간된 잡지 12종 대상(총 책수 107책/면수 8,116면/약 3,33만자) 대규모 디지털화 사업 실행 |
8월말 사업 계약 체결 예정 |
수차례에 걸친 전문가 초빙 학술행사와 자문회의 결과 등을 토대로 우수한 디지털 컬렉션의 구축과 적극적인 관리, 지속가능한 디지털 객체의 아카이빙과 디지털 보존을 위해서 관계형 데이터베이스 구조(RDBMS)가 가능하고, 더블린코어 메타데이터에 기반한 디지털 자료의 저장을 통해 디지털 컬렉션의 공유와 검색이 가능하도록 지식베이스를 구축하여 검색과 공유를 확산시킬 계획
지식베이스에 축적된 디지털 컬렉션을 바탕으로 근대한국학의 연구주제, 핵심개념, 연구주체, 지식정보의 분포 등을 분석하여 한국학 연구지형을 성찰할 수 있는 토대를 마련할 것임. 지식베이스에 축적된 디지털 자료는 대부분이 비정형 텍스트 자료이기 때문에 자연어 처리(Natural language processing, NLP), 개체명 인식(Named entity recognition, NER)을 통한 개체명 사전 구축(색인 DB 구축), 연관어 네트워크 구축을 통한 지식 데이터 관계 분석 등 텍스트 마이닝(Text Mining) 기법을 적극 활용할 예정
신규 한국학 자료의 디지털화 대상과 방법을 다음과 같이 확정함.
구분 | 자료명 | 대상자료현황 | DB 구축방식 |
근대 한국학 기초자료 DB |
한말 일제하 일반간행물 |
연세대학교 국학자료실, 국립중앙도서관 소장 개화기 관련 단행본 자료 『서유견문』(유길준, 1895) 등 한말 간행 단행본 31종 대상(총 면수 6,230면) 평균면수 200면, 평균면당 글자수 250자 예상글자수 1,560,000자 |
원문 전체 디지털화 |
한말 일제하 잡지간행물 |
연세대학교 국학자료실 및 기출판 잡지 중 국사편찬위원회 한국사데이터 등 한국학관련 디지털 자료 중 미작업분 근대한국학 관련 주요 학회의 잡지 12종 대상(총 책수 107책, 면수 8,116면) 평균면수 90면, 평균 면당 글자수 410자 예상글자수 3,330,000자 |
원문 전체 디지털화 |