본문 바로가기주메뉴 바로가기하단 바로가기
한국국학진흥원
한자를 인식중이며
1초 정도소요됩니다.
이미지의 용량과 인터넷 사정에 따라 시간이 더 걸릴 수 있습니다.
한문 고도서 원문

인쇄본

여기에 파일을 놓으세요
20Mb 이상의 이미지 파일은 속도를 저하시킬 수 있습니다. 이미지 형식은 jpg, png를 지원합니다.
한자 텍스트
이용제한 알림

고도서 한자 인식 서비스를 이용할 수 없습니다.

확인
도움말 팝업창 입니다.
도움말
본 서비스는 Windows 11 환경에 최적화되어 있습니다.
Internet Explorer에서는 일부 기능이 동작하지 않을 수 있습니다.
본 서비스는 Chrome, Safari, Naver Whale, Microsoft Edge, FireFox, Opera 브라우저에 최적화된 서비스입니다.
본 서비스는 인공지능 학습용 데이터의 딥러닝을 통해 도출된 ‘고도서 한자 인식(OCR) 인공지능 모델’을 활용하여 고도서 이미지 내의 한자를 인식한 후 한자 텍스트로 변환해 줍니다.
본 서비스에서 제공하는 ‘고도서 한자 인식(OCR) 인공지능 모델’은 초기 모델로서 사용자가 선택한 고도서 이미지 내에서 인식하지 못하거나 다르게 인식하는 한자가 있을 수 있습니다.
본 서비스에서 제공하는 ‘고도서 한자 인식(OCR) 인공지능 모델’은 고도서에서 일반적인 세로쓰기(오른쪽에서 왼쪽. 세로 10줄) 형태로 인출(목판,석판,연활자 등)된 조선시대 문집류 고도서들을 학습하여 개발되었기 때문에 가로쓰기나 세로 10줄 이상의 형태로 제작된 고문헌은 인식하지 못하거나 인식률이 낮을 수 있습니다.
본 서비스에서 제공하는 ‘고도서 한자 인식(OCR) 인공지능 모델’은 ‘해서체‘와 ‘행서체’ 한자를 주로 학습하여 개발되었기 때문에 흘림체인 초서체나 기타 다른 서체(전서체, 예서체 등)로 제작된 고도서는 인식하지 못하거나 인식률이 낮을 수 있습니다.
본 서비스의 고도서 한자 인식 및 변환에는 평균 1초 정도가 소요되지만, 이용 환경에 따라 시간이 더 걸릴 수도 있습니다.
본 서비스는 한 번에 고도서 이미지 1면씩을 한자 텍스트로 인식·변환할 수 있습니다.
고도서 이미지가 왜곡(기울어짐, 돌아감 등)되지 않고, 밝고 선명할수록 인식률이 더 좋아집니다.
이용 가능한 이미지 파일 포맷은 JPEG, PNG이며 컬러보다는 흑백 이미지를 더 잘 인식합니다.
이미지 URL을 입력하여 OCR을 이용할 수 있으며, 이때는 이미지 제공 웹서비스의 주소가 아닌 해당 이미지 자체의 주소를 입력해야 합니다.
첫 번째 창에는 사용자가 선택한 이미지 파일이 보입니다. OCR 결과 화면에서 마우스를 드래그하거나 마우스 휠을 돌리면 확대, 축소가 가능합니다.
두 번째 창에는 인식·변환된 한자 텍스트가 보입니다.
음훈 정보는 한국학중앙연구원 '유니코드 한자시스템'을 기반으로 한 데이터입니다. 선택한 한자가 이체자이거나 신출자인 경우 '음훈 정보 없음'으로 출력됩니다.
인공지능 OCR을 통해 인식·변환된 한자 텍스트는 직접 화면에서 복사하거나 TXT 파일로 다운로드할 수 있습니다.
본 서비스는 시범서비스로서 하루에 5회까지 이용할 수 있습니다.
인공지능 문자인식 학습용 데이터의 원시데이터 제공기관 :
국사편찬위원회, 규장각한국학연구원, 한국학중앙연구원, 한국고전번역원
도움말 팝업창 닫기