• 제목/요약/키워드: 문서배열

검색결과 20건 처리시간 0.024초

문서기록물의 파일링시스템에 관한 연구 (A Study on Records Filing Systems)

  • 유재옥
    • 한국비블리아학회지
    • /
    • 제16권2호
    • /
    • pp.5-24
    • /
    • 2005
  • 본 논문은 문서기록물을 대상으로 문서관리의 기초가 되는 문서의 파일링시스템의 다양한 종류와 방법을 소개하고 있다. 문서파일링시스템으로 거론되고 있는 명칭, 숫자, 지명, 주제 파일링시스템의 장단점과 특징, 적용하기에 적합한 문서의 종류, 사용방법을 설명하고 있다. 명칭파일링시스템은 인명, 상호명, 회사명, 등의 이름으로 문서를 검색하는 것이 빈번한 경우에 적합하며 반대로 문서가 기관명이나 개인명보다 장소나 위치에 의한 검색요구가 빈번할 것으로 예상될 때에는 지명파일링시스템이 선호된다. 주제 파일링시스템은 문서를 담은 폴더명을 주제명 혹은 '주제명'을 의미하는 '숫자'로 표현할 수 있는데 (1) 주제명 (alphabetic arrangement) (2) 숫자(numeric arrangement) (3) 문자와 숫자의 혼합형 (alphanumeric arrangement) (4) 분류번호(decimal arrangement) 등의 다양한 배열방법을 응용할 수 있다.

  • PDF

데이타마이닝 기법을 이용한 문서 자동 분류 모델 (An Automatic Text Classification Model using Association Rules)

  • 김영인;이진용;문현정;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.101-108
    • /
    • 2000
  • 기업에서 보유한 전문 지식 정보가 급속도로 증가함에 따라 대량의 문서에 저장된 지식 정보를 효과적으로 탐색하여 기업 경영에 활용하기 위한 지식경영시스템 도입이 확산되고 있다. 이러한 지식경영시스템에서 핵심적인 구성 요소는 전문 분야의 지식 정보를 체계적으로 분류하고 효율적으로 검색하기 위한 지식 탐사 기법이다. 본 논문에서는 데이타마이닝 기법을 이용하여 문서를 자동적으로 분류하기 위한 새로운 모델을 제안하였다. 연관 규칙 탐사 알고리즘을 이용하여 학습용 문서 집합으로부터 세부 분야를 대표하는 색인어 집합을 구성하였다. 세부 분야별 색인어 집합에 대하여 전체 문서에 대한 비중에 따라 가중치 배열을 구성하여 문서를 자동으로 분류하기 위한 기준으로 삼았다. 임의의 문서를 자동적으로 분류하는 실험을 통하여 제안된 방법의 효율성을 검정하였다.

  • PDF

통감부~일제 초기 갑오개혁과 대한제국기 공문서의 분류 - 분류도장·창고번호도장을 중심으로 - (The Classification arranged from Protectorate period to the early Japanese Colonial rule period : for Official Documents during the period from Kabo Reform to The Great Han Empire - Focusing on Classification Stamp and Warehouse Number Stamp -)

  • 박성준
    • 기록학연구
    • /
    • 제22호
    • /
    • pp.115-155
    • /
    • 2009
  • 한국이 일본에 병합되면서 갑오개혁~대한제국기 공문서는 조선총독부(朝鮮總督府)로 인계되어 과(課) 단위의 분류체계에서 부(部) 단위로 재분류되었지만, 그전에 몇 번의 재분류과정을 거쳤다. 재분류의 흔적은 갑오개혁~대한제국기 공문서철 표지에 찍힌 분류도장과 창고번호도장에서 확인된다. 분류도장에서는 '부(部)-국(局)-과(課)' 행정체계에서 과(課)를 단위로 문서철을 구분하고 분류도장을 찍고 호수를 부여하였다. 이는 대한제국기 공문서 분류체계와 동일한 것으로, 분류도장을 찍을 당시까지도 課를 단위로 한 분류체계는 유지되었다. 분류도장은 과(課) 단위로 구분하고 각 문서철에 호수를 부여하였지만, 과(課) 하위단위의 분류체계는 과(課)별로 차이가 있었다. 지세과(地稅課) 문서철은 한 호수에 여러 기관이 등장하고 문서연도는 앞뒤 호수에서 중복되었고, 같은 성격의 문서철이 따로 분류되어 있었다. 관세과(關稅課)와 잡세과(雜稅課) 문서철은 문서연도를 기준으로 편철된 두 과(課)의 편철 방식을 반영하여 문서연도를 기준으로 호수를 부여한 것으로 보여지지만, 문서연도와 'イロハ 가(歌)' 순서가 맞지 않았다. 갑오개혁~대한제국기에는 공문서를 과(課) 단위로 편철하였지만, 課 하위단위의 분류규정이 없어 분류도장의 문서철 분류를 대한제국기 공문서 분류체계의 원질서로 파악할 수 있는가의 여부는 명확하지 않다. 그러나 편철 방식은 문서 분류체계를 반영하므로, 편철 방식을 통해 대한제국기 과(課) 하위단위의 분류체계를 추론해 본다면, 분류체계는 '과(課) - 거래기관'과 '과(課) - 문서연도' 두 체계로 구분되었을 것으로 이해된다. 조선총독부는 대한제국기 공문서를 인계받고 창고에 보관하면서, 각 문서철에 창고번호도장을 찍었다. 창고번호도장은 대체적으로 각 창고별로 문서를 편철한 기관을 구분하여 문서철을 보관하였다. 각 창고의 서가에도 대체적으로 분류도장 호수 순으로 문서철을 배열하였지만, 일부 문서철은 호수가 뒤섞여 서가에 배열되어 서가와 호수 순서가 맞지 않았다. 서가에 문서철을 배열한 다음 각 문서철에 'イロハ 가(歌)' 순으로 기호를 부여했지만, 기호 역시 호수 순으로 부여된 것은 아니었다. 조선총독부가 각 창고에 문서철을 보관하는 과정에서 분류도장의 분류체계가 해체되고 있었던 것이다. 창고번호도장에서 나타난 특징 가운데 하나는 분류도장에서 각 문서철에 부여한 보존기간의 의미가 사라지고 있다는 점이다. 보존기간은 해당 문서가 지닌 역사적 행정적 가치에 따라 결정된다. 그런데 창고번호도장에서는 보존기간의 구분 없이 같은 서가에 보존기간이 다른 문서철을 뒤섞어 함께 배열하였다. 일본은 한국을 병합하면서 대한제국기 공문서를 일정 기간이 지난 뒤 폐기해야 할 행정 문서가 아니라, 식민 통치에 필요한 '고고(考古)의 재료(材料)'로 취급하였다. 일반 행정문서에서 식민 통치에 필요한 재료로 문서의 가치 평가가 전환되면서, 문서철에 부여된 보존기간에 상관없이 대한제국기 공문서를 모두 동일한 대상으로 취급하여 함께 보관하였던 것이다. 조선총독부는 식민 통치에 필요한 재료로 활용하기 위해 갑오개혁~대한제국기 공문서를 재정리하면서 부(部)를 단위로 재분류함으로써 대한제국기의 과(課)를 단위로 한 기관별 분류체계와 그 속에 포함되어 있던 기능별 분류의 성격도 해체하였다.

문서세단기의 커터날 형상, 크기, 배열과 절단특성에 관한 연구 (The Study on Cutting Characteristic according to a Shape, Size and Array of Cutter for Paper Shredder)

  • 이위로;이동규;김민호
    • 한국정밀공학회지
    • /
    • 제23권1호
    • /
    • pp.56-63
    • /
    • 2006
  • The aim of this study is to find the best cutting conditions as analyzing cutting process of paper shredder and shape of cutter. The test has been done variation of torque and cutting velocity according to load. When shape of cutter and distance between cutter and shaft are changed, The variation of cutting force according to cutting angle and load is geometrically analyzed. The result of geometrical analysis is presented that the radius and array of cutter is the method to improve torque of paper shredder. In this paper it is presented as basic method of design to improve cutting performance of paper shredder.

속성문법을 이용한 필기체 한글 문서 내의 자모인식 (The Recognition of Vowels and Consonants in a Handwritten Hangul Text with Attributed Grammars)

  • 유승필;김태균
    • 대한전자공학회논문지
    • /
    • 제26권3호
    • /
    • pp.85-94
    • /
    • 1989
  • 글자의 간격과 크기가 일정하지 않으므로 전처리 과정에서 각 글자를 분리하기 어려운 필기체 한글 문서로 부터 자모들을 인식하는 방법을 제안한다. 본 방법은 세선화된 필기체 한글문서의 영상 내에 있는 모든 글자들을 스트로크들로 변환시키고, 이들 사이의 배열관계를 나타내는 속성을 추출한 다음, 이들 스트로크와 속성들에 대해 속성문법을 적용하여 자모들을 인식한다.

  • PDF

카메라 문서 영상의 이진화 및 기울어짐 보정 방법 (A Method for Thresholding and Correction of Skew in Camera Document Images)

  • 장대근;전병태
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.143-150
    • /
    • 2005
  • 카메라 영상은 조명에 매우 민감하다. 그 결과 문자 인식을 매우 어렵게 만든다. 또한 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 비네팅현상이 발생하며 카메라와 피사체간의 위치와 각도의 불일치에 의해 기학적 왜곡이 발생한다. 비네팅 효과에 의한 문자분리의 어려움과 기하학적 왜곡으로 인한 문자모양의 변형으로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 양선형 변환을 이용하여 카메라로 획득한 문서영상의 기하학적 왜곡을 보정함으로써 문자인식 성능을 향상시킬 수 있는 방법을 제안한다. 기존에는 카메라의 위치정보 없이 기하하적 왜곡을 보정하기 어려웠으나 제안한 방법은 이진화한 문서영상을 대상으로 문자와 문자줄을 추출하여 상하로는 문자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

  • PDF

자화 인식 시스템에 관한 연구 (The Study for the Recognition System of Finger Languages)

  • 강민지;최은숙;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.151-154
    • /
    • 2003
  • 본 논문에서는 흑백 CCD 카메라를 이용하여 청각 장애인의 의사전달 수단인 지화 동작을 동영상으로 입력받아 인식하여, 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다. 일련의 입력 영상들 중에서 흐린 영상과 선명한 영상의 구분은 영상의 잔상을 이용하였고, 촬영된 연속 영상들의 배열로부터 문자 자소를 구하고, 오토마타를 적용하여 완성된 문자를 문서 편집기에 출력시켰다 획득된 선명한 영상 데이터 중 변화가 심한 손목 부분을 제거한 후, 최대 원형 이동법을 이용하여 손의 무게 중심점을 구하고, 원형 패턴 벡터 알고리즘을 적용하여 지화 해석에 필요한 손을 인식하였다. 손 중심으로부터 거리 스펙트럼을 이용하여 지화 인식에 사용되는 손 모양의 특징 벡터를 추출하고, 퍼지추론을 적용하여 표준 패턴과 입력 패턴의 특징벡터를 비교, 지화 동작을 인식하였다.

  • PDF

전문용어 탐지와 해석 모델: 한국어 의학용어 중심으로 (Detecting and Interpreting Terms: Focusing Korean Medical Terms)

  • 염하람;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.407-411
    • /
    • 2022
  • 최근 COVID-19로 인해 대중의 의학 분야 관심이 증가하고 있다. 대부분의 의학문서는 전문용어인 의학용어로 구성되어 있어 대중이 이를 보고 이해하기에 어려움이 있다. 의학용어를 쉬운 뜻으로 풀이하는 모델을 이용한다면 대중이 의학 문서를 쉽게 이해할 수 있을 것이다. 이런 문제를 완화하기 위해서 본 논문에서는 Transformer 기반 번역 모델을 이용한 의학용어 탐지 및 해석 모델을 제안한다. 번역 모델에 적용하기 위해 병렬말뭉치가 필요하다. 본 논문에서는 다음과 같은 방법으로 병렬말뭉치를 구축한다: 1) 의학용어 사전을 구축한다. 2) 의학 드라마의 자막으로부터 의학용어를 찾아서 그 뜻풀이로 대체한다. 3) 원자막과 뜻풀이가 포함된 자막을 나란히 배열한다. 구축된 병렬말뭉치를 이용해서 Transformer 번역모델에 적용하여 전문용어를 찾아서 해석하는 모델을 구축한다. 각 문장은 음절 단위로 나뉘어 사전학습 된 KoCharELECTRA를 이용해서 임베딩한다. 제안된 모델은 약 69.3%의 어절단위 BLEU 점수를 보였다. 제안된 의학용어 해석기를 통해 대중이 의학문서를 좀 더 쉽게 접근할 수 있을 것이다.

  • PDF

언어모델을 활용한 문서 내 발화자 예측 분류 모델 (Speaker classification and prediction with language model)

  • 김경민;한승규;서재형;이찬희;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.317-320
    • /
    • 2020
  • 연설문은 구어체와 문어체 두 가지 특성을 모두 갖고 있는 복합적인 데이터 형태이다. 발화자의 문장 표현, 배열, 그리고 결합에 따라 그 구조가 다르기 때문에, 화자 별 갖는 문체적 특성 또한 모두 다르다. 국정을 다루는 정치인들의 연설문은 국정 현황을 포함한 다양한 주요 문제점을 다룬다. 그러면 발화자의 문서 내 문체적 특성을 고려할 경우, 해당 문서가 어느 정치인의 연설문인지 파악 할 수 있는가? 본 연구에서는 대한민국 정책 브리핑 사이트로부터 한국어 기반 사전 학습된 언어 모델을 활용하여 연설문에 대한 미세조정을 진행함으로써 발화자 예측 분류 모델을 생성하고, 그 가능성을 입증하고자 한다. 본 연구는 5-cross validation으로 모델 성능을 평가하였고 KoBERT, KoGPT2 모델에서 각각 90.22%, 84.41% 정확도를 보였다.

  • PDF

카메라 획득 문서영상에서의 글자모양 왜곡보정 (Character Shape Distortion Correction of Camera Acquired Document Images)

  • 장대근;김의정
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.680-686
    • /
    • 2006
  • 스캐너로 획득한 문서영상을 대상으로 문자인식을 하는 경우와 달리 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 카메라 렌즈의 특성과 카메라와 피사체간의 위치와 각도의 불일치에 의해 글자모양의 왜곡이 발생한다. 따라서 이러한 왜곡들로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 문서 영상을 카메라로 획득할 때 발생하는 3차원의 비선형적 왜곡을 2차원의 선형 변환을 이용하여 근사화함으로써 왜곡된 글자모양을 교정한다. 또한 변환과정에서 글자와 글자줄을 추출하여 상하로는 글자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 왜곡으로 인해 사변형 형태로 변형된 글자영역 즉 변환영역을 자동으로 설정함으로써 부가적인 정보의 획득 없이 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.