• 제목/요약/키워드: 전문용어 사전

검색결과 89건 처리시간 0.026초

국방과학기술 전문용어 사전 구축을 위한 프로세스 및 워크벤치 개발 (Science and Technology Terminology Dictionary Building Process and Workbench Development in Defense Area)

  • 최중환;박정호;김경선;김평
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.420-428
    • /
    • 2012
  • 용어 의미 표준화를 통한 업무의 효율성을 높이기 위해서 다양한 분야에서 전문용어가 구축 활용되고 있으며, 국방분야에서도 국방용어 사전 발간을 통해 각 군의 효율적인 업무 연계 및 표준화된 국방 용어 유통체계를 정립하는데 노력하고 있다. 국방기술품질원에서도 3년을 주기로 국방과학기술분야의 전문용어 사전을 발간함으로써 전문용어 구축 표준화 연구는 물론, 전문용어의 활용성 제고에 힘쓰고 있다. 본 연구에서는 국방기술품질원에서 전문용어 사전을 실제로 구축하는데 필요한 구축 프로세스와 조직, 이를 지원하기 위한 워크벤치에 대해서 기술하고 있다. 즉, 국방과학기술 전문용어 사전을 구축하기 위한 전문용어 사전구축 프로세스 및 조직의 구성, 표제어 정의, 전문용어 후보 추출을 위한 대상 문서의 선정, 전문용어 후보추출, 전문용어 후보군 생성, 워크벤치 등록, 사전 구축, 사전 검증 과정에 대해서 설명하고 있다, 또한 전문 용어 사전의 활용성 제고를 위해서 시소러스를 구축 활용하는 내용은 물론, 전문용어 사전 구축을 위해서 개발된 워크벤치의 기능을 중심으로 효율적인 전문용어 사전 구축 지원 방법에 대해서도 기술한다.

전문용어사전의 미시구조에 관한 연구 (A Study on the Microstructure of Terminological Dictionaries)

  • 김성진;정동열
    • 한국문헌정보학회지
    • /
    • 제35권1호
    • /
    • pp.143-162
    • /
    • 2001
  • 학문의 발전으로 새로운 개념의 생성과 함께 전문용어가 급증함에 따라 이를 체계적으로 집성하여 관리하고자 하는 필요성이 대두되고 있다. 본 연구는 전문용어사전에서 전문용어의 체계적이고 효율적인 뜻풀이를 위한 미시구조를 제안하고자 한다. 이를 위해 전문용어사전과 밀접한 관계를 맺고 있는 전문용어와 사전편찬학의 이론을 바탕으로 전문용어기술학의 특성 혹은 차이점을 살펴보고, 현행 전문용어사전의 미시구조를 분석하여 문제점을 파악한 후, 형태론적 측면과 방법론적 측면에서 미시구조에 대한 개선방안을 제안하였다.

  • PDF

트라이와 구간트리를 이용한 사전기반 전문용어 인식 속도 향상 (Improving Speed for Dictionary-Based Term Recognition Using Trie and Interval Tree)

  • 김형철;김재훈;최윤수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.191-193
    • /
    • 2010
  • 전문용어는 특정 분야의 문서들에서 그 분야 특징을 반영하는 용어를 지칭하는 말로 최근 이러한 전문용어를 자동으로 인식하는 연구들이 활발하게 이루어지고 있다. 본 논문에서는 전문용어 인식의 방법 중 규칙 기반 방법의 한 종류인 사전 기반 방법을 이용하여 전문용어를 인식한다. 사전 기반 방법의 보통 다음과 같은 문제점이 있다. 첫째 같은 의미를 가지지만 형태가 다른 전문용어의 인식이 어려우며, 둘째 정확한 경계를 인식하기 위해서는 모든 단어에 대해 사전에 존재하는 가장 긴 단어의 크기만큼 매칭을 시도해야하며, 셋째 인식된 경계가 겹칠 수 있다는 문제점이 있다. 본 논문에서는 사전 매칭시 정규표현을 이용하여 첫 번째 문제를 해결하며, 트라이를 이용하여 사전을 구축하고, 매칭시 스택을 이용한 병렬구조를 사용하여 두 번째 문제를 해결하였으며, 구간트리라는 자료구조를 이용하여 세 번째 문제를 해결하였다.

  • PDF

국방분야 전문용어 사전 및 워크벤치 개발 (The Construction of Terminology Dictionary and Workbench in Defense Area)

  • 최중환;박정호;김경선;김평
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.67-68
    • /
    • 2012
  • 국방분야에서는 국방용어 사전 발간을 통해 각군의 효율적인 업무 연계 및 표준화된 국방 용어 유통 체계를 정립하는데 노력하고 있다. 국방기술품질원에서도 국방 과학기술 분야의 전문용어 사전 발간을 통해 각군의 과학기술 용어를 표준화함으로써 업무 연계 및 효율성 제고에 노력하고 있다. 본 연구에서는 전문용어 사전 구축 표준화 프로세스를 준용해서 국방 과학기술 전문용어 사전의 후보 용어 선정부터 정제, 시소러스 구축, 검수에 이르는 전주기 과정에 대한 실제 구축 내용을 기술하고 있다. 또한 전문용어 사전의 효율적 구축 및 관리를 위해 개발된 워크벤치의 기능을 중심으로 용어 선정, 정보 입력, 관리 기능을 기술하고 한다.

  • PDF

분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출 (Automatic Term Recognition using Domain Similarity and Statistical Methods)

  • 오종훈;이경순;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.258-269
    • /
    • 2002
  • 지금까지 전문용어를 자동으로 추출 (Automatic Term Recognition: ATR)하기 위한 많은 연구들이 있어 왔다. 이들 연구들은 주로 문서 내의 용어의 빈도수와 같은 단순한 통계정보를 이용하여 전문용어를 추출하였다. 하지만 전문분야의 기계가독형 사전의 구축으로 인하여 전문용어를 추출하는 데 있어 전문분야 사전의 사용이 가능하게 되었다. 본 논문에서는 이러한 기계가독형 전문분야 사전들을 이용하여 사전 간의 계층관계를 구축하고 이를 이용하여 전문용어를 추출하는 방법을 제시한다. 또한 전문용어 사전에서 나타나지 않는 전문용어를 추출하기 위하여 용어의 빈도수, 외래어 및 외국어, 내포관계 등을 포함한 통계기법을 이용한다. 본 논문에서 제안하는 기법은 기존의 방법에 비해 좋은 성능을 나타내었다.

전문용어사전 구축을 위한 전문용어 추출 및 순위화 (Term Extraction and Ranking for Building Term Dictionary)

  • 구희관;정한민;이병희;성원경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.745-748
    • /
    • 2005
  • 전문용어는 특정 분야의 전문가 사이에서 통용되는 표현 매체이며, 일반용어에 비해 생성과 소멸의 주기가 짧은 특징을 가지고 있다. 이런 특징 때문에 일반용어 사전구축과 달리 전문용어 사전을 구축하기 위해서는 신속한 대응전략이 필요하다. 이를 위해 본 논문에서는 전문용어 사전 구축을 위한 다음과 같은 두 단계의 과정을 제안한다. 우선 형태소 후처리와 결합규칙을 이용하여 1,200만 어절의 신문 말뭉치로부터 단일어 10만과 복합어 30만의 용어후보를 추출하고, 고빈도 용어 후보 6만개를 선별해 용어지배지수(Term Dominance Value)라는 개념을 도입하여 전문용어를 선정한다. 실험을 통해 용어지배지수 순위와 누적빈도순위 및 최근연도 순위를 비교한 결과 본 논문에서 제안한 용어지배지수가 전문용어 활용도를 나타내는 훌륭한 지표역할을 할 수 있음을 확인할 수 있었다.

  • PDF

전문용어사전 표제어 기술형식에 대한 연구 (A Study on the Entry Description Format of Glossaries)

  • 강정미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.39-42
    • /
    • 1999
  • 우리나라에서 학문분야별로 출판된 전문용어사전의 표제어 기술형식은 매우 상이하다. 이러한 특징은 여러 분야의 전문용어사전을 참조해야 하는 이용자에게 많은 불편을 초래할 뿐만 아니라 표준화된 전자사전에 대한 요구를 충족시키지도 어렵다. 본 연구에서는 전자사전 표준화의 일환인 전문용어사전의 표제어 기술형식 표준화를 위한 기초작업의 일부로서 현재까지 우리나라기서 출판된 전문 용어사전을 대상으로 표제어의 기술형식에 대하여 기술요소, 기술요소의 순서, 띄어쓰기, 다의성을 갖는 용어의 구분, 배열 등에 대하여 조사 분석하였다.

  • PDF

백과사전 기반 전문용어 태깅 시스템 (Terminology Tagging System using elements of Korean Encyclopedia)

  • 배영준;최호섭;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-172
    • /
    • 2005
  • 지금까지 자연언어처리에서의 품사태깅(parts-of-speech tagging) 기술에 대한 연구는 활발히 진행된 반면, 전문용어에 대한 처리 기술은 미비한 점이 많았다. 전문용어에 관련된 연구는 대부분 구축, 표준화, 추출 등에 대한 연구가 많았으나 전문용어 태그 설정과 태깅 기술 연구는 부족한 상황이다. 본 논문에서는 전문용어 태그를 (분야정보: 아이디) 순으로 설정하고 백과사전의 분류 체계를 이용하여 어떤 특정 분야 문서의 전문용어를 자동으로 태깅하는 시스템을 구축하였다. 전문용어 태깅 시스템은 형태소분석기를 사용하지 알고 문맥의 규칙과 조사 어미사전을 이용해 자동으로 태깅을 하게 된다. 이 시스템의 정확률 측정을 위한 정답말뭉치는 웹 상에 공개되어 있는 백과사전 html문서를 이용하였다. 우선 백과사전에 나와있는 용어는 전문용어라고 가정한다. 하나의 문서에는 '용어', '요약', '본문', '이미지', '분류', '참조항목' 등의 정보들이 있다. 이 중 '본문'에는 그 용어에 대한 자세한 설명이 있는데 특정 단어에는 태그로 백과사전 내에 있는 단어를 찾아 볼 수 있게 링크 되어있다. 이 정보를 이용해 태그로 되어있는 것을 설정한 태그로 바꾸고 단계별로 확장 태깅을 해서 정답말뭉치를 만든다. 태깅 시스템과 정답말뭉치를 비교해 정확률을 계산해서 시스템의 성능을 측정하였다.

전문용어 추출시스템 (A terminology extraction system)

  • 박정오;황도삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.381-383
    • /
    • 2000
  • 현재, 과학기술, 정치, 사회, 문화의 급격한 변화와 발전에 따라, 전문분야마다 새로운 전문용어가 빈번히 생성되거나 소멸되고 있다. 이러한 전문용어를 포함한 문서를 정확히 해석하기 위해서는 전문용어 전자사전이 필요하다. 전문용어 전자사전을 개발하는데는 수시로 생성되는 전문용어 표제어를 정확히 추출하는 것이 무엇보다 중요하다. 본 논문에서는 이러한 전문용어 표제어를 컴퓨터를 이용하여 추출하는 시스템을 개발하였다. 기본적으로 기존의 전문용어가 사용된 특정어구를 이용하여 전문용어를 추출한다. 또한, 전문용어의 어절 패턴을 이용하여 후보 전문 용어를 추출한 후, 전문용어를 구성할 수 있는 단어의 위치정보를 이용하여 전문용어를 추출하는 방법을 제안한다. 기존 전문용어 사전에 없는 단어에 대해서는 시소러스를 이용하여 유사 단어의 위치정보를 이용하는 방법을 이용하였다.

  • PDF

전문용어 대역사전의 구조와 배열에 관한 연구 (Structure Analysis of Multilingual Lexicon)

  • 김세주
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.35-40
    • /
    • 2001
  • 전문용어사전 중에서 개념 정보를 제시하지 않고 대역어나 음차어를 중심으로 제시하는 전문용어 대역사전을 선정하여 이들의 구조와 배열을 분석하였다. 실제로 전문용어 대역사전을 구성하고 있는 요소들의 기술 구조는 매우 다양하며 이들의 배열 방법도 사전마다 차이를 보이고 있는 것으로 나타났다. 이러한 특징은 사전의 이용자들에 많은 불편을 초래하며 표준화된 전자사전의 요구를 충족시키기 어려우므로 일관성있는 기술 방법이 요구된다.

  • PDF