• 제목/요약/키워드: 중요 용어

검색결과 975건 처리시간 0.026초

기계학습에 기반한 생의학분야 전문용어의 자동인식 (Machine-Learning Based Biomedical Term Recognition)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.718-729
    • /
    • 2006
  • 일정 분야의 문서들에서 그 분야 특정을 반영하는 전문용어를 자동으로 인식하는 연구에 대한 관심이 증가하고 있다. '전문용어 인식'은 문서에서 전문용어가 될 수 있는 언어적 단위를 파악하는 '용어 추출' 과정과 '용어추출' 과정에서 얻어진 용어목록 중 해당분야의 전문용어를 고르는 '전문용어 선택' 과정으로 구성된다. '전문용어 선택' 과정은 용어목록을 전문용어의 특정에 따라 순위화한 후 타당한 전문용어를 파악하는 작업으로 정의된다. 따라서 전문용어 선택 문제는 용어목록의 순위화 작업과 순위화된 목록에서 전문용어와 비전문용어 간의 경계를 인식하는 작업으로 정의된다. 기존의 전문용어 선택 기법은 주로 용어의 빈도수 등과 같은 통계적 특정만을 이용하였다. 하지만 통계적 특정만으로는 효과적으로 전문용어를 선택하기 어렵다. 본 논문의 논제는 전문용어 선택에서 다양한 전문용어의 특정을 고려하고 이들 중 전문용어 선택에서 효과적인 특정을 찾으려는 것이다. 순위화 문제는 다양한 전문용어 특정을 도출하고 이들을 기계학습방법으로 통합하여 해결한다. 경계인식 문제는 전문용어와 비전문용어의 이진 분류 문제로 정의하고 기계학습방법으로 해결한다. 본 논문의 기법은 경계인식측면에서 78-86%의 정확률과 87% -90%의 재현율을 나타내었으며, 순위화 측면에서 89%-92%의 11포인트 평균정확률을 나타내었다. 또한 기존 연구보다 최고 26% 의 성능향상을 보였다.

남북한 과학기술용어

  • 박찬모
    • 과학과기술
    • /
    • 제26권12호통권295호
    • /
    • pp.90-93
    • /
    • 1993
  • 지난 호에서도 언급한 바와 같이 컴퓨터용어는 아직 순화단계에 있어 남한에서도 통일된 것이 없고, 같은 영어 낱말을 여러 가지로 사용하는 경우가 많다. 예로 「interrupt」를 정익사판 컴퓨터용어사전에는 「인터럽트」로 영어발음을 그대로 우리말로 표기한 반면, 다른 용어사전에서는 「가로채기」, 「개입중단」등으로 되어 있다. 현재 남한에서 발간 된 컴퓨터용어 관련자료로는 크라운사, 교학사, 대은사 및 정익사 발행의 컴퓨터용어사전과 하이텔 이용자 모임순화안, 서울대 뉴미디어통신공동연구소 HDTV용어사전, 한국과학기술원 인공지능연구센터안, 교육부 편수자료 등이 있고 1993년 1월에 발간된 문화체육부의 전산기 기본용어 순화시안이 최신 것이라 하겠다. 이곳에서는 주로 1990년 정익사에서 출판한 한국정보과학회편 「컴퓨터용어사전」과 1986년 북한의 과학, 백과사전 출판사에서 발간한 전웅편저「전자계산기프로그람용어사전」을 참조하여 비교하였고, 참고로 문화체육부에서 내어놓은 순화시안도 함께 병기하였다. 지면상 모든 용어를 비교한다는 것은 불가능하여 남한과 북한에서 서로 다르게 부르는 용어 중 일부분만을 다음 표에 나열한다.

  • PDF

통계용어대조표의 소프트웨어화와 활용

  • 신봉섭
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.97-102
    • /
    • 2002
  • 본 연구는 현재 통계학회의 홈페이지(http://www.kss.or.kr)를 통해 서비스중인 ${\ulcorner}$통계학용어 온라인 대조표${\lrcorner}$를 개인의 PC에 설치하여 보다 손쉽게 통계용어의 검색에 활용할 수 있도록 소프트웨어로 재구성한 것이다. 따라서 사용자는 웹에 접속이 불가능한 경우에도 알파벳이나 가나다순의 검색 및 키워드를 입력한 검색이 가능하며, 검색된 결과의 레이아웃이나 글꼴을 조정하여 출력도 가능하다. 구현된 소프트웨어는 앞으로 추가되는 자료가 있더라도 사용된 데이터베이스만을 업데이트하면 소프트웨어에 대한 추가수정 없이 재사용이 가능하도록 구성되었다.

  • PDF

확장된 변이 규칙을 이용한 용어의 점진적 획득 (An Incremental Acquisition of Terms Using Extended Variation Rules)

  • 정한민;김영길;최승권
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-117
    • /
    • 1998
  • 자연어 처리 응용 분야에서 다양하게 이용할 수 있는 용어들을 자동적으로 획득하고, 나아가 이 과정을 점진적으로 반복하여 수행함으로써 획득할 수 있는 용어의 수를 증가 시키고 그 용어들 간의 의미적 관계도 얻을 수 있다. 점진적인 용어 획득을 위하여 용어의 형태에 변이 규칙을 적용하여 새로운 용어를 획득하는 과정을 반복한다. 우리는 변이의 종류를 단어간의 변이 뿐만 아니라 단어 내의 변이 그리고 이 둘을 결합한 복합 변이로까지 확장하여 새로운 용어 획득 과정을 더욱 다양화하는 기법을 제시한다. 실험은 확장된 변이 규칙으로부터 얻은 용어들 중에서 기존의 단어간의 변이로부터 획득한 용어들의 비율이 전체의 38.6%라는 사실로부터 변이의 종류 및 규칙의 확장이 획득할 수 있는 용어들의 수를 증가 시킬 수 있다는 것을 보여준다.

  • PDF

과학기술용어 통일은 국가발전의 주춧돌

  • 이의재
    • 과학과기술
    • /
    • 제35권11호통권402호
    • /
    • pp.16-18
    • /
    • 2002
  • 과학기술용어를 외국어로 쓰는 것은 익숙한 사람에게는 편리하겠으나 일반인에게는 엄청난 부담이 되며 독창적 사고를 통한 과학기술발전에 막대한 지장을 초래한다. 우리 사회에 횡행하는 여러 분야의 외국 용어들을 한시 바삐 우리말로 다듬어 정착시키는 일이 매우 중요하다.

  • PDF

초등학교 컴퓨터 교과서에 사용된 컴퓨터 용어 분석 (An Analysis of Computer Terms of Computer Textbooks in Elementary School)

  • 김갑수;홍명희;윤정석
    • 정보교육학회논문지
    • /
    • 제8권3호
    • /
    • pp.433-446
    • /
    • 2004
  • 컴퓨터를 배우고 이해하며 효과적으로 사용하기 위해서는 컴퓨터 용어를 바르게 알고 있어야 한다. 처음으로 컴퓨터를 배우는 초등학교 학생에게 있어서 컴퓨터 용어의 바른 이해는 매우 중요하다. 본 연구에서는 현재 초등학교에서 사용되고 있는 컴퓨터 교과서에 사용된 컴퓨터 용어를 조사하여 초등학생에게 적합한 컴퓨터 용어를 선정하였고, 이를 분석하여 초등학교 컴퓨터 교육과정에 맞게 1 2학년 용어, 3 4학년 용어, 5 6학년 용어로 분류하였고, 분야별로는 정보윤리 용어, 컴퓨터 기초 용어, 응용소프트웨어 용어, 컴퓨터 통신 용어로 분류하였다. 본 연구의 시사점은 다음과 같다. 첫째, 교사들에게 초등학교 컴퓨터 수업 지도에 필수적인 컴퓨터 용어 사용 지침을 제공한다. 둘째, 초등학교 컴퓨터 교과서나 연수 교재 그리고 학습 자료제작 시에 참고 자료가 된다. 셋째, 초등학교에서 컴퓨터 인정 교과서를 선정할 때 중요한 기준을 제공한다.

  • PDF

표준 의학용어 체계에서의 효과적인 용어 비교 검색 기법 (Effective Scheme for Comparative Search of Clinical Terms from Standard Clinical Terminology)

  • 류우석
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.537-542
    • /
    • 2015
  • 종합적 표준 임상 의학용어 체계인 SNOMED CT는 용어의 방대함 및 구조의 복잡성 때문에 환자 상태를 표현하는 가장 적합한 용어를 짧은 진료 시간 내에 선택하기가 어려운 용어 선택의 모호성 문제를 내포하고 있다. 본 논문에서는 용어 검색 과정에서 발생하는 동일하거나 유사한 용어를 분석하고 이를 효과적으로 구분하기 위한 용어 비교 검색 기법을 제시한다. 제안하는 기법은 용어의 계층 구조 분석을 통해 용어 간 "is-not-a" 관계를 새로 정의함으로써 두 비교 대상 용어의 차이점을 명확하게 하는 특징이 있다. 이를 통해 진료 과정에서 유사한 이름을 가진 용어들 중 환자의 상태를 가장 적합하게 표현하는 용어를 빠르게 선택함으로써 SNOMED CT의 활용성을 개선한다.

기술문서 정의문 패턴을 이용한 전문용어사전 자동추출 및 활용방안 (Automatic Extraction and Usage of Terminology Dictionary Based on Definitional Sentences Patterns in Technical Documents)

  • 한희정;김태영;두효철;오효정
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.81-99
    • /
    • 2017
  • 기술문서는 지식정보사회에서 생성되는 중요 연구 성과물로, 이를 제대로 활용하기 위해서는 정보 요약 및 정보추출과 같은 개선된 정보 처리 방법을 토대로 기술문서 활용의 편의성을 높여줄 필요가 있다. 이에 본 연구는 기술문서의 핵심 정보를 추출하기 위한 방안으로, 기술문서의 구조와 정의문 패턴을 기반으로 전문용어 및 정의문을 자동 추출하고, 이를 기반으로 전문용어사전을 구축할 수 있는 시스템을 제안하였다. 나아가 전문용어사전을 지식메모리로서 보다 다양하게 활용할 수 있도록 전문용어사전에 기반한 개인화서비스 제공방안을 제안하였다. 이처럼 전문용어 및 정의문 자동추출을 기반으로 전문용어사전을 구축하게 되면 새롭게 등장하는 전문용어를 빠르게 수용할 수 있어 이용자들이 최신정보를 보다 손쉽게 찾을 수 있다. 더불어 개인화된 전문용어사전을 이용자에게 제공한다면 전문용어사전의 가치와 활용성, 검색의 효율성을 극대화할 수 있다.

초등학교 컴퓨터 용어에 관한 연구 (A Study on Computer Terms in Elementary School)

  • 윤정석;김갑수
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2004년도 동계학술대회
    • /
    • pp.558-564
    • /
    • 2004
  • 21세기를 지식정보화 시대라고 한다. 자고 나면 새로운 것이 발견되고 새로운 책들이 쓰여지는 지식 홍수의 시대라고 할 수 있다. 그 중에서도 컴퓨터 분야는 타 분야에 비해 매우 빠른 변화를 보이고 있으며, 새로운 제품들이 끊임없이 개발 보급되고 있다. 이로 인해 과거에 쓰이던 컴퓨터 용어가 사라지기도 하고, 기술의 발달로 인해 새로운 용어가 생겨나기도 한다. 컴퓨터를 배우거나 컴퓨터를 효과적으로 사용하기 위해서는 컴퓨터에 관련된 용어에 대해 바르게 알고 있어야 한다. 그러나 대부분의 사람들은 잘못된 컴퓨터 용어를 사용하거나 여러 가지 용어를 섞어서 사용하고 있다. 따라서 본 연구는 최근에 개발된 컴퓨터 교과서 편수자료를 바탕으로 하여 현재 초등학교에서 사용하고 있는 계량활동 컴퓨터 교과서에 나타난 컴퓨터 용어를 분석하고 기존의 연구 자료와 비교해 본 후에 초등학교 수준에 맞는 컴퓨터용어를 선정하고, 더 나아가서 정보통신기술교육 영역별로 컴퓨터 용어를 분류해 보고자 한다.

  • PDF

EM 알고리즘을 이용한 전문용어의 자동 추출 (Automatic Term Recognition Through EM Algorithm)

  • 오종훈;김재호;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.487-489
    • /
    • 2003
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성 적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 70,000단어 수준의 영어 의학분야 300개 문서에 대하여 약 77%의 정확률로 전문용어를 추출하였다.

  • PDF