• 제목/요약/키워드: 전문용어인식

검색결과 51건 처리시간 0.032초

영-한 조어단위 대역쌍 추출을 위한 조어단위 정렬 모델 (An Alignment Model for Extracting English-Korean Translations of Term Constituents)

  • 오종훈;황금하;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.300-311
    • /
    • 2005
  • 전문용어는 전문분야의 개념을 표현하는 언어적 표현이다. 전문용어의 조어단위는 전문용어를 구성하는 최소의 형태적 단위이다. 따라서 조어단위는 전문용어의 의미를 파악하는데 중요한 요소이다. 하지만 조어단위를 이용한 전문용어의 의미파악은 ‘조어단위와 개념단위의 불일치 문제’, 조어 단위의 ‘동형이의어’, ‘동의어’문제 둥으로 인한 어려움이 있다. 이러한 문제를 해결하기 위해서는 하나의 개념을 나타내는 조어단위의 덩어리인 개념단위를 파악하는 작업이 선행되어야 한다. 본 논문에서는 영어의 조어단위를 하나의 개념단위로 정의하고 개념단위에 대응되는 한국어 조어단위의 집합을 개념단위로 인식한다. 개념단위의 파악과정은 영한 대역 전문용어사전에 대한 영어-한국어 조어단위 정렬문제로 해결하고자 한다. 본 논문의 기법은 물리, 화학, 생물 분야에 대한 조어정렬 실험을 수행하였으며, 평균 약 $93\%$의 정확률로 조어단위 간의 정렬을 수행하였다

은닉마르코프 모델(HMM)을 이용한 과학기술문서에서의 외래어 추출 모델 (Automatic Extraction of Technical Terminologies from Scientific Text based on Hidden Markov Model)

  • 오종훈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.137-141
    • /
    • 1999
  • 기술의 발달로 인해 수많은 용어들이 생성되고 있다. 이들은 대부분 전문용어이며 이는 비영어권 국가인 우리나라에 도입될 때, 외래어나 원어형태로 도입된다. 그런데 외래어나 원어형태의 전문용어는 형태소 분석기, 색인기 등의 시스템에서 오류의 원인이 되어, 이를 전처리기로 사용하는 자연언어처리 시스템의 성능을 저하 시킨다. 따라서 본 논문에서는 외래어나 원어로 된 전문용어를 처리하기 위한 전단계로서 문서에서 자동적으로 외래어를 인식하고 추출하는 방법을 제시한다. 본 논문에서 제시하는 방법은 외래어 추출 문제를 태깅문제로 변환하여, 태깅 문제를 해결하는 기법 중의 하나인 은닉마르코프 모델 (Hidden Markov Model)을 이용하여 외래어 추출을 하였다. 그 결과 94.90%의 재현률과 95.41%의 정확도를 나타내었다.

  • PDF

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

진안-무주 국가지질공원의 안내 표지판에 제시된 용어에 대한 학생들의 이해도 분석 (Analysis of Students' Understanding of the Terms Presented on the Information Board of Jinan-Muju National Geopark)

  • 조규성;박경진
    • 한국지구과학회지
    • /
    • 제41권5호
    • /
    • pp.520-530
    • /
    • 2020
  • 이 연구의 목적은 진안·무주 국가지질공원의 안내 표지판에 제시된 용어에 대한 학생들의 이해 정도를 알아보기 위한 것이다. 이를 위하여 학생 219명(초등학교 147명, 중학교 41명, 고등학교 31명)을 대상으로 지질공원에 대한 인식 수준, 안내 표지판의 유용성에 대한 인식, 그리고 국가지질공원에 설치된 안내판에 제시된 용어에 대한 이해 정도를 알아보기 위한 설문을 실시하였다. 이때 학생들의 용어에 대한 이해정도를 알아보기 위해 지질명소에 설치된 대표적인 안내 표지판 10개를 선정하고 전체 내용을 텍스트 형태로 변환하였으며, 전문가 3인과의 논의를 통해 핵심 용어 256개를 추출한 후 학생들에게 제시하여 이해 정도를 파악하였고, 이에 대한 결과는 다음과 같다. 첫째, 학생들의 지질공원에 대한 인식 수준은 매우 낮은 것으로 나타나 이에 대한 홍보와 교육적 접근이 필요해 보인다. 둘째, 학생들은 안내판에 대해 흥미를 보이지 않았으며 내용이 많고 어려워 이해도가 낮은 것으로 나타났다. 셋째, 256개의 용어 중에서 학생들이 이해하기 어려워하는 용어의 수는 초등학생 80개, 중학생 53개, 고등학생 31개로 나타나 학교 급이 높아지면서 감소하는 경향을 보였다. 이때 용어를 이해하기 어려운 이유는 초등학생은 교육과정에서 아직 배우지 않은 용어이기 때문이며, 중·고등학생은 전문 용어와 한자어에 대한 이해의 어려움 때문인 것으로 나타났다. 따라서 지질공원의 안내 표지판은 학생 및 방문객들이 보다 이해하기 쉽도록 한자어를 쉽게 풀어 쓰거나 전문 용어에 대한 추가 설명이 필요할 것으로 보인다.

학술정보포털에 대한 이용자만족 관련 인식에 관한 연구 - NAVER 전문정보의 학술자료 검색 기능을 중심으로 - (User Satisfaction related Perception of the Web Portal for Scholarly Information: Focused on the Academic Version of NAVER Search Engine)

  • 김양우
    • 한국문헌정보학회지
    • /
    • 제51권2호
    • /
    • pp.255-279
    • /
    • 2017
  • 본 연구는 NAVER 전문정보의 학술자료 검색 기능에 대한 이용자 만족과 관련된 인식을 조사한 질적 연구이다. 다양한 전공영역의 학부 학생들이 자신의 전공영역과 관련된 학술목적의 정보요구를 기반으로 스스로 선정한 탐색주제를 가지고 검색을 수행하는 과정에서 학술정보 전문포털에 대한 만족이나 불만족 등의 인식과 그 이유에 대한 조사가 이루어졌다. 수집된 데이터를 기반으로 한 연구결과는 인터페이스, 검색메커니즘 및 검색결과 등 세 가지 범주에 속하는 다양한 평가 항목 별로 제시되었다. 본 연구의 제언점은 1) 이용자들의 기본적인 관련 용어에 대한 제한한 지식 등을 토대로 한 시스템 인터페이스 개선 및 도움말 기능의 확대, 2) 상이한 맥락에서 사용된 검색어를 토대로 한 검색결과가 이용자 불만족으로 연결됨에 따른 검색 메커니즘의 개선 필요성, 그리고 3) 이용자들의 기본 용어 이해 부족과 더불어 검색 메커니즘 및 탐색기능에 대한 미흡한 식견을 기반으로 한 이용자교육의 제공 필요성으로 요약된다.

이미지데이터 활용을 위한 문서인식시스템 연구 및 개발 (Research and Development of Document Recognition System for Utilizing Image Data)

  • 곽희규
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.125-138
    • /
    • 2010
  • 본 연구는 공공기관이 소장한 이미지데이터의 검색 및 열람 등의 활용성을 높이기 위한 전문검색서비스 구현 시 필수적인 문서인식시스템의 고도화를 목표로 한다. 주요한 연구방향은 공공기관이 소장하고 있는 데이터를 사전에 분석하여 문서이미지 전처리 및 문서구조분석 기술을 개발하고, 문서인식 과정에서 활용하기 위한 이미지내용DB, 문자모델DB, 용어DB로 구성되는 특화된 지식베이스를 구축하는 것이다. 또한, 지식베이스 관리도구를 개발하여 향후 다양한 형태의 문서이미지로의 확장을 가능하게 한다. 최근 본 연구는 국가기록원에서 소장하고 있는 이미지데이터에 적합한 문서구조분석 라이브러리와 특화된 지식베이스를 결합한 문서인식 프로토타입 시스템 개발을 완료했다. 향후 본 연구의 결과는 방대한 소장자료의 검색 및 활용을 극대화할 전문검색시스템 연계를 위한 성능평가 및 테스트베드 구축에 활용될 것이다.

웹기반 신문활용교육을 위한 교수-학습 시스템 설계 및 구현 (Design and Implementation of Teaching and Learning System for Web-based NIE)

  • 소인미;이은숙;이지근;김희숙;정석태;정성태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.758-762
    • /
    • 2002
  • NIE(Newspaper-In-Education)는 신문을 활용한 교육을 말한다. NIE가 기존의 교육에 비하여 다양한 가치 인식을 통한 사회성 확립과 아울러 독해력과 작문력 향상, 정보 활용 능력의 육성 등의 장점이 있어서 교육 현장에서 널리 활용되고 있다. 그러나 기존의 NIE는 기사 스크랩의 번거로움, 복사 사용으로 인한 판독의 어려움, 전문용어에 대한 지도의 어려움 등의 문제점을 가지고 있다. 따라서 본 논문에서는 웹 기반 NIE를 위한 교수-학습 시스템을 설계한다. 웹 기반 NIE는 신문활용교육의 장을 교실과 가정에서 그대로 컴퓨터와 인터넷으로 옮겨온 것이다. 인터넷 신문을 통해 다양한 신문의 기사와 정보를 접하고, 분석하며 기존의 워크북(workbook)에서 하던 NIE 활동을 그대로 웹 기반으로 옳긴 것이다. 본 논문에서 설계한 웹 기반 NIE 교수-학습시스템은 신문지면을 준비하는 문제에 구애받지 않고, 전문용어에 대한 실시간 검색을 통한 빠른 이해와 다른 사람의 NIE 작품을 비교할 수 있는 둥의 장점을 가지고 있기 때문에 우리나라 NIE교육의 발전에 기여할 것으로 기대된다.

  • PDF

Shale을 왜 '혈암'이라 하는가?

  • 이창진;류춘렬
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2010년도 춘계학술발표회 논문집
    • /
    • pp.24-24
    • /
    • 2010
  • 중등 지구과학교과서와 대학 교재에서 학습하는 광물과 암석 이름은 대부분 영어, 한자, 일본어에서 도입한 용어이다. 이 용어에 대한 어원과 말뜻에 대한 분석이나 연구가 되지 않은 상태에서 바로 사용해왔기 때문에 지질학 초보자들이 학습하기에 아주 어렵다. 광물과 암석이름의 어원과 말뜻을 잘 알지 못하고 단순히 외우거나 학술적인 이름이나 의미만을 생각하고 사용하고 있으며, 한 광물이나 암석에 대하여 여러 가지 이름을 사용하기도 한다. 심지어 전혀 엉뚱한 암석 이름이 대중 사이에서 사용되고 있지만 이를 통제하지도 못하고 그 명칭이 틀렸다는 것도 모르고 있다. 예를 들면 영어로 Shale을 중등 교과서와 대학 교재에서 영어 발음을 따라 한국어로 셰일이라고 표기하지만 중국과 일본에서는 혈암(頁岩)으로 표기한다. 우리나라의 대중 매체의 인터넷 사전과 대중들이 사용하는 용어는 중국어 혈암(頁岩)을 공공연하게 '혈암'으로 표기하고 있다. '혈(頁)'을 한자 사전에서 찾아보면 '머리 혈'과 '책 면 엽'으로 정리되어 있다. 그러면 셰일의 암석학적 특징으로 볼 때 혈암이라고 해야 하나? 엽암이라고 해야 하나? 과학과의 다른 분야에서는 어려운 한자를 쉬운 한글로 표준화하는 연구와 실행을 꾸준히 진행해오고 있다. 생물의 경우 생물의 어려운 학명을 이미 쉬운 한글로 표준화했으며, 그 학명이 학생과 대중들에게 널리 알려져 있다. 지구과학의 교과서 문장에 나오는 단어와 전문용어가 한자를 한글로 표기한 경우가 많은데 이 단어들을 하루 속히 한글로 표준화하여 전문가들이 먼저 사용하는 동시에 학생과 대중들에게 알려 주어야 한다. 이렇게 되면 지구과학의 내용보다 용어가 어렵다는 인식을 바꾸어 줄 것이고 지구과학을 전공하고자 하는 학생들에게 희망과 용기를 줄 것이다. 그 일환으로 광물과 암석 이름의 어원을 조사해 보고 한글 표준화의 가능성을 타진해 보고자 한다.

  • PDF

식품안전사건 발생 시 미디어와 산업의 인식도 조사 (Survey on Comparative Awareness between Media and Industry on Occurrence of Food Safety Incident)

  • 신원정;이유시;오세라;박태균;김보영;김호식;이정호;이승용;하상도
    • 한국식품위생안전성학회지
    • /
    • 제28권2호
    • /
    • pp.108-114
    • /
    • 2013
  • 본 연구는 전문가집단을 대상으로 식품안전사고 발생 시 '보도용어'와 '대응용어'에 대한 인식도 차이를 알아보고 용어선택에 따른 피해정도를 개선하기 위한 기초자료를 제공하고자 실시하였다. 식품기업체 식품안전관리책임자 28인과 식품전문기자 17인 총 45인을 대상으로 인식도 조사 및 개선방안에 대해 설문조사하여 통계분석 하였다. 그 결과, 식품안전사건 발생 시 미디어의 영향이 크다는 질문에 기자 70.6%, 기업체 92.9%가 '매우 그렇다'의 응답률을 보였다. 미디어의 자극적인 용어사용이 기업피해의 원인이라는 인식에는 기업체의 83%가 '매우 그렇다', 기자의 70.6%가 '그렇다'로 답해 양측 모두 자극적 용어사용으로 인한 기업피해를 인식하고 있었다. 미디어의 '보도용어'와 정부, 학계 등의 '대응용어'가 소비자의 인식과 사건의 파급에 차이를 주는지를 묻는 질문에 기업체의 92.9%와 기자의 35.3%가 '매우 그렇다'로 답해 두 집단 모두 용어의 차이가 소비자의 인식뿐 아니라 파급을 확대시킨다는데 공통적인 의견을 보였으나 기업이 훨씬 심각하게 느끼고 있었다. '보도용어'의 통일 및 사용제한에 대해 기업체는 전반적으로 긍정적인 입장이고 기자는 긍정과 부정으로 답변이 나뉘어 개인차가 컸다. 식품안전사건 발생시 소비자와 기업체의 피해를 줄이기 위해 기업과 기자, 전문가간 사용하는 용어의 일치 및 차이를 좁힐 수 있는 방안 마련이 필요하다고 사료된다.

시민연극과 커뮤니티: 주체-객체 패러다임의 변화에 대한 소고 (Applied Theatre and Community: Reflections on the Subject and Object Paradigm Shift)

  • 김병주
    • 공연문화연구
    • /
    • 제38호
    • /
    • pp.5-31
    • /
    • 2019
  • 본 연구의 목적은 국내에도 이미 소개된 바 있는 '시민연극(applied theatre)'의 개념과 배경을 정리하고 그 특성을 논의하는 데 있다. 이를 위해 시민연극이 지닌 특성의 배경, 우산용어로서의 형성 과정을 정리하였다. 여전히 생소한 용어와 개념이 지닌 모호함과 혼란의 본질인 커뮤니티와 만나는 연극행위의 주체를 인식하는 패러다임의 변화를 고찰하고, 그러한 맥락에서 시민연극과 '커뮤니티 연극', 그리고 '커뮤니티 기반 연극' 개념을 비교하고 논의하였다. 이를 통해 '시민연극' 개념과 특성에 대한 가장 본질적 이해는 연극의 양식이나 유형적 관점이 아닌, 참여자와 커뮤니티를 주체로서 인식하는 시대와 사회의 패러다임 변화를 인지하는 것에서 비롯됨을 확인하게 되었다.