• 제목/요약/키워드: 한국용어

검색결과 3,081건 처리시간 0.03초

퍼지관계곱을 이용한 정보검색시스템의 성능 개선 (Performance Improvement of Information Retrieval System by means of Fuzzy Relational Product)

  • 김창민;김용기
    • 한국지능시스템학회논문지
    • /
    • 제10권3호
    • /
    • pp.242-251
    • /
    • 2000
  • 퍼지관계 개념을 응용한 BK-퍼지정보검색기법은 형태론에 입각하는 기존의 정보검색기법과는 달리 문서와 용어의 상대적 의미에 근거한 정보검색 기법이다. 그러나 BK-퍼지정보검색기법은 높은 시간복잡도(time complexity)의 검색 연산을 내재하고 있어 실제 대용량의 정보 검색은 사실상 불가능하다. 본 논문에서는 BK-퍼지검색정보모델의 시간복잡도를 낮추기 위해, 축소용어집합(reduced term set)을 이용한 개선된 BK-퍼지정보검색모델(A-FIRM)을 제안한다. 개선된 BK-FIRM은 시스템 처리시간과 신뢰도 간 상층점(trade-off)을 제공한다. 축소용어집합은 용어집합의 부분집합으로서 검색결과의 신뢰도와 밀접한 관계를 가진다. 동일한 크기의 축소용어집합이 주어질 때, 보다 적절한 용어들로 구성된 축소용어집합이 보다 나은 검색 신뢰도를 이끈다. 따라서 보다 적절한 축소용어집합 구성을 위한 축소용어집합 추출방법이 요구된다. 본 논문에서는 축소용어집합 추출방법을 크게 무작위 추출, 규칙에 의한 추출, 인간에 의한 직관적 추출 방법으로 구분하고 검색결과의 신뢰도 변화 형태를 분석한다.

  • PDF

인과관계 문맥정보를 사용한 용어 군집화 연구 (Term Clustering based on Causal Context Information)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

시소러스 용어관계에 관한 연구 (A Study on Term Relationship of Thesaurus)

  • 한상길;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.231-234
    • /
    • 1998
  • 시소러스는 정보검색과정에서 용어를 통제하여 색인과 검색에서 중요한 기능을 수행하는 도구로 사용되고 있는 통제용어집이다. 그러나 정보검색시스템 환경의 변화에도 불구하고 기존의 시소러스와 시소러스의 작성지침으로 사용되고 있는 국제 표준인 ISO 2788이나 Z39.19에서 제시하고 있는 기준은 용어간의 관계를 단순히 표현하고 있어 색인이나 검색시 용어통제의 어려움을 겪고 있다. 본 연구는 시소러스의 용어관계를 국제 표준과 현재 사용되고 있는 각종 시소러스를 비교 분석하여, 시소러스 용어관계의 확장방안을 제시한다.

  • PDF

알아봅시다 - 정보통신용어사전

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 12호통권31호
    • /
    • pp.139-144
    • /
    • 1995
  • 지난호에 이어 정보통신용어사전에서는 통신용어는 마지막으로 게재하고 '96년부터는 데이터베이스 용어사전을 게재할 예정이다.

  • PDF

신학 용어 분류를 위한 패싯 설계에 관한 연구 (Establishing Facet for Classifying Theological Terms)

  • 유영준
    • 한국문헌정보학회지
    • /
    • 제42권3호
    • /
    • pp.259-279
    • /
    • 2008
  • 신학 분야의 시소러스를 구축하는 전 단계로서, 패싯을 이용하여 신학 용어를 분류하였다. 영어로 된 신학 사전에서 1.031개의 용어를 선정하였고, 이 중에서 실제로 분류한 용어의 수는 984개이다. 용어를 분류하기 위해서 전개한 패싯은 기본 패싯 7개와 하위 패싯 14개이었다. 분류한 용어들을 분석해 본 결과, 신학 분야의 특성에 맞게 물리적 형태를 갖는 구체적인 용어의 수보다 추상적인 용어의 수가 많았으며. 전체 용어 수의 70% 정도를 차지하였다. 문헌 분류를 위한 십진 분류 체계에 대한 연구가 한계에 이른 상황에서. 이러한 특정 주제 분야의 용어를 분류하고 시소러스를 구축하는 연구가 더 활발해져야 한다고 생각한다.

북한 중등과정 지리 교과서 기상학분야 용어에 대한 전남지역 고등학생들의 이해 (Perception of High School Students in Chonnam Province on the Meteorology Terms in Geography Textbooks of North Korean Secondary School)

  • 홍정민;정영근
    • 한국지구과학회지
    • /
    • 제27권1호
    • /
    • pp.15-19
    • /
    • 2006
  • 북한에서는 중등과정 기상학 내용을 지리학 분야에서 배운다. 본 연구는 북한 지리교과서에 나오는 기상학분야 용어를 남한의 지구과학 교과서에서 사용하는 용어와 비교하여 같은 의미이면서 다른 용어 40개를 발췌하여 각 용어에 대해 전남지방 고등학생들이 이해하는 정도를 비교하였다. 용어의 이해도 조사는 전남지역 소재 2개 고등학교 89명을 대상으로 하였다. 고등학생들이 남한 용어에 대한 이해 수준은 북한용어의 이해 수준에 비해 평균적으로 30% 정도 높다. 더운전선, 합치기과정, 하루변화, 비탈면 등 9개의 북한 용어는 오히려 남한 용어보다 이해 수준이 높다. 이해 수준이 보다 낮은 3때 용어 가운데 2때 용어는 북한 고유어를 이용하여 최근 만들어진 것들이다. 남한의 용어 대부분은 한자어, 외래어 등에서 유래한 용어로 이루어져 있으며 대체로 북한 고유어로 새로 만들어진 용어보다 더 높게 이해되고 있다.

전북 서해안권 국가지질공원 지질명소 안내 표지판에 사용된 용어 분석 (An Analyses of the Terms used in the Information Boards of Geosites at Jeonbuk West Coast National Geopark)

  • 신영준;조규성
    • 한국지구과학회지
    • /
    • 제41권1호
    • /
    • pp.40-47
    • /
    • 2020
  • 본 연구는 전북 서해안권 국가지질공원 지질명소의 안내 표지판에 기술된 용어를 분석하였다. 안내 표지판에 기술된 용어들 중 명사만을 추출하여 표준국어대사전, 지구과학 학술용어집, 2015개정 교육과정에 따른 교과용 도서 개발을 위한 편수 자료를 기준으로 등재 여부를 확인하여 8가지 유형으로 분류하였다. 추출된 용어 중 71개(10.8%)의 용어는 어느 용어집에도 등재되지 않은 [유형 8]에 해당하는 용어들이었다. 이 유형의 용어들은 대부분이 [명사]+[명사] 또는 [명사]+[접사]가 결합하여 파생된 합성어로 그 의미를 명확하게 해석하여 이해하기란 쉽지 않은 것으로 판단되었다. 또한 256개(46%)의 용어가 전문 분야에서 사용되는 전문 용어로 확인되었다. 따라서 국가지질공원 안내 표지판의 제작에 있어 일반인들과 학생들이 더 쉽게 읽고 이해할 수 있도록 전문 용어를 가급적 쉽게 풀어서 기술하고 전문 용어를 사용할 경우에는 용어에 대한 주석을 달아 부연 설명을 통해 충분한 교육적 효과를 얻을 수 있도록 해야 할 것이다.

구조적 학술용어사전 데이터베이스 구축에 있어서 용어의 의미관계 형성에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Influencing Semantic Relation in Building a Structured Glossary)

  • 권선영
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.353-378
    • /
    • 2014
  • 본 연구는 구조적 정의에 의한 학술 용어 사전 데이터베이스 구축을 위해 학술용어의 의미관계 형성에 미치는 요인이 무엇인지를 찾아내고 이러한 요인이 어떠한 영향을 미치고 있는지를 밝히고자 하였다. 이를 위해 2007년부터 2011년 사이에 한국연구재단 등재학술지에 등재된 학술논문에서 학술논문 주제어를 추출하여 이를 대상으로 주제복합성, 언어 네트워크 특성, 출현빈도, 출현패턴을 분석하고 구축된 STNet의 의미관계 형성정도인 용어의 의미적 연결관계 노드의 수와 유형의 수와의 영향 관계를 살펴보았다. 가설 검증을 통해 구조적 학술용어사전의 구축에 있어 의미관계 형성정도에 주요한 영향을 미치는 요인으로 매개 중심성, 출현빈도, 구조적 공백성의 효과크기라는 것을 알 수 있었다. 그리고 용어의 중요성은 일반적으로 알려진 출현빈도를 통한 방법 외에도 연결정도 중심성, 근접 중심성, 매개 중심성, 위세 중심성과 같은 측정방법에 따라서도 판단할 수 있음을 확인하였다. 또한 주제복합성은 직접적으로 의미관계 형성정도에 영향을 미치지는 않지만 용어의 근접 중심성에 영향을 미치기 때문에 크게 4가지의 요인을 고려하여 용어를 선정할 경우 의미관계 형성정도는 높아질 수 있는 것으로 파악 되었다. 본 연구의 결과는 지금까지 용어를 선정하는 프로세스의 주된 방법론인 용어의 출현빈도를 활용하는 방법 이외에도 용어 네트워크상에서의 용어의 위치나 주제복합성 같은 방법론을 적용하여 용어를 선정할 수 있다는 것을 보여준다. 따라서 전문용어 사전을 구축할 때 용어의 네트워크에서의 매개 중심성, 출현빈도, 구조적 공백성의 효과크기, 용어의 주제복합성을 면밀히 판단하여 다각도로 용어를 선정할 경우 전문용어 사전의 질적인 향상과 완성도가 높아질 것을 기대할 수 있다.

남북한 음향학 전문용어 비교 분석 및 통합안 제시 (Comparative analysis of inter-Korean acoustic terminology and proposal for integration)

  • 김지완
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.271-284
    • /
    • 2023
  • 본 연구는 IEC 60050-801:1994 국제 표준을 기준으로 남한 산업표준과 북한 국가규격의 음향학 전문용어 431개를 비교 분석하고 통합 알고리즘을 사용하여 남북한 음향학 용어 통합안을 제시하였다. 용어가 완전히 같은 형태인 AA형은 139개(32.3 %), 어문규범의 차이로 인해 표기 형태가 다른 Aa형은 35개(8.1 %), 형태가 완전히 다른 AB유형은 257개(59.6 %)로 확인되었다. 형태적으로 같은 유형의 용어보다 다른 유형의 용어가 2배 이상 많았으나 내용 면에서 대부분 용어는 충분히 이해하고 유추할 수 있는 범위 안에 있었다. 형태가 다른 음향학 전문용어 통합에서는 북한 전문용어가 178개(61 %), 남한 전문용어가 76개(26 %)로 채택되었다. 이와 같은 결과는 북한 전문용어가 고유성이 압도적으로 높았고, 남한 전문용어는 경제성이 상대적으로 높았기 때문이다. 용어 순화를 통한 고유성과 최신 기술 용어의 대중 활용을 높일 수 있는 경제성 기준을 충족하는 음향학 전문용어 통합 체계 구축이 필요하다. 본 연구는 남북한 음향학 전문용어를 최초로 비교하고 통합안 제시에 의의가 있으며 다음과 같은 제언으로 연구 한계를 극복하고자 한다. 첫째, 정부는 남북한 학술 교류 및 표준화 공통 안을 마련할 수 있도록 지원 및 법적인 장치를 마련하고 북한 관련 연구 데이터에 쉽게 접근할 수 있는 연구 환경을 조성해야 한다. 둘째, 음향학 용어 데이터를 남북한이 공유하고 통합 음향학 용어사전을 발간하도록 노력해야 한다. 셋째, 추후 남북이 전문용어 위원회를 함께 발족하여 표준 개정이 동시에 이루어지도록 노력해야 한다.