• Title/Summary/Keyword: 용어 관계

Search Result 539, Processing Time 0.02 seconds

An Experimental Study on the Technical Term Based Analysis of University Library Collection: With a Focus on Computer Field (대학도서관 장서와 학술논문에 나타난 전문용어의 관계 분석을 위한 실험적 연구 - 컴퓨터 분야를 중심으로 -)

  • Kwak, Seung-Jin;Kwon, Yung-Keun;Lee, Seok-Hyoung
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.45 no.2
    • /
    • pp.393-413
    • /
    • 2011
  • The collections of university libraries such as books in academic disciplines and dissertations are much used to support education of students and research activities of faculty members. Most of such materials naturally contain unique terms frequently and exclusively used in specific academic disciplines. Therefore, it is possible to infer the latest research trend in or correlations among various disciplines by analyzing those terms. In this study, the trend was analyzed by extracting technical terms from the metatadata for collections in the field of computer science of two university libraries in Korea. By comparing these terms with the trend of terms which appeared in dissertations and domestic scholarly articles, the relation between collections of university libraries and research trend in this particular academic field was analyzed.

Design and Implementation of Thesaurus System for Geological Terms (지질용어 시소러스 시스템의 설계 및 구축)

  • Hwang, Jaehong;Chi, KwangHoon;Han, JongGyu;Yeon, Young Kwang;Ryu, Keun Ho
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.10 no.2
    • /
    • pp.23-35
    • /
    • 2007
  • With the development of semantic web technologies in information retrieval area, the necessity for thesaurus is recently increasing along with internet lexicons. A thesaurus is the combination of classification and a lexicon, and is the topic map of knowledge structure expressing relations among concepts(terms) subject to human knowledge activities such as learning and research using formally organized and controlled index terms for clarifying the context of superordinate and subordinate concepts. However, although thesaurus are regarded as essential tools for controlling and standardizing terms and searching and processing information efficiently, we do not have a Korean thesaurus for geology. To build a thesaurus, we need standardized and well-defined guidelines. The standardized guidelines enable efficient information management and help information users use correct information easily and conveniently. The present study purposed to build a thesaurus system with terms used in geology. For this, First, we surveyed related works for standardizing geological terms in Korea and other countries. Second, we defined geological topics in 15 areas and prepared a classification system(draft) for each topic. Third, based on the geological thesaurus classification system, we created the specification of geological thesaurus. Lastly, we designed and implemented an internet-based geological thesaurus system using the specification.

  • PDF

Calculation of similarity by weighting title and summary in word co-occurrence of research reports (연구 보고서의 공기관계 정보에 제목 및 요약의 가중치를 적용한 유사도 계산)

  • Kim, Nam-Hun;Joo, Jong-Min;Park, Hyuk-Ro;Yang, Hyung-Jeong
    • Proceedings of The KACE
    • /
    • 2017.08a
    • /
    • pp.37-40
    • /
    • 2017
  • 본 논문에서는 국가 연구 보고서의 공기 관계 정보와 제목, 요약 등에 가중치를 적용한 유사도 계산방법을 제안한다. 이를 위해 국가 연구개발 보고서에서 텍스트를 추출하여 한 문장 단위로 문서를 분할하고, 기본 불용어와 보고서에서 특징적으로 나타나는 불용어를 처리하고 형태소 분석을 한 뒤 공기관계를 추출하였다. 또한 문서의 유사도 계산시 정확성을 높이기 위해 제목과 요약 부분에 가중치를 부여하였다. 이를 통해 본 논문에서 제안하는 방법이 문서 검색 라이브러인 루씬(Lucene)을 이용한 방법보다 2.5%의 검색성능 향상을 그리고 Knn-휴리스틱 방법보다는 1.1%의 검색성능 향상을 보였다. 이러한 결과를 통해 문서의 요약과 제목 그리고 공기관계 정보가 연구보고서의 유사도를 계산 하는데 영향을 미친다는 것을 보였다.

  • PDF

A Junkmail Checking System Using Fuzzy Relational Products (퍼지 관계 곱을 이용한 정크메일 분류 시스템)

  • 박정선;김창민;김용기
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.341-344
    • /
    • 2001
  • 20세기 후반 인터넷의 발전을 기반으로 전자메일은 현재의 대표적인 개인간 정보전달 수단으로 자리 잡게 되었다. 그러나 전자메일 사용자들은 인터넷상에 개인 전자메일 주소가 노출되므로 해서 많은 정크메일(junkmail)을 수신하게 되었는데, 정크메일이란 기업의 광고 선전물과 같이 수신을 원하지 않는 전자메일을 의미한다. 이러한 정크메일의 증가에 따라 정크메일을 분류하는 수단이 필요하게 되었는데, 현재까지는 사용자가 입력한 송신자의 전자메일 주소 또는 도메인 주소를 등록하여 차단하거나 제목에 특정 단어를 포함한 메일을 완전히 삭제하여 버리는 기술수준에 머무르고 있다. 본 논문에서는 퍼지 관계 곱을 기반으로 메일의 내용에 의미적으로 접근하여 정크메일을 분류하는 시스템을 제안한다. 이는 퍼지 관계곱 연산을 이용하여 미리 정의한 정크용어들과 사용자에게 수신되는 전자메일 내의 용어들간 의미적 포함관계를 분석하고 그를 통해 전자메일의 정크도(degree of junk)를 추출한다. 각 전자메일별로 추출된 정크도는 사용자가 부여하는 정크 기준치(SVJ, Standard Value of Junk)를 기분으로 정크메일과 비 정크메일로 분류한다. 제안된 기법은 사용자가 특정 개수의 동일한 전자메일에 대해 느끼는 정크도를 기준으로 분류한 정크메일 수를 비교하여 그 효용성을 증명하였다.

  • PDF

Use of SNOMED CT to Represent Traditional Korean Medicine Concepts : A Semantic Characterization of Migraine-Related Concepts from Korean Medicine Clinical Practice Guideline (SNOMED CT를 활용한 한의약 개념 매핑 : 한의임상진료지침에서 도출된 편두통 관련 개념의 의미론적 표현)

  • Ahjung Byun;Hyeoun-Ae Park;Byung-Kwan Seo;EunYong Lee;Hyeoneui Kim
    • Journal of Society of Preventive Korean Medicine
    • /
    • v.28 no.2
    • /
    • pp.85-97
    • /
    • 2024
  • 목적 : 본 연구는 한의약에서 사용하는 용어가 SNOMED CT로 매핑 가능한지 여부를 조사하고, 한의약 용어를 표현하기 위해 기존 SNOMED CT 온톨로지를 개선할 수 있는 방안을 제안하는 것을 목표로 하였다. 방법 : 선행 연구의 매핑 가이드라인에서 제시된 7단계 과정을 수정하여 활용하였다. 매핑의 목적 및 범위 정의, 용어 추출, 개념 추출, 매핑을 위한 소스 용어 작업, SNOMED CT 개념 검색, 매핑 관계 분류 및 매핑 검증의 과정을 수행하였다. 매핑의 목적은 한의약 임상 아이디어를 표현하는 표준 용어로서 SNOMED CT를 평가하는 것이고, 범위에는 편두통 환자 관리의 평가, 진단, 치료 및 예방을 포함하였다. 결과 : 총 546개의 용어가 추출되었다. 중복된 용어를 제거한 후, 271개의 개념이 SNOMED CT 매핑에 사용되었다. 이중 43.2%는 SNOMED CT 개념과 의미론적으로 동등하게 매핑되었고(117개 개념), 39.1%는 SNOMED CT 개념이 더 포괄적인 의미를 가지도록 매핑되었다(106개 개념). 상대적으로 포괄적인 의미를 가지는 SNOMED CT 개념에 매핑된 한의약 개념 106개 중 19개는 SNOMED CT 후조합을 이용하여 의미론적으로 동등하게 표현이 가능하였다. 나머지 17.7%의 한의약 개념은 SNOMED CT에 매핑할 수 없었다. 결론 : 본 연구는 한의약에서 사용되는 개념을 SNOMED CT에 매핑하여 한의약 용어를 표준화하였다. 연구 결과를 바탕으로, 한의약에서 사용되는 용어를 표준의료용어로 표현하기 위하여 SNOMED CT에 새로운 개념과 속성을 추가하는 것을 제안한다.

A Study on the Standardization of Issuing Terms and Systemizing of Cartoon Term (만화용어 체계화 및 쟁점용어 표준화를 위한 연구)

  • Yoon, Ki-Heon;Kim, Byoung-Soo
    • Cartoon and Animation Studies
    • /
    • s.10
    • /
    • pp.73-90
    • /
    • 2006
  • The roles and needs of contents are increasing moving toward sensitivities and culture in terms of key values in the 21st century. The cartoon is evaluated in invaluable as the original contents. Moreover, the size of these industries and employees are extending. Regardless of the quantitative expansion, however, it is real situation that is delaying in the disciplinary development and that is scare in partnership with industries. It is needs to develop the textbook and its' systemizing, standardization of cartoon language, and cartoon dictionary development. Using the cartoon language widely, it requires universality, simultaneously it needs a times and exact definition in advance. The study and standardization work of cartoon terms in base endure the industry development and disciplinary research which enhance the efficiency between the two sectors.

  • PDF

A Study on the Description of Relationships and Homographs in Terms of Creator and Work in the Korean Thesaurus (한글 시소러스에서 저자와 저작에 대한 관계 설정과 동형 이의어의 기술)

  • Han, Sang-Kil;Choi, Suk-Doo
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.45 no.4
    • /
    • pp.139-155
    • /
    • 2011
  • The failure of distinguishing homographs in describing relations of individual authors and relations of authorship(i.e. distinction of persons with the same name or persons of the same literary author's name) will cause difficulties of retrieving exact information. It is because relations of automorphism cannot be formed between the two sets mentioned above. Therefore, it is ultimately necessary to set up the criteria or tools to distinguish homographs in order to retrieve more exact information. In the past, some efforts were made to develop authority data in order to solve the homograph problems by individual libraries, documents and portal sites in Korea. It is well understood that developing authority data by an individual institution was very difficult with no criteria or no rules to clarify the homograph problems at the national level. This study is to develop ways of recognizing individual names including subject words and proper nouns. The results of the study will present methods of distinguishing and describing homographs between individual author sets, and authorship sets particularly focused on the areas of arts and popular culture.

Opne API for semantic technology (시맨틱 기술 개발을 지원하기 위한 Open API)

  • Park, Jeong-Won;Nam, Se-Jin;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.111-115
    • /
    • 2009
  • 현재 Open API는 프로그램 개발 및 정보의 제공 등 다양한 방향에서 많이 활용 되고 있다. Open API는 개발된 기술을 웹으로 공개하여 네트워크가 연결된 곳이라면 어디서든지 그 기술을 활용할 수 있다. 잘 개발된 Open API는 매쉬업을 통해 또 다른 기술과 합쳐 새로운 서비스를 개발하는 등 그 활용빈도가 높다. 이미 개발된 기술을 활용할 수 있어서 개발 속도가 단축되고 새로운 서비스를 개발하면서 기존의 부족한 부분을 합쳐 더욱 창의적인 정보 제공이 가능하다. 이러한 Open API의 특성을 이용하여 시맨틱 기술 개발을 지원할 수 있으며, 개발 시간 단축 및 관계 설정, 온톨로지 제공 등을 네트워크를 통해 사용자들에게 제공하고 활용할 수 있는 방법을 제시한다. 시맨틱 기술은 사람이 글을 읽고 의미를 이해하는 것처럼 컴퓨터가 이해할 수 있는 언어와 규칙들을 정해 놓아 컴퓨터 사이의 의사소통을 가능하게 하는 지능형 기술이다. 이런 시맨틱 기술 개발을 지원하기 위하여 Open API를 통해 온톨로지의 개념 및 속성, 관계 설정, 코퍼스 등을 제공하기 하기 위해 CoreOnto API라는 것을 구축했다. CoreOnto API는 네트워크에서 사용할 수 있는 Open API로 세가지의 큰 형태의 Open API를 제공하고 있다. 첫 번째, 온톨로지에 대한 클래스, 속성, 관계를 제공하는 APIs, 두 번째, 트리플(두개의 용어가 어떤 관계인지를 표현한 형태로 구성(용어1, 관계, 용어2)) 생성 및 구축된 트리플을 검색할 수 APIs, 세 번째, 온톨로지를 생성하기 위해 필요한 자원(온톨로지 명, 개체명, 관계, 코퍼스 등)을 제공하는 APIs로 구성했다. 이상과 같이 시맨틱 기술 개발을 지원하기 위한 큰 형태의 세 가지 APIs를 구축하는 방법과 APIs의 활용, 그리고 서비스를 테스트한 결과를 제시한다.

  • PDF

Alleviating Syntactic Term Mismatches in Korean Information Retrieval (한국어정보검색에서 구문적 용어불일치 완화방안)

  • Yun, Bo-Hyun;Kim, Sang-Bum;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.143-149
    • /
    • 1998
  • 한국어 정보검색에서 복합명사와 명사구로 발생하는 색인어와 질의어간의 구문적 용어 불일치는 많은 문제를 일으켜왔다. 본 논문에서는 복합명사 분해와 명사구 정규화를 함께 수행하여 유사도 측정값을 적당히 유지함으로써 재현율을 저하시키지 않고서 정확률을 향상시킬 수 있는 구문적 용어불일치 완화방안을 제시하고자 한다 색인모듈에서는 통계정보를 이용하여 복합명사를 분해하고, 의존관계를 이용하여 명사구를 정규화한다. 분해되고 정규화된 키워드에 경계정보 '/'가 할당되고, 가중치가 계산된다. 검색모듈에서는 경계정보를 이용하여 부분일치를 고려하는 유사도 계산을 수행한다. KTSET 2.0으로 실험한 결과, 제안한 방법은 구문적 용어불일치를 완화할 수 있으며, 재현율을 저하시키지 않고서 정확률을 향상시킬 수 있음을 보인다.

  • PDF

Terminological Paraphrase Extraction with Ranking Combination (랭킹 결합에 의한 기술용어 패러프레이즈 추출)

  • Choi, Sung-Pil;Cho, Min-Hee;Jung, Hanmin;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.175-180
    • /
    • 2012
  • 기술용어 패러프레이즈 (Terminological Paraphrase, TP)는 학술 문헌 내에서 기술 용어의 개념 및 정의를 다른 형태로 풀어서 알기 쉽게 서술적 문구 (descriptive expression) 를 의미한다. 이러한 TP들에 대한 효율적인 식별과 추출은 학술 정보에 대한 개념적 접근이나 학술 정보 검색의 재현율 향상에 매우 중요하다. 본 논문은 생명 공학 분야의 논문에 나타나는 다양한 형태의 TP들을 효율적으로 추출하기 위한 정보 검색 기반의 추출 방법론을 제시하고 총 여섯 가지의 추출 랭킹 모델을 기반으로 이를 결합함으로써 TP추출의 확장 가능성에 대한 실험적 연구를 수행한다. 실험 결과, 활용된 랭킹 모델이 서로 상호 보완적인 관계에 있음을 알 수 있었으며, 랭킹 결합에 의한 성능 개선 효과를 얻을 수 있었다.

  • PDF