Semantic Relation Extraction using Pattern Pairs Sharing a Term (용어를 공유하는 패턴 쌍을 이용한 의미 관계 추출)

  • Kim, Se-Jong;Lee, Yong-Hun;Lee, Jong-Hyeok
    • Journal of KIISE:Computing Practices and Letters
    • v.15 no.3
    • pp.221-225
    • 2009
  • Constructing an ontology using a mass corpus begins with an automatic semantic relation extraction. A general method regards words appearing between terms as patterns which are used to extract semantic relations. However, previous approaches consider only one sentence to extract a pattern, so they cannot extract semantic relations for terms in different sentences. This paper proposes a semantic relation extraction method using pairs of patterns sharing a term, where each pattern is extracted using one of the seed term pair satisfying the target relation. In our experiments, we achieved the accuracy 83.75% improving previous methods by 7.5% in is-${\alpha}$ relation and the accuracy 83.75% improved by 5% in part-of relation. We also present a possibility of improving the recall by the relative recall.

A Contribution to Appropriate Korean Equivalents to Some International Gymnosperm Terminologies (나자식물의 바른 한국어(韓國語) 용어 사용에 대한 제언)

  • Song, Unsook
    • Journal of Korean Society of Forest Science
    • v.107 no.2
    • pp.126-139
    • 2018
  • This study aimed to correct some inappropriate Korean gymnosperm terminologies. Rational Korean equivalents to some international terms are suggested to replace the conventional misleading words impling as if gymnosperm plants have flowers and/or fruits like angiosperm plants do as reproductive structures. So, the rectification has been primarily made on reproductive parts including cone, microsporangium (microsporangia), ovulate cone, ovuliferous scale, pollen, and strobilus (strobili). Also, additional suggestions have been made for some expressions other than reproductive parts, such as conifers (coniferous plants), softwood and hardwood misused in Korean traditional practices for a long period of time.

Analysis of Scientific Item Networks from Science and Biology Textbooks (고등학교 과학 및 생물교과서 과학용어 네트워크 분석)

  • Park, Byeol-Na;Lee, Yoon-Kyeong;Ku, Ja-Eul;Hong, Young-Soo;Kim, Hak-Yong
    • The Journal of the Korea Contents Association
    • v.10 no.5
    • pp.427-435
    • 2010
  • We extracted core terms by constructing scientific item networks from textbooks, analyzing their structures, and investigating the connected information and their relationships. For this research, we chose three high-school textbooks from different publishers for each three subjects, i.e, Science, Biology I and Biology II, to construct networks by linking scientific items in each sentence, where used items were regarded as nodes. Scientific item networks from all textbooks showed scare-free character. When core networks were established by applying k-core algorithm which is one of generally used methods for removing lesser weighted nodes and links from complex network, they showed the modular structure. Science textbooks formed four main modules of physics, chemistry, biology and earth science, while Biology I and Biology II textbooks revealed core networks composed of more detailed specific items in each field. These findings demonstrate the structural characteristics of networks in textbooks, and suggest core scientific items helpful for students' understanding of concept in Science and Biology.

시맨틱 웹 기술에 의한 표준 정보 검색 서비스의 진화

  • Jeong, Han-Min;Lee, Mi-Gyeong;Kim, Pyeong;Lee, Seung-U;Seong, Won-Gyeong;Kim, Tae-Wan;Lee, Jong-Seop
    • Proceedings of the Korea Society for Industrial Systems Conference
    • 2008.10b
    • pp.575-582
    • 2008
  • 본 논문은 시맨틱 웹 기술이 어떻게 국가 표준(KS) 정보 검색 서비스 내 정보들을 연계시키고 사용자 접근성을 향상시키는 데 도움을 줄 수 있는지를 실증적으로 보여준다. 기존 표준 정보 검색 서비스는 용어 검색의 유연성이 부족하여 표준 정보에서 사용된 용어와 사용자 용어 간의 괴리를 해소하지 못했으며 표준, 기관, 인력 등 상호 관련성을 가진 개체 정보들을 개별적으로 서비스하였다. 이러한 상황은 사용자의 표준 정보 검색 서비스 접근성을 떨어뜨리는 요인으로 작용한다. 본 연구에서는 유의어, 관련어를 중심으로 한 표준 용어 사전 구축을 통해 사용자 용어와 표준 정보 내 용어 간의 원활한 매칭을 지원하며, 표준 관련 개체들을 온톨로지와 추론을 통해 연계시키는 방안을 제시한다. 개선된 표준 정보 검색 서비스는 개선된 표준 정보 검색 서비스는 개체 중심적 통합 검색 결과 제공 방식으로 관련 정보들을 단일 웹 페이지 내에서 확인할 수 있도록 해준다. 예를 들어, 특정 KS 표준 검색 결과 페이지에서는 기존에 DB 접근이나 검색 엔진을 통해 바로 획득할 수 없었던 정부 표준들, 기관들의 해당 KS 표준 인용 현황, 해당 KS 표준 전문가들, 부합화를 위해 참조된 국제 표준들, 해당 KS 표준 전문가들, 부합화를 위해 참조된 국제 표준들, 해당 KS 표준 전문가 네트워크, 해당 KS 표준 내 표준 용어 사전 정보 등 다양한 관련 정보들을 조합하여 서비스한다. 본 연구를 위해 모델링된 온톨로지와 시맨틱 웹기반 서비스 프레임워크인 OntoFrame 상에서 추론 작업이 표준 정보 적재 시에 전방 추론 (Forward-chaining) 방식으로 수행되었으며, 표준 온톨로지 질의 언어인 SPARQL (SPARQL Protocol and RDF Query Language)을 이용해 일반 검색 서비스 수준의 속도로 서비스될 수 있었다.

Website Classification based on Occurrence Frequency of Medical Terms and Hyperlinks in Webpage (웹페이지의 의학용어 출현 빈도와 하이퍼링크에 기반한 웹사이트 분류)

  • Lee, In Keun;Kim, Hwa Sun;Cho, Hune
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.23 no.2
    • pp.126-132
    • 2013
  • This study proposed a method to classify internet websites based on occurrence frequency of medical terms in the webpages and website structure composed with webpages and hyperlinks. The classification was done by using the suitability measure defined by three factors: (1)occurrence frequency of medical terms in the whole terms involved in a webpage, (2)occurrence frequency of medical terms in de-duplicated terms involved in the webpage, and (3)the number of hyperlinks to reach to a specific webpage from homepage. We conducted an experiment to verify the proposed method with the 80 websites registered in directories related to medical field and 127 websites in nonmedical field directories, and the experiment result showed 82.5 % of accuracy of the classification.

A Comparative Analysis of the Word Depth Appearing in Representations Used in the Definitions of Mathematical Terms and Word Problem in Elementary School Mathematics Textbook (초등 수학 교과서의 수학 용어 정의 및 문장제에 사용된 표현의 문장 복잡성 비교 분석)

  • Kang, Yunji;Paik, Suckyoon
    • Journal of Elementary Mathematics Education in Korea
    • /
    • /
    • pp.231-257
    • 2020
  • As the main mathematical concepts are presented and expressed in various ways through textbooks during the teaching and learning process, it is necessary to look at the representations used in elementary math textbooks to find effective guidance. This study analyzed sentences used in the definition of mathematical terms and unit assessments of current elementary mathematics textbooks according to word depth (Yngve, 1960) from a syntactic perspective. As a result of the analysis, it could be seen that the sentences in textbook were generally concise, the word depth was lower, and the sentence structure and form were different depending on the individual characteristics of each term. Also, the sentences in the lower grade textbooks were more easily constructed, and the sentences of the term definition were more complex than the sentences of the unit assessments. Efforts should be made to help learners learn mathematical concepts, such as clarifying sentences in textbooks, presenting visual materials together, and providing additional explanations to suit the level of individual learners.

Design and Implementation of technical term dictionary system written in nML (nML을 이용한 기술용어 사전 시스템 구축)

  • 강현구;이광근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.70-72
    • 2001
  • ML은 엄밀한 수학적 모델에 기반 하여 구현된 프로그래밍 언어로서 고차함수, 복합형 함수와 엄격한 타입시스템을 지원하는 언어이다. nML은 한국과학기술원 프로그램 분석 시스템 연구단에서 연구중인 프로그램 분석 기술을 최대한 반영하여 구현하고 있는 ML의 한국형 사투리이다. 본 논문에서는 nML을 이용하여 일반적이고 자주 사용되는 프로그래밍 국면을 다양하게 반영한 응용프로그램을 구축하여 보았다. 구현하고자 하는 시스템은 중앙 집중형 데이터 서버를 가지는 기술용어 사전 시스템으로서 KDIC이라 명하였다. 본 시스템의 목적은 특정 분야에서 영어 용어들에 대한 전문인의 한글 용어로의 번역 사례를 모은 데이터 베이스를 구축하고, 이러한 번역 사례가 자연스럽게 이용되고자 함에 있다.

Analysis of Terms by Curriculum in 2015 Revised Curriculum for Digital Knowledge Education in 2022 Revised Curriculum (2022 개정 교육과정의 디지털 소양 교육을 위한 2015 개정 교육과정 교과별 용어 분석)

  • Kim, Eun-Ji;Lee, Young-Jun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • /
    • pp.725-726
    • 2022
  • 디지털 소양의 용어는 2022 개정 교육과정에서 새롭게 다루어지는 개념이다. 그동안은 디지털 소양의 의미를 담은 다양한 용어들이 각 교과 특성에 맞게 혼재되어 사용되어 왔다. 하지만 2022 개정 교육과정에서는 모든 교과에서 디지털 소양을 다룰 것을 강조하고 있기 때문에 각 교과와의 개념에 대한 합의가 필요하다. 따라서 본 연구에서는 2015 개정 교육과정의 초등 각 교과에서는 디지털 소양과 관련된 어떤 용어들이 사용되어왔는지 분석해보고자 한다.

인터넷 항해

  • Korea Database Promotion Center
    • Digital Contents
    • no.2 s.45
    • pp.60-61
    • 1997
  • 한국데이터베이스진흥센터는 데이터베이스 이용의 편의를 제공하기 위해 97년 3월 1일부터 인터넷 홈페이지(URL : http://www.dpc.or.kr)를 개설한다. 센터의 홈페이지는 센터 안내 정보, 데이터베이스 목록 정보, 데이터베이스 용어 정보로 구성되어 있다. 데이터베이스 용어 정보로 구성되어 있다.

Preliminary Study on the Analysis of Term Associations in Korean Text (한국어 텍스트 내 용어연관성 분석을 위한 기초 연구)

  • 정영미;이재윤
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • pp.243-246
    • 1998
  • 텍스트 자동분석을 통해 얻어진 통계적인 용어연관성은 정보검색 및 언어 처리와 관련된 여러 분야에서 폭넓게 이용되고 있다. 용어연관성을 구하기 위한 연관계수는 여러 가지가 있지만 적용분야에 관계없이 유사계수 공식이나 상호정보량 공식이 주류를 차지하고 있다. 이런 공식들은 그 통계적 특성이 서로 다르기 때문에 알맞은 적용분야를 파악할 필요가 있다. 이 연구에서는 필요 연관계수 공식의 특성을 이론적으로 파악하였고, 실험으로 검증하기 위하여 240만 어절 분량의 실험용 한국어 신문기사 데이터베이스를 구축하였다.

