Comparing the Performance of Internet Search Engines according to the Query Types (질문 유형에 따른 인터넷 검색엔진의 성능 비교)

  • 이재윤
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2003.08a
    • /
    • pp.185-192
    • /
    • 2003
  • 국내 인터넷 검색엔진의 성능을 질문의 유형별로 비교해보았다. 실험에는 30명의 대학생이 참여하여 탐색질문을 작성하고 직접 탐색하여 검색결과의 적합성을 판정하였다. 실험참가자마다 탐색어 1개, 2개, 3개짜리 질문을 하나씩 작성하도록 한 결과 총 90개의 질문이 실험에 사용되었다. 질문의 유형은 질문의 길이 이외에 주제의 최신성 여부와 고유명사의 포함 여부를 기준으로 나누었다. 실험 결과 전체적인 성능은 구글이 가장 뛰어났으나, 고유명사를 포함한 최신주제 질문에 대해서는 네이트와 엠파스가 구글보다 좋은 성능을 보였다.

An Experimental Approach of Keyword Extraction in Korean-Chinese Text (국한문 혼용 텍스트 색인어 추출기법 연구 『시사총보』를 중심으로)

  • Jeong, Yoo Kyung;Ban, Jae-yu
    • Journal of the Korean Society for information Management
    • /
    • v.36 no.4
    • /
    • pp.7-19
    • /
    • 2019
  • The aim of this study is to develop a technique for keyword extraction in Korean-Chinese text in the modern period. We considered a Korean morphological analyzer and a particle in classical Chinese as a possible method for this study. We applied our method to the journal "Sisachongbo," employing proper-noun dictionaries and a list of stop words to extract index terms. The results show that our system achieved better performance than a Chinese morphological analyzer in terms of recall and precision. This study is the first research to develop an automatic indexing system in the traditional Korean-Chinese mixed text.

Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation (구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델)

  • Kim, Hae-Gyung;Chae, Young-Soog;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

The Anaphoric Theory of Reference and Objections Against It (지칭의 대용어 이론과 이에 대한 비판들)

  • Lee, Byeongdeok
    • Korean Journal of Logic
    • /
    • v.18 no.2
    • /
    • pp.217-241
    • /
    • 2015
  • Brandom upholds the anaphoric theory of reference. On this theory, reference is a relation of anaphoric dependence between linguistic items rather than a substantial relation between linguistic items and non-linguistic objects. In addition, 'refers' is a pronoun-forming operator, which is used to form anaphorically indirect descriptions such as 'the one referred to as "Leibniz"'. Recently, Arbid $B{\aa}ve$ raises three objections against this theory. First, the anaphoric theory distinguishes between ordinary descriptions and anaphorically indirect descriptions in terms of iterability. But this condition is not an adequate ground for asserting that anaphorically indirect descriptions form a distinctive semantic category. Second, sentences containing a pronoun such as 'he' and sentences containing an anaphorically indirect description such as 'the one referred to as "Leibniz"' have different modal statuses. Consequently, indirect descriptions are semantically different from paradigmatic anaphors. Third, on the anaphoric theory, expressions of the form 'a' and the corresponding indirect descriptions of the form 'the one referred to as "a"' are intersubstitutable. But we can make an equivalent claim by using the more general semantic concepts such as equivalence and intersubstitutability, instead of using notions such as 'anaphor' and 'antecedent'. So the anaphoric theory is explanatorily idle. In this paper I argue that these objections do not pose a serious problem for the anaphoric theory of reference. I argue thereby that the anaphoric theory of reference is a promising theory which provides us with the right understanding of the expression 'refers'.

Korean Morphological Analysis Algorithms for Automatic Indexing (자동색인을 위한 한국어 형태소 분석 알고리즘)

  • Lee, Young-Joo
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.240-246
    • /
    • 1989
  • 자동색인이라 함은 기존의 수작업에 의한 색인어 선정 대신 컴퓨터에 의해서 자동화하는 것을 말한다. 한국어는 색인어가 될 수 있는 어근에 조사 및 어미가 붙어서 한 어절을 이루는 언어학 적인 특성을 갖고 있다. 지금까지는 어근을 분리하기 위해 어근에 대한 사전을 구축하고 이를 Top-down 방법에 의해 처리하는 것이 통례였다. 그러나 이러한 방법은 외래어나 고유명사 등 새로 발생하는 어휘가 많은, 뉴스 원고와 같은 보도자료에는 쉽게 적용할 수가 없으며, 자연어를 다루는 타 분야에서도 미등록어에 대한 처리 방안이 시급한 실정이다. 본 논문은 어휘사전 없이 조사 및 어미의 생성 규칙을 이용한 Bottom-up 방식으로 처리하여 후보 색인어를 추론하고, 어절 상호간의 관계를 밝히는 구문분석을 통하여 이를 확정하는 알고리즘을 제안하였다.

A Trend analysis of cultural consumption in today's Korea (트렌드로 살펴본 문화 소비 현상)

  • Kim, Hye-Young;Kim, Heung-Gyu;Kang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.15-20
    • /
    • 2011
  • 본 논문은 동아, 조선, 중앙, 한겨레 신문의 2000-2009년까지의 신문 자료에서 나타나는 문화 소비 현상의 트렌드에 대한 분석이다. 구체적으로, 명사 '트렌드'와의 공기어(공기 명사) 중에서 10년 동안 꾸준히 증가하는 단어들(일반 명사, 고유 명사)을 살펴보고 이것들의 속성에 따라서 명사를 분류하여 공기어의 증감도를 살펴본다. t-score를 이용하여 공기어를 추출하고 이들의 증감도를 분석하여 매년 공기하여 나타는 정도가 증가하는 단어를 대상으로 연구하였다. 이러한 명사의 빈도 증가를 통해 신문에서 나타나는 사회적 트렌드를 관찰할 수 있다.

A Study on the Measurement of Natural Frequency for Seismic Design of High Rise Buildings (고층건물의 내진설계를 위한 고유진동수 측정에 관한 연구)

  • Kim, Dong-Baek;Lee, Byeong-Hoon;Lee, In-Duk;Lee, Kwang-Jae
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2015.11a
    • /
    • pp.127-129
    • /
    • 2015
  • 최근 도심의 건물들은 수요자의 요구에 따라 평면이 다양화 되어가고 토지의 효율을 높이기 위하여 초고층화 되어가는 경향이 있다. 심지어 전통적인 공동주택의 개념으로 지어지는 아파트도 그 높이가 100m를 상회하는 경우가 대부분이다. 현재 국내의 구조설계 시 구조물의 동적특성 요소를 반영하는 고유 진동수는 주로 미국의 지진자료를 바탕으로 계산되게 되어있으며, 기존 연구결과 실측결과가 상당한 차이를 보이고 있어 이에 대한 검토가 요구되고 있다. 이에 본 연구에서는 내진설계의 기본이 되는 건물의 고유주기를 측정하고 내진성능을 평가하여, 보다 경제적인 내진설계 방안에 대한 제시하고자 한다. 또한, 벽식구조건물의 경우 구조설계 기준에서 제시하는 지진하중을 산정할 때, 실무자들이 구조형식을 선택하기가 곤란하여 어떤 주기산정 식을 사용해야 할지 혼란스러워 하는 경우가 많으므로, 기타 골조 식과 전단벽 식을 고려하는 경우를 구조물의 상시 미진동을 측정하여 고유 진동수 및 고유 주기를 비교하여 제시하였다. 연구결과 기타 골조 식에 의해 계산된 값은 매우 보수적으로 나타나서 이에 대한 검토도 필요하다고 사료된다.

A Method for Unknown-Word Extraction from Korean Text (한국어 구문 분석기를 이용한 지명 추정 시스템 설계 및 구현)

  • Lee, Hyun-Suk;Ha, You-Sun;Kim, Tae-Hyun;Lee, Mann-Ho;Myaeng, Sung-Hyon
    • Annual Conference of KIPS
    • /
    • 2000.10a
    • /
    • pp.383-386
    • /
    • 2000
  • 본 논문에서는 학습데이터를 이용하여 텍스트로부터 미등록 고유명사를 추정하는 방법을 제안한다. 고유명사 추정을 위해 먼저 형태소 분석기를 이용하여 품사가 명사인 단어들을 후보단어로 선택한다. 이렇게 선택된 후보단어가 고유명사인지 추정해 보기 위해 학습데이터를 이용하여 구성한 정보집합을 사용한다. 이러한 정보집합으로는 이름집합, 접미사집합, 단서집합, 배제어 집합이 있다. 본 논문에서는 이런 정보를 이용하여 한국어 지명을 추정하는 시스템을 구현하여 실험한 결과 77.2%의 정확도와 84.9%의 재현율을 보였다.

Generalization of Tanner′s Minimum Distance Bounds for LDPC Codes (LDPC 부호 적용을 위한 Tanner의 최소 거리 바운드의 일반화)

  • Shin Min Ho;Kim Joon Sung;Song Hong Yeop
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.29 no.10C
    • /
    • pp.1363-1369
    • /
    • 2004
  • LDPC(Low Density Parity Check) codes are described by bipartite graphs with bit nodes and parity-check nodes. Tanner derived minimum distance bounds of the regular LDPC code in terms of the eigenvalues of the associated adjacency matrix. In this paper we generalize the Tanner's results. We derive minimum distance bounds applicable to both regular and blockwise-irregular LDPC codes. The first bound considers the relation between bit nodes in a minimum-weight codeword, and the second one considers the connectivity between parity nodes adjacent to a minimum-weight codeword. The derived bounds make it possible to describe the distance property of the code in terms of the eigenvalues of the associated matrix.

A Visualization Technique for Cyclic Queries in the Graphical Object Query Language OGQL (그래픽 객체 질의어 OGQL에서 순환적 질의의 시각적 표현 기법)

  • 정태성;안명상;조완섭
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.8 no.1
    • /
    • pp.112-120
    • /
    • 2003
  • We propose a graphical object query language called OGPL (Odysseus Graphical Query Language) for Odysseus object databases. By employing simple graphical notations, OGQL provides a user friendly database interface for object databases. OGQL provides a simple graphical notation for advanced features of the object queries such as path expressions including cycles (cyclic queries). Cyclic queries have not been handled in the previous graphical query languages because of their complexity and ambiguity in devising appropriate graphical notations. GOQL also provides a graphical notation for inheritance hierarchy. Since OGQL has been implemented in Java and JDBC standard interface, users can access the remote databases in a web environment and the system has platform-independent architecture.

