• 제목/요약/키워드: 수학식 검색

검색결과 11건 처리시간 0.027초

후위 표기법을 사용한 수학식 색인 및 랭킹 (Indexing and Ranking Mathematical Equations Using Postfix Notation)

  • 이세희;신준수;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.160-164
    • /
    • 2009
  • 최근 인터넷 및 컴퓨터의 사용이 활발해짐에 따라 문서의 디지털화가 빠르게 진행되고 있다. 이런 변화에 따라 수학식이 많이 사용되는 과학, 공학, 수학 등의 분야와 관련된 문서들을 검색해야할 필요성이 늘어가고 있다. 그러나 현재 일반 검색엔진은 텍스트 검색만을 제공하며 별도의 수학식 검색은 제공하지 않는다. 따라서 본 논문에서는 수학식 검색이 가능하도록 수학식의 색인 방법 및 랭킹 방법을 제안한다. 제안하는 색인 방법은 MathML로 입력되는 수학식을 후위 표기법과 일반 색인 방법의 두 가지로 색인하며, 언어모델을 사용하여 질의에 적합한 수학식을 랭킹한다. 일반 검색 엔진의 성능과 비교하기 위하여 2-포아송 모델과 제안 모델을 비교하였으며, 그 결과 제안 모델의 성능이 더 우수함을 보였다.

  • PDF

한글화된 수식 패턴을 이용한 수학식 검색 시스템 (A Mathematical Equation Retrieval System Based on Formula Patterns Expressed in Korean)

  • 김신일;양선;고영중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.233-236
    • /
    • 2011
  • 일반적인 문서에 대한 정보 검색 연구는 활발히 진행되고 있으며, 일상 생활 속에서도 대중화되어 많이 사용되고 있다. 이에 따라 음성, 이미지 검색 등 특정 분야의 검색에 대한 연구도 활발히 진행되고 있지만, 수학식 검색에 대한 연구는 비교적으로 미비한 실정이다. 수학식 검색과 관련된 연구들은 대부분 MathML (Mathematical Markup Language), TeX 등으로 작성된 수학식을 대상으로 진행되었지만, 특정 언어나 별개의 수학 입력 툴들을 이용한 검색 방법은 일반 사용자들이 사용하기에는 쉽지 않다는 단점이 있다. 그래서, 본 논문에서는 일반 문서 검색과 마찬가지로, 수학식을 읽듯이 한글을 입력했을 때 색인어 추출 방법 및 검색 방법에 대해 제안한다. 실험을 위해서 수학 문제집에 나오는 1,432개의 수학식을 한글화 시켰고, 한글화된 결과에 대해 패턴 등을 추출하여 MRR (Mean Reciprocal Rank), $Rel_{EQ}$@N(Relevance evaluation at N)로 평가하였다. 100개의 한글 질의어에 대해 MRR@5로 계산된 수학식 검색 결과가 약 0.6 정도 되는 것을 확인할 수 있었고, 학습 데이터에 포함되지 않은 질의수학식 5개에 대해 $Rel_{EQ}$@5로 계산했을 때 평균 60% 의 정확률을 보였다.

평문 질의어 MathML 용어 변환을 이용한 수학식 검색 (Mathematical Equation Retrieval by Converting Plaintext Queries into MathML Terms)

  • 이준영;양선;고영중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.312-314
    • /
    • 2012
  • 본 논문은 한글로 입력된 질의어를 이용하여 웹상의 MathML (Mathematical Markup Language) 수학식을 검색하는 시스템을 제안한다. 웹상의 수학식은 과거 이미지를 이용하여 표현되는 경우가 많았지만, 현재는 대부분 MathML과 같은 수학식 표현 마크업 언어로 작성되고 있다. 그러나 이러한 수학식을 검색하기 위해서는 해당 언어를 알고 있거나 수식 입력 툴을 이용해야 하는 경우가 대부분이기 때문에, 일반 사용자들이 수학식 검색을 하는 데에는 제약점이 따랐다. 본 연구에서는 사용자들이 전통적인 검색 방법을 이용하여 특정 마크업 언어가 아닌 일반 평문으로 작성된 질의어를 입력하여 수학식을 검색 가능 하도록 하기 위해, 평문 질의어를 MathML 표현으로 변환시키는 방법을 사용한다. 질의어로 입력될 수 있는 다양한 수학식 표현을 미리 구축한 사전을 이용하여 MathML 표현으로 변환하는 간결한 기법만으로도 MRR 0.495 의 높은 성능을 얻을 수 있었다.

토픽 모델을 이용한 수학식 검색 결과 재랭킹 (Reranking Search Results for Mathematical Equation Retrieval Using Topic Models)

  • 양선;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.77-81
    • /
    • 2013
  • 본 논문은 두 가지 주제에 대해 연구한다. 첫 번째는 수학식 검색에 대한 것이다. 웹에는 양질의 수학식 데이터가 마크업 언어 형태로 저장되어 있으며 이를 활용하기 위한 연구들이 활발히 진행되고 있다. 본 연구에서는 MathML (Mathematical Markup Language)로 저장된 수학식 데이터를 일반 질의어를 이용하여 검색한다. 두 번째 주제는 토픽 모델(topic model)로 검색 성능을 향상시키는 방법에 대한 것이다. 먼저 수학식 데이터를 일반 자연어 문장으로 변환한 후 Indri 시스템을 이용하여 검색을 수행하고, 토픽 모델을 이용하여 미리 산출된 스코어를 적용하여 검색 순위를 재랭킹한 결과, MRR 기준 평균 5%의 성능을 향상시킬 수 있었다.

  • PDF

정보검색에서 부울연산자를 연산하는 식의 수학적 특성 (Mathematical Properties of the Formulas Evaluating Boolean Operators in Information Retrieval)

  • 이준호;이기호;조영화
    • 정보관리학회지
    • /
    • 제12권1호
    • /
    • pp.87-97
    • /
    • 1995
  • 부울 검색 시스템은 구현이 용이하고 빠를 검색 시간을 제공하기 때문에, 오늘날 정보 검색 분야에서 가장 널리 사용되고 있다. 그러나 순수한 부울 검색 시스템은 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정도에 따라 정렬 할 수 없다. 부울 검색 시스템에 순위 결정 기능을 부여하기 위하여 퍼지 집합, Waller-Kraft, Paice, P-Norm, Infinite-One과 같은 확장된 부울 모델들이 개발되어 왔다. 이들 모델에서 부울 연산자 AND와 OR에 대한 계산식은 순위 결정의 성능을 결정하는 중요한 요소이다. 본 논문에서는 부울 연산자 계산식의 수학적 특성을 제시하고, 이들이 검색효과에 미치는 영향을 분석한다. 분석 결과는 P-Norm 모델이 높은 검색 효과를 얻기에 가장 적합함을 보여준다.

  • PDF

MathML에 기반한 수학식 생성 웹사이트의 설계 및 구현 (A Design and Implementation of MathML-based Math Equation Generating Website)

  • 박정희;이미정
    • 컴퓨터교육학회논문지
    • /
    • 제6권3호
    • /
    • pp.173-183
    • /
    • 2003
  • 인터넷이 널리 보급되면서 웹을 이용한 이러닝 교육방법이 활성화되고 있다. 웹 기반 교육에 있어서 수학도 예외는 아니다. 그런데 수학식을 웹 마크업 언어 HTML의 이미지 태그를 이용하여 표현하면 구조적 특정을 가지는 수학식의 표현과 검색이 어렵게 되고, 수학 관련 어플리케이션에서의 재사용이 어렵게 된다는 문제가 발생한다. 그래서 본 논문은 MathML에 기반하고, ActiveX 컨트롤 기술을 이용한 수학식 생성 웹사이트를 설계하고 구현한다. 본 시스템은 ActivcX 컨트롤 기술을 이용하기 때문에 웹상에서 시공간 제약 없이 수학식 생성을 할 수 있고, 프로그램의 최신 버전 관리가 가능하다. 또한 본 시스템에서 생성한 수학식을 저장 가능하게 하여 차후에 재사용이 가능하도록 하였다.

  • PDF

The Ecology of the Scientific Literature and Information Retrieval (I)

  • Jeong, Jun-Min
    • 정보관리학회지
    • /
    • 제2권2호
    • /
    • pp.3-37
    • /
    • 1985
  • 본 논문은 좀 더 효율적이고 효과적인 정보 시스팀을 개발하고자 다음 두가지 가설을 제시하였다. 1) 인용 문헌 분석을 통하여 인용빈도가 높고 시간의 흐름에 따른 인용율이 증가하는 문헌은 그 문헌적 가치가 상대적으로 높다(Quality Filtering). 2) 정보 검색에 있어서 확률이론을 통한 문헌간의 상관관계를 규명짓는 클러스터링 기법이 재현율과 정확율을 모두 증가시킬 수 있다(Clustering Technique). 실제로 고프만(Goffman)의 전염성 이론의 미시적 응용(Micro-epidemic process) 데이터 베이스 내에서의 문헌의 질적 여과(Quality Filtering)를 위한 한 기법으로서 좋은 결과를 얻어냈으며 많은 정보를 이런 식으로 여과시킴으로써 정보 검색 시스팀의 효율성 또한 높일 수 있었다. 한편, 질적 여과를 거친 소규모 데이터 베이스 내에서 클러스터링 기법에 의한 정보 검색 효율은 수학의 커널 기법(Kernel Technique)의 활용으로 높은 재현율과 정확율을 나타냈을 뿐만 아니라 검색의 폭에 있어서도 많은 융통성을 제시하여 주었다.

  • PDF

The Ecology of the Scientific Literature and Information Retrieval (II)

  • Jeong, Jun-Min
    • 정보관리학회지
    • /
    • 제3권1호
    • /
    • pp.3-16
    • /
    • 1986
  • 본 논문은 좀 더 효율적이고 효과적인 정보 시스팀을 개발하고자 다음 두가지 가설을 제시하였다. 1) 인용 문헌 분석을 통하여 인용빈도가 높고 시간의 흐름에 따른 인용율이 증가하는 문헌은 그 문헌적 가치가 상대적으로 높다(Quality Filtering). 2) 정보 검색에 있어서 확률이론을 통한 문헌간의 상관관계를 규명짓는 클러스터링 기법이 재현율과 정확율을 모두 증가시킬 수 있다(Clustering Technique). 실제로 고프만(Goffman)의 전염성 이론의 미시적 웅용(Micro-epidemic process)은 데이타 베이스 내에서의 문헌의 질적 여과(Quality Filtering)을 위한 한 기법으로서 좋은 경과를 얻어냈으며 많은 정보를 이런 식으로 여과시킴으로써 정보 검색 시스팀의 효율성 또한 높일 수 있었다. 한편, 질적 여과를 거친 소규모 데이터 베이스 내에서 클러스터링 기법에 의한 정보 검색 효율은 수학의 커널 기법(Kernel Technique)의 활용으로 높은 재현율과 정확율을 나타냈을 뿐만 아니라 검색의 폭에 있어서도 많은 융통성을 제시하여 주었다.

  • PDF

수식을 포함한 전자문헌의 구조적 처리를 위한 XML 문서편집시스템 (XML Document Editing System for Structural Processing of the Digital Document to Including Mathematical Formula)

  • 윤화묵;유범종;김창수;정회경
    • 정보관리학회지
    • /
    • 제19권4호
    • /
    • pp.96-111
    • /
    • 2002
  • 현재 기관이나 조직 내에 수많은 양의 데이터가 축적되어 존재하고 있으나 대부분의 데이터는 각 기관이나 조직에 따라 정형화된 형태로 남아있는 실정이다. 정형화된 정보는 정보의 교환 및 공유에 어려움이 있다. 이러한 단점을 극복하고자 지식정보자원관리라는 새로운 개념이 도입되었으며, 축적된 데이터들을 공유 및 관리하기 위한 지식정보자원의 디지털화가 실행되고 있다. 특히 과학기술 또는 교육학술 분야에서는 지식정보자원의 교환 및 공유에 필요한 데이터를 구조적으로 처리하고자 XML을 도입하려는 움직임이 일고 있으며, 이들 분야의 전자문서 안에 사용되어지는 수많은 수학식의 표현이 이미지나 텍스트 등의 비구조적인 데이터로 처리됨에 따라 검색과 인덱싱 또는 재사용성 등의 제한사항이 발생하게 된다. 이를 극복하고자 MathML을 이용한 수학식의 처리에 관심이 집중되고, MathML을 구조적인 문서상에 쉽고 효율적으로 처리할 수 있는 솔루션이 요구되고 있는 실정이다. 이에 본 논문에서는 지식정보자원을 목적으로 하는 전자문서의 구조적인 처리를 용이하게 하고, MathML에 대한 전문적인 지식이 없어도 구조적인 문서상에 쉽게 MathML을 생성 및 표현할 수 있는 XML 문서 편집 시스템을 구현하였다.

이동 객체의 최근접 질의를 위한 유효 시간에 관한 연구 (A Study on Valid Time for Nearest Neighbor Query of Moving Objects)

  • 강구안;이상욱;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.163-166
    • /
    • 2005
  • 최근 눈부신 무선 통신 기술의 발전은 위치정보 시스템과 위치 기반 서비스(Location-Based Service) 의 급속한 발전을 이루었다. 시공간 상에서 이동체에 대한 데이터베이스는 사용자에게 이동체의 현재위치 정보를 제공하는 것만큼 그 질의 결과의 유효시간 또한 매우 중요하다. 따라서 본 논문에서는 질의 점과 객체가 동시에 이동 중일 때 현재 질의 결과를 계산하는 방법과 그 질의 결과의 유효시간 및 유효시간 후의 질의 결과를 검색하는 방안을 제안한다. 이동 객체는 실시간으로 변화하기 때문에 현재 질의 결과가 조금만 시간이 지나도 잘 못된 정보가 될 수 있고 미래의 결과를 반복연산에 의해 계산하기 어렵기 때문에 우리는 수학식으로 유효 시간을 예측하고자 하는 것이다.

  • PDF