• Title/Summary/Keyword: 정보과

Search Result 39,114, Processing Time 0.053 seconds

코퍼스를 이용한 정보검색용 전자사전구축에 관한 연구

  • Nam, Yeong-Jun
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.430-440
    • /
    • 1996
  • 지능형 정보검색시스템이 효율적으로 운용되기 위해서는 여러개의 서브시스템이 필요하다. 특히, 시소러스와 색인 및 검색시스템용 전자사전은 중요한 지식베이스이다. 본 연구에서는 한글전자사전의 개발에 필요한 이론과 구축기술에 대해 조사하였다. 그 내용은 1)전자사전의 의미, 2)전자사전의 형태, 3) 전자사전개발을 위한 코퍼스 구축기술 및 방법이라는 이론적인 부분과 실제 과기원코퍼스2를 이용한 균형코퍼스를 설계하였다. 한편, 균형코퍼스를 이용한 기본적인 명사사전과 공기사전, 전문용어사전구축방법도 제시하였다.

  • PDF

Text Classification By Boosting Nave Bayes (베이지안 부스팅학습에 의한 문서 분류)

  • 김유환;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.256-258
    • /
    • 2000
  • 최근 들어, 여러 기계학습 알고리즘이 문서 분류와 여과에 사용되고 있다. 특히 AdaBoost와 같은 부스팅 알고리즘은 실세계의 문서 데이터에 사용되었을 때 비교적 좋은 성능을 보이는 것으로 알려져 있다. 그러나 지금까지의 부스팅 알고리즘은 모두 단어의 존재 여부만을 가지고 판단하는 분류자를 기반으로 하고 있기 때문에 가중치 정보를 충분히 사용할 수 없다는 단점이 있다. 이 논문에서는 나이브 베이스를 사용한 부스팅 알고리즘은 단어의 가중치 정보를 효율적으로 사용할 수 있을 뿐 아니라. 확률적으로도 의미있는 신뢰도(confidence ratio)를 생성 할 수 있기 때문이다. TREC-7과 TREC-8의 정보 여과 트랙(filtering track)에 대해서 실험한 결과 좋은 성능을 보여주었다.

  • PDF

Text Categorization Using Both Lexical Information and Syntactic Information (어휘정보와 통사정보를 모두 이용한 문서분류)

  • 박성배;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.37-39
    • /
    • 2001
  • 현재 이용가능한 대부분의 자동문서분류 시스템의 가장 큰 문제는 문서에 포함된 단어 사이의 통사 정보는 무시한 채, 각 단어의 분포만 고려한다는 점이다. 하지만, 통사 정보도 문서 분류를 위해 매우 중요한 정보 중의 하나이다. 본 논문에서는 문서에 나타난 어휘 정보와 함께 통사 정보를 함께 고려하는 자동문서분류 방법을 제시한다. Reuters-21578 말뭉치에 대한 문서분류 실험결과 제시된 방법은 어휘정보만 사용하는 방법과 통사정보만 사용하는 방법 모두보다 높은 성능을 보인다 이 말뭉치에 대해서, 어휘정보만으로 학습된 Support Vector Machine으로 약 77%의 매우 높은 정확도를 얻을 수 있음에도 약 0.63%의 추가적인 성능 향상이 있었다.

  • PDF

GeoVideo : Video Geographic Information System (지오 비디오 : 비디오 지리정보시스템)

  • 김경호;김성수;이성호;이종훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.623-625
    • /
    • 2003
  • 공간정보와 멀티미디어가 긴밀히 결합된 새로운 형태의 지리정보 환경이 미디어 지리정보시스템(MediaGIS)이다. 비디오 지리정보시스템(VideoGIS)은 미디어 지리정보시스템의 한 예로서 공간정보와 비디오와의 결합과 상호작용에 중점을 두고 있다. 본 논문에서 제시한 지오 비디오(GeoVideo)는 비디오를 기반으로 공간정보의 조회, 검색, 분석 등이 가능한 최초의 비디오 지리정보시스템이다. 지오 비디오는 기존의 인위적이고 함축적이고 그래픽적인 패러다임에서 자연적이고 사실적이고 이미지적인 패러다임으로의 변화의 의미를 지닌다. 본 논문에서는 비디오와 공간정보의 결합에 대해 자세히 논의하고 시스템 구성 방법에 있어서의 고려사항 등에 관해서 논의하기로 한다.

  • PDF

고차 일반화극치분포와 PMLE를 이용한 환율자료분석

  • Jeong, Bo-Yun;Jeon, Yu-Na;Park, Jeong-Su
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2003.10a
    • /
    • pp.147-152
    • /
    • 2003
  • 본 논문에서는 일반화극치분포(GEV)와 r개의 순서통계량을 이용한 r-GEV를 기술하였다. 모수 $\mu,\;\sigma$, k 를 추정하기 위해 최우추정법(MLE)과 Penalized MLE(P-MLE) 방법을 적용해 보았다. 이 분포를 원/달러 환율자료에 적용하여 일종의 재정위기 분석을 실시하였다.

  • PDF

Building a UML class diagram using Java code analysis techniques (Java 코드 분석기법을 이용한 UML 클래스 다이어그램 생성 방법)

  • 한무희;김경수;김현수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.133-135
    • /
    • 2003
  • 본 연구에서는 자바 코드로부터 UML 클래스 다이어그램을 추출하는 역공학방법을 제시하였다. 파서를 이용하여 자바 코드로부터 AST를 생성하고 이를 순회하면서 클래스다이어그램 생성에 필요한 정보를 추출하였다. 이를 위해 구조정보와 관계정보를 정의하였는데, 구조정보에서는 클래스 몸체를 구성하는 정보를 표현하였다. 관계정보에서는 클래스들 간의 연관관계를 결정하기 위해 필요한 정보를 표현하였으며, 얻어진 관계정보를 통해 연관관계를 유추하는 방법을 제시하였다. 특히 클래스들간의 연관관계를 추출하기 위한 규칙들을 정의하고, 이를 통해 얻어진 관계정보를 이용하여 연관관계를 유출하는 과정을 설명하였다.

  • PDF

Design of a Utilization Evaluation System on the Integrated Information (통합정보 활용평가시스템의 설계)

  • Go, Bun-Lee;Park, O-Hui;Park, Jun-Ho;Gwon, Cheol-Shin
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2007.11a
    • /
    • pp.149-151
    • /
    • 2007
  • 본 연구는 최첨단 기술정보를 기반으로 경쟁하는 기업들이 첨단기술정보, 창조정보, 지식정보를 통합한 통합정보를 최적으로 경영하여 이를 연구원에게 제공함으로써 창조성을 극대화할 수 있도록 하기 위한 것이다. 이를 위해 각 기술정보, 창조정보, 지식정보의 기본적인 가치를 측정하는 정적평가와 정보의 공유도산출이라는 동적평가를 동시에 수행하는 평가시스템으로 설계하여 이들 정보의 활용도를 극대화시키는 것이 본 논문의 목적이다.

  • PDF

Classification and Acquisition of Information using Unstructured Ontology of Intelligent Agent (지능형 에이전트의 비구조화 Ontology를 이용한 정보의 분류와 획득)

  • 양성기;배상현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.123-125
    • /
    • 1998
  • 광역 네트워크 정보원으로부터 정보량이 증가함에 따라 효율적인 정보검색 도구의 필요성이 강조되고 있다. 기존의 정보검색 도구는 내용기반 검색방법으로 대상영역에 관계되는 체계적인 지식이 결여되어 사용자의 요구에 정확한 정보의 제공이 어려웠다. 본 논문에서는 광역 네트워크 환경에서 시시각각으로 생성.소멸되는 정보 중 사용자가 원하는 정보를 정확한 시간에 정확하게 제공하기 위해 지능적인 처리가 가능한 Ontology를 이용하였다. 광역 네트워크에 산재하는 대량의 정보원에서 Ontology를 이용하여 사용자가 필요한 정보를 자동적으로 수집.분류하는 지능형 에이전트인 정보검색 시스템을 제안한다.

  • PDF

정보표시를 이용한 화일처리와 정보 검색 시스템

  • Park, Jae-Wan;Choe, Yun-Cheol;Song, Man-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.24-31
    • /
    • 1990
  • 표본자료에 있는 정보표시는 그 표본에 있는 모든 자료의 내용을 상실하지 않도록 하기 위해서 필요하다. 그러한 정보표시는 또한 자료들의 구분을 명확히 하여 자료의 저장과 정보검색 목적으로 사용된다. 본 연구에서는 이러한 텍스트 정보표시의 잘못 쓰여진 오류의 검출과 수정 그리고 이러한 분류표시를 이용하여 방대한 표본자료를 정보표시별로의 화일처리와 필요한 정보에 관한 검색 시스템에 관하여 기술한다.

  • PDF

Information Extraction Using the Ontology (온톨로지를 이용한 정보 추출)

  • Kim, In-Su;Lee, Bog-Ju
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.652-654
    • /
    • 2005
  • 정보 추출은 텍스트로 되어 있는 비 정형화된 데이터로부터 정형화된 정보를 추출하는 분야이다. 기존의 정보 추출이 구문 중심의 방법인데 비해 본 논문에서는 시맨틱 웹과 온톨로지를 이용한 의미 기반의 정보 추출을 시도한다. 또한 본 논문에서는 기존의 정보 추출 모델을 분류해 보고 반자동 정보 추출이라는 새로운 모델을 제시한다. 이 모델에 기반하여 개인 정보를 자동으로 정형화 시켜주는 정보 추출 도구를 개발하고 이를 소개한다.

  • PDF