• 제목/요약/키워드: Semantic retrieval

검색결과 397건 처리시간 0.021초

정보검색의 시맨틱웹 지향 설계에 관한 연구 - 온톨로지와 소셜태깅을 활용한 탐험적 발견행위 모델개발을 중심으로 - (A Study of a Semantic Web Driven Architecture in Information Retrieval: Developing an Exploratory Discovery Model Using Ontology and Social Tagging)

  • 조명대
    • 한국비블리아학회지
    • /
    • 제21권3호
    • /
    • pp.151-163
    • /
    • 2010
  • 이 논문에서는 기존 정보검색모델에서의 문제점을 살펴보고 그 대안을 제시하고 있다. 정보환경의 변화에 따라 '개념'중심의 새로운 정보조직인 온톨로지와 소셜태깅은 탐험적 발견행위를 가능하게 해줄 수 있다. 이들을 통해 어느 한 이용자의 머릿속에 있는 생각을 인터넷상의 수많은 사람의 머릿속에 있는 생각을 연결해주고 있다. 이러한 상호작용을 통한 연결고리를 통해서 이젠 이용자들이 탐험적으로, 적극적으로 정보를 찾아 나서고 있다. 이에 본 연구의 목적은 질적인 연구방법론으로 온톨로지와 소셜태깅에서 제공되는 수많은 탐색촉진제의 존재를 밝힌 후, 하나의 탐험적 발견행위 모델을 만들어내는 것이다. 그 결과는 먼저 3개의 상위그룹이 형성되었다. 첫째, 브라우징 및 모니터링으로 어떤 대상을 인지 및 집중하는 단계, 둘째, 의미부여로 적극적인 참여 및 공유하는 단계이며 셋째는 더 적극적으로 생각을 확장시켜나가면서 스스로 사회적 학습을 하는 단계였다. 제일 첫 그룹에는 정보요구인지, 소셜공간에서 도움 필요성인지, 도움을 받을 수 있는 자료 발견, 일단 멈춤, 그 대상에 집중등의 단계가 있었다. 두 번째 그룹에는 적극적 의미형성, 소셜 북마킹 및 태깅, 소셜 네트워크에서 나눔, 처음 정보요구를 더 구체화하는 단계가 있었다. 세 번째는, 발견적인 소셜학습, 우연한 정보 발견, 창조적 생각을 유발, 문제 해결 능력향상 등의 총 13단계를 발견하게 되었다. 이 모델은 이용자들이 탐험적 발견행위를 할 수 있는 능력을 향상하게 시키는 정보시스템 디자인에 공헌할 수 있을 것이다.

소셜 네트워크에서 관계 랭킹 모델 (A Model for Ranking Semantic Associations in a Social Network)

  • 오선주
    • 한국전자거래학회지
    • /
    • 제18권3호
    • /
    • pp.93-105
    • /
    • 2013
  • 실생활에서 소셜 네트워크 서비스의 사용은 활성화되고 있으나 이를 비즈니스 차원에서 활용하기 위한 이론적이며 실증적인 연구가 부족한 상황이다. 기존의 다양한 데이터로부터 소셜 네트워크를 구축하고, 구축된 소셜 네트워크에서 잠재적 관계를 도출하거나 찾는 등의 유용한 활용 방법에 대한 연구가 요구된다. 본 연구는 소셜 네트워크에서 잠재되어 있는 관계를 인식하여 유용한 관계를 찾기 위한 방안으로서 소셜 네트워크에서 구성원간 관계를 검색하기 위한 랭킹 방법을 제안한다. 본 연구에서는 온톨로지를 기반으로 개체간 의미적 관계를 유추하여 확장하고 이를 바탕으로 다양한 랭킹 기준을 융통성 있게 조합하여 검색하고자 하는 관계를 효율적으로 찾기 위한 랭킹 모델을 제시하였다. 또한 제안한 연구 방법이 유의미한 것을 보이기 위하여 기업과 대학 간 사회적 네트워크에서 임의의 관계를 검색하고 강도를 측정하는 데 연구 모델을 적용하여 보았다. 본 연구에서 제안하는 시맨틱 웹기반 소셜 네트워크에서 임의의 관계를 검색하여 랭킹하는 방법은 빅데이터 시대에 유용한 관계 정보를 편리하게 검색할 수 있는 효과적인 방법으로 활용이 기대된다.

RDF 기반의 학습 메타데이터 관리 (Management of Learning Metadata based on RDF)

  • 이영석;서영배;박정환;김수민;최병욱;조정원
    • 정보처리학회논문지A
    • /
    • 제13A권1호
    • /
    • pp.87-94
    • /
    • 2006
  • 웹이 보편화되고 웹 기반 학습을 관리하고 제공해 주는 학습관리시스템이 늘어남에 따라 이제 학습자는 시공간에 제약을 받지 않는 학습 환경을 체험 할 수 있게 되었다. 하지만 기존의 학습 관리 시스템들은 적합한 학습을 제공하기 위해 유용하고 적합한 메타데이터를 사용하고 있지 않다 이러한 문제점을 해결하기 위해서 학습관리 시스템에서는 학습자에게 다양한 학습 체험과 향상된 검색 능력을 제공할 수 있도록 학습자의 특성이나 많은 자원에 관한 학습 메타데이터를 자유롭게 정의하고 관리해야 할 필요가 있다. 본 논문에서는 학습관리시스템에서 부가적인 학습 메타데이터를 사용할 수 있도록 하기 위하여 시맨틱 웹의 기반이 되는 언어인 RDF(Resource Description Framework)를 이용한 검색 방법과 학습 메타데이터 제작하고 관리할 수 있는 방법을 두 가지 형태로 제안하였다. 차세대 메타데이터 관리 방법을 통해 교수자는 빠르고 편리하게 차세대 학습 메타데이터를 작성하고 저장할 뿐 아니라 학습자에게 정확하고 확장된 검색방법을 제공한다.

한국학술지인용색인(KCI)의 인문학, 사회과학, 예술체육 분야 저자키워드의 의미적 관계 유형 최적화 연구 (A Study on the Optimization of Semantic Relation of Author Keywords in Humanities, Social Sciences, and Art and Sport of the Korea Citation Index (KCI))

  • 고영만;송민선;이승준
    • 한국문헌정보학회지
    • /
    • 제49권1호
    • /
    • pp.45-67
    • /
    • 2015
  • 본 연구의 목적은 KCI의 인문, 사회, 예술체육 분야 저자키워드를 기반으로 구축한 구조적 학술용어사전 데이터베이스 시스템 STNet에 실제 입력된 용어들의 의미적 관계들을 분석하여 관계 유형을 최적화하고 관계명을 세분화하는 방안을 기술하는 것이다. 분석 결과, 관계 유형과 관계명을 최적화하기 위해서는 빈도수에 의한 관계명 신설 또는 관계의 유형화 제한, 관계의 방향성 고려, 기존 관계명 반영의 4가지 논리적 기준이 필요한 것으로 나타났다. STNet의 "실존인물" 클래스를 테스트베드로 삼아 이 기준을 적용해 관계 유형을 최적화하고 관계명을 세분화한 결과 원래 RT, RT_X, RT_Y로 연결된 1,743건의 관계 중 1,135건이 세분화되는 것으로 나타났다. 이는 약 65%의 RT 관계가 구체화된 것으로 사전 구축 및 검색 단계에서의 유용성 측면에서 상당한 의미가 있음을 보여주는 것이다.

메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색 (Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents)

  • 류성준;황재문;김태훈;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1505-1518
    • /
    • 2004
  • 본 논문은 구조적, 의미론적 이질성을 가진 분산 XML 문서의 통합 검색을 위해 반자동으로 생성된 인터페이스를 통해 각 지역 문서에 대한 질의를 생성하여 검색하는 방법을 제안한다. 본 시스템에서는 데이타 통합을 위한 메타데이타 인터페이스인 DDXMI(Distributed Documents XML Metadata Interface)를 정의하고, 분산 데이타에 대한 DTD를 입력으로 받아 사용자로 하여금 전역 DTD와 각 지역 DTD 간의 의미 차이를 극복하기 위한 사용자 인터페이스 생성 방법을 제안하였다. 전역 DTD와 지역 DTD의 특성을 고려하여 인덱스 매핑과 그에 필요한 함수 이름의 매핑 정보를 기반으로 DDXMI가 자동으로 생성된다. XML 질의 언어인 Quilt를 사용하여 생성된 DDXMI를 통해 각 지역 문서에 적합한 질의를 생성, 수행한다 사용자는 검색 대상 문서의 스키마와 통합스키마의 구조를 잘 알고 있다고 가정하였다. XML로 만들어진 석박사 논문, 논문지, 연구보고서에 대한 소규모, 중규모 전역 DTD를 만들어 실제로 질의를 생성하여 검색 결과를 검증할 수 있도록 하였다. 본 시스템은 JavaCC와 Java 서블릿을 이용하여 개발하였다.

빅 데이터 환경에서 계층적 문서 유형 분류를 위한 클러스터링 기반 다중 SVM 모델 (Multi-class Support Vector Machines Model Based Clustering for Hierarchical Document Categorization in Big Data Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.600-608
    • /
    • 2017
  • 최근 인터넷의 급격한 확장에 따른 정보의 양이 기하급수적으로 증가하고 있다. 그러나 실제 사용자에게 필요한 정보는 극히 일부분으로 사용자가 원하는 정보를 찾는데 까지는 부가적인 시간과 노력이 요구된다. 따라서 검색어로 검색된 문서에 대한 유사도 평가를 통한 계층적 유사 정보와 검색 우선순위에 대한 정보를 제공할 필요성이 있다. 이를 위해서 검색어를 구성하고 있는 키워드의 동시 발생 빈도를 고려한 검색 문서에 대한 유사도를 기반으로 문서 클러스터를 구성하고 SVM을 적용한 빅 데이터 기반 계층적 유형 분류 모델을 제안한다. 계층적 분류방법과 SVM 분류기의 결합은 문서의 계층이 기하급수적으로 늘어나는 웹 문서의 경우에 높은 성능을 얻을 수 있다. 제안된 모델은 정확하고 신속한 검색을 제공하는 정보검색시스템의 응용 모델로 활용될 수 있다.

지능형 내용기반검색을 이용한 시각정보 자동추출 (Automatic Selection of Visual Information using Intelligent Content-Based Retrieva)

  • 송점동
    • 정보학연구
    • /
    • 제4권2호
    • /
    • pp.69-81
    • /
    • 2001
  • 지능형 기본구조에 의존하는 내용기반 정보검색 시스템을 발전시키기 위한 많은 노력들이 진행중이다. 실세계에 존재하는 상황을 구축하고 유지하며, 동적 지식 표현을 실용화하고, 문맥을 이용하고, 그리고 진보된 추론과 학습능력을 이용하여 실세계에 존재하는 상황을 구축하고 유지하는 능력을 지능이라고 간주하여 이 지능을 채택한 진보된 내용기반 정보검색시스템을 제안하였다. 지능의 이러한 요소들은 인간의 지각과 인지에 정합하는 의미적 수준에서 시각 정보를 검색하기 위한 효과적인 시스템을 만들어내기 위해 필요로 하는 것들이다. 본 논문에서는 인간이 가지고 있는 지능과 인지 심리학, 인공지능, 기호학의 분야에 존재하는 지능시스템의 구축에 관련한 연구들을 조사해 본 후, 기존의 내용기반 정보검색 시스템의 능력을 개선하기 위해 본 논문에서 제안한 멀티미디어 지식 표현 모형인 MMNet을 알아보고, 이것을 이용하여 시각 정보를 자동적으로 추출하기 위한 지능형 내용기반검색시스템 모형을 만들어 보았다.

  • PDF

구문 다양성 해소를 위한 복합명사구 색인 방법 (A Method Of Compound Noun Phrase Indexing for Resolving Syntactic Diversity)

  • 조민희;정도헌
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.467-476
    • /
    • 2011
  • 복합명사구는 단일어보다 명확한 의미를 갖기 때문에 의미적 정보처리에서 중요한 요소로 사용된다. 하지만 명사구의 표현형태의 다양성 때문에 같은 의미를 갖고 있다 할지라도 그 동일성을 판단하기 어렵다. 이에 본 연구에서는 이러한 구문 다양성 해소를 위해 복합명사구 색인 방법을 제안한다. 본 연구의 최종목적은 다양한 형태로 표현된 동일한 의미의 명사구를 동일한 형태의 색인어로 표현하는 것이며, 이를 위해 다음과 같은 과정을 따른다. 먼저 복합명사구 인식을 위한 규칙 템플릿을 생성하고, 국내학술논문 집합에 적용하여 복합명사구들을 추출한다. 일반적으로 복합명사구는 특정성이 크다. 이에 이를 고려한 색인어 합성규칙을 제안하고, 추출된 명사구에 적용한다. 본 연구의 성능을 객관적으로 평가하기 위해 HANTEC 2.0 테스트셋을 이용하였으며, 그 결과를 기준모델과 비교하였다. 실험과 비교를 통해 본 논문에서 제안하는 색인방법이 검색 정확률 향상에 긍정적으로 영향을 미치며, 정보검색의 성능을 향상시킬 수 있음을 확인하였다.

디지털 음악 콘텐츠의 확장된 검색을 지원하는 한국어 기반 감성 모델과 온톨로지 설계 (Designing emotional model and Ontology based on Korean to support extended search of digital music content)

  • 김선경;신판섭;임해철
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.43-52
    • /
    • 2013
  • 대량의 음악 콘텐츠가 유통되는 초고속 인터넷 환경에서, 사용자가 원하는 음악 콘텐츠를 효과적으로 검색하기 위한 연구들이 다양하게 수행되고 있다. 특히, 음악 정보 검색(MIR: Music Information Retrieval) 연구에 감성 모델을 접목한 음악 추천 시스템 개발도 활발하게 진행되고 있다. 그러나, 적용된 감성 모델이 단순하고, 한국어를 대상으로 하지 않아 한국어의 의미적 감성 표현 처리에 한계점을 가진다. 따라서, 본 논문에서는, 한국어를 기반으로, 기존의 감성 모델을 확장한 새로운 감성 모델(KORean Emotional Model : KOREM)을 제안하고, 이를 온톨로지(Music EMotional Ontology : MEMO)로 설계 및 구현하였다. 이를 통해, 한글로 서술된 폭넓고 다양한 감성적 표현을 이용한 음악 콘텐츠의 분류, 저장 및 검색이 가능하다.

Design of a Question-Answering System based on RAG Model for Domestic Companies

  • Gwang-Wu Yi;Soo Kyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.81-88
    • /
    • 2024
  • 생성형 AI 시장의 급속한 성장과 국내 기업과 기관의 큰 관심에도 불구하고, 부정확한 정보제공과 정보유출의 우려가 생성형 AI 도입을 저해하는 주된 요인으로 나타났다. 이를 개선하기 위해 본 논문에서는 검색-증강 생성(Retrieval-Augmented Generation, RAG) 구조 기반의 질의응답시스템을 설계·구현하였다. 제안 방법은 한국어 문장 임베딩을 사용해 지식 데이터베이스를 구축하고, 최적화된 검색으로 질문 관련 정보를 찾아 생성형 언어 모델에게 제공된다. 또한, 이용자가 지식 데이터 베이스를 직접 관리하여 변경되는 업무 정보를 효율적으로 업데이트하도록 하고, 시스템이 폐쇄망에서 동작할 수 있도록 설계하여 기업의 기밀 정보의 유출 가능성을 낮추었다. 국내 기업 등 조직에서 생성형 AI를 도입하고 활용하고자 할 때 본 연구가 유용한 참고자료가 되길 기대한다.