• 제목/요약/키워드: 토픽 검색

검색결과 131건 처리시간 0.023초

분산 토픽맵의 다중 전략 매핑 기법 (A Multi-Strategic Mapping Approach for Distributed Topic Maps)

  • 김정민;신효필;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권1호
    • /
    • pp.114-129
    • /
    • 2006
  • 유사한 지식구조의 분산된 온톨로지들을 통합 및 연결하여 새로운 온톨로지를 생성하거나 확장 지식 검색을 효과적으로 제공하기 위해서는 온톨로지 모델 자체의 구조적 특성이나 제약조건을 고려한 온톨초지 매핑이 중요하다. 그러나 과거의 온톨로지 매핑은 범용성을 높이기 위해 대부분 그래프 모델을 기반으로 노드와 간선 중심의 매핑여부를 계산함으로써 온톨로지 모델의 특성과 제약조건을 매핑에 반영하지 못하는 문제점을 가진다. 본 논문에서는 RDF와 함께 온톨로지 모델로 사용되고 있는 토픽맵의 구문적 특성과 제약조건을 반영한 다중 매핑 전략의 토픽맵 매핑 기법을 제안한다. 다중 매핑 전략에는 토픽명 기반 매핑, 토픽 속성 기반 매핑, 계층 구조 기반 매핑, 연관관계 기반 매핑의 4가지 매핑 전략이 포함되어 있으며 개체들 사이의 매핑 여부를 결정하기 위해 각 매핑의 개별 유사도를 조합한 다음 단일 유사도를 결정하는 하이브리드 방식을 사용한다. 또한 토픽맵의 구문적 특성에 따라 매핑 계산 전에 매핑이 불가능한 개체들을 미리 제거함으로써 탐색 범위를 줄이고 있으며 토픽명 색인과 PSI 색인을 생성하여 매핑 계산의 효율을 높이고 있다. 제안하는 토픽맵 매핑 기법의 성능을 보이기 위해 동, 서양 철학 온톨로지들과 야후 철학 백과사전 및 독일 문학 백과사전을 토픽맵으로 구현하여 실험 데이타로 활용하였으며 그 결과 자동 생성된 매핑 집합이 전문가에 의해 생성된 매핑 집합을 대부분 포함함을 확인하였다.

토픽모델링과 동시출현단어 분석을 이용한 기업가정신에 대한 연구동향 분석: 2002~2021 (Current Research Trends in Entrepreneurship Based on Topic Modeling and Keyword Co-occurrence Analysis: 2002~2021)

  • 장성희
    • 벤처창업연구
    • /
    • 제17권3호
    • /
    • pp.245-256
    • /
    • 2022
  • 본 연구는 토픽모델링과 동시출현단어 분석을 이용하여 기업가정신에 대한 연구 동향을 제공하는 것이 목적이다. 이를 위해 Web of Science 데이터베이스에서 'entrepreneurship'을 기본검색어로 설정하고, 2002년부터 2021년까지 발표한 14,953편의 기업가정신 논문의 데이터를 확보하였다. 본 연구에서는 VOSviewer 프로그램을 이용하여 동시출현단어 분석을 하였고, R 프로그램을 이용하여 토픽모델링 분석을 하였다. 본 연구의 분석결과는 다음과 같다. 첫째, 동시출현단어 분석 결과, 기업가정신과 혁신 클러스터, 기업가정신 교육 클러스터, 사회적 기업가정신과 지속가능성 클러스터, 기업성과 클러스터, 그리고 지식 및 기술이전 클러스터 등 5개의 클러스터로 구분되었다. 둘째, 토픽모델링 분석 결과, 창업환경 및 경제발전, 국제 기업가정신, 다양한 기업가정신, 벤처기업과 자본조달, 정부정책 및 지원, 사회적 기업가정신, 경영관련 이슈, 지역도시계획 및 개발, 기업가정신 교육, 기업가의 혁신과 성과, 기업가정신 연구, 기업가의 창업의도 등 12개의 토픽으로 분석되었다. 마지막으로, 시기별 토픽변화 추이 분석결과, 벤처기업과 자본조달과 기업가의 창업의도에 대한 토픽은 상승토픽으로 나타났고, 국제 기업가정신은 하강토픽으로 나타났다. 본 연구의 결과는 기업가정신 연구에 대한 전반적인 연구동향을 파악할 뿐만 아니라, 기업가정신 연구에 대한 통찰력을 제공하는데 유용할 것으로 기대된다.

태권도 뉴스기사의 연도별 주제어 비교분석: 토픽모델링 적용 (Comparative Analysis of the Keywords in Taekwondo News Articles by Year: Applying Topic Modeling Method)

  • 전민수;임효성
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.575-583
    • /
    • 2021
  • 이 연구는 토픽모델링을 적용하여 뉴스기사에 따른 태권도 동향을 연도별로 분석하는 것에 목적이 있다. 언론보도를 통한 태권도 동향을 살펴보기 위해 한국언론재단의 빅카인즈를 통해 뉴스기사와 태권도 전문 언론에 대한 기사를 수집하였다. 검색기간은 2000년 이전, 2001년~2010년, 2011년~2020년 3개의 구간으로 구분하여 검색하여 총 12,124개를 연구자료로 선정하였다. 토픽분석을 위해 전처리 과정을 거쳤으며, LDA 알고리즘을 활용하여 토픽분석을 수행하였다. 이때 모든분석은 python 3을 적용하였다. 그 결과 첫째, 연도별에 따른 언론기사 주제를 분석한 결과 2000년이전 1위는 '세계'. 2위는 '남북', 3위는 '올림픽'으로 나타났으며, 2001년~2010년 1위는 '세계', 2위는 '협회', 3위는 '세계태권도연맹'으로 조사되었다. 2011년~2020년 1위는 '세계', 2위는 '시범', 3위는 '국기원'으로 나타났다. 둘째, 2000년이전 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 2가지로 구분되었다. 구체적으로 Topic 1은 '남·북 체육교류', Topic 2는 '올림픽 시범종목 채택'으로 선정되었다. 셋째, 2001년~2010년 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 3가지로 선정되었다. Topic 1은 '태권도 시범공연 및 비리', Topic 2는 '무주태권도공원 조성', Topic 3은 '세계태권도축제'로 선정되었다. 넷째, 2011년~2020년 뉴스기사를 토픽모델링으로 분석한 결과 토픽은 3가지로 선정되었다. Topic 1은 '2018 평창동계올림픽 성공 개최', Topic 2는 '남북 태권도 합동시범공연 ', Topic 3은 '2017 무주세계태권도선수권대회'로 선정되었다.

재미 감성 주제 온톨로지를 이용한 질의어 확장 멀티미디어 데이터 검색 시스템 구현 (Implementation of Query Expansion Multimedia Data Retrieval System using "FUN" Based Ontology of Emotion)

  • 이정송;변동률;박순철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.279-284
    • /
    • 2010
  • 최근 컴퓨터와 네트워크의 기술 발달로 멀티미디어 데이터가 폭발적으로 증가하고 있다. 따라서 정보검색 시스템도 텍스트 데이터 위주에서 벗어나 멀티미디어 데이터 검색이 큰 비중을 차지하고 있다. 또한 멀티미디어 데이터 질의어처리도 기술적인 변화와 함께 다양한 질의어 확장으로 검색의 정확성을 높이고 있다. 본 논문에서는 인간의 감성에 대한 '재미' 주제 온톨로지를 구축하여 질의어 확장에 응용하였고, 한편의 동영상에서 재미 요소를 찾아내는 멀티미디어 데이터 검색 시스템을 구축하였다. 온톨로지 구축은 한글 워드넷(KorLex)에서 "재미"라는 특정 감소 요소의 의미 계층 구조를 파악하고 토픽맵을 이용하여 구축하였다. 또한, 온톨로지에 정의된 용어들 사이의 가중치는 실시간으로 계산하여 질의어를 확장에 적용하였으며, 따라서 검색의 효율성과 질을 높였다. 검색방법은 사용자가 질의어를 직접 입력하는 텍스트 입력 검색과 온톨로지 구조를 이용한 GUI 인터페이스 검색방법으로 나누어 사용자의 편의성을 증대시켰다.

  • PDF

시맨틱 웹 기술 기반 정보서비스 시스템 $OntoFrame^{(R)}$ (($OntoFrame^{(R)}$;an Information Service System based on Semantic Web Technology)

  • 성원경;이승우;한선화;정한민;김평;이미경;박동인
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.87-88
    • /
    • 2008
  • 시맨틱 웹 기술을 기반으로 한 정보서비스 시스템인 $OntoFrame^{(R)}$은 연구자가 원하는 정보를 쉽고 정확하게 제공하는 학술정보 분석${\cdot}$융합 서비스 프레임워크를 목표로 한다. 본 시스템은 현재 학술정보를 지식 체계로 표현한 온톨로지와 이에 맞게 학술정보를 관리하고 가공하여 지식화하는 $OntoURI^{(R)}$, 이 지식을 기반으로 추론을 수행하고 고속의 탐색 기능을 제공하는 $OntoReasoner^{(R)}$로 구성되어 있다. 단순 검색 서비스를 제공하는 기존의 검색 시스템과는 달리 본 시스템은 시맨틱 웹 기술을 바탕으로 학술정보에 대한 연도별 토픽 경향, 연관 토픽, 토픽별 연구자와 연구기관, 연구자 네트워크, 통계 정보, 지역적 분포 등과 같은 보다 의미적인 분석 서비스를 제공한다.

  • PDF

위성·지상정보 융합 재난 대응 기술 분야 유망기술 도출을 위한 연관 키워드 및 빅데이터 분석 기법 (A New Scheme Exploiting the Related Keyword and Big Data Analysis for Predicting Promise Technology in the Field of Satellite·Terrestrial Information Convergence Disaster Response)

  • 이항원;김영억
    • 한국재난정보학회 논문집
    • /
    • 제18권2호
    • /
    • pp.418-431
    • /
    • 2022
  • 연구목적: 기존의 유망기술 도출 연구에서 대상 특허를 선별하는 과정에서 검색식이 충실하게 구성되지 않아 중요 특허가 분석 대상에서 누락되는 문제와 출원 미공개 기간에 변화하는 최신 기술 트랜드를 반영하지 못하는 문제들을 개선하기 위한 새로운 기법들을 제시한다. 연구방법: 본 논문에서는 R 프로그래밍을 통한 TF와 TF-IDF 등의 연관 키워드 기반 검색식 구성 기법 및 LDA 토픽 모델링 기법을 제안하고, 위성·지상 정보 융합 재난 대응 기술을 중심으로 기존 방법과 비교 분석하여 제안된 기법의 유효성을 확인한다. 연구결과: 상용 특허 DB 시스템을 활용한 제안된 방식 적용을 통해 대상 기술과 관련도가 가장 높은 주요(핵심)특허가 기존 방식(19건) 대비 17건 추가로 도출(36건, 89.5% 증가)되어 중요 특허 누락이 상당히 개선됨을 보였으며 Science ON에 등록된 최근 5년간 발표 논문을 대상으로 LDA 토픽 모델링을 수행하여 최신 기술 트랜드를 반영한 유망 기술 도출이 가능함을 보였다. 결론: 본 논문을 통해 제시한 유망기술 도출 기법을 통해 위성·지상정보 융합 재난 대응 기술분야에서의 유망기술 도출을 통한 신규 연구개발에 유용하게 사용될 수 있는 방향성을 제공하였다.

텍스트 마이닝을 이용한 4차 산업 연구 동향 토픽 모델링 (Topic Modeling on Research Trends of Industry 4.0 Using Text Mining)

  • 조경원;우영운
    • 한국정보통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.764-770
    • /
    • 2019
  • 본 연구에서는 "4차 산업"과 관련된 논문들의 세부 연구 주제를 파악하기 위하여 텍스트 마이닝 기법을 이용하여 논문들을 분석하였다. 이를 위하여 2016년부터 2019년까지 한국학술지인용색인(KCI)에서 "4차 산업"이라는 키워드로 논문을 검색하여 총 685편의 논문을 수집하였다. 논문 수집을 위해서는 Python 기반의 웹 스크랩핑 프로그램을 사용하였으며, 자료 분석을 위해서는 R 언어로 구현된 LDA 알고리즘 기반의 토픽 모델링 기법들을 활용하였다. 수집된 논문들에 대한 Perplexity 분석 결과, 9가지 토픽이 최적으로 결정되었고 수집된 논문들의 9가지 대표 토픽들을 Gibbs 샘플링 방법을 사용하여 추출하였다. 분석 결과, 인공지능, 빅데이터, 사물인터넷, 디지털, 네트워크 등이 상위 주요 기술들로 나타났으며, 산업, 정부, 교육 현장, 일자리 등 4차 산업과 관련한 다양한 분야에서 주요 기술들로 인한 변화에 대한 연구들이 이루어져 왔음을 확인할 수 있었다.

토픽모델링을 활용한 간호리더십 관련 국내 연구동향 분석 (Analysis of Research Trends in Korea on Nursing Leadership Research Using Topic Modeling)

  • 윤희장
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.451-457
    • /
    • 2023
  • 이 연구의 목적은 간호리더십에 관한 국내 연구 동향을 파악하고, 이를 바탕으로 국내 간호리더십 관련 연구 및 중재 개발에 활용할 수 있는 기초 자료를 제공하기 위함이다. 연구에서는 2012년 1월부터 2021년 12월까지 국내 학술지에서 게재된 335편의 논문에서 간호리더십에 대한 토픽을 추출하기 위해 토픽모델링 기법을 사용하였다. 키워드는 초록에서 추출되었으며, DBpia, KISS, RISS, KM base, Nanet 등 5개의 국내 데이터베이스에서 문헌 검색이 수행되었다. 연구 결과, 간호리더십에 대한 학술 논문은 꾸준히 증가하고 있으며, 셀프리더십, 자기 효능, 교육 등이 주요 토픽으로 확인되었다. 또한, 리더십의 종류 중 셀프리더십이 가장 빈번하게 출현한 키워드로 확인되었기 때문에 다양한 형태의 리더십에 대한 연구가 더욱 활발히 이루어져야 한다는 결론을 얻을 수 있었다. 이러한 연구결과는 국내 간호리더십 분야에 대한 이해를 높이는 데 기여할 것으로 기대한다. 간호리더십에 대한 연구동향을 파악하는데 있어서 이 연구는 새로운 관점을 제공하고, 국내 간호리더십 연구의 지식구조를 분석하였다는데 의의가 있다.

토픽 모델링을 활용한 도서관, 기록관, 박물관간의 연구 주제 분석 (Analysis of Research Topics among Library, Archives and Museums using Topic Modeling)

  • 김희섭;강보라
    • 한국도서관정보학회지
    • /
    • 제50권4호
    • /
    • pp.339-358
    • /
    • 2019
  • 본 연구의 목적은 광의의 측면에서 지식정보제공이라는 공동의 임무를 수행하는 도서관, 기록관, 박물관간의 협력 플랫폼 구축에 관한 연구의 동향을 토픽 모델링을 통하여 파악하기 위한 것이다. 연구의 목적을 달성하기 위하여 Scopus로부터 이들 세 기관을 동시에 다루는 논문 637편의 서지정보를 수집하였다. 수집된 서지정보 중에서 초록을 대상으로 NetMiner V.4를 통하여 총 5,218개의 단어를 추출한 후 토픽모델링 분석하였으며, 그 결과는 다음과 같다. 첫째, tf-idf의 가중치에 따른 단어출현 빈도를 분석한 결과 '보존(Preservation)'이 가장 높게 나타났으며, 둘째, LDA(Latent Dirichlet Allocation) 알고리즘을 통한 토픽모델링 분석결과 13개의 주제 영역이 도출되었다. 셋째, 13개의 주제 영역을 네트워크로 표현한 결과 '리포지터리 구축(Repository Construction)'을 중심으로 기관간의 협력, 정보자원 보존을 위한 환경 구축, 정부차원에서의 제도와 정책 발굴, 정보자원의 생애주기, 정보자원의 전시, 정보자원의 검색 등이 서로 밀접한 관련성을 가진 것으로 나타났다. 넷째, 13개의 주제 영역의 연도별 동향을 살펴보면, 1998년 이전의 연구는 제도와 정책 발굴, 정보자원의 검색, 정보자원의 생애주기 등과 같이 특정 주제에 한정된 반면, 그 이후의 연구는 보다 다양한 주제를 다룬 것으로 분석되었다.

효과적인 의견 자질 결합을 위한 실험적 연구 (Experimental Study for Effective Combination of Opinion Features)

  • 한경수
    • 정보관리학회지
    • /
    • 제27권3호
    • /
    • pp.227-239
    • /
    • 2010
  • 의견 검색은 사용자의 정보 요구에 주제적으로 연관되면서도 의견이 포함되어 있는 정보를 검색하는 태스크이다. 본 연구는 효과적인 의견 검색을 위해 사용자 정보 요구를 표현하는 방법과 이 요구를 만족시킬만한 여러 의견 자질들을 효과적으로 결합할 수 있는 방법에 대하여 실험을 통해 분석하였다. 본 실험에서는 추론 네트워크 모델을 기본 검색 모델로 사용하였고, Blogs06 컬렉션과 100개의 TREC 토픽에 대해 실험을 수행하였다. 실험 결과, 가상의 '의견' 개념을 설정하여 효과적으로 의견 검색의 정보 요구를 표현할 수 있었으며, 극히 소량의 일반 의견 단어집만을 사용했는데도 동일한 환경에서 기존 모델과 견줄 만한 의견 검색 성능을 달성할 수 있었다.