• 제목/요약/키워드: 주제 기반

검색결과 1,755건 처리시간 0.029초

동시출현 단어 분석을 통한 지식 구조의 파악 : 인공지능 분야를 대상으로 (Exploration of Intellectual Structure of Artificial Intelligence Field Using Co-word Analysis)

  • 이미경;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.245-251
    • /
    • 2003
  • 이 연구에서는 통제된 색인어를 이용하여 파악한 지식 구조와 통제되지 않은 키워드를 이용한 지식 구조를 비교하여 두 구조가 어떤 차이점을 보이는지를 살펴보았다. 또한 색인효과가 어떻게 나타나는지, 비통제어를 사용한 경우가 실제적으로 더 상세한 하위 영역을 표현하는지를 확인하고자 하였다. 실험 결과 통제된 색인어인 주제명표목을 사용한 영역지도와 비통제 색인어인 키워드를 사용한 영역지도 둘 다 인공지능 분야의 주요 분야들을 비슷하게 나타냈지만, 주제명표목을 사용한 경우에 색인효과가 일부 나타났다. 그리고 대체적으로 주제명표목에 기반한 영역지도보다는 키워드에 기반한 영역지도가 더 상세하게 나타났다.

  • PDF

맞춤형 광고를 위한 내용기반 영화 추천 기법 (A content-based movie recommendation method for targeted advertising)

  • 봉성용;서인식;김문식;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.269-272
    • /
    • 2011
  • 추천은 다양한 컨텐츠 중에서 사용자가 원하는 것을 선택할 수 있도록 돕는 것이다. 이러한 추천은 광고주가 자신의 광고에 적절한 컨텐츠를 찾을 때에도 활용될 수 있다. 본 논문에서는 광고를 표현하는 태그와 영화를 나타내는 주제어들을 매칭하여 광고에 적합한 영화를 추천하는 문제를 다룬다. 이 문제의 경우, 광고를 표현하는 태그의 개수가 적고, 영화의 주제어와 성격이 다른 경우가 많아 단순 매칭을 활용한 추천 기법으로는 결과를 얻을 수 없는 경우도 존재한다. 우리는 이러한 문제를 완화하기 위해 키워드 확장을 통한 추천 기법을 제안한다. 구체적으로 각 영화 컨텐츠가 가진 주제어를 위키피디아를 통해 검색하고 이를 통해 주제어를 확장한다. 광고의 태그 또한 위키피디아 검색을 통해 확장한다. 이렇게 확장된 영화 주제어와 광고 태그를 연관성 규칙에 기반하여 매칭한다. 실험 결과 단순 매칭보다 제안한 확장을 통한 매칭이 37.5%의 성능 향상을 보였다.

유튜브 메타정보를 이용한 자동 주제 분류 고찰 (Analysis of Automatic Topic Classification using Youtube Meta Information)

  • 김용우;전성배;정유철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.349-351
    • /
    • 2021
  • Youtube 동영상 업로드 시, 사용자가 직접 주제를 설정해야 하는 어려움이 있다. 본 연구에서는 사용자가 입력하는 제목과 설명정보를 이용하여 자동으로 주제를 분류하는 연구를 진행하였다. 이를 위해 한국어기반의 컨텐츠 중 고빈도의 8개 주제 카테고리를 선정하고, 이를 1.3만건의 학습데이터를 크롤링을 통해 구축하였다. 또한, 다양한 알고리즘들에 대한 최대성능을 확인하기 위해 대표적인 텍스트 분류 방법인 SVM과 LSTM기법 및 BERT 모델기반 미세적용(fine-tuning)을 시도하였다. 결과적으로 Bert-multiligual (base)를 fine-tuning한 실험에서 최대 94%의 정확도를 확인하였다. 하지만, Youtube 동영상 특성상 여러 주제를 가진 것들이 상당수 존재하기에, 실제 체감정확도는 더 높을 것으로 기대된다.

  • PDF

Microsoft Luis 기반의 전시장 추천 챗봇 설계 및 구현 (A Design and Implementation of Exhibition Recommendation Chatbot Based on Microsoft Luis)

  • 이원주;김승겸;이교범;한재근
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.425-426
    • /
    • 2022
  • 본 논문에서는 사용자가 원하는 주제를 통해 전시장을 추천, 등록, 조회하는 Microsoft Bot Framework, Microsoft Azure 기반의 챗봇을 설계하고 구현한다. 이 챗봇은 사용자가 원하는 주제를 입력하면, 해당하는 주제의 전시장을 추천하게 된다. 주제는 알고리즘으로 단어를 지정한 것이 아닌, Azure Luis로 단어를 학습시켜서 비슷한 주제의 단어를 도출하는 알고리즘을 선택한다. 등록 부분은 Form 형식이 아닌 대화형으로 사용자 정보를 수집하게 된다. 사용자 정보는 Microsoft SQL Database 서버에 저장이 되고, 구현한 챗봇은 애뮬레이터 형식이 아닌 Channel 연동으로 Line 서비스로 배포한다.

  • PDF

인스턴트 메시징에서의 대화 주제 및 주제 전환 탐지 (Topic and Topic Change Detection in Instance Messaging)

  • 최윤정;신욱현;정윤재;맹성현;한경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.59-66
    • /
    • 2008
  • 본 논문에서는 인스턴트 메시징(Instant Messaging), 채팅과 같은 텍스트 기반의 대화에서 현재 발화를 기준으로 대화의 주제를 파악하고, 대화 주제 전환 여부를 판단하는 기법에 대해 기술한다. 대화는 다른 종류의 글과 다르게 길이가 매우 짧아 적은 수의 단어를 사용하고, 두 사람 이상이 참여를 하며, 대화의 이력(History)이 현재의 발화에 영향을 미친다. 이러한 특성에 따라 본 논문에서는 사용자 발화 뿐 아니라 대화 상대자의 발화에서 추출한 키워드 기반으로 주제 탐지를 하며, 대화의 이력도 고려하여 대화 주제 탐지의 정확도를 높힌 연구 결과를 기술한다. 대화주제 전환 탐지는 이전 발화와 현재 발화에서 탐지된 주제의 유사성을 계산하여, 유사성이 낮은 경우에 전환 탐지가 이루어졌다고 판단하였다. 본 논문의 실험에서 대화 주제 탐지는 88.20%. 대화 주제 전환 탐지는 87.36%의 정확도를 얻었다.

  • PDF

내용기반 음악정보 검색을 위한 선율의 시계열 데이터 변환을 이용한 주제선율색인 구성 (Construction of Theme Melody Index by Transforming Melody to Time-series Data for Content-based Music Information Retrieval)

  • 하진석;구경이;박재현;김유성
    • 정보처리학회논문지D
    • /
    • 제10D권3호
    • /
    • pp.547-558
    • /
    • 2003
  • 음악은 서로 다른 높이와 길이를 갖는 음표들을 주어진 박자 안에서 리듬성을 갖도록 나열한 패턴이기 때문에 음악의 선율정보는 시간의 흐름에 따라 정보 값을 갖는 시계열 데이터로 변환할 수 있다 따라서 본 연구에서는 음악의 특성을 유지하도록 선율정보를 정규화와 보정과정을 거쳐 시계열 데이터로 변환하고 유클리드 거리함수를 이용하여 선율정보간의 유사도를 계산하며, 유사성을 갖는 선율들을 클러스터링하여 각 클러스터의 대표성을 갖는 선율을 주제선율로서 추출한다. 그리고 추출된 주제선율로 다차원색인 기법인 M-tree를 이용하여 주제선율색인을 구성한다. 사용자 질의에 대한 검색과정에서도 색인 구성단계와 같은 과정으로 사용자 질의를 시계열 데이터로 변환하여 검색을 한다. 또한, 본 연구에서는 주제선율색인을 이용하여 내용기반 음악 검색을 실시하는 프로토타입 시스템을 개발하여 제안된 주제선율색인 구성기법의 실효성을 시험하였다. 실험결과에 따르면, 주제선율색인을 이용하면 원하는 음악 정보를 적은 공간을 사용하여 빠르고 정확하게 검색할 수 있음을 알 수 있다.

주제어 기반 문서 클러스터링 알고리즘 (Keyword-based Document C lustering Algorithm)

  • 장성호;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.469-471
    • /
    • 2002
  • 높은 연관성을 갖는 문서들을 서로 집단화시키는 문서 클러스터링은 문서와 문서간의 연관성을 확인할 수 있는 문서의 주제어 추출이 중요한 문제이며 일반적인 정보검색 시스템에서 사용하는 출현빈도에 의한 주제어 추출은 성능 향상에 한계가 있다. 또한, 문서 클러스터링은 문서를 집단화시키기 위해 문서간 연관성을 확인하기 위해 유사도 계산에 따른 시간과 공간을 많이 소비하는 문제를 가지고 있다. 본 논문에서는 주제어 추출 기법을 적용하여 주제어 연관성에 의해 문서들을 집단화시키는 새로운 방법의 문서 클러스터링 알고리즘을 제안한다.

  • PDF

구술 기록의 활용을 위한 패싯 기반 주제명표목 개발에 관한 연구: 해방촌 니트 사업 구술 기록을 대상으로 (A Study on Developing Facet-based Subject Headings of Oral History Records Use: Using Oral History Records of Knit Business in Haebangchon)

  • 김해인;정연경
    • 한국기록관리학회지
    • /
    • 제22권4호
    • /
    • pp.67-85
    • /
    • 2022
  • 본 연구는 해방촌 니트 사업을 주제로 수집된 구술 기록의 주제 접근을 위해 패싯을 기반으로 한 주제명표목의 개발 방안을 제안하는데 목적이 있다. 첫째, 문헌 연구에서 구술 기록과 그 내용의 개념과 특징을 고찰하고 구술 내용에 대한 패싯과 주제명표목의 적용 의미를 살펴보았다. 둘째, 구술의 서사적 측면을 반영한 육하원칙을 토대로 구술 기록에 대한 기본 패싯을 설정하였다. 셋째, 해방촌 니트 사업의 종사자와 관계자 7인과 면담자 1인의 구술 면담을 통해 수집된 녹취록을 대상으로 용어 분석을 진행하였고, 그 결과 540개의 주제어를 선정하고 패싯에 따라 범주화하였다. 마지막으로 패싯으로 구분한 주제어를 주제 명표목의 표목으로 활용하여 관계어와 함께 작성하였다. 본 연구는 구술 기록의 내용에 대한 주제적 접근과 활용에 기여할 수 있을 것이다.

연관도를 계산하는 자동화된 주제 기반 웹 수집기 (An Automated Topic Specific Web Crawler Calculating Degree of Relevance)

  • 서혜성;최영수;최경희;정기현;노상욱
    • 인터넷정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.155-167
    • /
    • 2006
  • 인터넷을 사용하는 사람들에게 그들의 관심사와 부합하는 웹 페이지를 제공하는 것은 매우 중요하다. 이러한 관점에서 본 논문은 각 웹 페이지의 주제와 연관된 정도를 계산하여 웹 페이지 군(cluster)을 형성하며, 단어빈도/문서빈도 엔트로피(entropy) 및 컴파일된 규칙을 이용하여 수집된 웹 페이지를 정제하는 주제 기반 웹 수집기를 제안한다. 실험을 통하여 주제 기반 웹 수집기에 대한 분류의 정확성, 수집의 효율성 및 수집의 일관성을 평가하였다. 첫째, C4.5, 역전패(back propagation) 및 CN2 기계학습 알고리즘으로 컴파일한 규칙을 이용하여 실험한 웹 수집기의 분류 성능은 CN2를 사용한 분류 성능이 가장 우수 하였으며, 둘째, 수집의 효율성을 측정하여 각 범주별로 최적의 주제 연관 정도에 대한 임계값을 도출할 수 있었다. 마지막으로, 제안한 수집기의 수집정도에 대한 일관성을 평가하기 위하여 서로 다른 시작 URL을 사용하여 수집된 웹 페이지들의 중첩정도를 측정하였다. 실험 결과에서 제안한 주제 기반 웹 수집기가 시작 URL에 큰 영향을 받지 않고 상당히 일관적인 수집을 수행함을 알 수 있었다.

  • PDF

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.