• 제목/요약/키워드: 제목 생성

검색결과 42건 처리시간 0.031초

미디어 분류를 위한 온톨로지 스키마 자동 생성 (Automated Modelling of Ontology Schema for Media Classification)

  • 이남기;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제44권3호
    • /
    • pp.287-294
    • /
    • 2017
  • UCC와 SNS 등을 통해 개인 미디어가 다양한 방식으로 생성됨에 따라 미디어를 분석하고 인지하는 기술에 대한 연구가 진행되고 있으며, 이를 통해 객체 인지의 수준이 향상되었다. 그 결과 기존의 제목, 태그 및 스크립터 정보를 이용한 추론 방식과 달리 미디어에서 인지되는 객체를 활용하는 영상 분류 추론 연구가 수행되고 있다. 하지만 추론을 위한 미디어 온톨로지 모델링을 사람이 직접 수행해야 하기 때문에 많은 시간과 비용이 발생하는 단점이 있다. 따라서 본 논문에서는 미디어 분류를 위한 온톨로지 스키마 모델링의 자동화 방법을 제안한다. 영상에서 인지되는 객체의 빈도에 따른 OWL-DL 공리의 특성을 고려하여 온톨로지 모델 생성의 자동화 방안에 대하여 설명한다. 유튜브에서 수집한 15가지의 카테고리에 대한 영상으로부터 온톨로지 모델을 자동 생성하여 추론을 통해 미디어 분류의 정확도에 대한 실험을 수행하였다. 실험결과 15가지 영상 이벤트의 행위 약 1500개에 대하여 영상 분류를 수행한 결과, 86%의 정확도를 얻었고, 온톨로지 모델링의 자동화 방법에 대한 타당한 성능을 보였다.

음악과 플레이리스트의 메타데이터를 활용한 하이브리드 음악 추천 시스템에 관한 연구 (Research on hybrid music recommendation system using metadata of music tracks and playlists)

  • 이현태;임규건
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.145-165
    • /
    • 2023
  • 추천 시스템은 인터넷의 발달로 급격하게 증가하는 정보의 양으로 인해 생긴 정보 선택의 어려움을 소비자에게 덜어주고 각 개인의 취향에 맞는 정보를 효율적으로 보여주는 중요한 역할을 한다. 특히, E-commerce와 OTT 기업은 상품과 콘텐츠 양이 급격하게 증가하면서 추천 시스템의 도움 없이는 인기 있는 상품만 소비되는 현상을 극복하지 못한다. 이러한 현상을 극복하고 고객 개인 취향에 맞는 정보 혹은 콘텐츠를 제공해 고객의 소비를 유도하기 위해 추천 시스템의 연구가 활발히 진행되고 있다. 일반적으로 유저(user)의 과거 행동 이력을 활용한 협업 필터링이 유저가 선호한 콘텐츠의 정보를 활용하는 콘텐츠 기반 필터링에 비해 높은 성능을 보여준다. 하지만 협업 필터링은 과거 행동 데이터가 부족한 유저에 대해서는 추천의 성능이 낮아지는 콜드 스타트(Cold Start) 문제를 겪게 된다. 본 논문에서는 카카오 아레나 경진대회에서 주어진 음악 스트리밍 서비스 멜론의 플레이리스트 데이터를 기반으로 앞에서 언급한 콜드 스타트 문제를 해결할 수 있는 하이브리드 음악 추천 시스템을 제시했다. 본 연구에서는 플레이리스트에 수록된 곡 목록과 각 음악과 플레이리스트의 메타데이터를 활용해 절반 혹은 전부 가려진 플레이리스트의 다른 수록 곡을 예측하는 것을 목표로 하였다. 이를 위해 플레이리스트 안에 곡이 있는 경우와 아예 곡이 없는 경우를 나눠서 추천을 진행하였다. 플레이리스트 안에 곡이 있는 경우에는 해당 플레이리스트의 곡 목록과 각 곡의 메타데이터를 활용하기 위해 LightFM을 활용하였다. 그 다음에 Item2Vec을 활용해 플레이리스트에 있는 수록 곡과 태그 및 제목의 임베딩 벡터를 생성하고 이를 추천에 활용하였다. 최종적으로 LightFM과 Item2Vec 모델의 앙상블을 통해 최종 추천 결과를 생성하였다. 플레이리스트 안에 곡이 없고 태그 혹은 제목만이 존재할 경우에는 플레이리스트의 메타데이터인 태그와 제목을 FastText를 활용해 사전 학습을 시켜 생성된 플레이리스트 벡터를 기반으로 플레이리스트 간의 유사도를 활용하여 추천을 진행하였다. 이렇게 추천한 결과, 기존 Matrix Factorization(MF)에서 해결하지 못한 콜드 스타트 문제를 해결할 수 있었을 뿐만 아니라 곡과 플레이리스트의 메타데이터를 활용해 기존 MF 모델인 ALS와 BPR 그리고 Word2Vec 기반으로 추천해 주는 Item2Vec 기술보다 높은 추천 성능을 낼 수 있었다. 또한, LightFM을 토대로 다양한 곡의 메타데이터를 실험한 결과, 여러 메타데이터 중에서 아티스트 정보를 단독으로 활용한 LightFM 모델이 다른 메타데이터를 활용한 LightFM 모델들과 비교해 가장 높은 성능을 보여준다는 것을 확인할 수 있었다.

자동 생성 메일계정 인식을 통한 스팸 필터링 (Spam-Filtering by Identifying Automatically Generated Email Accounts)

  • 이상호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.378-384
    • /
    • 2005
  • 본 논문에서는 기존의 스팸 메일 필터링 시스템의 성능을 향상시키기 위한 새로운 필터링 방법을 설명한다. 대부분의 스팸 필터링 시스템은 메일의 제목이나 혹은 그 문서 안에서 발견되는 단어들의 분포를 조사하여 이루어진다. 한편, 최근의 스팸 발송자들은 메일 서비스 업체가 제공하는 웹메일 계정을 이용하여 스팸을 발송하기 시작하였다 이렇게 웹메일을 통해 발송되는 스팸 메일의 특징을 보면, 그 메일 계정이 자동으로 생성되기 때문에 일반 사용자의 메일 계정과 많은 차이를 보인다. 본 연구에서는 이러한 점에 착안하여, 발송자의 메일 계정이 자동 생성된 메일 계정인지를 예측하고 이를 통해 스팸을 필터링하고자 한다. 메일 계정을 분류하기 위해서는 패턴 인식 문제에서 사용되어 온 결정 트리를 이용하였으며, 메일 서비스 업체로부터 수집된 약 215 만개의 메일 계정에 대해 실험하였다. 실험 결과, $96.3\%$의 정확률을 나타내었으며, 기존 시스템과 연동하여 새로운 형태의 스팸을 필터링할 수 있었다.

자가 생성 지도 학습 알고리즘을 이용한 컨테이너 식별자 인식

  • 김재용;박충식;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.500-506
    • /
    • 2005
  • 본 논문에서는 자가 생성 지도 학습 알고리즘을 이용한 운송 컨테이너 식별자 인식 시스템을 제안한다. 일반적으로 운송 컨테이너의 식별자들은 글자의 색이 검정색 또는 흰색으로 이루어져 있는 특정이 있다. 이러한 특성을 고려하여 원 컨테이너 영상에 대해 검은색과 흰색을 제외하고는 모든 부분을 잡음으로 처리하기 위해 퍼지 추론 방법을 이용하여 식별자 영역과 바탕영역을 구별한다. 식별자 영역으로 구분 된 영역은 그대로 두고, 바탕 영역으로 구분된 영역 은 전체 영상의 평균 픽셀 값으로 대체시킨다. 그리고 Sobel 마스크를 이용하여 에지를 검출하고, 추출된 에지를 이용하여 수직 블록과 수평 블록을 검출 하여 컨테이너의 식별자 영역을 추출하고 이진화한다. 이진화 된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 4 방향 윤곽선 추적 알고리즘을 적용하여 개별 식별자를 추출 한다. 개별 식별자 인식을 위해 자가 생성 지도 학습 알고리즘을 제안하여 개별 식별자 인식에 적용한다. 제안된 자가 생성 지도 학습 알고리즘은 입력층과 은닉층 사이의 구조를 ART-l을 개선하여 적용하고 은닉층과 출력층 사이에는 일반화된 델타 학습 방법과 Delta-bar-Delta 알고리즘을 적용하여 학습 및 인식 성능을 개선한다. 실제 80 개의 컨테이너 영상을 대상으로 실험한 결과, 제안된 식별자 추출 방법이 이전의 개별 추출 방법보다 추출률이 개선되었고 FCM 기반 자가 생성 지도 학습 알고리즘보다 제안된 자가 생성 지도 학습 알고리즘이 컨테이너 식별자의 학습 및 인식에 있어서 개선된 것을 확인하였다.색 문제를 해결하고자 하는 것이 연구의 목적이다. 정보추출은 사용자의 관심사에 적합한 문서들로부터 어떤 구체적인 사실이나 관계를 정확히 추출하는 작업을 가리킨다.앞으로 e-메일, 매신저, 전자결재, 지식관리시스템, 인터넷 방송 시스템의 기반 구조 역할을 할 수 있다. 현재 오픈웨어에 적용하기 위한 P2P 기반의 지능형 BPM(Business Process Management)에 관한 연구와 X인터넷 기술을 이용한 RIA (Rich Internet Application) 기반 웹인터페이스 연구를 진행하고 있다.태도와 유아의 창의성간에는 상관이 없는 것으로 나타났고, 일반 유아의 아버지 양육태도와 유아의 창의성간의 상관에서는 아버지 양육태도의 성취-비성취 요인에서와 창의성제목의 추상성요인에서 상관이 있는 것으로 나타났다. 따라서 창의성이 높은 아동의 아버지의 양육태도는 일반 유아의 아버지와 보다 더 애정적이며 자율성이 높지만 창의성이 높은 아동의 집단내에서 창의성에 특별한 영향을 더 미치는 아버지의 양육방식은 발견되지 않았다. 반면 일반 유아의 경우 아버지의 성취지향성이 낮을 때 자녀의 창의성을 향상시킬 수 있는 것으로 나타났다. 이상에서 자녀의 창의성을 향상시키는 중요한 양육차원은 애정성이나 비성취지향성으로 나타나고 있어 정서적인 측면의 지원인 것으로 밝혀졌다.징에서 나타나는 AD-SR맥락의 반성적 탐구가 자주 나타났다. 반성적 탐구 척도 두 그룹을 비교 했을 때 CON 상호작용의 특징이 낮게 나타나는 N그룹이 양적으로 그리고 내용적으로 더 의미 있는 반성적 탐구를 했다용을 지원하는 홈페이지를 만들어 자료

  • PDF

미등록 어휘에 대한 선택적 복사를 적용한 문서 자동요약 (Automatic Text Summarization based on Selective Copy mechanism against for Addressing OOV)

  • 이태석;선충녕;정영임;강승식
    • 스마트미디어저널
    • /
    • 제8권2호
    • /
    • pp.58-65
    • /
    • 2019
  • 문서 자동 요약은 주어진 문서로부터 주요 내용을 추출하거나 생성하는 방식으로 축약하는 작업을 말한다. 최근 연구에서는 대량의 문서를 딥러닝 기법을 적용하여 요약문 자체를 생성하는 방식으로 발전하고 있다. 생성 요약은 미리 생성된 위드 임베딩 정보를 사용하는데, 전문 용어와 같이 저빈도 핵심 어휘는 입베딩 된 사전에 없는 문제가 발생한다. 인코딩-디코딩 신경망 모델의 문서 자동 요약에서 미등록 어휘의 출현은 요약 성능 저하의 요인이다. 이를 해결하기 위해 본 논문에서는 요약 대상 문서에서 새로 출현한 단어를 복사하여 요약문을 생성하는 방법을 사용한다. 기존의 연구와는 달리 정확한 포인팅 정보와 선택적 복사 지시 정보를 명시적으로 제공하는 방법으로 제안하였다. 학습 데이터는 논문의 초록과 제목을 대상 문서와 정답 요약으로 사용하였다. 제안한 인코딩-디코딩 기반 모델을 통해서 자동 생성 요약을 수행한 결과 단어 제현 기반의 ROUGE-1이 47.01로 나타났으며, 또한 어순 기반의 ROUGE-L이 29.55로 향상되었다.

개념기반 복합키워드 추출방법 (Concept-based Compound Keyword Extraction)

  • 이상곤;이태헌
    • 컴퓨터교육학회논문지
    • /
    • 제6권2호
    • /
    • pp.23-31
    • /
    • 2003
  • 인간은 문서를 읽고 그 내용을 머릿속에서 개념적으로 정리하여 적은 수의 복합단어를 이용하여 문서를 대표하는 적당한 키워드로 정리한다. 본 논문은 이러한 점에 착안하여 문서를 대표하는 키워드를 추출하는 방법을 제안한다. 학술논문을 실험 예로 사용하여 저자가 자신의 문서에 부여한 키워드가 문서의 본문 중에 출현하지 않는 경우에도 동작하도록 출현단어의 개념정보를 기초로 복합어 생성규칙을 구축한다. 문서의미와 상관없는 키워드의 추출을 억제하기 위해 중요도 결정법을 새로 제안한다. 추출된 키워드의 타당성 여부는 자연언어와 음성언어에 관한 논문의 제목과 요약을 수집하여 실험하였다. 또한 저자가 부여한 키워드와 본 시스템이 출력한 키워드를 비교 한 결과, 상위 한 개의 정확율이 96%가 되어 제안방법의 유용성을 확인하였다.

  • PDF

문서구조를 이용한 질의응답문서 클러스터링에 관한 연구 (A Study on Clustering Query-answer Documents with Structural Features)

  • 최상희
    • 한국문헌정보학회지
    • /
    • 제39권4호
    • /
    • pp.105-118
    • /
    • 2005
  • 이용자가 직접 참여하여 질의를 제공하고 응답을 하면서 공동으로 지식을 생산해내는 형태의 정보서비스는 응답된 내용이 축적되어 가면서 새로운 대용량 정보검색 분야로 성장하고 있다. 이 연구에서는 질의와 응답이 결합되어 있는 질의응답문서의 구조적 특성을 반영하여 질의응답문서의 효율적인 이용 방안을 도모하고자, 문서 구성요소인 질의제목, 질의설명, 응답내용을 기반으로 클러스터를 자동 생성하여 수작업 주제 범주와 비교한 후 각 구성요소의 주제 표현 성능을 평가하였다. 실험 결과 응답내용 클러스터링 결과가 수작업 결과와 가장 유사한 것으로 나타나 응답내용이 문서의 주제를 표현하는데 효과적인 것으로 분석되었다.

선율을 이용한 음악정보 검색 시스템의 설계 및 구현 (Design and Implementation of Music Information Retrieval System)

  • 지정규;오해석
    • 한국정보처리학회논문지
    • /
    • 제5권1호
    • /
    • pp.1-11
    • /
    • 1998
  • 본 논문은 디지털 음악 도선관에서 음악정보를 효율적으로 검색하기 위한 시스템의 설계 및 구현에 관한 것이다. 종래의 전형적인 음악정보 검색 항목인 제목이나 작곡자 또는 주제 목록을 입력하는 것이 아니라, 사용자가 음악 데이터베이스로부터 검색하고자 하는 음악의 일부 선율을 마이크를 통해서 노래한다. 그러면 입력된 선율에 대한 음 신호를 처리하여 음표 정보를 인식하고, 이를 바탕으로 음정 곡선을 생성하여 이를 탐색 패턴으로 사용한다. 탐색 패턴을 가지고 제안한 음표열 탐색 알고리즘을 이용하여 근사 탐색을 함으로써 사용자는 노래의 어느 마디를 부르더라도 쉽게 후보곡을 검색하고, 감상할 수 있도록 했다.

  • PDF

서지 데이터베이스에서의 레코드 필드 선택이 검색 성능에 미치는 영향에 관한 연구 (A Study of the Influence of Choice of Record Fields on Retrieval Performance in the Bibliographic Database)

  • Heesop Kim
    • 한국문헌정보학회지
    • /
    • 제35권4호
    • /
    • pp.97-122
    • /
    • 2001
  • 본 연구에서는 레코드필드 선택이 대규모 서지 데이터베이스 탐색시 미치는 검색 성능에 대하여 관찰하였다. 실험의 구성 요소는 크게 (1) 대규모 상업용 데이터베이스 INSPEC. (2) 관련된 레코드들 (target sets이라고 정의함). (3) 4개의 키워드가 한 세트로 이루어진 4개의 서로 다른 형태의 질의어들 (CT_TF, CT_IDF, UT_TF, UT_IDF), (4) 최적의 질의를 위한 알고리즘, (5) 가능한 모든 경우의 탐색식을 생성해내는 블리언 탐색식 생성기, 그리고 (6) 실제 운영중인 웹 기반의 검색 시스템으로 이뤄졌다. 실험에서의 레코드 필드 선택은 (1) Abstract, (2) Descriptors, (3) Identifiers, (4) 'Subject'(Descriptors + Identifiers). (5) Title. (6) 'All fields'로 정의하여 독립변수로 채택하였다. 검색 성능은 재현율, 정도율을 모두 반영한 Heine의 D측정에 의하여 평가 되었다. 본 연구에서 얻은 주된 결과로는 (1) 필드선택은 검색성능에 중요한 영향을 미치며, (2) 각 검색 성능에서 보여준 순위는 질의어에 따라 민감한 결과를 보였고 (3) 제목(Title)필드 선택이 D측정에서 최적의 결과를 보였다.

  • PDF

Crystal Structure and Thermal Stability Study on Tetrabutylammonium Hexamolybdate [n-Bu4N]2[Mo6O19](TBAM)

  • Zhao, Pu Su;Zhao, Zhan Ru;Jian, Fang Fang;Lu, Lu De
    • 대한화학회지
    • /
    • 제47권6호
    • /
    • pp.553-558
    • /
    • 2003
  • $[n-Bu_4N]_2[Mo_6O_{19}]$(TBAM)의 결정구조는 X-ray 분석기로 결정되었다. 그 결정은 monoclinic 계이며 ${\alpha}$=16.314(5), b=17.288(5), c=17.776(4) ${\AA}$, ${\beta}$=101.47(3) 그리고 z=4의 결정파라미터를 갖는 sapce group 이 C2/c인 결정이다 $[Mo_6O{19}]^{2-}$ 음이온에서, Mo 원자는 팔면체의 여섯 개 모서리를 차지하며 각 Mo 원자는 여석개의 산소원자에 배위되어 찌그러진 팔면체 배위 기하학을 지닌다. Mo-Ot(말단기), Mo-Ob(연결된), 그리고Mo-Oc(중앙)의 평균거리는 각각 1.680 ${\AA}$, 1.931 ${\AA}$ 및 2.325 ${\AA}$ 이다. $[n-Bu_4N]^+$ 양이온에서 N원자는 약간 찌그러진 사면체 모형을 갖는다. 격자안에서 폭 넓은 C-H ${\cdots}$ O 수소결합이 있으며, 그것에 의하여 분자들을 연결하고 결정구조를 안정화 한다. 열분석에 의하여 제목의 열적분핸ㄴ 두개의 전이가 일어나며 356.0와 803.5 $^{\circ}$에서 각각 무게를 잃는다. 그리고 분해된 생성물은 $Mo_2O_2$로 추정된다. 따라서, 제목의 화합물은 높은 열적 안정성을 갖는다.