• 제목/요약/키워드: 텍스트 검색

검색결과 684건 처리시간 0.031초

텍스트 마이닝 기반 사용자 경험 분석 및 관리: 스마트 스피커 사례 (User Experience Analysis and Management Based on Text Mining: A Smart Speaker Case)

  • 연다인;박가연;김희웅
    • 경영정보학연구
    • /
    • 제22권2호
    • /
    • pp.77-99
    • /
    • 2020
  • 스마트 스피커는 인공지능을 활용하여 음악, 일정, 날씨, 상품 등 다양한 정보와 콘텐츠들을 검색, 이용할 수 있는 대화형 음성 기반 서비스를 제공하는 기기이다. 인공지능 기술은 데이터가 축적될수록 이를 활용하여 더욱 정교하고 최적화된 서비스를 이용자에게 제공한다. 따라서 스마트 스피커 제조사들은 초기에 공격적인 마케팅을 통해 플랫폼 구축에 힘썼다. 하지만 스마트 스피커의 사용빈도는 월 1회 미만이 전체의 3분의 1 이상을 차지하고, 사용자 만족도도 49%에 그치는 것으로 나타났다. 이에 지속적인 이용활성화와 만족도 증진을 위해 스마트 스피커의 사용자 경험을 강화할 필요성이 대두되었다. 이에 본 연구에서는 스마트 스피커의 사용자 경험을 분석하고, 이를 바탕으로 스마트 스피커의 사용자 경험 강화 방안을 제시하고자 한다. 본 연구는 사용자가 직접 작성한 실제 리뷰 데이터를 수집하여 스마트 스피커 사용자 경험 차원을 기반으로 분석 결과를 해석했다는 점에서 의의가 있다. 또한 스마트 스피커 사용자 경험 차원을 개발하여 텍스트 마이닝 결과를 해석한 것에서 학술적 의의가 있다. 본 연구 결과를 통해 스마트 스피커 제조사에게 실무적으로 사용자 경험 강화를 위한 전략을 제안할 수 있다.

통합된 비디오 인덱싱 방법을 이용한 내용기반 비디오 데이타베이스의 설계 및 구현 (Design and Implementation of Content-based Video Database using an Integrated Video Indexing Method)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.661-683
    • /
    • 2001
  • 오늘날 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이타베이스에 대한 효율적인 관리는 더욱 중요한 의미를 가지게 되었다. 그리고 초고속 정보통신망과 디지털 기술의 발전은 비디오 데이타를 통신 및 컴퓨터와 결합하여 새로운 멀티미디어로 발전하고 있으며, 인터넷 방송, 주문형 비디오(VOD) 등에 크게 활용하고 있다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 비디오를 검색하기 위해 비디오의 정확한 특징정보를 추출하여 비디어 데이타베이스를 구축하여야 한다. 비디오 데이타베이스는 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 비디오 데이타베이스에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 비디오 데이타베이스 생성기법과 효율적인 검색기법이 필요하다. 본 논문에서는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적할 수 있는 내용기반 비디오 데이타베이스의 구축 방안과 생성기법을 제시하였다. 그리고 제안된 비디오 데이타베이스의 구축 방안과 생성기법을 사용하여 새로운 인터넷 방송 프로그램 컨텐츠 제작에 활용할 수 있는 비디오 데이타베이스를 구현하였다. 이를 위해 비디오 분할과 대표키 프레임 추출 시 비디오의 의미적 구조와 사전 제작지식정보의 상호관계를 기반으로 하여 비디오 데이타의 특징정보를 추출하고, 검색할 수 있도록 주석기반 검색과 내용기반 검색을 통합한 비디오 인덱싱 방법을 제시하였다. 통합된 비디오 인덱싱 방법은 비디오의 하위 레벨에 표현된 내용기반 메타데이타 유형과 비디오의 특징정보 추출이 어려운 상위 레벨에 표현된 주석기반 메타데이타 유형을 동시에 이용하므로 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 비디오 데이타베이스는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적하여 데이타베이스를 구축하므로 정확한 인터넷 방송 컨텐츠 정보의 축적관리와 구축작업의 효율화가 가능하며, 또한 인터넷 방송 컨텐츠 제작 시 정보공유 및 재이용이 가능하므로 새로운 컨텐츠 제작의 효율성을 높일 수 있다.

  • PDF

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

종교유적 건축물 정보의 메타데이터 구성과 온톨로지 구축 (Construction of Metadata Format and Ontology for Religious architecture heritage Information)

  • 정희선;김희순;송현숙;이명희
    • 한국도서관정보학회지
    • /
    • 제44권1호
    • /
    • pp.5-26
    • /
    • 2013
  • 표준화된 메타데이터 구성은 문화유산정보의 효율적인 검색을 위해서 중요하지만 현실적으로 메타데이터는 각 객체가 속한 집단의 목적이나 자원의 속성에 따라 다양하게 표현되고 있다. 본 연구에서는 서울시 종교유적 건축물 데이터베이스 구축에 적합한 메타데이터 항목 구성을 위하여 국내외의 대표적인 문화유산정보 분야의 6종의 메타데이터 포맷을 비교하여 18개의 메타데이터 항목을 구성하였다. 종교유적 건축물 메타데이터 항목에 근거하여 서울시 소재 72개 종교유적 건축물에 대하여 건축물 부분, 스토리텔링 부분, 참고자료 및 관련 자료의 세부분으로 이루어진 데이터베이스를 구축하였다. CIDOC-CRM에 한국의 종교문화유산 정보에 필요한 항목을 추가하여 구성한 수정모형을 이용한 온톨로지를 설계하고, 수동 말뭉치 구축 프로그램을 개발하여 원문 텍스트로부터 개체명 및 이벤트를 부착하였다.

SRR을 이용한 분산 도메인 문서 객체 관리 (A Distributed Domain Document Object Management using Semantic Reference Relationship)

  • 이종득
    • 디지털융복합연구
    • /
    • 제10권5호
    • /
    • pp.267-273
    • /
    • 2012
  • 시맨틱 관계성은 포맷되지 않은 많은 문서 객체들을 계층적으로 구조화한다. 그러나 분산 응용도메인에서 관련 데이터를 추출하여 구조화하기란 쉽지 않는 일이다. 이러한 문제를 해결하기 위하여 본 논문에서는 분산된 응용 도메인 객체들을 서비스할 수 있도록 시멘틱 참조 관련성을 이용한 새로운 객체 관리 기법을 제안하였다. 제안된 기법은 응용 도메인 객체들로부터 시멘틱 유사성을 추출하기 위하여 프로파일 구조를 이용하였으며, 추출된 객체들의 시멘틱 관계성을 결정하기 위하여 joint matrix를 이용하였다. 제안된 기법의 성능을 알아보기 위하여 시뮬레이션을 수행하였으며, 시뮬레이션 결과 제안된 기법이 기존의 텍스트 마이닝 기법과 정보추출기법에 비해서 검색 성능이 우수함을 알게 되었다.

오프닝 크레딧 분석을 통한 무빙 타이포그래피 활용에 관한 연구 (A Study on the application of Moving Typography through the analysis of Opening Credit)

  • 조규명;김태원
    • 디자인학연구
    • /
    • 제12권3호
    • /
    • pp.117-126
    • /
    • 1999
  • 본 연구는 영화의 오프닝 크레딧에서 표현된 무빙타이포그래피를 분석함으로써 현재 매스미디어로 급부상하고 있는 멀티미디어환경에서 타이포그래피에 대한 활용방안을 모색하는 데 목적을 두었으며, 무빙 타이포그래피의 활용방안은 움직임을 통한 주목성의 증대와 이미지 전달에서 파생된 아래의 4가지를 제시하였다. 첫째, 텍스트 위주의 화면에서 키워드에 움직임을 부여함으로 주목성을 높이는 수단으로 활용이다. 둘째, 정보검색자들의 효율적인 정보수집에 도움을 줄 수 있는 사용자환경을 제공하기위한 차별화된 CUI(Character Uesr Interface) 버튼으로 활용한다. 셋째, 언저정보인 문자에 움직임을 부여함으로써 학습되지 않은 문자에 대한 정보전달 수단으로 활용한다. 넷째, 문자가 내포하고 있는 의미의 전달과 움직임을 통한 이미지 전달수단으로 활용한다.

  • PDF

웹 기반 리포팅 시스템 구현 (Implementation of Web-based Reporting System)

  • 김영균
    • 한국컴퓨터산업학회논문지
    • /
    • 제7권5호
    • /
    • pp.495-502
    • /
    • 2006
  • 리포팅 시스템은 사용자가 원하는 정보를 정형화된 형식으로 출력할 수 있는 시스템이다. 클라이언트/서버 환경에서는 원격의 사용자는 클라이언트에서 동작하는 컴포넌트를 이용하여 서버의 데이터를 가공, 처리하여 원하는 형식의 문서 양식으로 출력을 할 수 있었으나, 웹 기반의 인트라넷 구축이 보편화되면서 이와 같은 클라이언트/서버 시스템 구조의 리포팅 시스템이 웹 기반의 환경으로 전환되고 있다. 본 연구는 이와 같은 웹 기반의 시스템 환경에서 사용자가 브라우저를 통해 서버에 접속하고, 서버의 데이터베이스를 검색, 처리한 결과를 원하는 형식으로 파일 저장 또는 인쇄 출력할 수 있도록 지원하는 기능이다. 본 연구 결과는 텍스트 및 그래픽 기능을 지원하며, 실시간 데이터 연동 기능이 가지는 컴포넌트를 개발하였으며, 특히, 서버 시스템에 독립적으로 동작하도록 자바를 이용한 표준 인터페이스로 구현하였다. 특히, 망 관리 시스템의 리포팅 컴포넌트로 구현, 적용함으로써 사용자 인터페이스 및 기능을 검증하였다.

  • PDF

질의응답 시스템을 위한 백과사전 기반 지식베이스와 온톨로지 (Encyclopedia-Based Knowledge Base and Ontology for Question Answering System)

  • 최호섭;옥철영;김창환;왕지현;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.177-183
    • /
    • 2003
  • 기존의 정보검색시스템이 사용자의 질의에 의해 키워드가 포함된 의미 있는 문서를 제공하는 시스템이라면, 질의응답시스템은 사용자 질의에 맞는 정답을 적절한 언어처리 기법을 통해 텍스트로부터 추출하여 제공하는 시스템이다. 이러한 언어처리 기법을 이용한 질의응답 시스템에서 시스템의 성능 향상에 도움을 줄 수 있는 것이, 실세계의 지식을 저장하고 있는 지식베이스라 할 수 있다. 지식베이스가 가지고 있는 실세계의 지식을 어떻게 효율적으로 활용하느냐에 따라 질의 처리 분석과 정답 확률을 향상시킬 수 있는 것이다. 본 논문에서는 실세계의 지식을 어느 정도 체계적 의미적으로 반영하고 있는 것을 백과사전으로 판단하여, 백과사전의 '인물' 범주(category)를 중심으로 백과사전 지식베이스의 틀을 마련하고자 하였다. 또한 어휘의 계층적 구조를 중심으로 한 온톨로지를 백과사전 지식베이스와 유기적으로 연결시킴으로써 보다 의미 있는 지식베이스를 형성하는 방안을 모색하고자 하였다.

  • PDF

차세대 웹에서의 멀티미디어 동기화 기술 (Synchronized Multimedia Technology on Next Generation Web)

  • 신봉희;김성종
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.60-70
    • /
    • 1999
  • 웹 서비스를 기반으로 한 인터넷은 비약적으로 발전하고 있으며, 차세대 웹 표준화를 위한 노력이 전세계적으로 진행 중에 있다. 처음 개발된 당시 웹은 텍스트 기반의 구조에 맞추어 HTTP, HTML, URL이 제안되어 이를 통해 비동기적인 형태의 검색과 단순하고 단일한 방식의 표현 방식을 사용해 왔다. 그러나 최근 인터넷 상의 상당수의 데이터들은 보다 복잡해지고 구조화되어 가고 있으며 동기적인 멀티미디어 정보를 포함하는 등 새로운 구조 및 표현 방식을 요구하게 되었다. W3C의 사용자 인터페이스 도메인 중 멀티미디어 동기화 그룹에서 현재 표준화 작업중인 언어는 SMIL SMIL은 웹 상에서 멀티미디어 요소들이 잘 통합되어 어느 위치에서 얼마동안 표현되는지를 기술하는 XML-기반 언어이다. 본 논문에서는SMIL 관련 표준화 동향 및 주요 이슈들을 연구 분석하고 기술 개발 내용에 대하여 논의한다.

  • PDF

병렬말뭉치를 이용한 대체어 자동 추출 방법 (Automatic Extraction of Alternative Words using Parallel Corpus)

  • 백종범;이수원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권12호
    • /
    • pp.1254-1258
    • /
    • 2010
  • 정보 검색에 있어서 통일 객체를 다양한 표기로 기술하는 문제는 시스템의 성능을 저하시키는 요인이 된다. 본 연구에서는 이러한 문제를 해결하기 위하여 특허 정보의 국/영문 제목을 병렬말뭉치로 이용하여 대역어 뭉치를 추출하고, 이를 각 단어의 특징(Feature)으로 이용하여 대체어 목록을 자동 추출하는 방법을 제안한다. 또한 대체어 목록 내에 대체어가 아닌 다수의 연관단어들이 포함되는 문제점을 해결하기 위하여 국문 제목에서 추출한 연관단어 뭉치를 이용하여 대체어 목록 내 연관단어들을 필터링하는 방법을 제안한다. 평가결과에 따르면 본 연구에서 제안한 방법이 기존의 대체어 추출 방법들보다 더 우수한 것으로 나타났다.