• 제목/요약/키워드: 데이터 분석 및 검색

Search Result 793, Processing Time 0.031 seconds

An Efficient Content-based Retrieval System using High-Dimensional Index Structure Image Database (대규모 이미지 데이터베이스에서 고차원 색인 구조를 이용한 효율적인 내용 기반 검색 시스템)

  • Lee, Dong-Ho;Park, Ju-Hong;Jeong, Jin-Wan;Kim, Hyeong
    • Journal of KIISE:Software and Applications
    • /
    • v.26 no.1
    • /
    • pp.52-65
    • /
    • 1999
  • 이미지나 비디오, 오디오와 같이 멀티미디어 데이터들은 기존의 단순한 텍스트 기반의 데이터에 비하여 대용량적인 특성과 비정형적인 특성을 가지고 있어서 검색시 많은 어려움이 따른다. 본 논문에서는 대규모의 이미지 데이터베이스에서 효율적이고 신속하게 사용자가 원하는 이미지를 검색할수 있는 내용 기반 검색 시스템을 제시한다. 이를 위해서 본 논문에서는 최근 여러 장점으로 인하여 신호 분석이나 이미지 압축 분야에 많이 사용되는 웨이브릿 변환을 이용하여 이미지 데이터로부터 내용 기반 검색에 사용되는 특징 벡터를 효율적으로 추출하는 기법과 유사성 측정 방법을 제안한다. 그리고, 이러한 특징 추출방법과 유사성 측정 방법을 이용하여 내용 기반 질의 및 검색을 수행할 경우, 검색 조건을 만족하는 객체인데 실수로 검색해내지 못하는 경우인 false dismissals 이 발생하지 않음을 보인다. 또한 대규모 이미지 데이터베이스에서 신속한 내용 기반 검색을 지원하기 위하여 고차원 데이터에 대한 효율적인 색인을 제공하는 X-tree를 이용한 이미지 색인 방법을 보이며 이것이 기존의 순차 검색이나 R*-tree를 이용한 색인 방법보다 신속하게 이미지 데이터들을 검색할 수 있다는 것을 다양한 실험을 통해 보인다. 마지막으로 QBIC에서 제안한 검색 적합성 측정 방법을 이용하여 본 논문에서 제안하는 내용 기반 이미지 검색시스템의 검색 적합성을 보인다.

Analysis of Construction and Searching Algorithms for Compressed Index Data Structures (압축된 인덱스 자료구조를 위한 구축 및 검색 알고리즘의 성능 분석)

  • 이분녀;김동규
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.640-643
    • /
    • 2004
  • 기하급수적으로 증가하고 있는 방대한 양의 데이터를 효율적으로 저장하고, 검색하기 위한 방법으로 압축된 인덱스 자료구조(compressed index data structure)가 제안되었고 현재 활발히 연구되고 있다. 압축된 인덱스 자료구조란 데이터를 적절한 방법으로 색인화(indexing)하여 이를 압축(compression)된 자료구조로 저장하여, 데이터 검색의 성능저하 없이, 저장 공간을 줄일 수 있는 방법이다. 본 논문에서는 대표적인 방법으로 Ferragina와 Manzini가 제시한 FM-index를 다룬다. 이 방법을 구현하여 전체적인 성능에 영향을 미치는 요소들을 실험을 통해 분석하였다. 이를 통하여 각 파라미터들의 상관관계를 분석하고 이상적인 설정 값을 실험하였다.

  • PDF

A Study on Cultural properties and Historical Region Management System construction Using Geo-Spatial Information System (GSIS를 이용한 문화유적지 관리시스템 구축방안에 관한 연구)

  • Kim Kam-Rae;Kim Hoon-Jung;Kim Myoung-Bae;Lee Ka-Hyoung
    • Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography Conference
    • /
    • 2006.04a
    • /
    • pp.353-358
    • /
    • 2006
  • 지자체에 보유하고 있는 문화유적에 대한 현황이 표시된 종이도면에 대해 스캐닝을 통한 벡터라이징을 수행하여 자료를 전산화하고 지적도와 중첩 표시 되어있는 현황에 맞게 동일좌표계로 데이터를 구축한다. 이러한 기초데이터에 대해 사용자의 질의 및 이에 의한 검색을 수행하기 위해 개발도구는 Visual C++, Visual Basic과 지도에 대한 질의 및 화면도시를 위한 기초엔진을 Map Object를 통해 최적화 시켰다. 본 연구를 통해 구축된 시스템의 중요기능으로는 문화유적에 대해 지번 및 반경입력을 통해 유적에 영향을 미치는 영향권 분석, 선택지번에서 최단거리에 있는 문화재 검색, 최단경로 분석, 문화재에 대한 다양한 정보 및 관리대장에 대한 관리기능 등의 주요기능이며 부수적으로 다양한 검색 및 출력을 위해 지번 및 소유자검색, 대장검색, 문화재검색, 도면 및 대장출력, 출력물 연동, 화면이미지 저장 등을 수행하도록 시스템을 구축하였다.

  • PDF

Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots (패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축)

  • Choi, Su-Won;Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

WSBAT: Web Services based Biodata Analysis Tool (웹 서비스 기반 바이오 정보 통합 분석 도구)

  • 최요한;유성준;김민경;박현석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.289-291
    • /
    • 2004
  • 최근 웹 서비스 기술을 이용하여 바이오 데이터 및 데이터 메소드를 제공하는 것과 관련된 연구들이 진행되고 있다. 웹 서비스 기반 바이오 데이터 서비스에 대한 연구 자료는 시스템 구조 및 API 등을 중심으로 보고되고 있으나 이를 기반으로 한 통합 응용 도구 개발 관련 연구는 미미한 실정이다. 이에 따라 이 논문에서는 웹 서비스 API 등을 이용하여 바이오인포매틱스 연구자들이 이용할 수 있는 데이터 통합, 검색, 브라우징 기능을 제공하는 분석 도구를 개발하였다 사용자는 이 도구를 이용하여 바이오 데이터 간의 상호연관성을 보다 쉽게 발견할 수 있으며 보다 다양한 검색 결과를 여러 가지 형태로 볼 수 있게 될 것이다.

  • PDF

Design of the Naming Agent using Meta-data (메타 데이터를 이용한 네이밍 에이전트 설계)

  • 김광명;고현;이연식
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.1109-1114
    • /
    • 2002
  • 본 논문에서는 멀티 에이전트 모델에서의 정보 검색 서비스 지원에 있어 이동 에이전트의 이주 호스트(이하 노드) 자동 탐색, 이주 순위 결정 및 검색 적중률 분석을 통한 보다 정확한 정보 서비스 지원을 위해 메타 데이터를 이용한 네이밍 에이전트를 설계한다. 기존의 이동 에이전트 시스템에서는 이동 에이전트가 이주할 노드의 IP와 포트번호 또는 CORBA 구현 저장소에 등록된 구현 객체의 이름 등을 사용자가 직접 지정해주어야 함으로써, 이주 대상 노드에 대한 구현 객체 연결을 위해 물리적인 정보들을 반드시 알고 있어야 하는 단점이 있다. 따라서, 본 논문에서는 각 네이밍 서비스별로 구현 객체 관련 정보들을 메타 데이터 테이블에 저장 및 관리하고, 사용자 입력 검색 키워드에 대한 해당 구현 객체의 객체 참조자를 반환하는 네이밍 에이전트를 설계한다. 설계된 네이밍 에이전트는 메타 데이터를 이용하여 정확한 정보 검색을 수행하기 위한 노드 이주를 지원하고, 이를 통해 다양한 사용자의 요구에 따른 정보 검색 정확도의 향상은 물론 이동 에이전트의 순회 검색 수행 시간의 단축 및 한정된 네트웍 환경에서의 트래픽 감소를 유도한다.

  • PDF

A Study on Design and Development for Online Search Advertisement Platform using Big Data Analysis System (빅데이터 분석 시스템을 활용한 온라인 검색 광고 플랫폼 설계 및 개발에 관한 연구)

  • Noh, Seon-Taek;Hong, Seung-Hyung;Kim, Kyung-Soo;Song, Young-Ki;Kim, Hwan-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.187-190
    • /
    • 2012
  • 온라인 검색 광고는 인터넷 사용자의 증가, 그리고 온라인 광고 수요의 규모가 커짐에 따라 광고 시장에서 보조적인 역할에서 벗어나 주도적인 위치로 변화하고 있다. 지속적인 규모성장과 수요 증가에도 불구하고 기존의 관계형 데이터베이스에 의존한 온라인 검색 광고 플랫폼은 구조적인 한계로 인해 유연한 자원 확장이나 분석속도의 보장성을 유지할 수 없다. 본 논문에서는 빅데이터 분석 시스템을 이용하여 온라인 검색 광고 플랫폼을 설계 및 구현함으로써, 데이터 저장 공간을 유연하게 확장할 수 있으며, 일정한 시간으로 수렴할 수 있는 안정적인 분석 속도를 유지하는 시스템을 제안한다.

Design and Evaluation of a Personalized Search Service Model Based on Web Portal User Activities (웹 포털 이용자 로그 데이터에 기반한 개인화 검색 서비스 모형의 설계 및 평가)

  • Lee, So-Young;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.23 no.4 s.62
    • /
    • pp.179-196
    • /
    • 2006
  • This study proposes an expanded model of personalized search service based on community activities on a Korean Web portal. The model is composed of defining subject categories of users, providing personalized search results, and recommending additional subject categories and queries. Several experiments were performed to verify the feasibility and effectiveness of the proposed model. It was found that users' activities on community services provide valuable data for identifying their Interests, and the personalized search service increases users' satisfaction.

Development and Evaluation of Authority Data based Academic Paper Retrieval System (전거데이터 기반 학술논문 검색시스템의 구축 및 평가에 관한 연구)

  • Lee, Seok-Hyoung;Kwak, Seung-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.46 no.2
    • /
    • pp.133-156
    • /
    • 2012
  • This study aims to develop and evaluate the authority data-based academic retrieval system that may provide search tools and additional information for search of academic papers with users. To evaluate the usability of authority data-based academic paper search system, this work studied 60 subjects who had experienced the academic paper service to measure their satisfaction on both search efficiency and system usability and additionally analyzed whether the difference between search efficiency and system availability is significant in the experimental search system among user groups. As a result, the authority data-based academic paper search system was analyzed to show a higher search efficiency and user satisfaction than the ordinary system.

The Design and Implementation of A Video Geographic Information System (비디오 지리 정보 시스템의 설계 및 구현)

  • 유재준;주인학;남광우;이종훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.274-276
    • /
    • 2002
  • 최근에 지리 정보를 검색, 관리, 분석할 수 있는 지리 정보 시스템(Geographic information System)의 사용이 확대됨에 따라 단순한 수치지도 정보 이외에 좀 더 현실적이고. 사실적인 정보를 제공해 줄 수 있는 시스템에 대한 요구가 커지고 있다 이러한 요구에 부응하는 한 방향으로써 차량에 부착된 카메라 등등 사용하여 획득한 비디오 데이터와 수치지도 정보를 연계하여 특정 수치지도 객체의 영상을 제공함으로써 수치지도 객체에 대한 자세한 현장의 정보를 쉽게 파악할 수 있도록 하는 비디오 지리 정보 시스템이 등장하였다. 하지만 기존의 비디오 지리 정보 시스템은 획득한 비디오 데이터를 수치지도의 한 속성으로서 표현하거나, 수치지도에서 비디오 데이터로의 단순한 링크를 사용하여 수치지도와 연계함으로써 수치지도의 검색을 통한 영상 정보의 출력이라는 단방향 검색만을 지원한다. 즉, 비디오 데이터에 존재하는 수치지도 객체의 검색을 통한 수치지도의 검색 및 관리, 분석은 지원해 주지 못하고 있다. 본 논문에서는 비디오 데이터와 수치지도의 양방향 검색 및 관리를 지원하는 비디오 지리 정보 시스템을 설계하고 구현한다. 이를 위해 1) 비디오 데이터와 수치지도 정보를 효율적으로 연계하기 위한 데이터 모델을 제안하고, 2) 비디오 데이터와 수치지도 정보의 연계 정보를 추출 및 구축하는 과정을 제안하며, 3) 비디오 데이터의 출력 및 검색, 수치지도의 출력 및 검색, 연계 정보를 통한 비디오 데이터와 수치지도 정보의 연동 등을 효율적으로 지원하기 위한 시스템을 컴포넌트(Component) 구조를 사용하여 설계한다. 이해성 및 이를 기반으로 하는 교육용 애플리케이션 개발의 용이성의 증대를 기대할 수 있으며, 모델의 재사용성을 보장할 수 있다. 제안한다.수행하였다. 분석에서는 제품의 효율성뿐만 아니라 보안성을 중요하게 생각하였으며, 앞으로 보안 관련 소프트웨어 개발에 사용될 수 있는 도구들이 가이드 라인에 대한 정보를 제공한다.용할 수 있는지 세부 설계를 제시한다.다.으로서 hemicellulose구조가 polyuronic acid의 형태인 것으로 사료된다. 추출획분의 구성단당은 여러 곡물연구의 보고와 유사하게 glucose, arabinose, xylose 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의

  • PDF