• 제목/요약/키워드: 질의 로그

검색결과 130건 처리시간 0.027초

전자상거래를 위한 확장된 디지털 카탈로그 및 질의 모델 제안 (Extended Electronic Catalog for dynamic and flexible Electronic Commerce)

  • 정지혜;이상구;우치수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.120-122
    • /
    • 1999
  • World Wide Web은 하이퍼미디어라는 뛰어난 사용자 인터페이스 기능을 제공함으로써 인터넷을 대중화 시켰고, 전자상거래라는 인터넷의 상업화도 가능하게 되었다. 이와 같은 전자상거래에서 필수적인 기술 중의 하나는 사용자가 원하는 상품의 카탈로그를 쉽고 빠르게 찾는 것이다. 본 논문의 목적은 전자 카탈로그를 정의하고 질의하는 모델을 제안하여 전자 카탈로그 시스템을 보다 쉽게 구축하고 유지하며 사용자의 요구사항을 만족하는 상품에 대한 카탈로그를 보다 쉽게 검색할 수 있는 방법을 제공하는 것이다. 본 모델의 주된 아이디어는 상품에 대한 정보를 표현하는 기존의 카탈로그와 계층적 검색을 위해 존재하는 분류체계를 통합하여 하나의 객체로 정의하고 그 객체에 대한 질의 언어를 정의함으로써 기존의 카탈로그에 대한 개념을 확장하여 전자 카탈로그 시스템 전반에 관한 검색을 용이하도록 하는 것이다. 확장된 카탈로그는 하나의 객체로 정의되기 때문에 질의에 의해 전체를 필터링해서 일부분만을 보여주거나, 사용자가 원하는 형태로 재구성하는 것이 가능하게 된다. 이를 위해 본 모델에서는 상품에 대한 정보를 그래프 형태로 정의하고 그들을 계층적으로 분류하는 분류 체계에 대해서 설명한다. 그리고 확장된 카탈로그를 각 상품과 카테고리를 노드로 한 그래프 형태로 정의하고 그에 대한 질의어를 제안한다.

  • PDF

질의 로그 분석을 통한 네이버 이용자의 검색 형태 연구 (Information Seeking Behavior of the NAVER Users via Query Log Analysis)

  • 이준호;박소연;권혁성
    • 정보관리학회지
    • /
    • 제20권2호
    • /
    • pp.27-41
    • /
    • 2003
  • 이용자와 검색 서비스 시스템의 모든 검색 과정을 기록한 질의 로그는 이용자의 실제 검색 행위를 사실적으로 반영한다. 따라서, 웹 검색 이용자들의 검색 행태를 이해하기위하여 웹 검색 서비스 시스템이 생성한 질의 로그를 분석하는 방법이 널리 사용되고 있다. 본 연구는 네이버 이용자의 웹 검색 행태를 파악하기 위하여 기존의 질의 로그 분석 방법론을 보완하여 제시한다. 또한, 본 연구는 통합 검색, 디텍토리 검색, 웹 문서 검색과 같은 다양한 검색 유형에 대하여 일주일 동안 생성된 질의 로그를 분석함으로써 네이버 웹 검색 이용자들의 전반적인 검색 행태를 파악하였다. 본 연구의 결과는 보다 효과적인 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

로그분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구 (Investigating Web Search Behavior via Query Log Analysis)

  • 박소연;이준호
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.111-122
    • /
    • 2002
  • 본 연구에서는 웹 검색 이용자들의 전반적인 검색 행태를 이해하기 위하여 국내에서 널리 사용되고 있는 웹 검색 서비스 네이버에서 생성된 검색 트랜잭션 로그를 분석하였다. 본 연구에서는 웹 검색 트랜잭션 로그 분석에 필요한 세션 정의 방법을 설명하고 로그 정제 및 질의 유형 분류방법을 제시하였으며, 한글 검색 트랜잭션 로그 분석에 필수절인 검색어 정의 방법을 제안하였다. 본 연구의 결과는 보다 효과적인 국내 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.

클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석 (An Analysis of Query Types and Topics Submitted to Navel)

  • 박소연;이준호;김지승
    • 한국문헌정보학회지
    • /
    • 제39권1호
    • /
    • pp.265-278
    • /
    • 2005
  • 웹 검색 분야의 대부분의 선행 연구들은 검색 질의를 살펴본 연구자의 판단에 근거하여 질의의 주제를 분석하였다. 그러나 웹 검색 질의의 주제 분야가 방대하고 다양하여서 이용자가 검색 결과에서 실제로 조회한 문서를 모르는 상태에서 연구자의 판단에 근거하여 질의의 주제를 분류하기에는 한계가 있다. 이에 본 연구에서는 1년 동안 네이버 이용자들이 입력한 질의를 기록한 질의로그와 질의에 대한 검색 결과에서 이용자가 조회한 문서를 기록한 클릭 로그에 근거하여 국내 웹 검색 질의의 형태 및 주제를 분석하였다. 질의를 형태별로 분류한 결과 사이트 검색 질의가 내용 검색 질의보다 많은 것으로 나타났다. 또한 이용자들이 전반적으로 가장 많이 검색한 주제는 컴퓨터/인터넷. 엔터테인먼트, 쇼핑, 게임. 교육 순으로 나타났다. 본 연구의 결과는 인터넷 포탈 업체들의 효과적인 컨텐츠 구축 및 효율적인 검색 시스템 개발에 기여할 것으로 기대된다.

관계 데이터 모델 기반 라이프로그 관리 시스템과 그 응용 (A Lifelog Management System Based on the Relational Data Model and its Applications)

  • 송인철;이유원;김현규;김항규;함덕민;김명호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권9호
    • /
    • pp.637-648
    • /
    • 2009
  • 하드 디스크 저장 매체의 가격이 하락함에 따라 가까운 시일 안에 개인 컴퓨터에 1TB가 넘는 하드 디스크가 기본으로 장착될 것으로 예상된다. 한 사람이 한 달에 1GB의 데이터를 저장한다고 가정하면 대략 1TB면 그 사람의 일생 동안에 걸친 데이터를 저장할 수 있다. 이에 따라 개인이 일상 생활에서 보고들은 것을 기록한 라이프로그(lifelog)를 효과적으로 관리하는 라이프로그 관리에 대한 연구가 활발히 이루어지고 있다. 지금까지 관계 데이터 모델 기반, 온톨로지 기반, 파일 시스템 기반 라이프로그 관리 시스템(LMS: Lifelog Management System) 등 다양한 LMS들이 제안되었지만, 관계 데이터 모델 기반 LMS는 질의 처리 성능이 뛰어난 반면 복잡한 질의를 잘 처리하지 못하고 온톨로지 기반 LMS는 복잡한 질의를 처리할 수 있는 반면 질의 처리 성능이 떨어지며 파일 기반 LMS는 질의만 지원하는 등 저마다 장단점을 가진다. 또한 이들 시스템들은 라이프로그 그룹을 효과적으로 관리하기 위한 기능을 제공하지 못하고 있고 효과적인 검색을 위해 라이프로그의 태그(데타데이터)를 수정하거나 새로운 태그를 추가하기 위한 편리한 인터페이스를 제공하지 못하고 있다. 본 논문에서는 이러한 문제점들을 해결하기 위해 관계 데이터 모델 기반 라이프로그 관리 시스템을 제안한다. 제안하는 시스템은 라이프로그를 관계 데이터 모델로 모델링하고 사용자 질의를 SQL로 변환해 처리함으로써 질의 처리 성능이 뛰어나다. 또한 복잡한 질의를 잘 처리하지 못하는 관계 데이터 모델 기반 LMS의 단점을 보완하기 위해 찾으려는 라이프로그와 직접적으로 관련 있는 라이프로그에 대한 정보에 기반해 라이프로그를 검색하는 단순화된 관계 질의를 지원한다. 이와 더불어, 제안하는 시스템은 라이프로그 그룹 생성, 편집, 검색, 플레이 및 공유 기능을 제공함으로써 라이프로그 그룹에 대한 효과적인 관리를 지원한다. 마지막으로 제안하는 LMS에서 제공하는 라이프로그 태깅 도구는 태그 추상화를 통해 여러 종류의 태그를 손쉽게 수정하거나 추가할 수 있는 기능을 제공한다. 본 논문에서는 제안하는 시스템의 설계 및 구현을 설명하고 이 시스템을 활용한 다양한 응용을 소개한다.

지능적 이미지 검색 시스템을 위한 질의 패턴 탐사 (Mining Query Patterns for the Intelligent Image Retrieval System)

  • 이충우;나연목
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.284-286
    • /
    • 1999
  • 본 논문은 지능적 이미지 검색 시스템을 위한 질의 패턴 탐사를 제안한다. 지능적 이미지 검색 시스템은 이미지 검색시 질의 로그로부터 사용자의 검색 패턴을 탐사하여 패턴에 따라 연관된 검색을 동시에 수행함으로써 검색 효율을 높일 수 있는 시스템이다. 본 논문은 이 시스템의 질의 로그 마이닝 과정에서 필요한 질의 패턴 탐사 방법을 제안한다. 연관 규칙의 경우 단편적인 연관 관계만이 탐사되기 때문에 사용자의 질의 패턴으로 사용하기에 효과적이지 못하다. 따라서 본 논문에서는 연관 규칙을 개선하여 하나의 항목과 연관된 패턴을 표현할 수 있는 형태를 제안한다. 질의 패턴을 사용하면 사용자의 패턴을 탐사하는 응용에서 좀 더 효율적으로 사용할 수 있다.

  • PDF

CERES: 백본망 로그 기반 대화형 웹 분석 시스템 (CERES: A Log-based, Interactive Web Analytics System for Backbone Networks)

  • 서일현;정연돈
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권10호
    • /
    • pp.651-657
    • /
    • 2015
  • 웹 응용 프로그램의 급격한 증가와 함께 웹 트래픽이 증가하고 있다. 웹에 대한 요청과 그 응답에 대한 기록인 웹 로그 또한 폭발적으로 증가하고 있다. 웹 로그로부터 가치 있는 정보를 취득하기 위해서는 매우 큰 용량의 데이터를 효과적이고 다양한 방법으로 다룰 수 있는 시스템이 필요하다. 본 논문에서는 백본망 로그 기반 대화형 웹 분석 시스템인 CERES를 소개한다. 기존의 웹 분석 시스템들과 달리, CERES는 하나의 웹 서버에 대한 분석이 아닌 백본망에서 생성되는 모든 웹 로그의 분석을 목적으로 한다. CERES는 하둡 분산 파일 시스템 (HDFS)을 저장소로 하는 서버 클러스터에 배포되며, 대용량의 로그에 기반한 분석을 분산 처리를 통해 지원한다. CERES는 백본망에서 생성된 웹 로그 데이터를 관계형 데이터로 변환하고, 사용자는 변환된 관계형 데이터에 대해 SQL을 이용하여 질의를 요청할 수 있다. 내부적으로 CERES는 웹 로그의 통계적 분석에 대한 질의를 효과적으로 처리하기 위해 데이터 큐브를 활용한다. 또한, CERES는 다양한 통계적 분석을 지원하기 위해 대화형 SQL 질의 인터페이스를 포함한 세 가지 형태의 웹 인터페이스를 제공하며 사용자는 이를 통해 쉽게 질의를 요청할 수 있고 그 결과를 시각적으로 확인할 수 있다.

데이터로그 시스템들의 재귀 질의 처리 성능 평가 (Experimental Evaluation of Recursive Query Processing in Datalog Systems)

  • 이유경;김현지;홍기재;강혁규;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.729-732
    • /
    • 2019
  • 데이터로그는 논리형 선언형 프로그래밍 언어로, 특히 재귀적인(recursion) 알고리즘을 표현하기 편리한 언어이다. 대표적인 데이터로그 시스템으로는 CORAL, LogicBlox, XSB, Soufflé가 있다. 본논문에서는 이 네 가지 시스템의 특징을 설명하고, 세 가지 벤치마크, 이행적 폐쇄(Transitive closure), 동세대(same generation), 포인터 분석(pointer analysis)으로 데이터로그 시스템들의 재귀 질의(recursive query) 처리 성능을 비교하였다.

자기 학습 방법을 이용한 음성 대화 시스템의 슬롯 교정 (Self-learning Method Based Slot Correction for Spoken Dialog System)

  • 최태균;김민경;이인재;이지은;박규연;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-360
    • /
    • 2021
  • 음성 대화 시스템에서는 사용자가 잘못된 슬롯명을 말하거나 음성인식 오류가 발생해 사용자의 의도에 맞지 않는 응답을 하는 경우가 있다. 이러한 문제를 해결하고자 말뭉치나 사전 데이터를 활용한 질의 교정 방법들이 제안되지만, 이는 지속적으로 사람이 개입하여 데이터를 주입해야하는 한계가 있다. 본 논문에서는 축적된 로그 데이터를 활용하여 사람의 개입 없이 음악 재생에 필요한 슬롯을 교정하는 자기 학습(Self-learning) 기반의 모델을 제안한다. 이 모델은 사용자가 특정 음악을 재생하고자 유사한 질의를 반복하는 상황을 이용하여 비지도 학습 기반으로 학습하고 음악 재생에 실패한 슬롯을 교정한다. 그리고, 학습한 모델 결과의 정확도에 대한 불확실성을 해소하기 위해 질의 슬롯 관계 유사도 모델을 이용하여 교정 결과에 대한 검증을 하고 슬롯 교정 결과에 대한 안정성을 보장한다. 모델 학습을 위한 데이터셋은 사용자가 연속으로 질의한 세션 데이터로부터 추출하며, 음악 재생 슬롯 세션 데이터와 질의 슬롯 관계 유사도 데이터를 각각 구축하여 슬롯 교정 모델과 질의 슬롯 관계 유사도 모델을 학습한다. 교정된 슬롯을 분석한 결과 발음 정보가 유사한 슬롯 뿐만 아니라 의미적인 관계가 있는 슬롯으로도 교정하여 사전 기반 방식보다 다양한 유형의 교정이 가능한 것을 보였다. 3 개월 간 수집된 로그 데이터로 학습한 음악 재생 슬롯 교정 모델은 일주일 동안 반복한 고유 질의 기준, 음악 재생 실패의 12%를 개선하는 성능을 보였다.

  • PDF

질의로그 데이터에 기반한 특허 및 상표검색에 관한 연구 (Analysis of Korean Patent & Trademark Retrieval Query Log to Improve Retrieval and Query Reformulation Efficiency)

  • 이지연;백우진
    • 정보관리학회지
    • /
    • 제23권2호
    • /
    • pp.61-79
    • /
    • 2006
  • 본 연구는 특허 및 상표 검색 개선을 위한 방법을 제안하고자 하는 목적에서 출발하였다. 이를 위해 193일간 한국 특허정보원의 특허기술정보서비스를 이용한 17,559명의 이용자가 작성한 100,016개의 질의문에 대한 로그 데이터를 분석하였다. 개별적인 질의로그 분석 이외에, 2,202개의 복수 질의문을 이용한 탐색세션을 분석함으로써 검색 개선을 위한 추가적인 단서를 발견하였다. 분석결과에 의하면, 특허 및 상표검색은 일반적인 웹 검색의 유형과 유사한데, 특히 질의문의 길이가 짧다는 측면에서 매우 흡사하다. 그러나 특히 및 상표검색의 경우, 일반 웹 검색보다 불리언 연산자를 많이 사용하고 있었다. 복수 질의문 분석을 통해 이용자들이 질의문을 재작성하는데 도움이 될 수 있는 탐색기능을 제안할 수 있었다. 복수의 질의문으로 구성된 탐색세션을 분석한 결과, 이용자들은 질의문을 재작성하기 위하여 부연하기, 특정화하기, 일반화하기, 교체하기, 중단하기와 같은 방법을 사용하고 있음을 알 수 있었다.