• 제목/요약/키워드: Search Logs

검색결과 51건 처리시간 0.027초

온라인 열람목록의 주제탐색 강화를 위한 실험적 연구 (An experiment to enhance subject access in korean online public access catalog)

  • 장혜란;홍지윤
    • 한국도서관정보학회지
    • /
    • 제25권
    • /
    • pp.83-107
    • /
    • 1996
  • The purpose of this study is to experiment online public access catalog enhancements to improve its subject access capability. Three catalog databases, enhanced with title keywords, controlled vocabulary, and content words with controlled vocabulary respectively, were implemented. 18 searchers performed 2 subject searshes against 3 different catalog databases. And the transaction logs are analyzed. The results of the study can be summarized as follows : Controlled vocabulary catalog database achieved 41.8% recall ratio in average ; the addition of table of contents words to the controlled vocabulary is an effective technique with increasing recall ration upto 55% without decreasing precision ; and the database enhanced with title keywords shows 31.7% recall ratio in average. Of the three kinds of catalog databases, only the catalog with contents words produced 2 unique relevant documents. The results indicate that both user training and system development is required to have better search performance in online public access catalog.

  • PDF

Vocabulary Expansion Technique for Advertisement Classification

  • Jung, Jin-Yong;Lee, Jung-Hyun;Ha, Jong-Woo;Lee, Sang-Keun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권5호
    • /
    • pp.1373-1387
    • /
    • 2012
  • Contextual advertising is an important revenue source for major service providers on the Web. Ads classification is one of main tasks in contextual advertising, and it is used to retrieve semantically relevant ads with respect to the content of web pages. However, it is difficult for traditional text classification methods to achieve satisfactory performance in ads classification due to scarce term features in ads. In this paper, we propose a novel ads classification method that handles the lack of term features for classifying ads with short text. The proposed method utilizes a vocabulary expansion technique using semantic associations among terms learned from large-scale search query logs. The evaluation results show that our methodology achieves 4.0% ~ 9.7% improvements in terms of the hierarchical f-measure over the baseline classifiers without vocabulary expansion.

A HAZARDOUS AREA IDENTIFICATION MODEL USING AUTOMATED DATA COLLECTION (ADC) BASED ON BUILDING INFORMATION MODELLING (BIM)

  • Hyunsoo Kim;Hyun-Soo Lee;Moonseo Park;Sungjoo Hwang
    • 국제학술발표논문집
    • /
    • The 4th International Conference on Construction Engineering and Project Management Organized by the University of New South Wales
    • /
    • pp.17-22
    • /
    • 2011
  • A considerable number of construction disasters occur on pathways. Safety management is usually performed on construction sites to prevent accidents in activity areas. This means that the safety management level of hazards on pathways is relatively minimized. Many researchers have noted that hazard identification is fundamental to safety management. Thus, algorithms for helping safety managers to identify hazardous areas are developed using automated data collection technology. These algorithms primarily search for potential hazardous areas by comparing workers' location logs based on a real-time location system and optimal routes based on BIM. Potential hazardous areas are filtered by identified hazardous areas and activity areas. After that, safety managers are provided with information about potential hazardous areas and can establish proper safety countermeasures. This can help to improve safety on construction sites.

  • PDF

MITRE ATT&CK 및 Anomaly Detection 기반 이상 공격징후 탐지기술 연구 (MITRE ATT&CK and Anomaly detection based abnormal attack detection technology research)

  • 황찬웅;배성호;이태진
    • 융합보안논문지
    • /
    • 제21권3호
    • /
    • pp.13-23
    • /
    • 2021
  • 공격자의 무기가 점차 지능화 및 고도화되고 있어 기존 백신만으로는 보안 사고를 막을 수 없으므로 endpoint까지 보안 위협이 검토되고 있다. 최근 endpoint를 보호하기 위한 EDR 보안 솔루션이 등장했지만, 가시성에 중점을 두고 있으며, 이에 대한 탐지 및 대응 기술은 부족하다. 본 논문에서는 보안 관리자 관점에서 효과적인 분석과 분석 대상을 선별하기 위해 실 환경 EDR 이벤트 로그를 사용하여 지식 기반 MITRE ATT&CK 및 AutoEncoder 기반 Anomaly Detection 기술을 종합적으로 사용하여 이상 공격징후를 탐지한다. 이후, 탐지된 이상 공격징후는 보안 관리자에게 로그정보와 함께 alarm을 보여주며, 레거시 시스템과의 연계가 가능하다. 실험은 5일에 대한 EDR 이벤트 로그를 하루 단위로 탐지했으며, Hybrid Analysis 검색을 통해 이를 검증한다. 따라서, EDR 이벤트 로그 기반 언제, 어떤 IP에서, 어떤 프로세스가 얼마나 의심스러운지에 대한 결과를 산출하며, 산출된 의심 IP/Process에 대한 조치를 통해 안전한 endpoint 환경을 조성할 것으로 기대한다.

한의학 표준용어집 서비스와 향후 발전 방향 (A Service of Korean Medical Standard Terminology and Directions for Future Development)

  • 서진순;김상균;김안나;장현철
    • 한국콘텐츠학회논문지
    • /
    • 제15권11호
    • /
    • pp.571-581
    • /
    • 2015
  • 한의학 분야에서는 오랜 기간 동안 한의학 용어가 혼재되어 사용되어 왔다. 대한한의학회에서는 우리나라에서 사용되고 있는 한의학 용어를 체계적으로 정리하고 표준화하여 표준한의학용어집을 발간하였다. 본 연구에서는 표준한의학용어집의 콘텐츠를 바탕으로 표준한의학용어집 온라인 서비스를 구축하였다. 표준한의학용어집 온라인 서비스는 표준 한의학 용어와 해설을 찾아보고 용어의 해설에 대한 의견을 모아서 반영할 수 있는 시스템이다. 표준용어와 시맨틱 검색 결과와 네이버 지식백과 검색 결과를 한 화면에서 볼 수 있어 한의학 표준용어를 다양하게 비교하고 참조할 수 있도록 하였다. 또한 로그를 분석하여 검색기능 개선, 홍보 활용, Open API 제공 등 향후 발전 방향을 제시하였다. 로그를 통해 일관된 방문자와 수요가 존재함을 알 수 있었으며, 올해 6월을 기점으로 검색 건수가 점점 상승하고 있는 것을 알 수 있었다. 향후 표준화된 한의학 용어는 국내 학술연구, 한의 임상은 물론 한의학 국제 표준화에도 중요한 근거가 될 것으로 기대된다.

라이프로그 관리 시스템에서 블루투스 장치를 이용한 효과적인 사진 검색 방법 (Effective Picture Search in Lifelog Management Systems using Bluetooth Devices)

  • 정은호;이기용;김명호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.383-391
    • /
    • 2010
  • 라이프로그 관리 시스템이란 개인의 일상 생활에 관련된 모든 정보를 저장하고, 이에 대한 관리 및 검색 기능을 제공하는 시스템이다. 본 논문은 라이프로그를 검색하는 방법 중, 현실 세상에서 발생한 사용자와 다른 사람들과의 사회적 접촉에 대한 정보를 키워드로 하여 관련된 라이프로그를 검색할 수 있도록 하는 방법을 제안한다. 이를 위하여 휴대폰의 근거리 무선 통신 장치를 이용하여 현실 세상에서 발생한 사용자의 사회적 접촉 정보를 자동으로 수집하는 방법과, 수집된 사회적 접촉 정보를 이용하여 주어진 인물과 관계된 사진을 검색할 수 있도록 하는 방법을 제안한다. 블루투스 장치와 인물의 관계를 추론하기 위하여 인물 정보가 기록된 기존 라이프로그를 이용, 인물과 블루투스 장치가 동시에 관찰되는 빈도수를 계산하여 사람-블루투스 매트릭스를 만든다. 실험 결과, 실제 사용자의 오프라인 만남 정보 중에서, 빈도수 계산 시각에 발생한 모든 오프라인 만남 정보의 20%의 정보만으로도 블루투스 장치와 그 소유주의 관계를 90% 이상의 정확도로 알아 낼 수 있었다. 또한 매트릭스에서 인물에 해당하는 벡터와 라이프로그가 생성된 시점에 스캔된 블루투스 장치들을 벡터 정보 검색 방법으로 비교하여 주어진 인물과 관련된 라이프로그를 검색함으로써, 제안하는 검색 방법은 기존의 검색 방법에 비하여 더 많은 사진을 반환할 뿐만 아니라 기존에는 불가능했던 검색어와의 유사도에 따른 정렬을 가능하게 한다.

다양한 기기로부터의 데이터 단일 표현을 통한 개인 미멕스 시스템 (A Personal Memex System Using Uniform Representation of the Data from Various Devices)

  • 민영근;이복주
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.309-318
    • /
    • 2009
  • 한 개인이 일상 생활을 하면서 겪는 사건을 자동으로 기록하고 탐색하는 시스템은 비교적 최근에 활발히 연구되고 있는 분야이다. 개인 미멕스(personal memex) 또는 라이프로그(life log)라 불리는 이러한 시스템은 MyLifeBits 프로젝트의 센스캠(SenseCam)처럼 보통 이를 위한 전용 디지털 기기를 수반한다. 본 연구에서는 개인의 일상 생활을 담는 매체로서 이러한 현대인이 일상적으로 사용하는 휴대폰, 신용카드, 디지털 카메라 등의 매체를 주목하였다. 이러한 매체에 직접 기록되는 일상 생활 또는 이러한 매체를 통해 상용 서비스를 제공하는 업체의 사이트 (예를 들면 휴대폰 회사 통화 기록)에 기록되는 일상 생활을 전송받아 체계적으로 저장하고 추후 빠르게 참조할 수 있도록 하였다. MyMemex라 불리는 본 시스템의 데이터 수집 에이전트는 이러한 싸이트에서 제공하는 웹 서비스를 이용하여 개인의 라이프로그 '웹 데이터'를 수집하여 서버에 저장한다. 또한 디지털 기기에 저장되는 '파일 데이터'를 로드하여 서버에 저장한다. 본 연구에서는 이러한 웹 데이터 또는 파일 데이터를 4W1H로 기술되는 하나의 미멕스 사건으로 보아 각 서비스마다 다른 형태를 가지는 데이터를 4 W1H 미멕스 사건 데이터로 변환한다. 이러한 변환에는 미멕스 사건 온톨로지를 사용한다. 웹 기반으로 제공되는 본 시스템에서 사용자는 자신의 일상 기록을 시간 순으로 볼 수 있고 특정 키워드를 이용하여 검색할 수 있다. 또한 미멕스 사건들이 문장으로 변환되어 일기 또는 이야기 형식으로 전개될 수 있다. 관련된 일련의 미멕스 사건들은 '에피소드'로 자동으로 군집화되어 보여진다. 저자 중 한명의 실제 라이프로그 데이터를 사용하여 에피소드 군집화를 실험한 결과 높은 정확도를 보였다.

인터넷 검색기록 분석을 통한 쇼핑의도 포함 키워드 자동 추출 기법 (A Methodology for Extracting Shopping-Related Keywords by Analyzing Internet Navigation Patterns)

  • 김민규;김남규;정인환
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.123-136
    • /
    • 2014
  • 최근 온라인 및 다양한 스마트 기기의 사용이 확산됨에 따라 온라인을 통한 쇼핑구매가 더욱 활성화 되었다. 때문에 인터넷 쇼핑몰들은 쇼핑에 관심이 있는 잠재 고객들에게 한 번이라도 더 자사의 링크를 노출시키기 위해 키워드에 비용을 지불할 용의가 있으며, 이러한 추세는 검색 광고 시장의 광고비를 증가시키는 원인을 제공하였다. 이 때 키워드의 가치는 대체로 검색어의 빈도수에 기반을 두어 산정된다. 하지만 포털 사이트에서 검색어로 자주 입력되는 모든 단어가 쇼핑과 관련이 있는 것은 아니며, 이들 키워드 중에는 빈도수는 높지만 쇼핑몰 관점에서는 별로 수익과 관련이 없는 키워드도 다수 존재한다. 그렇기 때문에 특정 키워드가 사용자들에게 많이 노출된다고 해서, 이를 통해 구매가 이루어질 것을 기대하여 해당 키워드에 많은 광고비를 지급하는 것은 매우 비효율적인 방식이다. 따라서 포털 사이트의 빈발 검색어 중 쇼핑몰 관점에서 중요한 키워드를 추출하는 작업이 별도로 요구되며, 이 과정을 빠르고 효과적으로 수행하기 위한 자동화 방법론에 대한 수요가 증가하고 있다. 본 연구에서는 이러한 수요에 부응하기 위해 포털 사이트에 입력된 키워드 중 쇼핑의도를 포함하고 있을 가능성이 높을 것으로 추정되는 키워드만을 자동으로 추출하는 방안을 제시하고, 구체적으로는 전체 검색어 중 검색결과 페이지에서 쇼핑과 관련 된 페이지로 이동한 검색어만을 추출하여 순위를 집계하고, 이 순위를 전체 검색 키워드의 순위와 비교하였다. 국내 최대의 검색 포털인 'N'사에서 이루어진 검색 약 390만 건에 대한 실험결과, 제안 방법론에 의해 추천된 쇼핑의도 포함 키워드가 단순 빈도수 기반의 키워드에 비해 정확도, 재현율, F-Score의 모든 측면에서 상대적으로 우수한 성능을 보이는 것으로 나타남을 확인할 수 있었다.

오픈소스를 이용한 윈도우 기반 PC 로그 수집 시스템 (Windows based PC Log Collection System using Open Source)

  • 송중호;김학민;윤진
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.332-337
    • /
    • 2016
  • 각 조직의 시스템관리자 또는 보안 관리자는 보안 침해사고가 발생한 경우 사고의 원인 분석과 이를 통해 감염 및 피해를 입은 시스템 분석을 위해서 조직 및 기관에서 사용되고 있는 컴퓨팅 기기의 로그 정보를 지속적으로 수집하여야 하여야 한다. 그리고 수집된 로그는 취약성이 있는 기기를 식별하여 보안사고 예방 활동에도 활용 할 수 있다. 또한, 최근 많이 발생하고 있는 내부자를 통한 정보 유출을 사전에 예방하는 데에도 활용 할 수 있다. 이에 본 논문에서는 윈도우 시스템이 기본으로 제공하는 기능과 명령어를 사용 할 수 있는 오픈소스를 이용하여 로그 정보를 수집 시스템을 개발 하였다. 그리고 수집된 로그 정보를 다양한 관점에서 조회 및 분석이 가능 하도록 오픈소스 기반의 검색엔진 시스템과 연동할 수 있는 방안을 제시하고자 한다.

기업간통합 XML 메시지의 기록과 색인을 위한 저장 방식 (A Storage Scheme for Logging and Indexing B2Bi XML Messages)

  • 송하주;김창수;권오흠
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권5호
    • /
    • pp.416-426
    • /
    • 2005
  • 기업간통합(business-to-business integration; B2Bi) 시스템은 XML 메시지의 송수신 내역을 고속으로 기록하고 검색할 수 있는 메시지 저장시스템이 필요하다 XML 전용데이타베이스 시스템 또는 XML 데이타타입을 지원하는 관계형데이타베이스는 도입 비용과 기능의 과도함 때문에 메시지 저장시스템으로는 적합하지 않다. XML 데이타를 관계형데이타베이스의 레코드로 분산시켜 저장하는 저장 방식 또한 수행 성능이 떨어지거나 구현이 복잡하므로 사용하기 어렵다. 이에 본 논문은 관계형데이타베이스를 사용하여 메시지 저장시스템을 구현하기 위한 단순한 구조의 메시지 저장 방식을 제안한다. 제안하는 저장방식은 메시지 타입별로 색인필드를 등록하고 색인필드를 통해서만 메시지를 검색한다. 따라서 XQL과 같은 강력한 검색 기능은 지원하지 못하나 비교적 단순한 저장 구조만으로도 고속의 메시지 기록과 제한된 형태의 메시지 검색이 가능하다 제안하는 저장방식을 구현하기 위해서는 세 가지의 데이타베이스 스키마를 사용할 수 있으며 실험 평가를 통해 이들 세 가지의 스키마가 가지는 성능상의 장단점을 평가한다.