• 제목/요약/키워드: web search engine

검색결과 249건 처리시간 0.024초

링크내역을 이용한 페이지점수법 알고리즘 (PageRank Algorithm Using Link Context)

  • 이우기;신광섭;강석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.708-714
    • /
    • 2006
  • 웹은 정보의 저장 및 검색에 있어서 보편적인 매체가 되고 있다. 웹에서 정보 검색은 검색엔진을 출발점으로 이용하는 것이 대부분이지만, 그 결과는 사용자의 요구와 늘 일치하는 것은 아니며 때로는 의도적으로 조작된 검색 결과가 제시되기도 한다. 검색엔진의 데이타를 의도적으로 조작하는 것을 스패밍(spamming)이라고 부르며, 다양한 스패밍과 방지기술이 있지만, 최근에 각광을 받고있는 링크기반 검색 방식에는 스패밍이 쉽지 않은 것으로 알려져 있다. 그러나 이러한 방식에서도 구글폭탄(Google Bombing)과 같이 페이지점수법(PageRank)을 조작할 수 있는 약점이 있다. 본 논문에서는 이러한 약점을 방지할 수 있는 알고리즘을 제시한다. 기본적으로 링크 기반 검색 방식을 기초로 하여 웹을 하나의 유향 레이블 그래프로 인식하여 각 웹 페이지들은 하나의 노드로, 하이퍼링크는 에지로 표현함에 있어서 본 연구에서는 링크구조를 기반으로 링크내역(link context)을 부여하고 이를 에지의 레이블로 사용한다. 링크내역과 대상 페이지 사이의 유사도를 구하고, 이것을 이용하여 페이지점수법의 인접행렬을 재구성하는 방법을 취했다. 결과로써 기존의 방법 및 특이값 추출기법(SVD)에 기반한 새로운 기준을 도입해 그 효과를 입증했다.

소아를 주요 대상으로 하는 한의원 웹사이트의 분석 및 고찰 (Analysis of Oriental Pediatrics Clinic Web Sites in Korea)

  • 김장현;서영민
    • 대한한방소아과학회지
    • /
    • 제20권2호
    • /
    • pp.45-57
    • /
    • 2006
  • Objectives : The Internet is closely related to the live of modern people in the 21st Century. With increasing interest in health and disease of children, the public has access to a growing supply of information on oriental pediatrics clinic through Internet. The purpose of this study is to collect and analyze the Internet web sites concerning oriental pediatrics clinic in Korea, and study the effectiveness of internet toward oriental pediatrics. Methods : We selected 42 web sites by searching for such keyword as child and oriental Medical clinic at korea major web search engine. The sites were evaluated and analyzed on the basis of 24 is under three evaluation criteria such as quality of contents, the easy of use, reliability of web sites. Results: Study results indicated that 34% of web sites were built in 2004, 58% of oriental pediatrics clinic was located in Seoul & Kyunggi and 84% of them was connected network medical system. About health information was supplied in oriental pediatrics clinic web sites, the growth was high frequent information, 50% of web sites supplied high quality information and 19% of them was supplied high diversity information. Conclusions: It is necessary to control system as information certification system in the area of oriental pediatrics clinic web sites.

  • PDF

웹 2.0 기반의 도서관 정보서비스 (Library Information Service on the Web 2.0)

  • 양병훈
    • 정보관리연구
    • /
    • 제39권1호
    • /
    • pp.199-220
    • /
    • 2008
  • 최근 도서관 홈페이지를 통한 정보탐색행위가 다른 사이트들에 비해 낮은 편이다. 이를 해결하기 도서관에서는 웹 2.0 기반으로 도서관 홈페이지를 개선하고 있는 중이다. 본 연구는 웹 2.0의 대표적인 웹사이트와 웹 2.0 트랜드를 도입하고 있는 국내외 도서관 홈페이지를 분석하여 새로운 도서관 서비스를 방안을 찾아보고자 하였다. 그 결과 AJAX, RSS, Open API, MashUp, Wikis, 블로그와 같은 기술들을 도서관 홈페이지 적용하면, 도서관 홈페이지가 이용자 중심으로 변화할 수 있다는 사실이 다. 그러나 정보를 전달하는 도구나 서비스가 새롭게 개발하는 것도 중요하지만, 더 중요한 것은 이용자들에게 전달할 정보를 생산하는 일이다. 즉 새로운 정보전달도구를 통하여 이용자들이 도서관 정보를 활용할 수 있도록 안내하는 정보를 생산하여 이용자들의 정보욕구를 촉진하는 일을 병행하는 일이 보다 더 쉬워졌다. 이것은 나아가 도서관으로 하여금 정보생산자로서 그 역할을 확대하는 계기가 될 것이다.

기업 대 기업간(B to B) 섬유거래 웹사이트 분석 (The Analysis of Web Sites of Textile Exchange of B to B)

  • 홍병숙;이은진;이지연
    • 한국의류학회지
    • /
    • 제27권1호
    • /
    • pp.123-133
    • /
    • 2003
  • The specific objectives of the study were as follows: 1) To investigate the composition system (design, usability and interactivity) of web sites of textile exchange of B to B 2) To examine and valuate contents and marketing (announcement, satisfaction and variety of contents) of web sites of textile exchange of B to B. The data were collected from search engine, portal sites of evaluation, direct contact, interview over the phone with web master of concerned web sites and the result of analytical valuation of web sites. The results of this study were as fellows: 1) The Dongsung trading intended to mainly use their homepage as a inside communication place by intranet network. The Daechang trading was mainly using their homepage as a tool of expansion of their outside export market. The etextiler was selling their web solutions through homepage. The texcom was offering the web place and useful informations to trading companies in Asia. 2) The texcom consisted text with little image to speed up for loading and navigation for usability of users. The Dongsung trading made intranet network for communication and exchange of informations of company inside. The etextiler offered a booking menu to inquiry in homepage. The Daechang trading tried to give good impression from the introduction page at homepage.

의사연관 피드백과 퍼지 연관을 이용한 개인화 문서 스니핏 추출 방법 (Personalized Document Snippet Extraction Method using Fuzzy Association and Pseudo Relevance Feedback)

  • 박선;조광문;양후열;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.137-142
    • /
    • 2012
  • 스니핏(snippet)이란 검색엔진이 사용자에게 제공하는 웹 페이지를 대표할 수 있는 요약된 정보이다. 스니핏은 검색엔진의 페이지 순위와 함께 사용자의 페이지 방문에 큰 영향을 준다. 스니핏을 이용시 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 스니핏을 추출하는 방법이 사용자의 의도를 정확히 이해하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 의사연관 피드백과 퍼지 연관을 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 연관을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비하여서 스니핏 추출에 더 좋은 성능을 보인다.

안드로이드 기반 모바일 Booky 컨텐츠 (Android Based Mobile Booky Contents)

  • 오범교;강태환;안병구
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.53-59
    • /
    • 2010
  • 안드로이드는 구글(Google)과 오픈 핸드셋 얼라이언스(Open Handset Alliance)가 만들어낸 모바일폰용 오픈소스 소프트웨어 툴킷(toolkit)이다. 안드로이드는 몇 년 내로 수백만 개의 핸드폰 및 그 밖의 모바일 장치에 사용될 것이며, 응용프로그램 개발자들의 주요 플랫폼이 될 것이다. 본 논문에서는 구글의 안드로이드 플랫폼을 기반으로 하여 웹뷰(Webview)의 장점과 구글의 검색기능을 활용하여 새로운 애플리케이션 컨텐츠 Booky를 개발한다. 개발된 Booky 컨텐츠의 특징은 다음과 같다. 첫째, 모바일 기반의 웹 브라우저로서 일반적인 웹브라우저보다 향상된 화면 해상도 기능과 데이터 전송량을 줄여서 보다 빠른 화면(View) 기능을 가지고 있다. 둘째, 효과적인 E-book 검색(Search) 및 리딩 기능을 가지고 있다. 성능평가는 AVD(Android Virture Device)를 사용하여 시뮬레이션하였다.

Pre-Processing of Query Logs in Web Usage Mining

  • Abdullah, Norhaiza Ya;Husin, Husna Sarirah;Ramadhani, Herny;Nadarajan, Shanmuga Vivekanada
    • Industrial Engineering and Management Systems
    • /
    • 제11권1호
    • /
    • pp.82-86
    • /
    • 2012
  • In For the past few years, query log data has been collected to find user's behavior in using the site. Many researches have studied on the usage of query logs to extract user's preference, recommend personalization, improve caching and pre-fetching of Web objects, build better adaptive user interfaces, and also to improve Web search for a search engine application. A query log contain data such as the client's IP address, time and date of request, the resources or page requested, status of request HTTP method used and the type of browser and operating system. A query log can offer valuable insight into web site usage. A proper compilation and interpretation of query log can provide a baseline of statistics that indicate the usage levels of website and can be used as tool to assist decision making in management activities. In this paper we want to discuss on the tasks performed of query logs in pre-processing of web usage mining. We will use query logs from an online newspaper company. The query logs will undergo pre-processing stage, in which the clickstream data is cleaned and partitioned into a set of user interactions which will represent the activities of each user during their visits to the site. The query logs will undergo essential task in pre-processing which are data cleaning and user identification.

WWW 탐색도구의 색인 및 탐색 기능 평가에 관한 연구 (A Comparative Study of WWW Search Engine Performance)

  • 정영미;김성은
    • 한국문헌정보학회지
    • /
    • 제31권1호
    • /
    • pp.153-184
    • /
    • 1997
  • WWW 탐색도구들은 인터넷 정보자원의 탐색에 있어서 매우 중요한 역할을 하고 있다. 본 연구에서는 주요한 WWW 탐색도구들의 성능을 평가할 목적으로 먼저 각 탐색도구의 색인 데이터베이스 특성, 탐색 기능, 적합성 순위 부여 방법 등을 비교한 후, 탐색실험을 통하여 검색효율, 중복탐색의 정도, 탐색결과의 유사도 등을 측정하였다. 탐색실험 결과 탐색질문의 유형에 관계없이 Alta Vista, HotBot, Open Text Index가 비교적 좋은 검색효율을 보였으며, 대부분의 탐색도구가 질문의 유형에 따라 검색효율에 있어서 차이를 보였다. 동일한 사이트를 중복하여 탐색하는 탐색의 중복도는 Magellan, WebCrawler, Yahoo!를 제외한 나머지 탐색도구들에서 모두 높게 나타났다. 탐색결과의 유사도를 측정한 견과 대부분의 탐색도구들이 매우 낮은 유사도를 보였다.

  • PDF

Development of Mobile Social Network Game by using Web Service

  • An, Syoungog;Kang, ManJe;Kim, Soo Kyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권10호
    • /
    • pp.81-86
    • /
    • 2018
  • In the field of mobile games, social network games are steadily increasing in market scale and public interest every year. This paper proposes a method to design a social network game, which is one of the most successful genres in mobile games. The method uses Unity3D, the most commonly used engine for mobile game development. NGUI, a versatile developmental tool of Unity3D, is used to create shops and battle UIs. This paper particularly focuses on how to use the web hosting service to search and operate the necessary data from the database in the server. In addition, the proposed social network game is easy to implement real-time battle using Animator and Raycast, and is characterized by efficient battle implementation through time delay using Coroutine function.

이미지 검색 과정에 나타난 질의 전환 및 재구성 패턴에 관한 연구 (Examining Categorical Transition and Query Reformulation Patterns in Image Search Process)

  • 정은경;윤정원
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.37-60
    • /
    • 2010
  • 이 연구는 이미지 특성 범주와 관련하여 질의 재구성 패턴을 탐색하고자 하였다. 이러한 연구 목적을 수행하기 위해서 Excite 웹검색 엔진 로그 데이터가 사용되었으며, 총 592 세션과 2,445 질의어가 분석되었다. 데이터 분석은 Batley의 정보 형태 구분과 선행 연구에서 밝혀진 팻싯과 서브팻싯을 활용하여 수행되었다. 분석결과는 두가지 형태로 구분하여 제시되었다. 첫째, 질의 재구성에 관한 분석결과이다. 질의 분석 결과, 가장 많은 부분을 차지하는 범주는 특정어(specific)와 지칭어(nameable)이며, 이러한 경향은 다양한 정보 탐색 단계에서도 지속적으로 나타났다. 둘째, 질의 재구성 패턴과 관려하여, 평행이동이 가장 많이 나타났으며, 이러한 경향은 최초 혹은 직전 질의 범주에 따라 근소한 차이를 보였다. 범주 전환 분석에서는 높은 비율(60%-80%)로 검색 질의의 범주가 지속적으로 동일한 범주에 머무르는 경향을 밝혀내었다. 이러한 결과는 이미지 검색 시스템 설계와 구현에 있어서, 이용자의 질의 선정 과정에 도움을 제공하고 효과적인 시소러스 구축 등에 활용될 수 있을 것으로 기대된다.