• 제목/요약/키워드: 웹 검색 엔진

검색결과 366건 처리시간 0.022초

데이타마이닝을 이용한 전문 검색엔진의 설계 및 구현 (A Design and Implementation of Expert Search Engine Using DataMining)

  • 황보윤;김병찬;김영지;문현정;우용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.43-46
    • /
    • 2001
  • 본 논문에서는 데이타마이닝 기법을 이용하여 지능형 전문 검색엔진을 설계하고 사용자 인터페이스를 구현하였다. 먼저, 컴퓨터 분야의 전문 용어에 대하여 연관 규칙 탐사 알고리즘을 이용하여 의미적으로 연관된 용어들끼리 클러스터로 구성하였다. 전문 용어별로 구성된 클러스터는 본 논문에서 제안한 지식베이스 테이블에 저장하여 의미적으로 연관된 용어를 포함하는 웹 문서를 검색하는 과정에서 이용하였다. 검색과정에서는 사용자가 제시한 키워드와 관련된 전문 용어들간의 연관정도를 가중치로 부여하여 연관 정도가 높은 웹 문서순으로 출력하였다. 제안된 방법을 통하여 사용자가 제시한 키워드와 의미적으로 연관된 웹 문서를 효과적으로 검색할 수 있었다.

  • PDF

의학 분야 웹 자료의 분류에 대한 개선 방안 연구 (A Study on the Organizing Web Materials in the Field of Medicine)

  • 정경희
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.89-106
    • /
    • 2004
  • 웹 상의 의학 분야 자료들은 방대한 규모로 존재하며, 각 검색엔진에서는 이를 분류하여 제공하고 있으나 그 구성에 있어서 일관성과 체계성이 부족하다. 따라서 본 논문은 검색엔진에서 의학 분야 웹 자료 분류체계를 구성하기 위하여 의학 전문 문헌분류표인 NLMC를 준용하고, 항목의 배열이 주제간 관련성을 기반으로 이루어져야 한다는 것을 제안하였다. 또한 순환성을 고려한 1차 분류 및 2차 분류 항목에서의 중복 분류시, 그에 대한 명확한 기준이 설정되어야 하며, 분류 항목명을 의학 분야 표준 용어집인 MeSH와 $\boxDr$의학용어집$\boxUl$의 용어로 선택하여 기존의 도서관 정보검색시스템과의 상호호환성을 높여야 한다는 것을 제안하였다.

자연어의 논리식으로의 변환을 이용한 고급검색 및 이를 활용한 히스토리 검색 (An Advanced Search that Converts Natural Language into the Logic Advanced Search and with Developed History Search Method)

  • 이대홍;유한석;박상원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권6호
    • /
    • pp.195-204
    • /
    • 2020
  • 현재 웹에서 존재하는 웹페이지는 16억개 이상이며 이중에서 원하는 검색결과를 얻기란 쉽지 않은 일이다. 대부분의 검색엔진에서는 정밀한 검색결과를 제공하기 위하여 논리식의 형태로 검색할 수 있게 하고 있다. 하지만 일반적인 경우 사람들은 원하는 정보를 논리식 형태로 검색하는데 익숙하지 않다. 때문에 복잡한 논리식 형태로 검색하기 보다는 자연어로 검색한다. 따라서 본 논문에서는 사용자가 입력하는 자연어 질의를 검색엔진의 고급검색을 사용할 수 있는 논리식으로 변환하여 검색결과의 품질을 향상시켜주는 검색방법을 제안한다. 또한 사용자들은 검색형태의 특징 중 하나인 단순성에 의해 길게 검색하기 보다는 여러 번의 짧은 검색을 이용하는 경우가 훨씬 많다. 이에 따라 사용자들에게 편리성을 제공하기 위하여 앞에서 제안한 검색방법을 활용한 히스토리 검색방법을 제안한다. 본 논문의 검색방법들을 사용한 결과 자연어 상태의 검색결과보다 논리식으로 변환한 검색결과의 정확도가 개선되었고 누락되는 키워드 없이 사용자가 검색하고자하는 모든 키워드를 반영할 수 있다. 이러한 검색방법이 검색엔진의 발전에 기여할 것으로 기대한다.

웹 검색 환경에서 범주의 동적인 분류 (Dynamic Classification of Categories in Web Search Environment)

  • 최범기;이주홍;박선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권7호
    • /
    • pp.646-654
    • /
    • 2006
  • 분류검색 방법은 색인검색 방법과 함께 중요한 요소로서 웹 검색 엔진에서 지원되고 있다. 사용자가 분류나 색인검색 방법 중 하나를 이용하여 원하는 검색결과를 찾지 못하면 다른 검색방법을 이용하여 찾을 수 있도록 대부분의 검색엔진에서는 두 가지 방법 모두 지원하고 있다. 색인검색 방법에서는 검색결과의 재현율이 높지만 검색결과가 너무 많이 나오기 때문에 원하는 검색결과를 찾아내는 것이 어렵다는 단점이 있다. 분류검색 방법은 찾고자 하는 문서의 해당 분류가 애매모호하거나 명확하게 알지 못할 때에는 문서를 찾지 못하는 경우가 빈번히 발생한다. 즉, 검색결과의 정확도는 높으나 재현율이 떨어지는 단점이 있다. 본 논문은 이러한 문제점을 해결하기 위해서 분류와 검색어간의 관계를 퍼지논리를 이용하여 정량적으로 계산하고 이를 바탕으로 범주간의 함의관계를 유도함으로써 동적인 범주체계를 구성하는 새로운 방법을 제시한다. 이 방법의 장점은 범주간의 합의관계를 유사한 하위범주로 간주함으로써 분류검색 결과의 재현율을 높일 수 있다는 것이다.

웹기반 한글정보검색시스템의 구현 (An Implementation of Web-Based Korean Language Information Retrieval System)

  • 홍기채;정현수
    • 전자통신동향분석
    • /
    • 제14권6호통권60호
    • /
    • pp.9-21
    • /
    • 1999
  • 최근 인터넷상에는 매일 방대한 양의 정보가 창출되어 유포되고 있으며, 수많은 정보 제공 사이트들이 늘고 있다. 이용자들은 필요한 정보를 찾고 활용하기 위해 야후(Yahoo), 알타비스타(AltaVista) 등 국외 검색엔진(search engine)들과 심마니, 미스 다찾니 등 국내 검색엔진 등 인터넷상에 운용되고 있는 이들 시스템들을 이용하고 있지만, 대부분의 시스템들은 자체 정보 제공보다는 로봇 에이전트를 이용하여 인터넷 사이트에 등록되어 있는 다양한 분야의 홈페이지 정보들을 수집/분석하여 관련 사이트를 연결해주는 방식의 메타 검색엔진들로서 불필요한 정보들까지 제공함에 따라 이용자들이 필요로 하는 정보를 찾기에는 너무 많은 노력과 시간을 소모하게 되는 문제점을 안고 있다. 이에 본 고에서는 형태소 분석 및 시소러스 사전을 이용하여 검색의 정확성 및 재현율 향상을 고려하고, 주제어 중심의 불리언 검색뿐만 아니라 하이퍼텍스트 기반의 주제어 카탈로그 검색, 각기 다른 사이트의 검색엔진들로부터 질의한 결과를 통합하여 제공하는 지능형 통합검색, 이용자 프로파일에 근거하여 최신 업데이트된 정보를 주기적으로 제공해주는 맞춤정보서비스(Selective Dissemination of Information Service: SDI) 등을 통합한 인터넷 기반의 한글 정보검색시스템의 구현에 대한 내용을 기술하고자 한다.

사용자에 따라 검색 결과의 순위를 적용하는 DQL 검색 시스템 (DQL Search System That Apply Ranking Of Search Result)

  • 김제민;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.589.1-591
    • /
    • 2004
  • 현재 웹 서비스에서 사용하고 있는 키워드 기반 검색은 syntactic한 정보만을 제공한다. 웹 서비스의 이러한 단점을 보안하고자 시멘틱 웹 기술이 제안되고 있다. DQL 검색 시스템은 검색 결과의 질을 향상시키기 위해서 시멘틱 웹 기반의 검색 시스템 중지 하나다. 시멘틱 검색은 입력된 질의들을 통해서 사용자가 원하는 정보와 의미가 일치하는 결과를 얻어내는 것이다. 본 논문은 시스템을 이용하는 각 사용자에 따라 검색되는 결과들에 우선순위를 적용하는 DQL 검색 시스템을 제안하고 다음 3가지 부분에 중점을 두어 시스템을 설계하였다. 첫째, 각 사용자들의 성향을 검색 결과에 반영하기 위해 개인화 프로파일과 온톨로지를 생성하는 개인화 온톨로지 생성기를 설계한다. 둘째. 검색 정확도틀 논이기 위해 검색 대상에 되는 정보들의 숙성과 관계를 추론해주는 검색 엔진을 설계한다. 마지막으로 DQL 검색 시스템의 사용 효율성을 높이기 위해 사용자가 입력한 키워드를 DQL로 자동 변환하는 DQL 컨버터를 설계한다.

  • PDF

인터넷 검색엔진: 사용자의 관심을 흡수하여 전문성을 강화하는 기술 (Internet Search Engine: Technological Mode that Draws User's Attention to Make Its Expertise Reinforce)

  • 김지연
    • 과학기술학연구
    • /
    • 제13권1호
    • /
    • pp.181-216
    • /
    • 2013
  • 본 논문에서는 일반적인 웹검색 기술에 대한 분석을 포함하여, 한글검색엔진에 대한 접근도 전개하고자 한다. 최근 검색엔진의 독점적 지위문제, 검색순위의 공정성 문제가 발생하면서 우려가 높아지고 있다. 검색엔진을 둘러싸고 발생하는 상이한 해석적 주장들에는 기술결정론적 관점에서부터 도구주의적 관점까지 다양하다. 여러 해석적 주장들은 강한 지향성을 가지고 있지만 또한 그럴만한 기원도 가지고 있다. 이처럼 다양한 해석이 병존하는 것은 이 기술에 대한 통합적 재해석이 제기되고 있다는 의미일 것이다. 검색엔진은 사용자의 관심을 흡수하여 자신의 질서를 부여하는 기술양식이다. 이는 검색엔진의 합리성으로부터 기원한다. 특히 한글검색엔진은 사용자들의 관심을 끌어들임으로서 자신의 합리성을 증식시켜왔다. 한글검색은 일반적인 검색엔진이 수행하는 문서들 사이의 관계만이 아니라, 사용자들이 입력하는 단어들 사이의 기호학적 관계를 양식화해냈고 그로써 강력한 권위를 구성해냈다. 이제 검색엔진의 판단은 단순한 안내자의 지위를 넘어서 민주주의의 문제가 되었다. 어떻게 검색엔진의 전문성을 승인하면서도 민주주의에 봉사하도록 할 것인가? 검색엔진과 인간행위자를 분절적으로 보는 대신에, 둘 사이의 관계방식에 초점을 둘 때 검색기술에 대한 새로운 전망을 내놓을 수 있을 것이다.

  • PDF

개념 검색어 확장을 통해 질의 형식화를 도와주는 “개념 마법사”의 설계 및 구현 (Design and Implementation of “Concept Wizard” Supporting Query Formulation with Concept Term Expansion)

  • 강현규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.437-444
    • /
    • 2002
  • 정보 검색 시스템이나 웹(Web)이 방대해지고 초보적 수준의 사용자들이 늘어남에 따라 간단한 조작만으로 원하는 정보를 얻어낼 수 있는 도구의 개발이 점점 중요해지고 있다. 일반적으로 정보 검색 시스템이나 검색 엔진을 통한 질의 입력 방법이나 연산자들이 매우 다양하며 일반 사용자들은 질의를 형식화 하는 것이 쉽지 않다. 본 논문은 일반 사용자가 정보 검색 시스템이나 검색 엔진을 통하여 정보를 검색하기 위한 검색어 형식화를 도와주는 개념 마법사를 제안한다. 본 논문에서 제시한 개념 마법사는 실세계 지식의 부족을 시소러스를 이용하여 인터렉티브(interactive) 하게 제시하고 웹을 기반으로 하는 플러그인(plug-in)으로 제공함으로써 유용성 및 확장성이 크다.

인터넷의 정보의 탐색, 평가 및 활용:대학 이공계 연구자의 사례를 중심으로 (Information Seeking, Evaluation, and Use on the Internet: A Case Study of Science and Engineering Scholars)

  • 이해영;이수영
    • 정보관리학회지
    • /
    • 제18권4호
    • /
    • pp.163-181
    • /
    • 2001
  • 본 연구는 다양한 형태와 성격의 정보가 혼재해 있는 인터넷환경에서 이공계연구자들이 어떻게 정보를 탐색하고 평가하며, 이용하는지를 밝혀보고자 하였다. 이를 위해 연구를 위한 웹정보의 활용도 인터넷검색방법의 특수성, 검색엔진의 활용범위, 국내외자료의 병행여부, 그리고 인터넷정보의 신뢰도 및 학술적가치를 주요 연구문제로 다루었다. 명지대학교의 이공계 연구자 28명을 인터뷰한 결과에 따르면, 연구참가자들은 취미 여행등 개인적 관심사를 위한 정보검색에는 검색엔진을 많이 활용하지만, 연구를 위한 정보검색에는 본인이 이미 알고 있는 학회, 연구소, 대학 사이트 등을 선별적으로 이용하고 있다. 이는 검색엔진을 통해 검색된 일반 웹 사이트정보는 연구에 직접 사용하기에는 학술적 가치가 부족하다고 믿는것과 방대한 웹 전체를 대상으로는 원하는 정보를 찾기에 어려움이 많다는 것이 주 원인인 것으로 나타났다. 외국자료에 비해 국내자료는 신빙성, 전문성, 최신성 면에서 뒤떨어진다고 보고 있어, 연구를 위한 정보는 주로 외국자료에 의존하고 있는 것으로 밝혀졌다. 결론에서 검색엔진 개발자와 도서관 관계자 그리고 인터넷 정보의 이용자이자 생산자인 연구자를 위한 제안이 각각 제시되었다.

  • PDF

네트워크 및 웹 서버의 부하를 고려한 지능적인 검색시스템의 설계 및 구현 (Intelligential Search Engine Considering the Load of Web Servers and Networks)

  • 김창근;탁한호
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권8호
    • /
    • pp.1035-1044
    • /
    • 2001
  • 기존의 검색엔진은 분산된 불특정 다수의 웹 서버에 대해 웹 서버 부하, 네트워크 부하를 고려하지 않고 로봇을 동작시키므로 웹서버 및 네트워크의 과부하를 초래한다. 또한 정보의 갱신 기간도 3∼4주 간격으로 필요한 시기에 정보가 갱신되지 않는 경우가 많으며, 웹서버의 내용 변경이 없음에도 불구하고 무조건 웹서버의 내용을 수집하여 갱신한다. 본 논문에서는 네트워크 및 웹서버 부하를 고려한 지능적인 검색시스템을 제안하고, 이 시스템에 필요한 실시간 제어 검색엔진 및 분산되어 있는 정보를 모아서 갱신해 주는 지능적인 로봇을 설계 및 구현하였으며, 네트워크 부하 및 웹 서버의 부하를 모니터링하여 전체 시스템의 성능을 향상시킬 수 있는 로봇 제어 정책을 수립하였다.

  • PDF