• 제목/요약/키워드: 한국화 검색

검색결과 2,073건 처리시간 0.041초

시멘틱 웹 환경에서의 개인화 검색 (Personalized Search Service in Semantic Web)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.533-540
    • /
    • 2006
  • 웹에 분산된 모든 윈 페이지는 구조가 서로 다르다. 시멘틱 웹 환경은 이형적인 구조를 갖는 웹 페이지들의 메타데이터 바탕으로 시멘틱 검색이 가능하다. 그러나 일반적으로 사용자의 요구에 따른 시멘틱 김색은 상황에 따라 엄청난 수의 검색 결과를 내놓는다. 따라서 검색 결과에 대해 각 사용자에 맞는 검색 결과 순위를 적용할 필요가 있다. Culture Finder는 시멘틱 웹 검색 에이전트들이 개인화 된 문화 정보를 검색할 수 있도록 도움을 준다. Culture Finder는 웹에 존재하는 각 웹 페이지에 대한 메타 데이터를 작성하고, 시멘틱 검색을 이행하며 사용자 프로파일을 기반으로 삼아 검색 결과에 대한 순위 점수를 계산한다. Culture Finder에는 개인화 된 시멘틱 검색을 효율적으로 실행하기 위해 중요한 5가지 기법이 적용되었다. 사용자의 검색 행위로부터 사용자 프로파일을 생성하기 위한 기계 학습기법, 시멘틱 웹 검색 에이전트를 위한 효율적인 시멘틱 검색 기법, 사용자 질의의 효과적인 파악을 위한 질의 분석 기법, 각 사용자에게 적합한 검색 결과를 제공하기 위한 순위 적용 기술, 메타데이터를 생성하기 위한 상위 온톨로지 표현 방법, 본 논문에서는 Culture Finder의 구조를 통해서 시멘틱 개인화 검색에 대한 기법을 제안한다.

가중치를 가지는 웹문서 색인기법에 관한 연구 (A Study of Indexing Methods with weight-value of Web document)

  • 김종영;김철수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2459-2462
    • /
    • 2002
  • 검색된 문헌들에 대한 항해 시간을 줄이기 위해서 검색된 문헌들의 문헌 순위화가 필수적이다. 문헌 순위화를 위해서는 문헌 순위화를 위한 순위화 정보가 필요하다. 본 논문에서는 검색된 문헌들에 대한 순위화를 보다 효율적으로 수행하기 위한 정보를 제공하기 위하여 HTML 문서에 대한 색인 과정에서 다양한 가중치를 가지는 색이어 추출 방법에 관하여 연구하였다. 웹문서들은 태그로 이루어지며 중요한 색인어들은 특정 태그 속에 포함되어 있다는 것에 착안하여 색인어의 중요도에 영향을 줄 수 있는 태그를 선별하고, 선별된 태그들에 대해 휴리스틱 정보를 이용하여 중요도를 부여한 후 선별된 태그에 영향을 받는 문장들에서 추출된 색인어에 대하여 가중치를 부여하는 방법을 이용하였다. 색인어 추출을 형태소 분석기를 이용하였다. 색인어들이 다양한 가중치를 가지므로 검색 과정에서 검색된 문헌들에 대하여 효율적인 순위화가 가능하여 관련 문헌을 보다 빠르게 찾을 수 있는 환경을 제공할 수 있다.

  • PDF

내용기반 영상 검색을 위한 ART2를 이용한 양자화 방법에 관한 연구 (A Study on Quantization Method Using ART2 for Contents-Based Image Retrieval)

  • 김병훈;구경모;박용민;차의영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.919-922
    • /
    • 2004
  • 본 논문에서는 칼라 정보 기반 영상 검색에서 양자화 과정을 거치면서 나타나는 문제점의 해결 방안으로 ART2 신경회로망을 이용한 양자화 방법을 제시한다. 영상을 양자화하면 비슷한 칼라를 가진 픽셀이 다른 칼라로 나누어지는 경우가 발생하여 영상 검색 성능을 떨어뜨린다. 따라서 본 논문에서는 양자화를 하기 전에 ART2 신경회로망을 이용하여 영상에 존재하는 여러 칼라들을 클러스터링하여 같은 클러스터 속한 비슷한 칼라의 픽셀들은 같은 칼라로 양자화되도록 하였다. 실험에서 영상 검색에 제안한 방법을 적용하였을 때, 검색의 성능 향상에 도움이 된다는 것을 확인할 수 있었다.

  • PDF

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

강화학습을 사용한 개인화된 웹 검색 (Personalized web searching with Reinforcement Learning)

  • 이승준;장병탁
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.259-262
    • /
    • 2001
  • 본 논문에서는 사용자의 취향에 맞춰 특정 웹 문서를 탐색하는 개인화된 웹 검색기의 구현을 다룬다. 사용자의 취향은 사용자의 직접적인 평가와 사용자의 검색 과정을 통해 얻어지는 간접적인 평가를 사용한 강화 학습을 사용하여 학습된다. 웹 문서의 검색은 사용자의 취향과 현재 문서와의 관련 도를 보상으로 사용한 강화 학습을 통하여 이루어진다.

  • PDF

포털의 노블리스 오블리제를 기대한다!

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 10호통권161호
    • /
    • pp.102-117
    • /
    • 2006
  • 지식정보화사회가 도래함에 따라 지식과 정보의 중요성이 더욱 대두되고 있으며 IT 기술의 급속한 발전은 지식의 기술 기반화, 정보 환경화를 가져왔다. 인터넷 사용이 급속도로 증가하면서 필요한 정보들은 지식 검색서비스를 이용해 찾는 것이 일상화 되었다. 이에 검색기술환경의 변화에 따른 지식검색서비스의 등장과 일상화 추세를 통해 지식의 개념과 특징, 지식검색서비스의 체계를 살펴보는 것은 지식 정보화 사회를 살아가는 이들에게 의미 있는 연구가 될 것이다.

  • PDF

개인화 웹 검색 시스템 기반의 문서 요약 시스템 (A Document Summary System based on Personalized Web Search Systems)

  • 김동욱;강수용;김한준;이병정;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.357-365
    • /
    • 2010
  • 개인화 웹 검색 시스템은 사용자의 검색의도에 따라 질의어 확장, 검색 결과의 재순위화 등의 방법을 통하여 사용자에게 개인화된 검색 결과를 제공한다. 이를 위해 검색 시스템은 질의어와 사용자의 프로파일 정보를 활용하여 사용자의 검색 의도를 파악하고 분석하여, 검색 결과 페이지에 반영하여 보여주게 된다. 이때 검색 결과 페이지는 문서의 URL과 문서의 제목, 작은 텍스트 조각을 표시한다. 여기서 작은 텍스트 조각은 검색 질의어가 포함된 문서의 요약이며, 스니펫이라고 알려져 있다. 사용자는 이러한 문서의 요약을 통하여 웹 문서가 자신이 원하는 정보를 가진 문서인지를 판단하거나, 해당 URL에 직접 접속하지 않고도 원하는 정보를 얻을 수 있게 된다. 따라서 문서 요약은 사용자가 문서를 볼 것인지 아닌지에 대한 중요한 판단 기준이 되며, 만약 문서 요약 시스템이 개인화된 요약 결과를 제공한다면 사용자의 만족도는 더욱 증가할 것이다. 본 논문은 전체 웹 검색 시스템에서 검색 속도의 큰 하락없이 사용자의 만족도를 증가시킬 수 있는 개인화 문서 요약 시스템을 제안한다.

개인화 검색 시스템 프레임워크 개발 (Development of a Personalized Search System Framework)

  • 김광영
    • 한국콘텐츠학회논문지
    • /
    • 제10권11호
    • /
    • pp.461-467
    • /
    • 2010
  • 본 논문에서는 다양한 콘텐츠들을 특징을 이용하여 각 콘텐츠에 적합한 특징들을 설계하고 수행할 수 있는 개인화 검색 시스템의 프레임워크를 개발하였다. 이를 이용하여 한국과학기술정보 연구원에서 제공하는 국내학술, 특허, 동향 정보 등 다양한 콘텐츠들을 이용하여 개인화 검색 시스템의 다양한 알고리즘에 적용하여 수행하였다.

사용자에 따라 검색 결과의 순위를 적용하는 DQL 검색 시스템 (DQL Search System That Apply Ranking Of Search Result)

  • 김제민;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.589.1-591
    • /
    • 2004
  • 현재 웹 서비스에서 사용하고 있는 키워드 기반 검색은 syntactic한 정보만을 제공한다. 웹 서비스의 이러한 단점을 보안하고자 시멘틱 웹 기술이 제안되고 있다. DQL 검색 시스템은 검색 결과의 질을 향상시키기 위해서 시멘틱 웹 기반의 검색 시스템 중지 하나다. 시멘틱 검색은 입력된 질의들을 통해서 사용자가 원하는 정보와 의미가 일치하는 결과를 얻어내는 것이다. 본 논문은 시스템을 이용하는 각 사용자에 따라 검색되는 결과들에 우선순위를 적용하는 DQL 검색 시스템을 제안하고 다음 3가지 부분에 중점을 두어 시스템을 설계하였다. 첫째, 각 사용자들의 성향을 검색 결과에 반영하기 위해 개인화 프로파일과 온톨로지를 생성하는 개인화 온톨로지 생성기를 설계한다. 둘째. 검색 정확도틀 논이기 위해 검색 대상에 되는 정보들의 숙성과 관계를 추론해주는 검색 엔진을 설계한다. 마지막으로 DQL 검색 시스템의 사용 효율성을 높이기 위해 사용자가 입력한 키워드를 DQL로 자동 변환하는 DQL 컨버터를 설계한다.

  • PDF

이진 부분영상을 이용한 영상 검색 기법에 관한 연구 (Research of an image retrival method using binary subimage)

  • 정순영;최민규;남재열
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.329-332
    • /
    • 2000
  • 영상 검색 기법 중 기존의 색상 정보만을 이용한 기법에는 많은 한계가 존재하기 때문에 현재의 검색 기법 혹은 상용 검색 프로그램들은 두가지 이상의 검색 기법을 동시에 이용한다. 본 논문에서는 이진 영상을 이용하여 형태 정보를 추출하고 색상 정보와의 결합을 이용한 검색 기법을 제안한다. 이진화된 영상만으로도 상당수의 형태 정보를 포함하고 있기 때문에 최소한의 계산을 이용하여 영상의 개략적인 형태를 파악할 수 있는 방법을 제안한다. 아울러, 이진화된 형태 정보로 자칫 놓칠 수 있는 형태 정보를 보완하기 위하여 영상 내의 객체의 위치 정보를 이용하기 위해 부분영상으로 영상을 분할하여 좀 더 효율적인 검색을 가능하게 하는 기법을 제안한다.

  • PDF