• 제목/요약/키워드: 한국화 검색

검색결과 2,078건 처리시간 0.031초

MPI 미들웨어에 기반한 병렬검색 시스템 구현 (An implementation of parallel search system based on MPI Middleware)

  • 이정훈;강미경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.52-54
    • /
    • 2003
  • 본 논문은 MPI 미들웨어에 기반하여 데이터베이스에 포함되어 웹에 의해 제공되는 정보들을 고속으로 검색할 수 있는 분산 병렬 검색 시스템을 구현한다. 지리적으로 산재한 막대한 양의 정보를 다루어야 히는 생물정보 분야 응용의 요구에 부합하기 위하여, LINUX를 탑재한 3 대의 PC로 구성된 클러스터를 구축하고 CGI 구동 프로그램, 마스터와 슬레이브로 구성된 MPI 프로세스를 구현하였으며 메시지 큐. MPI 프리미티브. HTTP 1.1 프로토콜에 의해 서로 통신한다. 마스터는 CGI의 요청에 따라 슬레이브에게 명령을 내려 동시에 해당 웹 페이지에 대한 검색을 수행하며 이를 통합하여 CGI에게 전달한다. 마스터는 다수의 CGI 요청들을 직렬화할 뿐 아니라 슬레이브들과의 동기화에 의해 최종적인 검색 결과를 수행한다. 본 논문에서 구현된 클러스터는 특정 어댑터의 추가 구현에 의해 새로운 데이터베이스에 대한 검색 기능을 추가할 수 있으며 동일한 운영체제와 미들웨어를 갖는 노드를 추가함으로써 협력 검색에 있어서 보다 많은 컴퓨터를 참여시킬 수 있다.

  • PDF

이미지 화일과 텍스트 화일의 검색효율성 비교 (A Comparison of Retrieval Effectiveness between Image File and Text File)

  • 임영선;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.15-18
    • /
    • 1996
  • 본 논문은 본문 전체가 기계가독형 화일로 구성된 텍스트 전문데이터베이스와 이미지화일로 구성된 이미지 전문데이터베이스와의 검색효율성을 비교함으로써 도서관과 최종이용자의 입장에서 바람직한 전문데이터베이스가 어떤 것인지를 제안하고자 한다.

  • PDF

검색 재순위화를 위한 가중치 반영 딥러닝 학습 모델 (Search Re-ranking Through Weighted Deep Learning Model)

  • 안기택;최우석;박준용;박정민;이경순
    • 정보처리학회 논문지
    • /
    • 제13권5호
    • /
    • pp.221-226
    • /
    • 2024
  • 정보검색에서 질의는 다양한 유형이 존재한다. 추상적인 질의부터 구체적인 키워드를 포함하는 질의까지 다양한 형태로 구성되어 있어서 사용자의 요구에 정확한 결과 도출은 어려운 과제이다. 또한 검색시스템이 오타, 다국어, 코드와 같은 다양한 요소를 포함하는 질의를 다뤄야 하는 특징이 존재한다. 본 연구에서는 질의 유형을 분석하고, 이에 따라 딥러닝 기반 재순위화의 적용 여부를 결정하는 방법을 제안한다. 최근 연구에서 높은 성능을 보인 딥러닝 모델인 DeBERTa를 이용하여 질의에 대한 적합 문서의 학습을 통해 재순위화를 수행한다. 제안 방법의 유효성을 평가하기 위해 국제정보검색 평가대회인 TREC 2023의 상품 검색 트랙(Product Search Track) 테스트컬렉션을 이용하여 실험을 하였다. 실험 결과에 대한 정규화된 할인누적이득(NDCG) 성능측정 비교에서 제안 방법이 정보검색 기본 모델인 BM25 에 비해 질의 오류 처리를 통한 검색, 잠정적 적합성피드백을 통한 상품제목 기반 질의확장과 질의유형에 따른 재순위화에서 0.7810으로 BM25 대비 10.48% 향상을 보였다.

검색 포탈에서 사용자 질의분석을 통한 검색형태 연구

  • 이소영;조영환
    • 정보과학회지
    • /
    • 제22권4호
    • /
    • pp.47-51
    • /
    • 2004
  • 정보화 사회가 성숙되면서 인간의 정보 요구는 계속 다양화, 전문화, 개인화 되어왔으며, 한편 정보의 양과 다양성은 기하급수적으로 증가하여 왔다. 인터넷은 이러한 변화의 중심에서, 여러 가지 새로운 사회 현상을 적나라하게 표현하는 한편, 새로운 현상이 생기는 바탕이 되어왔다. 클리어링 하우스의 개념으로 시작된 인터넷 검색 포탈은, 다각적인 방법으로 실험되어졌고, 검색 효율적 또 상업적인 목적에 의하여 괄목한 성장을 보여 왔다.

효율적인 비디오 검색 및 브라우징을 위한 대표 프레임 군집화 (Key Frame Clustering for Efficient Video Retrieval and Browsing)

  • 김영민;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.553-555
    • /
    • 1998
  • 효율적인 비디오 검색과 브라우징을 위해서는 비디오를 장면 단위로 나누는 비디오 분할과 더불어 분할된 비디오 셧을 대표하는 프레임을 군집화하는 기술이 필요하다. 이는 내용 기반 비디오 검색 및 브라우징의 바탕이 되는 핵심 기술로써, 국내외적으로 많은 연구가 요구되고 있는 실정이다. 본 논문에서는 주파수 정보를 이용한 대표 프레임 군집화 방법을 제안하고 실험 비디오 데이터에 대하여 그 성능을 평가해 본다. 제안된 방법에서는 웨이블렛 변환을 통하여 대표 프레임의 주파수 정보를 구한 후, 고주파 영역과 저주파 영역에 가중치를 두어 대표 프레임을 군집화 하였다. 제안된 방법을 드라마 비디오 데이터에 대하여 실험한 결과 군집화의 정확도가 우수할 뿐 아니라 군집화 정도를 조절할 수 있어 다양한 수준의 군집화를 수행할 수 있음을 확인할 수 있었다.

  • PDF

사용자 패턴을 분석한 지능형 메타 검색 시스템 구현 (User-patterns Analysis Intelligent Meta-search System Implementation)

  • 범수한;김복용;이동원;서대영;오용철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.58-61
    • /
    • 2010
  • 최근 인터넷이 보편화되면서 검색에 대한 관심도가 높아지고 있다. 특히 사용자는 정확한 키워드의 입력 없이도 자신이 원하는 검색을 하고 싶어 한다. 그러한 욕구를 충족시키기 위해서 네이트의 '시맨틱', MSN의 'Bing' 등이 새로 제작되어 지고 있으며 네이버, google 등 대형 포털 사이트들도 검색분야에 투자를 아끼지 않고 있다. 본 논문은 사용자중심의 검색을 구현하기 위해서 패턴을 분석하여 연관규칙을 사용하여 검색시간을 단축함을 물론 검색결과의 정확성을 높였다. 구현을 위해서 네이버 사이트의 블로그로 검색의 범위를 한정 하여 데이터를 분석, 관리 및 시각화 하는 사이트를 개발하였다. 또한 검색을 위한 크롤러, 루씬 등을 실질적으로 직접 개발 활용 하였다. 시제품의 시험결과 정답사이트 도출 정확도는 google에 비해 20%, 재현율은 7.2%의 향상성을 보였다.

정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구 (Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval)

  • ;강대현;박한샘;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

메타검색엔진의 특징에 관한 연구 (A Study on the Characteristics of Meta Search Engines)

  • 이란주
    • 정보관리학회지
    • /
    • 제17권2호
    • /
    • pp.85-100
    • /
    • 2000
  • 본 연구 목적은 웹 정보원의 효과적인 정보 검색을 위하여 국내외 메타검색엔진 17개의 성격과 특징을 본 연구에서 제시한 메타검색엔진의 평가 요소와 함께 일반검색엔진의 평가 요소들을 중심으로 조사ㆍ분석하였다. 메타검색엔진은 여러 검색엔진들을 한번에 쉽게 검색할 수 있기 때문에 종종 웹 검색을 위한 첫 의뢰 검색엔진으로 사용되고 있다. 분석 결과에 의하면, 선정된 메타검색엔진들은 공통된 점을 갖고 있기도 하나 제각기 특성을 갖고 있다. 성능이 뛰어난 메타검색엔진이라면, 특별한 검색 질의를 위하여 초기 화면에 체크 상자 기능을 제공하여 검색엔진을 선택할 수 있도록 하며 개인의 희망에 맞추어 쉽게 제시되는 리스트를 제공하여야 한다. 메타검색엔진도 현재 주제별 검색엔진과 키워드형 검색엔진들이 이용자의 편의를 위해서 지향하고 있는 개인화, 주문화, 웹 문서 외의 다른 정보원을 검색 대상으로 포함하고 있는 추세를 잘 반영하고 있다. 본 연구 결과는 메타검색엔진의 선정과 효과적인 정보 검색에 반영될 수 있으며 국내 메타검색엔진 개발과 설계에 관심 있는 연구자들에게 기초자료로 활용될 수 있다.

  • PDF

소셜 네트워크 기반 사용자 유사성 발견을 통한 개인화 및 소셜 검색 (Personalized and Social Search by Finding User Similarity based on Social Networks)

  • 박건우;오정운;이상훈
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.683-690
    • /
    • 2009
  • 소셜 네트워크(Social Network)는 웹 환경에서 개인 중심의 네트워크로 구성되어 웹 사용자별 프로파일을 탐색하고 새로운 연결을 형성함으로써 정보의 소통을 지원한다. 따라서 유사한 내재적 정보를 가진 웹 사용자들로 구성 된 소셜 네트워크를 찾아서 검색에 적용한다면 검색의 효율성과 검색 결과에 대한 웹 사용자의 만족도를 향상 시킬 수 있다. 본 논문에서는 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜 네트워크를 구성 한다. 둘째, 사용자들의 속성(Feature)에 내재된 정보를 이용하여 주제(topic)별 웹 사용자 간 유사성(Similarity)을 산정한 후, 주제(Topic)별 변화되는 유사성에 따라 소셜 네트워크를 재구성한다. 마지막으로 산정된 유사성과 웹 사용자들의 검색결과에 대한 만족도, 즉 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 주제별 유사성이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 이와 같은 사실을 검색에 적용한다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성 및 신뢰성 향상에 기여 할 수 있다.