• 제목/요약/키워드: 분류검색

검색결과 1,722건 처리시간 0.025초

점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 모델 (A Hypertext Categorization Model Exploiting Link and Incrementally Available Category Information)

  • 오효정;임정묵;이만호;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.89-96
    • /
    • 1999
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 하이퍼링크는 문서간의 관계를 나타내는 유용한 정보로서 링크를 통해 연결된 두 문서는 내용적으로 관련이 있어 검색에 도움을 준다는 것은 이미 밝혀진바 있다. 본 논문에서는 이러한 과거 연구를 바탕으로 새로운 문서 분류 모델을 제안하는데, 이 모델의 주안점은 대상 문서와 링크로 연결된 이웃 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 문서의 범주를 결정한다. 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이 모델은 이웃한 문서의 범주가 미리 할당되어 있지 않은 경우 용어 기반 분류 방법으로 가용 범주를 할당하고, 이렇게 할당된 분류 정보가 다시 새로운 문서의 범주를 결정할 때 사용됨으로써, 문서 집합 전체의 분류가 점진적으로 이루어지며 그 정확도를 더해 나가는 효과를 가져올 수 있다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRI-Kyemong) 자료를 대상으로 실험한 결과 18.5%의 성능 향상을 얻었다.

  • PDF

멀티 비트 트리 비트맵 기반 패킷 분류 (A Multibit Tree Bitmap based Packet Classification)

  • 최병철;이정태
    • 한국통신학회논문지
    • /
    • 제29권3B호
    • /
    • pp.339-348
    • /
    • 2004
  • 패킷 분류근 인터넷 망에서 QoS(Quality of Service)보장, VPN(Virtual Private Network)등과 같은 사용자들의 다양한 서비스를 수용하기 위한 중요한 요소이다. 패킷 헤더는 기본적으로 IP(Internet Protocol) 패킷 헤더 내의 목적지 주소뿐만 아니라 발신지 주소, 프로토콜, TCP(Transmission Control Protocol)포트 번호 등 여러 필드들을 조합하여 룰 테이블로부터 best matching 룰을 찾는 것이다. 본 논문에서는 멀티 비트 트라이 구조의 트리 비트맵을 이용하여 하드웨어적인 룰 검색이 가능한 패킷 분류 기법을 제안한다. 검색 대상 필드 및 패킷 분류 룰을 구성하는 프레픽스를 비교 단위가 되는 일정한 비트 크기의 멀티 비트로 나누고, 이와 같이 구분된 멀티 비트 단위로 트리 비트맵 기반의 룰 검색 기능을 수행한다. 제안한 기법은 프레픽스의 일정한 상위 비트들에 대해서는 인덱싱 키로 사용하여 룰 검색을 위한 메모리 액세스 횟수를 줄이도록 하였다. 또한 룰 검색시 성능 저하를 초래하는 백트랙킹이 발생하지 않도록 하기 위하여 룰 테이블 구축시 마커 프레픽스에 대한 처리 기법을 제안하였다 그리고 본 논문에서는 IPMA(Internet Performance Measurement Analysis) 프로젝트에서 제공하는 라우팅 테이블의 프레픽스들을 이용하여 2차원 즉, 목적지 주소와 발신지 주소의 2필드로 구성되는 랜덤 룰 셋을 생성하고 제안한 기법에 대한 메모리 소요량 및 성능 비교를 하였다.

3D 디지털 연표 기반의 지능형 전통문화 검색 시스템 개발 (Development of Intelligent Traditional Culture Retrieval System based on 3D Digital Timeline)

  • 신유탁;조재춘
    • 융합정보논문지
    • /
    • 제9권10호
    • /
    • pp.154-162
    • /
    • 2019
  • 정보통신 기술이 빠르게 발전하면서 사회와 문화 전반에 많은 영향을 미치고 있음에도 전통문화에 대한 체계적인 분류 및 최신 검색 기능을 제공하는 시스템은 아직까지 제공되고 있지 않다. 따라서 본 논문은 전통문화 콘텐츠 분류체계를 수립하여 3D 연표를 자동으로 생성하고 시각화함으로써 사용자에게 체계적인 분류 및 검색 기능을 제공함과 동시에 융복합서비스가 가능한 전통문화 검색 시스템을 개발하였다. 본 시스템은 전통문화 콘텐츠를 수집하는 기능, 수집된 전통문화 콘텐츠를 분류 및 저장하는 기능, 저장된 전통문화 콘텐츠에 기반을 두어 3D 디지털 연표를 자동으로 생성하는 기능을 제공한다. 또한, 시스템의 사용성 평가를 위해 시스템 만족도 설문지를 개발하였고 대학생 19명이 참여하여 시스템 사용성을 검증하였다. 실험 결과, 시스템 만족도에서는 모든 문항이 평균적으로 '만족한다'는 결과를 보였다.

감성용어 및 패턴을 이용한 감성기반 분산 문서분류시스템 (Distributed Document Classification System using Susceptibility Terms and Patterns)

  • 김명규;인주호;채수환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.356-360
    • /
    • 2007
  • 인터넷이 폭 넓게 보급되어 개인의 의견을 개진할 기회가 확대됨에 따라 정치, 경제 등의 사안이나 제품 기업의 이미지, 공인에 대한 긍정.부정의 글을 개진할 수 있게 되었다. 이러한 현상에 따라 기업, 제품, 혹은 공공의 분야에서 일반 개인들이 어떻게 생각하는가에 대한 분석 및 자료수집의 필요성이 높아지고 있다. 감성용어 문서분류시스템은 문서의 내용 중 감성기반의 용어들에 기반하여 이에 대한 패턴을 정의하고 이에 대응하는 범주에 문서를 자동으로 할당하는 작업으로써 효율적인 정보 관리 및 검색을 가능하게 한다. 하지만 자동문서 분류를 하기 위해서는 방대한 양의 데이터를 수집 보관하기 위한 분산 환경이 반드시 필요하다. 본 논문에서는 감성기반 문서분류 시스템을 위한 감성용어 추출 및 긍정, 부정의 패턴을 검색해 자동 문서분류를 위해 RTI(Run Time Infrastructure)를 통한 분산 시스템 환경으로 구성하였다.

  • PDF

자질의 범주 모호성 해소를 위한 Naive Bayes 분류기 설계 (A Naive Bayes Classifier for Category Disambiguation of Features)

  • 유현숙;정영미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.364-366
    • /
    • 2001
  • 문서 범주화는 전자 정보환경에서 매우 유용한 정보처리 도구로서, 다양한 문서 범주화 기법 및 성능향상을 위한 연구들이 지속적으로 이루어지고 있다. 그러나, 대부분의 연구들은 문서 범주화의 대상이 되는 단어 자질 공간의 차원축소 문제에만 집중되었을 뿐, 학습단계에 큰 영향을 미치는 다범주 단어 자질의 범주 모호성은 고려하지 않았다. 본 연구에서는, 다범주 자질의 범주 모호성을 해소함으로써 문서 범주화의 성능향상을 유도하는 범주 모호성 해소 가중치 W를 제시하고 이를 실험을 통해 증명하였다. 실험에서는 Naive Bayes 분류기와 가중치 W를 적용한 Naive Bayes-W 분류기를 직접 구축하여 문서 범주화의 성능향상 여부를 비교하는데 사용하였다. 도출된 실험결과를 통해, 가중치 W는 현재의 분류기가 가지고 있는 자질 표현의 범주 모호성이라는 단점을 보완하고 분류기의 성능향상을 유도함으로써 정보검색시스템의 검색효율을 높이는 데 활용될 수 있음일 증명되었다.

  • PDF

웹문서분류체계의 분석 및 새로운 설계 (Analysis and Design for the System of Korean Web Document Classification)

  • 남영준
    • 한국문헌정보학회지
    • /
    • 제32권3호
    • /
    • pp.207-230
    • /
    • 1998
  • 인터넷에 존재하는 웹문서와 사이트들은 충분히 학술적 가치를 갖고 있기 때문에 중요한 정보원으로 간주된다. 도서관은 이 새로운 정보원을 대상으로 도서관 이용자를 위한 새로운 검색기법과 관리기법을 개발할 필요가 증대되었다. 왜냐하면 현재 웹검색엔진에서 제공하는 분류체계는 도서관학적 관점에서 개발되지도 않았으며 또한 웹검색엔진간 분류체계의 설계원칙도 없기 때문이다. 본 논문에서는 이점에 착안하여 웹 문서를 효율적으로 검색할 수 있는 실험적인 새로운 웹문서 분류체계를 설계하였다. 설계는 해당 분류항목과 연관된 웹문서의 수와 접속비율에 근거하였으며, 설계의 수준은 1차적으로 류${\cdot}$강항목까지 제한하였다.

  • PDF

주차장 차량사고 음향분류 DVR시스템 (Digital Video Record System for Classification of Car Accident Sounds in the Parking Lot.)

  • 윤재민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.429-432
    • /
    • 2010
  • 주차장에서는 다양한 형태의 사건 사고가 발생하는데, 기존 DVR(CCTV)는 단순 영상녹화 기능만 지원하므로, 이를 효과적으로 분석하는데는 한계가 있다. 따라서, DVR의 영상카메라와 마이크를 통해서 입력되는 영상과 사운드 신호를 대상으로, 해당 영상이 발생하는 음향 신호의 종류를 파악하여, 특정 음향이 발생한 영상구간을 저장하여 이를 검색할 수 있다면, 주차장 관리자가 효과적으로 사건 사고를 대처할 수 있게 된다. 본 연구에서는 주차장에서 발생하는 차량관련 음향(충돌음, 과속음, 경적음, 유리파손, 비명)을 분류하기 위해 효과적인 특징벡터를 제안하고, 제안한 특징벡터를 이용하여 신경망 차량음향분류기를 설계하여 성능을 평가함으로써, 효과적으로 차량음향을 분류하기 위한 방법을 제안하였다. 또한, 신경망 차량음향분류기를 DVR시스템과 연동하여, 마이크로부터 입력되는 음향신호를 실시간 분석하고, 특정 소리가 발생한 영상구간을 기록함으로써, 음향 키워드에 의해서 해당 사고영상을 검색 및 디스플레이하는 시스템을 개발하였다.

  • PDF

SIFT 알고리즘을 이용한 플리커 이미지 자동분류 (Flickr Image Classification using SIFT Algorism)

  • 장현웅;조수선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1394-1396
    • /
    • 2013
  • 플리커와 같은 대용량 영상저장 및 공유 사이트가 인기를 끌면서 이미지 정보의 양은 점점 늘어나고 있고 사용자들은 정확한 이미지 정보 검색을 요구하고 있다. 태그기반의 이미지 검색에서 정확도를 높이기 위하여 태그들의 의미적 연관성을 이용하는 등 다양한 연구가 진행되고 있다. 본 논문에서는 특징점 추출에 기반하여 이미지를 분류하는데 뛰어난 성능을 가진 SIFT알고리즘을 사용하여 플리커 이미지를 분류하는 방법을 제안한다. 위키피디아 의미 연관성을 이용해 태그 정보로 1차 분류된 데이터베이스에 SIFT알고리즘을 사용해본 결과 기존의 SURF를 사용한 연구보다 높은 정확성을 보이는 것을 확인하였다. 따라서 이 방법을 통하여 다양한 이미지를 더욱 정확하게 분류할 수 있을 것으로 기대한다.

프레스품의 GT 검색시스템 개발

  • 이현용;박화영
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 1991년도 추계학술대회 논문집
    • /
    • pp.207-214
    • /
    • 1991
  • 설계사양서를 검토하여 이미 설계(또는 제작) 또는 유사한 품목을 설계한 적이 있는가를 검색하는데 GT가 이용된다. 기술적인 검토를 하는 경우 구상도를 그리거나 유니트로 분류되어 있으면 무엇을 사용해야 하는가를 조사하는 것이 용이하게 되며 이러한 개념은 모든 정보를 검색하는데 이용 할 수 있다.(중략)

  • PDF

감성 개념을 이용한 웹 이미지 검색 결과 분류 (Categorizing Web Image Search Results Using Emotional Concepts)

  • 김영래;권경수;신윤희;김은이
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.562-566
    • /
    • 2009
  • 영상 검색에서 보다 빠르고 정확한 결과를 제공하기 위해 많은 시스템들은 결과내 재검색을 위한 카테고리 내 검색을 제공하고 있다. 이를 위해, 본 논문에서는 감성 카테고리를 사용하여 영상을 분류하는 시스템을 제안한다. 제안된 시스템은 영상에 포함된 컬러와 패턴 정보를 가지고 감성 벡터를 추출하여, 각 영상을 8 개의 감성 카테고리로 분류한다. 이때, 감성 카테고리는 고바야시가 정의한 8 개의 어휘 {romantic, natural, casual, elegant, chic, classic, dandy, modern}를 사용한다. 질의에 대한 결과가 주어지면, 사용자는 선택한 감성 카테고리로 재분류된 영상들을 제공받을 수 있다. 제안된 시스템의 성능을 평가하기 위하여 야후 이미지 검색에서 수집된 풍경 영상 1,000 장으로 사용자 평가를 실시하였으며 이를 통해 제안된 시스템의 성능을 증명하였다.

  • PDF