• Title/Summary/Keyword: 분류검색

Search Result 1,717, Processing Time 0.052 seconds

Implementation of Reusable Class Library based on CORBA using Genetic Algorithm (유전자 알고리즘을 이용한 CORBA 기반의 재사용 클래스 라이브러리 구현)

  • Lee, Byeong-Jeong;Mun, Byeong-Ro;U, Chi-Su
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.5 no.2
    • /
    • pp.209-222
    • /
    • 1999
  • 개발 과정의 생산성과 프로그램의 신뢰성을 향상시키기 위하여 소프트웨어 재사용이 매우 중요하며 , 효과적인 재사용을 위해서 세밀한 분류 방법과 정확한 검색 방법에 기반한 객체 지향 재사용 라이브러리가 필수적이다. 본 연구에서는 재사용 라이브러리의 다중 클러스터링(multi-way clustering) 분류 방법과 클러스터 기반 선형 검색(cluster-based linear retrieval) 방법에 유전자 알고리즘(genetic algorithm)을 적용한다. 다중 클러스터링은 부품들이 할당된 클러스터 개수, 클러스터 내부 유사도 그리고 클러스터들 사이의 유사도를 최적화하는 클러스터링을 찾아 부품을 세밀히 분류하는 것이고, 클러스터 기반 선형 검색은 주어진 질의와 유사한 부품을 많이 포함하는 클러스터를 검색하는 것이다. 본 논문에서는 유전자 알고리즘이 시뮬레이티드 어닐링 알고리즘(simulated annealing algorithm) 보다 우수한 해를 찾는 것을 실험을 통하여 보이고, 또한 본 알고리즘을 이용한 CORBA 기반의 재사용 클래스 라이브러리(RCL)를 기술한다.

Development of a prototype system for simultaneous search matching between KCD7 and SNOMED CT (KCD7 과 SNOMED CT 의 동시검색 매칭 프로토타입 시스템 개발)

  • Hae-Yeon, Seo;Dong-Geun Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.519-520
    • /
    • 2024
  • KOICD(질병분류 정보센터), 보건의료정보표준, 질병분류기호 모두 국내에서 권위 있는 질병분류 정보 검색 가능 홈페이지를 가지고 있다. 그러나 국내에서 가장 많이 이용되는 KCD 와, 국제적으로 사용되는 SNOMED CT 의 검색결과가 동시에 나오는 사이트는 아직 존재하지 않는다. 이에 의료진과 환자, 보험사의 편의를 모두 고려하여 KCD 와 SNOMED CT 가 동시에 출력되는 검색사이트를 제작하였다.

A Study on the Connecting Method of Query and Legal Cases Using Doc2Vec Document Embedding (Doc2Vec 문서 임베딩을 이용한 질의문과 판례 자동 연결 방안 연구)

  • Kang, Ye-Jee;Kang, Hye-Rin;Park, Seo-Yoon;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.76-81
    • /
    • 2020
  • 법률 전문 지식이 없는 사람들이 법률 정보 검색을 성공적으로 하기 위해서는 일반 용어를 검색하더라도 전문 용어가 사용된 법령정보가 검색되어야 한다. 하지만 현 판례 검색 시스템은 사용자 선호도 검색이 불가능하며, 일반 용어를 사용하여 검색하면 사용자가 원하는 전문 자료를 도출하는 데 어려움이 있다. 이에 본 논문에서는 일반용어가 사용된 질의문과 전문용어가 사용된 판례를 자동으로 연결해 주고자 하였다. 질의문과 연관된 판례를 자동으로 연결해 주기 위해 전문용어가 사용된 전문가 답변을 바탕으로 문서분류에 높은 성능을 보이는 Doc2Vec을 이용한다. Doc2Vec 문서 임베딩 기법을 이용하여 전문용어가 사용된 전문가 답변과 유사한 답변을 제안하여 비슷한 주제의 답변들끼리 분류하였다. 또한 전문가 답변과 유사도가 높은 판례를 제안하여 질의문에 해당하는 판례를 자동으로 연결하였다.

  • PDF

Reconstruction of E-mail Category Using Dynamic Category Hierarchy and Document Summarization (문서요약 및 동적 분류체계를 사용한 E-mail 분류의 재구성)

  • Ahn, Chan-Min;Park, Sun;Kim, Tae-Soon;Choi, Bum-ghi;Lee, Ju-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.511-514
    • /
    • 2004
  • 현재의 이메일 분류는 규칙기반, 베이시안, SVM 등을 이용하여 스팸메일을 필터링 하는 이원분류가 주로 연구되어지고 있고, 이외에도 다원분류에 대한 연구로는 클러스터링을 이용한 방법이 있다. 그러나 클러스터링에 의한 방법은 단순히 유사도에 의해 메일을 묶는 수준에 그치고 있다. 본 논문에서는 자동 문서요약 방법과 동적분류체계 방법을 결합하여 새로운 이메일 자동 다원분류 방법을 제안했다. 본 논문에서 제안한 방법은 이메일을 자동으로 분류하며 분류한 결과를 검색할 때 사용자의 요구사항을 만족하지 못하면 재분류하여 분류 빛 검색의 정확성을 높였다.

  • PDF

Hierarchical Binary Search Tree (HBST) for Packet Classification (패킷 분류를 위한 계층 이진 검색 트리)

  • Chu, Ha-Neul;Lim, Hye-Sook
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.32 no.3B
    • /
    • pp.143-152
    • /
    • 2007
  • In order to provide new value-added services such as a policy-based routing and the quality of services in next generation network, the Internet routers need to classify packets into flows for different treatments, and it is called a packet classification. Since the packet classification should be performed in wire-speed for every packet incoming in several hundred giga-bits per second, the packet classification becomes a bottleneck in the Internet routers. Therefore, high speed packet classification algorithms are required. In this paper, we propose an efficient packet classification architecture based on a hierarchical binary search fee. The proposed architecture hierarchically connects the binary search tree which does not have empty nodes, and hence the proposed architecture reduces the memory requirement and improves the search performance.

Vector Space Model for Patent Information Retrieval System (특허정보 검색을 위한 벡터스페이스 검색모텔의 적용)

  • 원상훈;노태길;손기준;박정희;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.516-518
    • /
    • 2003
  • 본 논문은 특허 문서에 맞게 벡터스페이스 모델을 적용하여 특허정보 검색기를 구현한다. 기존의 상용 특허 검색 시스템의 문제점을 제시하고, 특허 문헌의 특징을 분석하여, 이를 반영한 특허 문헌 검색등의 벡터 스페이스 모델을 제시한다. 하나의 특허 문서는 서로 상이한 특성을 지닌 텍스트와 데이터의 조합으로 이루어져 있다. 따라서 이를 하나의 벡터로 표현하는 것이 용이하지 않다. 이에 대해 본 연구에서는 내용 필드들을 특성에 따라 둘 이상의 벡터로 표현하고, 수치 및 고유명 필드는 불린검색형태로 처리되는 혼합형 벡터 모델을 제안한다. 각 필드의 특징에 맞게 색인어를 추출하며, 텍스트 필드의 색인어률 벡터로 표현하는 과정에서는 잘 알려진 TF-IDF 가중치를 사용하되, 특허 문서가 IPC 특허 분류 기준에 따라 완전 분류되어 있는 문서라는 특징을 이용, 보다 정확한 가중치를 부여한다. 실험과 성능평가를 통하여 제안한 특허 모델의 유용성을 보인다.

  • PDF

Image Retrieval Using Wavelet Templates (Wavelet Templates를 이용한 영상 검색)

  • 서덕원;김종훈;김대중;이성기;곽훈성
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.117-120
    • /
    • 2002
  • 본 논문에서는 정지 영상에서 물체를 검출하는 방법을 제안한다 제안하는 방법은 먼저 정지 영상 내에서 찾을 물체에 대해서 웨이블렛 변환을 통해서 템플릿을 만든다. 만들어진 템플릿은 웨이블렛 변환의 특징을 토대로 중요한 특징 벡터만 한곳에 모이게 된다. 그 중요한 특징 벡터를 모아놓은 템플릿을 토대로 영상 검색을 하는 것이다. 예를 들어 영상 내에서 보행자를 찾는다면, 보행자 영상을 웨이블렛 변환을 통해서 템플릿을 만든다. 만들어진 템플릿을 토대로 영상 내에서 보행자를 검색할 수 있는 분류자를 만든다. 검색한 영상 내에서 보행자랑 유사한 Positives를 이미 만들어진 분류자를 통해서 찾으면 찾은 결과를 가지고 만들어진 템플릿에 비교를 한 후 최종적으로 보행자를 찾아내는 시스템이다. 이 시스템은 꼭 보행자뿐만 아니라 사용자가 검색하기 원하는 물체를 웨이블렛을 통해서 템플릿화 해 놓으면 물체를 효과적으로 검색 할 수 있다.

  • PDF

Implementation of motif database for integrating motif sources (모티프 자원 통합을 위한 데이터베이스 구축)

  • 이범주;최은선;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.160-162
    • /
    • 2002
  • 서열 시퀀싱을 통해 등장하는 원시 데이터들을 대상으로 유사한 서열과 기능 예측에 사용되는 모티프 데이터베이스들은 원시 데이터 생성 속도가 빠르게 증가함에 따라 그 중요성 또한 나날이 증가하고 있다. 그러나, 이러한 모티프 데이터베이스들은 서로 독자적으로 개발되고 발전되어 왔기 때문에 각각 서로 다른 형식의 데이터를 사용하고 있어 이에 대한 검색결과도 데이터베이스마다 서로 이질적인 형태로 제공하고 있다. 그러므로 사용자는 각 데이터베이스에서 사용하는 데이터 구조들에 대한 전반적 지식을 습득해야 할 뿐만 아니라 중복된 반복 검색 작업을 하여야 한다. 따라서, 이 논문에서는 이러한 문제 해결을 위해 독립적인 모티프 데이터베이스들의 자원을 분해하고, 합병하는 과정을 거쳐 하나의 통합된 모티프 데이터베이스를 구축하였다. 또한 데이터베이스의 각 엔트리당 단백질의 3차 구조 정보, 분류 정보, 샘플 정보의 지원을 가능케 하여 기존 검색 조건을 개선하였다. 이 데이터베이스 구축으로서 사용자는 모티프 데이터베이스 검색에 대한 streamline적인 검색이 가능할 뿐만 아니라 기존의 통합된 데이터베이스에서 지원되지 못한 구조 정보, 분류 정보 검색을 가능케 하였다.

  • PDF

A Study on Retrieval and Management of Efficient Design Patterns (효율적인 설계패턴의 검색 및 관리에 관한 연구)

  • Choi, Young-Keon;Kim, Gui-Joung;Song, Young-Jae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.535-538
    • /
    • 2000
  • 본 연구는 점차로 늘어가고 있는 설계 패턴의 효율적인 관리와 재사용을 위하여 패싯 방식을 이용한 패턴 분류와 검색 방법을 제안하고 이를 UML 다이어그램으로 나타낼 수 있도록 설계 구현하였다. 재사용 가능한 설계 패턴은 기본적인 특성을 기준으로 영역별로 라이브러리에 저장하고 각 패턴의 특성을 표현하기 위하여 패싯과 항목을 설정하였다. 또한 모든 패턴의 패싯 항목에 대해 유사성을 측정하여 관련 패턴을 찾을 수 있도록 하였으며, 패턴 분류 체계에 따라 패턴을 추가.갱신함으로써 적절한 경험을 자동화된 방식으로 제공할 수 있도록 하였다. 제안한 분류 방식은 검색 결과 Gamma의 분류방법을 사용했을 때 보다 질의 작성이 간단하고 관련 패턴을 쉽게 찾을 수 있어 재사용에 용이하며 이를 UML 다이어그램으로 표현할 수 있다.

  • PDF

A High-Speed Packet Classification Scheme For 2 Dimensional Filters (2 차원 필터에 대한 빠른 패킷 분류 기법)

  • 정상훈;윤현수;조정완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.593-595
    • /
    • 2003
  • 패킷 분류는 품질보장(QoS), VPN(Virtual Private Network), 고성능 방화벽(high speed firewall). 인터넷 사용료 부과(pricing)를 제공하는 차세대 라우터에 반드시 필요한 기능이다. 라우터는 송신 주소, 수신 주소. 프로토콜 타입. 흑은 포트 번호와 같은 패킷 헤더의 설러 필드를 주어진 필터 리스트와 비교하여 패킷을 분류한다. 기존에 제시된 하드웨어 기반의 패킷 분류 기법은 빠른 검색 시간을 제공하지만 확장성과 테이블 갱신 면에서 문제점이 있다. 본 논문에서는 하드웨어 기반의 빠르고 확장성있고 갱신이 가능한 2차원 필드 검색 기법을 제시한다. 차후 연구에서는 본 기법을 보다 면밀히 분석하고 다차원 필터 검색이 가능하도록 확장한 기법을 제시하겠다.

  • PDF