• 제목/요약/키워드: 랭크 알고리즘

검색결과 48건 처리시간 0.027초

Sparse and low-rank feature selection for multi-label learning

  • Lim, Hyunki
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권7호
    • /
    • pp.1-7
    • /
    • 2021
  • 본 논문에서는 다중 레이블 분류를 위한 특징 선별 기법을 제안한다. 기존 많은 특징 선별 기법들은 상호정보척도 등을 이용하여 특징과 레이블 사이의 연관성을 계산하여 특징을 선별하였다. 하지만 상호정보척도는 결합 확률을 요구하기 때문에 실제 전제 특징 집합에서 결합 확률을 계산하는 것은 어렵다. 따라서 소수의 특징만 계산이 가능하여 지역적 최적화만 가능하다는 단점을 가진다. 이런 지역적 최적화 문제를 피해, 주어진 특징 전체 공간에서 저랭크 공간을 구성하고, 희소성을 가진 특징들을 선별할 수 있는 특징 선별 기법을 제안한다. 이를 위해 뉴클리어 노름을 이용해 회귀 기반의 목적함수를 설계하였고, 이 목적 함수의 최적화 문제를 풀기 위한 경사하강법 방식의 알고리즘을 제안하였다. 4가지의 데이터와 3가지 다중 레이블 분류 성능을 기준으로 다중 레이블 분류 실험 결과를 통해 제안하는 방법론이 기존 특징 선별 기법보다 좋은 성능을 나타내는 것을 보였다. 또한 제안하는 목적함수의 파라미터 값 변화에도 성능 변화가 둔감한 것을 실험적인 결과로 확인하였다.

개인별 유전자 네트워크 구축 및 페이지랭크를 이용한 환자 특이적 암 유발 유전자 탐색 방법 (Cancer Patient Specific Driver Gene Identification by Personalized Gene Network and PageRank)

  • 정희원;박지우;안재균
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.547-554
    • /
    • 2021
  • 암을 유발하는 유전자는 모든 암 환자에게 공통적인 것은 아니며, 이러한 환자 특이적 암 유발 유전자의 탐색은 개인 맟춤형 암 치료 및 항암제 개발에 있어서 매우 중요하다. 환자 특이적 암 유발 유전자를 찾기 위한 생물 정보학 연구들이 있어왔지만, 아직 정확도 면에서는 발전의 여지가 있다. 본 논문에서는 환자 특이적 암 유발 유전자를 탐색하기 위하여 NPD (Network based Patient-specific Driver gene identification)라는 방법을 제안한다. NPD는 환자 특이적 유전자 네트워크를 구축하고, 여기에 수정된 PageRank 알고리즘을 적용하여 유전자에 점수를 부여한 후, 유전적 변이 데이터를 사용한 승률 계산 방법을 통하여 암 유발 유전자를 찾는 세 단계로 이루어진다. TCGA 데이터 베이스의 여섯 개의 암 데이터에 NPD를 적용한 결과, NPD가 기존의 환자 특이적 암 유발 유전자 탐색 방법들보다 전체적으로 높은 F1 점수를 보여줌을 확인할 수 있었다.

IHP 알고리즘을 이용한 SIMO 시스템용 적응 직접 결정 등화기 연구 (An Adaptive Decision-Directed Equalizer using Iterative Hyperplane Projection for SIMO systems)

  • 이원철
    • 한국통신학회논문지
    • /
    • 제30권1C호
    • /
    • pp.82-91
    • /
    • 2005
  • 본 논문은 iterative hyperplane projection 을 이용한 효율적인 APA(affine projection algorithm)을 소개한다. 다양한 적응 알고리즘들 중 APA는 랭크 부족 문제를 해결하며 고속 수렴의 특성 때문에 다양한 응용분야에 적용되고 있다. SIMO(Single-Input-Multiple-Output) 시스템을 위한 STDE(Space-Time Decision- directed Equalizer) 적용 시 흔히 단일 채널 환경에서 발생하는 "shifting invariance property"를 이용할 수 없으므로 인해 FTF(Fast Transversal Filter)와 같이 저 복잡도를 갖는 고속 적응 알고리즘을 사용할 수 없다. 따라서 APA 기반의 STDE 기능을 수행하는 과정에서 SMI(Sample Matrix Inversion) 처리가 불가피하며, 계산상의 복잡도가 증가하게 된다. 이러한 문제점을 해결하고자 본 논문에서는 APA 기법 고유의 우수한 추적 특성 및 고속 수렴 성질을 유지하면서, 낮은 복잡도를 갖는 IHP(Iterative Hyperplane Projection) 알고리즘 기반의 효율적인 수정 APA 기법을 소개한다. 제안된 IHP 기반 APA 기법의 성능을 확인하기 위하여, 무선 SIMO 채널 환경 하에서 제안된 IHP-APA 알고리즘을 적용한 STED에 대한 비트 에러 오률 (BER) 특성과 계산량 분석을 통해서 우수성을 입증하였다.

Haar-like Feature 및 CLNF 알고리즘을 이용한 차량 번호판 인식 (A Vehicle License Plate Recognition Using the Haar-like Feature and CLNF Algorithm)

  • 박승현;조성원
    • 스마트미디어저널
    • /
    • 제5권1호
    • /
    • pp.15-23
    • /
    • 2016
  • 본 논문은 한국의 차량 번호판 인식에 효과적인 방법을 제안한다. 획득한 자동차 이미지로부터 Haar-Like Feature를 이용해 대략적인 번호판 후보 영역을 찾아낸 후, 랭크 필터를 사용하여 전처리를 하고 캐니 에지 추출 (Canny Edge Detecting) 알고리즘을 이용하여 연결된 사각형을 찾아 번호판을 추출한다. 추출된 번호판의 색상 정보를 이용하여 흰색/녹색 번호판을 구분하고, 각 번호판을 OTSU 이진화와 주변 전경 픽셀 전파 알고리즘인 CLNF (CCLUF with NFPP)을 통해 문자를 제외한 잡음을 제거하고 레이블링하여 숫자 및 문자 영역을 분리한다. 분리된 문자 영역은 메쉬 방법 및 세선화 후 X-Y 투영 방법으로 특징 벡터를 추출한다. 추출된 특징 벡터는 역전파 알고리즘을 사용하여 학습된 신경망을 이용하여 문자 인식을 수행한다. 제안된 차량 번호판 인식 알고리즘의 효과적 동작은 실험을 통해 확인하였다.

무손실 인덱스 영상 압축을 위한 적응적 랭크-리인덱싱 알고리즘 (Adaptive Rank-Reindexing Algorithm for Lossless Index Image Compression)

  • 이한정;유기형;김형무;유강수;곽훈성
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제54권8호
    • /
    • pp.501-503
    • /
    • 2005
  • In this paper, using ranks of co-occurrence frequency about indices in pairs of neighboring pixels, we introduce a new re-indexing algorithm for efficiency of index color image lossless compression. The proposed algorithm is suitable for arithmetic coding because it has concentrated distributions of small variance. Experimental results proved that the proposed algorithm reduces the bit rates than other coding schemes, more specifically $15\%$, $54\%$ and $12\%$ for LZW algorithm of GIF, the plain arithmetic coding method and Zeng's scheme, respectively.

단어 근접도를 반영한 단어 그래프 기반 질의 확장 (Query Expansion based on Word Graph using Term Proximity)

  • 장계훈;조승현;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.754-757
    • /
    • 2010
  • 질의 확장은 초기 검색결과에서 질의와 연관된 단어를 선택하여 질의를 확장함으로써 검색 성능을 향상시키는 기법이다. 페이지 랭크(PageRank) 알고리즘은 웹문서 사이의 링크구조를 이용하여 문서들의 상대적인 중요성을 측정하기 위해 제안되었다. 본 논문에서는 문서들 사이의 관계가 아니라 문서 안에서 단어 그래프(Word Graph)를 통해 단어들 사이의 상대적인 중요성을 계산하였다. 질의와 가까이 위치한 단어들 사이의 관계를 단어 그래프에 적용하여 중요도를 계산하고 확장단어를 선택한다. 본 논문의 유효성을 검증하기 위해 웹문서 집합인 TREC WT10g 에 대해 실험하였고, 적합모델(Relevance Model)보다 MAP(Mean Average Precision)가 4.1% 향상되었다.

특화된 정보에 대한 Tag 기반 연속정보검색 시스템 (A Continuous Information Retrieval System Based-on Tag for Specialized Data)

  • 이기은;박영호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1474-1477
    • /
    • 2011
  • 정보화 사회에 접어 들면서 정보를 판별하는 능력이 중요시 되고 있다. 그러나 정보가 점점 이질적이고 방대해 짐에 따라 사용자의 의도와 목적에 맞는 정보를 빠르고 정확하게 찾아내는 것이 어렵다. 정보검색 서비스를 제공하는 국내외 포털 사이트에서는 랭크 알고리즘을 이용하여 사용자에게 정보를 제공한다. 그러나 사용자의 요구를 충족시키기 위해 랭킹보다 더 중요한 것 정보를 압축시켜 사용자에게 사용자가 원하는 정보만 제공하는 것이다. 따라서 본 논문에서는 도메인을 제한하여 특화된 정보를 제공하며 사용자 위주의 더 특화된 정보를 제공하는 친구추가 기능을 제안한다. 동시에 주 검색 기능으로 사용자가 등록한 태그 링크를 따라 클릭하면서 연속적으로 정보 검색을 할 수 있는 연속정보검색을 제안한다. 그리고 제안한 시스템을 실제 웹 사이트를 구현을 통해 나타낸다. 제안한 시스템은 사용자에게 효율적으로 유용한 정보를 제공하는 기대효과가 있다.

PageRank 특징을 활용한 RDP기반 내부전파경로 탐지 및 SHAP를 이용한 설명가능한 시스템 (RDP-based Lateral Movement Detection using PageRank and Interpretable System using SHAP)

  • 윤지영;김동욱;신건윤;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권4호
    • /
    • pp.1-11
    • /
    • 2021
  • 인터넷이 발달함에 따라 다양하고 복잡한 사이버공격들이 등장하기 시작했다. 공격들을 방어하기 위해 네트워크 외부에서 다양한 방식의 탐지 시스템들이 활용되었으나 내부에서 공격자를 탐지하는 시스템 및 연구는 현저히 드물어 내부에 들어온 공격자를 탐지하지 못해 큰 문제를 야기하기도 했다. 이를 해결하고자 공격자의 움직임을 추적하고 탐지하는 내부전파경로 탐지 시스템에 대한 연구가 등장하기 시작했다. 특히 그중에서도 Remote Desktop Protocol(RDP) 내 특징을 추출해 탐지하는 방식은 간편하면서도 매우 좋은 결과를 나타내었다. 하지만 그럼에도 불구하고 이전 연구들은 각 로그온 된 노드들 자체의 영향 및 관계성을 고려하지 않았으며, 제시된 특징 또한 일부 모델에서는 떨어지는 결과를 제공하기도 했다. 또한 왜 그렇게 판단했는지 판단에 대해 설명하지 못한다는 문제점도 존재했다. 이는 결과적으로 모델의 신뢰성 및 견고성 문제를 야기하게 된다. 이를 해결하기 위해 본 연구에서는 PageRank 특징을 활용한 RDP기반 내부전파경로 탐지 및 SHAP를 이용한 설명가능한 시스템을 제안한다. 페이지랭크 알고리즘과 여러 통계적인 기법을 활용해 여러 모델에서 활용 가능한 특징들을 생성하고 SHAP을 활용해 모델 예측에 대한 설명을 제공한다. 본 연구에서는 이전 연구에 비해 대부분의 모델에서 더 높은 성능을 보여주는 특징을 생성했고 이를 SHAP을 이용해 효과적으로 증명했다.

대용량 그래프 압축과 마이닝을 위한 그래프 정점 재배치 분산 알고리즘 (A Distributed Vertex Rearrangement Algorithm for Compressing and Mining Big Graphs)

  • 박남용;박치완;강유
    • 정보과학회 논문지
    • /
    • 제43권10호
    • /
    • pp.1131-1143
    • /
    • 2016
  • 수십억 개 간선들로 구성된 대용량 그래프를 어떻게 효과적으로 압축할 수 있을까? 정점 재배치를 통해 인접 행렬의 0이 아닌 값들을 집중시키면 그래프를 효율적으로 압축할 수 있을 뿐 아니라 페이지랭크 등 여러 그래프 마이닝 알고리즘의 수행 속도를 개선할 수 있다. 최신 정점 재배치 기법인 SlashBurn은 실세계 네트워크의 멱법칙 특성을 활용하는 실세계 그래프에 효과적인 방법이다. 하지만 단일 머신 기반으로 설계되어 대용량 그래프에 대해 처리 속도가 현저히 느려지거나 적용이 불가능한 한계가 있다. 본 논문에서는 이러한 한계를 극복하기 위한 분산 SlashBurn을 제안한다. 분산 SlashBurn은 대규모의 정점 재배치 프로세스를 분산 처리하여 대용량 그래프를 기존 방법보다 훨씬 빠르고 확장성 있게 처리한다. 대용량 실세계 그래프들에 대한 실험 결과, 분산 SlashBurn은 단일 머신 SlashBurn보다 45배 이상 빠르게 동작하였고, 16배 이상 큰 그래프를 처리할 수 있었다.

질의 어휘와의 근접도를 반영한 단어 그래프 기반 질의 확장 (Query Expansion based on Word Graph using Term Proximity)

  • 장계훈;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.37-42
    • /
    • 2012
  • 잠정적 적합성 피드백모델은 초기 검색 결과의 상위에 순위화된 문서를 적합 문서라 가정하고, 상위문서에서 빈도가 높은 어휘를 확장 질의로 선택한다. 빈도수를 이용한 질의 확장 방법의 단점은 문서 안에서 포함된 어휘들 사이의 근접도에 상관없이 각 어휘를 독립적으로 생각한다는 것이다. 본 논문에서는 어휘빈도를 이용한 질의 확장을 대체할 수 있는 어휘 근접도를 반영한 단어 그래프 기반 질의 확장을 제안한다. 질의 어휘 주변에 발생한 어휘들을 노드로 표현하고, 어휘들 사이의 근접도를 에지의 가중치로 하여 단어 그래프를 표현한다. 반복된 연산을 통해 확장 질의를 선택함으로써 성능을 향상시키는 기법을 제안한다. 유효성 검증을 위해 웹문서 집합인 TREC WT10g 테스트 컬렉션에 대한 실험에서 언어모델 보다 MAP 평가 기준에서 6.4% 향상됨을 보였다.