• Title/Summary/Keyword: 유사성 학습

검색결과 668건 처리시간 0.025초

확률적 부울(Boolean) 모델과 연관성 학습을 통한 내용기반 영상 검색 성능 향상 (Performance Improvement For Content-Based Image Retrieval Using Probabilistic Bollean Model And Relevance Learning)

  • 고병철;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.556-558
    • /
    • 2001
  • 전체 영상을 이용하지 않고 영상 안에 포함된 특정 객체 혹은 영역만을 이용하는 "영역에 의한 질의(query-by-region)" 방법은 내용기반 영상 검색 중 상위개념의 방법 이지만, 영상 분할의 한계, 여러개로 분할된 영역을 모두 검색하기 위한 인덱싱 문제, 유사성 측정 시 선형적으로 분리되지 않는 특징 값들에 대한 무리한 선형 조합으로 인한 검색 오류와 같은 많은 문제점을 안고 있다. 따라서 본 논문에서는 영역 기반 영상 검색 시스템인 FRIP에 대하여 영상 분할의 한계를 극복하고, 사용자의 주관성을 영상 검색에 적용하기 위해 확률적 연관성 학습 모델(MPFRL)을 유사성 측정 단계에서 적용 하였고, 아울러 검색 모델로는 기존에 일반적으로 사용되어 오던, 선형 모델을 사용하지 않고 선형 모델보다 유연한 검색 결과를 보여주는 확률적 이접 부울 모델(PDB)을 사용하였다. 또한, 검색 시간을 단축 시키기 위해, 선형 검색 방법에 부울 AND 연산자를 적용 시킴으로써, 검색 시간을 상당부분 단축 할 수 있었다. 실험 결과, 본 논문에서 제안하는 방법(MPFRL+PDB)을 사용할 경우 검색 결과가 선형 조합 보다 향상되는 것을 알 수 있었다. 아울러 사용자 피드백을 통해 사용자가 특징 가중치를 일일이 조절하지 않더라도 단순한 몇 번의 클릭만으로 사용자의 주관성을 반영하고 보다 정확한 검색 결과를 보여 줄 수 있는 시스템을 설계 할 수 있었다.

  • PDF

퍼지적분을 이용한 내용기반 검색 사용자 의견 반영시스템 (Relevance Feedback for Content Based Retrieval Using Fuzzy Integral)

  • Young Sik Choi
    • 인터넷정보학회논문지
    • /
    • 제1권2호
    • /
    • pp.89-96
    • /
    • 2000
  • 영상의 유사성에 대한 사용자의 주관적인지를 학습하는 방법으로 relevance feedback 기술이 사용되며, 최근 들어 이에 대한 관심이 높아지고 있다. 대부분의 relevance feedback기술은 영상 유사성을 측정하는데 사용되는 특징이 서로 독립적이라는 가정하고 있으나, 이러한 가정은 유사성 판단을 모델링 하는데 있어서 상당한 제약을 두는 것이다. 이 논문에서는. 퍼지 측정과 Choquet 적분을 이용하여, 유사성 판단에 대한 보다 나은 모델링 방법을 제안하고, 이를 이용한 relevance feedback 알고리즘을 제안한다. 실험결과를 통하여, 기존의 가중치 평균 방식에 의한 relevance feedback보다 제안된 방식이 우수함을 보인다.

  • PDF

심층 신경망의 발전 과정과 이해

  • 이재성
    • 정보와 통신
    • /
    • 제33권10호
    • /
    • pp.40-48
    • /
    • 2016
  • 본고에서는 최근 활발하게 연구되고 있는 심층 학습에 대하여 알아본다. 기계 학습 분야 중 하나인 심층 학습은 인공 신경망의 한 형태인 심층 신경망을 통해 구현된다. 심층 신경망은 기존 다층 신경망의 구조와 거의 유사한 학습 구조를 가지지만, 학습 과정에서 발생하는 부정확한 학습 문제를 해결함으로써 최근의 성공을 이끌어낼 수 있었다. 본고에서는 다층 신경망이 가지고 있던 문제점들을 심층 신경망에서 어떻게 극복하였는지 심층 신경망의 발전 과정을 통해 알아보고, 기계 학습의 기본개념을 바탕으로 이를 설명하여 비전문가들의 이해를 돕고자 하였다.

마코프 논리 기반의 시맨틱 문서 검색 (Semantic Document-Retrieval Based on Markov Logic)

  • 황규백;봉성용;구현서;백은옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권6호
    • /
    • pp.663-667
    • /
    • 2010
  • 본 논문은 질의 문서와 의미가 유사한 문서를 검색하는 문제를 다룬다. 이 문제에 대한 기본적인 접근법은 각 문서를 bag-of-words 형태로 표현한 후, 코사인 유사도 등의 거리 기준에 기반하여 유사 문서를 판별하는 것이다. 그러나, 이처럼 문서에 출현하는 단어에만 의존하는 검색 방법은 의미적 유사성을 제대로 반영하기 어렵다는 단점을 가진다. 본 논문에서는 이러한 문제를 극복하기 위해 데이터 기반의 감독 학습(supervised learning) 기법과 관련 온톨로지 정보를 마코프 논리(Markov logic)에 기반하여 결합한다. 구체적으로, 단어들 사이에 존재하는 관계를 표현한 온톨로지와 유사도가 태깅된 문서 데이터에서 마코프 논리 망(Markov logic network)을 학습하며, 학습된 마코프 논리 망과 문서 데이터 및 새로 주어진 질의 문서에 대한 추론을 통해 질의 문서와 의미적으로 유사한 문서를 검색하는 기법을 제안한다. 제안하는 접근법은 서울시의 민원서비스 홈페이지에서 수집된 실제 민원 데이터에 적용되었으며, 적용 결과, 단순한 문서 간 거리에 기반한 유사 문서 검색 기법에 비해 월등히 높은 정확도를 보였다.

이상 탐지를 위한 합성 데이터 생성 및 성능 분석 (Synthetic Data Generation and Performance Analysis for Anomaly Detection)

  • 황주효;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.19-21
    • /
    • 2022
  • 자기 지도 학습을 이용한 이상 탐지는 일반적으로 합성 데이터를 생성해 정상과 이상을 학습하고, 실제 이상 데이터를 테스트 데이터로 사용하여 이상 탐지 성능을 측정한다. 정상 데이터와 유사한 합성 데이터를 생성하기 위해 기존 연구에서는 원본 이미지에서 특정 패치를 자르고 붙이는 식으로 합성 데이터를 생성한다. 이런 방식에서 정상 데이터와 유사한 정도는 패치 개수와 크기에 따라 달라지므로 이상 탐지 성능에 영향을 미칠 수 있다. 본 연구에서는 패치 크기 및 개수를 다르게 하여 합성 데이터를 생성한 뒤 사전 학습된 모델을 사용하여 정상 데이터와의 유사성 측정 및 분석을 진행하였고 모델을 학습시켜 이상 탐지 성능을 측정하여 보았다.

  • PDF

벡터 공간 모델과 HAL에 기초한 단어 의미 유사성 군집 (Word Sense Similarity Clustering Based on Vector Space Model and HAL)

  • 김동성
    • 인지과학
    • /
    • 제23권3호
    • /
    • pp.295-322
    • /
    • 2012
  • 본 연구에서는 벡터 공간 모델과 HAL (Hyperspace Analog to Language)을 적용해서 단어 의미 유사성을 군집한다. 일정한 크기의 문맥을 통해서 단어 간의 상관성을 측정하는 HAL을 도입하고(Lund and Burgess 1996), 상관성 측정에서 고빈도와 저빈도에 다르게 측정되는 왜곡을 줄이기 위해서 벡터 공간 모델을 적용해서 단어 쌍의 코사인 유사도를 측정하였다(Salton et al. 1975, Widdows 2004). HAL과 벡터 공간 모델로 만들어지는 공간은 다차원이므로, 차원을 축소하기 위해서 PCA (Principal Component Analysis)와 SVD (Singular Value Decomposition)를 적용하였다. 유사성 군집을 위해서 비감독 방식과 감독 방식을 적용하였는데, 비감독 방식에는 클러스터링을 감독 방식에는 SVM (Support Vector Machine), 나이브 베이즈 구분자(Naive Bayes Classifier), 최대 엔트로피(Maximum Entropy) 방식을 적용하였다. 이 연구는 언어학적 측면에서 Harris (1954), Firth (1957)의 분포 가설(Distributional Hypothesis)을 활용한 의미 유사도를 측정하였으며, 심리언어학적 측면에서 의미 기억을 설명하기 위한 모델로 벡터 공간 모델과 HAL을 결합하였으며, 전산적 언어 처리 관점에서 기계학습 방식 중 감독 기반과 비감독 기반을 적용하였다.

  • PDF

머신러닝 기반 I형 곡선 거더 단경간 교량 지진 취약도 분석 (Seismic Fragility of I-Shape Curved Steel Girder Bridge using Machine Learning Method)

  • 전준태;주부석;손호영
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.899-907
    • /
    • 2022
  • 연구목적: 기계학습법을 이용하여 일반적인 직선 교량의 지진 취약도 분석 연구는 다수 수행되었으나 곡선 교량 구조물에 대한 연구 사례는 미미하다. 따라서 본 연구의 목적은 기계학습법 기반 I형 곡선 거더를 갖는 교량의 재료 특성 및 기하학적 불확실성을 고려한 지진 취약도 분석하는 것이다. 연구방법: 강재 및 콘크리트의 재료 특성과 교각의 높이를 불확실성 매개변수로 고려하였다. 라틴하이퍼큐브 기법을 이용하여 매개변수를 샘플링하였으며 지진파의 불확실성을 고려하여 시간이력해석을 수행하였다. 해석결과를 원본데이터로 인공신경망, 반응표면분석법을 적용하여 학습 데이터를 생성하였다. 최종적으로 원본 데이터 및 학습데이터를 이용하여 지진 취약도 분석을 수행하였다. 연구결과: 라틴하이퍼큐브 기법을 이용하여 매개변수를 샘플링하였으며 지진파의 불확실성을 고려하여 총 160회의 시간 이력해석을 수행하였다. 해석결과와 기계학습을 통해 얻어진 예측 값을 비교하였으며 두 값의 유사도를 비교하기 위해 결정계수를 비교하였다. 반응표변분석법의 결정계수가 0.737로 비교적 관측 값과 유사한 것으로 나타났다. 지진 취약도 곡선도 반응표면 분석법을 통해 예측된 값이 관측 값과 유사한 것으로 나타났다. 결론: 본 연구에서 유한요소 해석을 통해 관측된 값과 기계학습법을 통해 예측된 값을 비교하였을 때 반응표면 분석법이 관측값과 유사한 결과를 예측하는 것으로 나타났다. 하지만 두 가지 기계학습법 모두 관측 값에 비해 과소평가되는 것으로 나타났다.

챗봇 프레임워크 성능 향상을 위한 점진적 학습 기법 (Incremental Learning for Performance Enhancement of Chatbot Framework)

  • 박상현;박진욱;조수헌;현제혁;황진성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.283-284
    • /
    • 2019
  • 규칙 기반의 챗봇(Chatbot)은 개발자가 미리 지정한 키워드와 패턴을 통해 사용자의 의도(Intent)를 파악하기 때문에, 챗봇을 응용한 어플리케이션에서는 제한적인 활용도를 보인다. 본 논문에서는 위 문제를 해결하기 위해, 프레임워크 기반의 한글 자연어 처리 챗봇 성능 향상을 위한 점진 학습(Incremental Learning)을 제안한다. DialogFlow는 규칙 기반의 챗봇 프레임워크로서, 사용자 질의 패턴에 대한 사전 학습이 치명적이다. 제안하는 점진 학습 기법은 사용자 질의가 미리 학습되어 있지 않은 경우에도, 유사도 기반으로 질의의 의도를 결정할 수 있다. 이때 entity 조합과 기존에 학습된 질의들과의 유사도를 통해 의도를 결정하여, 프레임워크를 점진적으로 학습한다. 이를 적용하여 연세대학교 정보들을 제공하는 챗봇을 개발하고, 실험을 통해 제안된 점진 학습 기법은 기존 시스템보다 다양한 종류의 질의 처리가 가능하고, 더욱 빠른 응답 속도를 나타내는 것을 확인하였다. 또한 사용자가 증가함에 따라 점진 학습을 통해 성능이 더욱 증가하는 자가 학습 모형으로서의 우수함을 확인하였다.

  • PDF

LDA와 Local MLP를 이용한 얼굴 인식 (Face Recognition using LDA and Local MLP)

  • 이대종;최기선;전명근
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.212-216
    • /
    • 2006
  • MLP는 뛰어난 학습능력으로 인하여 많은 분야에 성공적으로 적용되고 있다. 그러나, 학습 방법으로서 최급경사법에 근거한 오차역전파 알고리즘을 적용하기 때문에 학습시간이 오래 걸리는 단점이 있다. 또한 입력차원의 크기가 크거나 클래스간 학습데이터의 유사성이 클 경우 최적의 파라미터를 구하는데는 한계가 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 LDA와 local MLP을 이용한 새로운 얼굴인식시스템을 제안하고자 한다. 제안된 방법은 우선 LDA 기법에 의해 차원이 축소된 얼굴의 특징벡터를 계산한다. 다음 단계로서 전체 학습영상을 사용하기 보다는 그룹별로 분할된 얼굴영상에 대해 MLP를 수행하므로서 그룹별로 최적인 파라미터를 결정한다. 마지막 단계로 그룹별로 수행된 local MLP를 결합함으로써 전체 얼굴인식 시스템을 구성한다. 제안된 방법의 타당성을 보이기 위해 ORL 얼굴영상을 대상으로 실험한 결과 기존 방법인 PCA나 LDA에 비해 향상된 결과를 보임을 확인할 수 있었다.

  • PDF

FCM을 이용한 퍼지 RBF 네트워크 (Fuzzy RBF Network using FCM)

  • 김재용;이상수;이준행;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.158-161
    • /
    • 2004
  • RBF 네트워크의 중간층은 클러스터링하는 층이다. 즉, 이 충의 목적은 주어진 자료 집합을 유사한 클러스터들(homogenous cluster)로 분류하는 것이다. 여기서 유사하다는 것은 입력 데이터들에 대한 특징 벡터 공간사이에서 한 클러스터내의 벡터들 간에 거리를 측정하여 정해진 반경 내에 존재하면 같은 클러스터로 분류하고 정해진 반경 내에 존재하지 않으면 다른 클러스터로 분류한다. 그러나 정해진 반경 내에서 클러스터링하는 것은 잘못된 클러스터를 선택하는 단점을 가지게 된다. 그러므로 중간층을 결정하는 .것은 RBF 네트워크의 전반적인 효율성에 큰 영향을 준다. 따라서 본 논문에서는 효율적으로 중간층을 결정하기 위한 방법으로 퍼지 C-Means 클러스터링 알고리즘을 적용한 퍼지 RBF 네트워크를 제안한다. 제안된 퍼지 RBF 네트워크의 학습은 크게 두 단계로 구분된다. 첫 번째 단계는 입력층과 중간층 사이에 퍼지 C-Means 알고리즘이 수행되고, 두 번째 단계는 중간층과 출력층 사이에 지도학습이 수행된다. 제안된 방법의 학습 성능을 평가하기 위하여 실제 주민등록증에서 추출한 숫자패턴에 적용한 결과, 기존의 RBF네트워크 보다 학습 성능이 개선된 것을 확인하였다.

  • PDF