• 제목/요약/키워드: 유클리디안

검색결과 118건 처리시간 0.024초

공간 데이터의 분포를 고려한 공간 엔트로피 기반의 의사결정 트리 기법 (A Spatial Entropy based Decision Tree Method Considering Distribution of Spatial Data)

  • 장윤경;유병섭;이동욱;조숙경;배해영
    • 정보처리학회논문지B
    • /
    • 제13B권7호
    • /
    • pp.643-652
    • /
    • 2006
  • 의사결정 트리는 데이터 마이닝의 분류와 예측 작업에 주로 사용되는 기법 중의 하나이다. 실생활에서 공간의사결정을 위한 분류를 수행할 때에는 인접 데이터의 위치와 분산도를 고려하는 것이 매우 중요하다. 기존의 공간 의사결정 트리는 데이터의 공간적 특성을 표현하기 위해 각 객체간의 유클리디안 거리비율을 엔트로피로 반영하여 트리 구축 시 이용하였다. 그러나 이것은 공간 객체간의 거리 비율만을 설명할 뿐 공간 차원에서의 데이터 분산 정도와 각 분류된 클래스간의 연관관계 등은 파악할 수 없다는 한계점이 있었다 본 논문에서는 분산도와 차별도 기반의 공간 엔트로피를 이용하여 공간 데이터의 분포도를 반영하는 공간 의사결정 트리를 제안한다 분산도는 분류된 클래스 내의 공간 객체 분포도를 나타내고 차별도는 다른 클래스 내 공간 객체와의 분포도 및 관계성을 나타낸다. 이러한 분산도와 차별도의 비율을 엔트로피 계산 시 이용함으로써 비공간적 속성으로 분류된 각 클래스가 공간적으로는 얼마나 뚜렷하게 분류되는지 알 수 있게 한다. 제안 기법은 정확성과 계산 비용에 있어서 기존 기법보다 각각 약 18%, 11%의 성능 향상을 보였다.

단면 형상 영상을 이용한 3차원 모델 검색 (3D Model Retrieval Using Sliced Shape Image)

  • 박유신;서융호;윤용인;권준식;최종수
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.27-37
    • /
    • 2008
  • 멀티미디어 기술과 콘텐츠의 발달로 3차원 데이터의 사용 범위가 넓어지고, 이를 보다 효율적으로 관리하고 검색하기 위한 시스템이 필요하다. 본 논문은 효율적인 3차원 모델의 형상 기반 검색을 하기위해 모델의 특징을 추출하는 단면 형상 영상 방법을 제안한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기에 불변해야 하므로 모델을 정규화 시키는 작업이 필요하다. 본 논문에서는 주성분 분석 방법을 이용하여 정규화하였다. 제안한 알고리즘은 주성분 분석을 통해 각 축의 방향 성분을 찾고, 각 축에 직교하는 n 개의 평면을 생성한다. 이 평면은 각 축의 방향과 직교 성분을 갖으며 단면 형상 영상을 구하는데 사용된다. 단면 형상 영상은 3차원 모델과 각 평면이 교차해서 생기는 2차원 평면 영상이다. 제안한 3차원 모델의 특징 기술자는 단면 형상 영상의 중심점과 2차원 형상(shape)을 이루는 직선까지의 유클리디안 거리(distance)값들의 분포도이다. 검색 성능 평가는 MPEG-7에서 제시한 표준 평가 방법인 표준화된 수정 검색 순위의 평균(ANMRR)을 이용하였고 제안한 방법의 우수성을 실험 결과를 통해 입증하였다.

PCA와 얼굴방향 정보를 이용한 얼굴인식 (Face recognition using PCA and face direction information)

  • 김승재
    • 한국정보전자통신기술학회논문지
    • /
    • 제10권6호
    • /
    • pp.609-616
    • /
    • 2017
  • 본 논문은 얼굴 인식에 있어 안정적인 인식률을 얻기 위해 입력 영상에 대한 좌우 회전정보를 사용하여 보다 안정적이며 높은 인식률을 내기위한 알고리즘을 제안한다. 제안하는 알고리즘은 웹 카메라 환경에서 얼굴 영상을 입력정보로 사용하여 향상된 인식률을 얻기 위해 영상의 사이즈 축소 및 밝기와 컬러에 대한 정보를 정규화한 후 전처리 과정을 거쳐 얼굴 영역만을 분할 검출한다. 검출된 후보 영역에 대해 주성분분석(PCA)을 적용하여 특징벡터를 구하여 얼굴을 분류한다. 또한 인식률의 오차 범위를 줄이기 위해 입력되는 얼굴 영상에 대한 방향성을 고려하여 좌 우 $45^{\circ}$ 회전 정보를 가진 영상을 대상으로 데이터 셋을 구성하여 PCA로 각각의 특징벡터를 구하였다. 구해진 특징벡터로 안정된 인식률을 얻기 위해 고유공간에 뿌린 후 각각의 특징들을 대상으로 유클리디안(euclidean distant) 거리를 비교하여 최종 얼굴을 인식한다. PCA에 의한 특징벡터는 저차원의 데이터이지만 얼굴을 표현하는데 있어 아무런 문제가 없으며 계산량이 적어 인식 속도도 빠를 수 있다. 본 논문에서 제안하는 방법은 기존의 다른 알고리즘에 비해 빠른 인식과 인식률의 안전성과 정확성을 향상시킬 수 있고 실시간 인식 시스템에도 사용할 수 있다.

단어 임베딩 및 벡터 유사도 기반 게임 리뷰 자동 분류 시스템 개발 (Development of An Automatic Classification System for Game Reviews Based on Word Embedding and Vector Similarity)

  • 양유정;이보현;김진실;이기용
    • 한국전자거래학회지
    • /
    • 제24권2호
    • /
    • pp.1-14
    • /
    • 2019
  • 게임은 소프트웨어 특성상 출시 후 사용자들의 반응을 빠르게 파악하여 개선하는 것이 중요하다. 하지만 구글 플레이 앱 스토어 등 사용자들이 게임을 다운로드하고 리뷰를 올릴 수 있는 대부분의 사이트들은 게임 리뷰에 대한 매우 제한적이고 모호한 분류 기능만을 제공한다. 따라서 본 논문에서는 사용자들이 사이트에 올린 게임 리뷰를 보다 명확하고 운영에 유용한 주제들로 자동 분류하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 리뷰에 포함된 단어들을 대표적인 단어 임베딩 모델인 word2vec을 사용하여 벡터들로 변환하고, 이 벡터들과 각 주제 간 유사도를 측정하여 해당 리뷰를 관련된 주제로 분류한다. 특히 분류 성능에 직접적인 영향을 미치는 벡터 간 유사도 측정 방법을 선택하기 위해 본 연구에서는 대표적인 벡터 간 유사도 측정 방법인 유클리디안 유사도, 코사인 유사도, 확장된 자카드 유사도의 성능을 실제 데이터를 사용하여 비교하였다. 또한 어떤 리뷰가 둘 이상의 주제에 해당하는 경우를 위해 임계값에 기반한 다중 분류 방법을 사용하였다. 구글 플레이 앱스토어의 실제 데이터를 사용한 실험 결과 본 시스템은 95%까지의 정확도를 보임을 확인하였다.

점진적 기계학습 기반의 레이더 위협체 역추정 모델 생성 및 갱신 (Managing the Reverse Extrapolation Model of Radar Threats Based Upon an Incremental Machine Learning Technique)

  • 김철표;노상욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.29-39
    • /
    • 2017
  • 다양한 전자전 상황에서 단위 위협체에 대하여 전자전 모델링과 시뮬레이션을 수행할 수 있는 통합 전자전 시뮬레이터의 개발 필요성이 대두되고 있다. 본 논문에서는 전자전 상황에서 전자정보 수집신호의 변수를 기반으로 전자파 신호를 발산하는 레이더 위협을 역추정하기 위한 시뮬레이션 시스템의 구성요소를 분석하고, 역추정 모델을 점진적으로 유지할 수 있는 방법을 제안한다. 또한, 실험을 통하여 점진적 역추정 모델 갱신 기법의 유효성 및 개별 역추정 결과의 통합 기법을 평가한다. 개별 역추정 모델의 생성을 위하여 의사결정트리, 베이지안 분류기, 인공신경망 및 유클리디안 거리 측정방식과 코사인 유사도 측정방식을 활용하는 군집화 알고리즘을 이용하였다. 첫 번째 실험에서 레이더 위협체에 대한 역추정 모델을 구축하기 위한 위협 예제의 크기를 점진적으로 증가시키면 역추정 모델의 정확도는 향상되었으며, 이러한 과정이 반복되면 역추정 모델에 대한 정확도는 일정한 값으로 수렴하였다. 두 번째 실험에서는 개별 역추정 모델의 결과를 통합하기 위하여 투표, 가중투표 및 뎀스터-쉐이퍼 알고리즘을 이용하였으며, 역추정 모델의 통합 결과는 뎀스터-쉐이퍼 알고리즘에 의한 역추정 정확도가 가장 좋은 성능을 보였다.

뇌 PET과 MR 영상의 자동화된 3차원적 합성기법 개발 (Development of an Automatic 3D Coregistration Technique of Brain PET and MR Images)

  • 이재성;곽철은;이동수;정준기;이명철;박광석
    • 대한핵의학회지
    • /
    • 제32권5호
    • /
    • pp.414-424
    • /
    • 1998
  • 목적: PET과 MR 영상을 체계적으로 합성i분석하여 각각의 영상기법이 갖는 단점을 보완하고 기능을 향상시킴으로써 보다 정확하고 유용한 임상정보를 얻을 수 있다. 두 영상을 공간적으로 합성하기 위해서 머리 표피 경계점들 간의 거리를 최소화하는 알고리즘을 이용할 경우 경계점 추출의 정확성 및 견실성과 거리 계산 속도가 합성 알고리즘의 성능을 결정하는 중요한 요소가 된다. 본 연구에서는 PET 영상의 경계 추출과 거리 계산 방법을 개선하고 이를 이용하여 PET과 MR 영상을 3차원적으로 합성하였다. 대상 및 방법: 공간적인 합성을 위한 영상처리기법의 핵심인 경계점 추출을 위해 PET영상에서는 방출스캔 sinogram의 경계를 강조한 후 재구성한 횡단면으로부터 2 mm 간격으로 머리 표피 경계점들을 추출하였으며 MR 영상에서는 각 횡단면마다 약 2도 간격으로 경계점들을 추출하였다. 두 영상의 모든 경계점들 간의 평균 유클리디안 거리를 최소화하는 3차원 가상공간 상에서의 위치 이동과 회전 각도를 최소자승법을 이용하여 구한 후 PET영상을 역 전환하여 위치 정합을 하였다. 평균 거리의 계산 속도를 향상시키기 위하여 고정된 대상의 각 경계점을 중심으로 하여 주변 공간 정들에서의 거리를 순차적으로 계산하고 이들의 최소값을 취하는 방법으로 거리지도를 구성하였으며 최소자승법에서 경계점들 간의 위치가 변할 때마다 매번 평균거리를 다시 계산하지 않고 거리지도를 참조하여 평균 거리를 산출하는 방법을 사용하였다. 위치 정합된 두 영상의 동시 표현을 위하여 PET 영상의 화소값에 $0.4{\sim}0.7$부터 1사이의 범위로 정규화된 MR 영상의 화소 값으로 가중치를 주는 가중정규화 방법을 사용하였다. 결과: 방출스캔의 sinogram을 이용함으로써 PET영상의 경계를 견실하게 추출할 수 있었으며, 거리지도를 이용하여 거리 계산을 한 결과 계산 속도를 향상시킬 수 있었다. 정상인의 뇌영상에 대해 위치 정합을 실시한 결과 평균 거리 오차는 2mm 이하였다. 가중정규화 방법을 사용하였을 때 합성된 영상의 정성적인 식별 명확도가 향상하였다. 결론: 견실한 PET 영상 경계점 추출과 거리지도를 이용한 계산 속도의 향상을 통해 뇌 PET과 MR 영상 합성기법의 성능을 개선할 수 있었으며 이를 이용하며 개발한 영상정합 프로그램은 임상 환경에서 유용하게 사용될 수 있을 것이다.

  • PDF

지능형 검색엔진을 위한 색상 질의 처리 방안 (Color-related Query Processing for Intelligent E-Commerce Search)

  • 홍정아;구교정;차지원;서아정;여운영;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.109-125
    • /
    • 2019
  • 지능형 전자상거래 검색 엔진에 대한 관심이 커지면서, 검색 상품의 특징을 지능적으로 추출하고 활용하기 위한 연구들이 수행되고 있다. 특히 전자상거래 지능형 검색 엔진에서 상품을 검색 할 때, 제품의 색상은 상품을 묘사하는 중요한 특징 중에 하나이다. 따라서 사용자의 질의에 정확한 응답을 위해서는 사용자가 검색하려는 색상과 그 색상의 동의어 및 유의어에 대한 처리가 필요하다. 기존의 연구들은 색상 특징에 대한 동의어 처리를 주로 사전 방식으로 다뤄왔다. 하지만 이러한 사전방식으로는 사전에 등록되지 않은 색상 용어가 질의에 포함된 경우 처리하지 못하는 한계점을 가지고 있다. 본 연구에서는 기존에 사용하던 방식의 한계점을 극복하기 위하여, 실시간으로 인터넷 검색 엔진을 통해 해당 색상의 RGB 값을 추출한 후 추출된 색상정보를 기반으로 유사한 색상명들을 출력하는 모델을 제안한다. 본 모델은 우선적으로 기본적인 색상 검색을 위해 671개의 색상명과 각 RGB값이 저장된 색상 사전을 구축하였다. 본 연구에서 제시한 모델은 특정 색상을 검색하는 것으로 시작하며, 검색된 색상이 색상 사전 내 존재하는 지 유무를 확인한다. 사전 내에 검색한 색상이 존재한다면, 해당 색상의 RGB 값이 기준 값으로 사용된다. 만일 색상사전 내에 존재하지 않는다면, Google 이미지 검색 결과를 크롤링하여 각 이미지의 특정 영역 내 RGB값들을 군집화하여 구한 평균 RGB값을 검색한 색상의 기준 값으로 한다. 기준 RGB값을 앞서 구축한 색상 사전 내의 모든 색상의 RGB 값들과 비교하여 각 R, G, B 값에 있어서 ${\pm}50$ 내의 색상 목록을 정렬하고, RGB값 간의 유클리디안 거리 유사도를 활용하여 최종적으로 유사한 색 상명들을 출력한다. 제안 방안의 유용성을 평가하기 위해 실험을 진행하였다. 피설문자들이 생각하는 300 개의 색상 이름과 해당 색상 값을 얻어, 본 연구에서 제안한 방안을 포함한 총 네가지 방법을 통해 얻은 RGB 값들과 피설문자가 지정한 RGB값에 대한 비교를 진행했다. 인간의 눈을 반영하는 측정 기준인 CIELAB의 유클리드안거리는 평균 13.85로 색상사전만을 활용한 방안의 30.88, 한글 동의어사전 사이트인 워드넷을 추가로 활용한 방안의 30.38에 비해 비교적 낮은 색상 간의 거리 값을 보였다. 연구에서 제시하는 방안에서 군집화 과정을 제외한 방안의 색 차는 13.88로 군집화 과정이 색 차를 줄여준다는 것을 확인할 수 있었다. 본 연구에서는 기존 동의어 처리 방식인 사전 방식이 지닌 한계에서 벗어나기 위해, 사전 방식에 새로운 색상명에 대한 실시간 동의어 처리 방식을 결합한 RGB값 기반의 새로운 색상 동의어 처리 방안을 제안한다. 본 연구의 결과를 활용하여 전자상거래 검색 시스템의 지능화에 크게 기여할 수 있을 것이다.

Emoticon by Emotions: 소비자 감성 기반 이모티콘 추천 시스템 개발 (Emoticon by Emotions: The Development of an Emoticon Recommendation System Based on Consumer Emotions)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.227-252
    • /
    • 2018
  • 인터넷의 발달을 통해 지속적으로 인스턴트 커뮤니케이션이 발달해왔다. 인스턴트 커뮤니케이션에서 가장 대표적인 것이 메신저 애플리케이션이다. 메신저 애플리케이션에서 이모티콘은 송신자의 감정 전달을 보완하기 위해 활용됐다. 메신저 애플리케이션 송신자의 감정 전달에 약한 모습을 보이는데 그 이유는 면대면 커뮤니케이션이 아니기 때문이다. 이모티콘은 과거 화자의 기분 상태를 나타내는 기호로만 사용됐다. 그러나 현재는 이모티콘은 감정 전달 뿐만 아니라 개인의 특성과 개성을 나타내고 싶어 하는 소비자의 심리를 반영하는 형태로 발전해가고 있다. 이모티콘의 사용 환경이 개선되었고, 이모티콘 자체가 발전함으로써 이모티콘 자체에 대한 관심도는 증가하였다. 대표적인 예로 카카오톡, 라인, 애플 등에서 서비스를 진행하고 있으며, 관련 컨텐츠 상품의 매출도 지속적으로 증가할 것으로 전망하고 있다. 이모티콘 자체의 관심도 증가와 관련 사업의 성장세에도 불구하고 현재 적절한 이모티콘 추천 시스템이 부재하다. 국내 점유율 90% 이상의 메신저 애플리케이션인 카카오톡조차 단순히 인기 순이나 최근 순, 혹은 간략한 카테고리 별로 분류한 정도이다. 소비자들은 원하는 이모티콘을 찾기 위해서 스크롤을 계속해서 내려야 하는 불편함이 있으며, 본인이 원하는 감성의 이모티콘을 찾기 어렵다. 소비자들이 편의성 향상과 기업의 이모티콘 관련 사업의 판매 매출 증가를 위해 소비자가 원하는 이모티콘을 추천해줄 수 있는 이모티콘 추천 시스템이 필요하다. 적절한 이모티콘을 추천하기 위해서 소비자가 이모티콘을 보고 느낀 감성에 대해 정량화할 필요성이 있다. 정량화를 통해 소비자가 원하는 이모티콘 셋이 가진 특징과 감성에 대해 분석할 수 있으며, 분석 결과를 토대로 소비자에게 이모티콘을 추천할 수 있다. 이모티콘은 메타데이터화의 방법으로 정량화가 가능하다. 메타데이터화 방법은 빅데이터 시대에 비정형, 반정형 데이터에 대해서 의미를 추출하기 위해 데이터를 구조화 혹은 조직화하는 작업이다. 비정형 데이터인 이모티콘을 메타데이터화를 통해 구조화한다면, 쉽게 소비자가 원하는 감성 형태로 분류할 수 있을 것으로 생각한다. 정확한 감성을 추출하기 위해 감정과 관련된 선행 연구를 통해 7개의 공통 감성 형용사와 한국어에서만 나타나는 은유 혹은 표현적 특징들을 반영하기 위해 하위 세부 표현들까지 고려했다. 이모티콘의 가장 큰 특징인 캐릭터를 기반으로 "표상", "형상", "색상"의 범주에서 세부 하위 감성들을 수집했다. 정확도 높은 추천 시스템을 설계하기 위해 감성 지표만이 아니라 객관적 지표도 고려하였다. 메타데이터화 방법을 통해 이모티콘이 갖고 있는 캐릭터의 특징을 객관적 지표로 14개, 감성 지표로 활용하기 위해 감성 형용사를 36개를 추출하였다. 추출된 감성 형용사는 대비되는 형용사로 구성하여 총 18개로 줄였으며, 18개의 감성 형용사는 카카오톡의 이모티콘을 인기 순으로 임의의 40개 셋을 대상으로 측정하였다. 측정을 위해 이모티콘을 평가할 조사 대상자 온라인으로 모집하였고, 277명의 20~30대의 이모티콘을 구매한 경험이 있는 소비자를 대상으로 설문을 진행하였다. 설문응답자에게 서로 다른 5개의 이모티콘 셋을 평가하도록 하였다. 평가 결과 수집된 18개의 감정 형용사는 요인분석을 통해 감성 지표 요인으로 추출하였다. 추출된 소비자 감성 지표의 요인은 "코믹", "부드러움", "모던함", "투명함"이었다. 이모티콘의 객관적 지표와 감성 지표 요인을 활용하여 소비자 만족과의 관계를 분석하였고, 객관적 지표와 감성 지표 간의 관계도 분석하였다. 이 과정에서 객관적 지표가 소비자 태도에 바로 영향을 주는 것이 아니라 감성 지표 요인을 통해 소비자 태도에 영향을 주는 매개 효과가 있음을 확인하였다. 분석 결과는 소비자의 감성 평가 메커니즘을 밝혀냈고, 소비자의 이모티콘 감성 평가 메커니즘은 객관적 지표가 감성 지표 요인에 영향을 미치며, 감성 지표 요인은 소비자 만족에 영향을 미치는 관계였다. 따라서 감성 지표 요인의 네 가지만으로 이모티콘 추천 시스템을 설계하였고, 추천 방법은 각 감성과의 거리를 유클리디안 거리로 측정하여 거리의 차가 0에 가까울수록 비슷한 감성으로 정의하였다. 본 연구에서 제안한 이모티콘 시스템의 검증을 위해 각 감성 지표 요인과 소비자 만족의 평균을 지표 값으로 활용하여 각 이모티콘 셋의 감성 패턴을 그래프로 비교하였고, 추천된 이모티콘들과 선택된 이모티콘이 대체로 비슷한 패턴을 그리는 것을 확인하였다. 정확한 검증을 위해 사전 조사하였던 소비자를 대상으로 이모티콘 추천 시스템이 제시한 결과와 유사하게 평가하였는지 유사 순위를 세 구간으로 나누어 비교하였고, 순위별 예측 정확도는 결과 1순위 81.02%, 2순위 76.64%, 3순위 81.63%였다. 본 연구의 결과는 학문적, 실무적으로 다양한 분야에서 활용 가능한 방법론을 제시하였으며, 기존에 없던 이모티콘 추천 시스템의 설계를 통해 소비자에게는 편의와 이모티콘을 서비스하는 기업에는 매출증대의 효과를 가져올 것으로 예상한다. 그리고 본 연구를 통해 지능형 이모티콘 시스템으로 발전할 수 있는 단초를 제공했다는 점에서 의미가 있다. 본 연구에서 제안한 감성 요인들을 활용하여 감성 라이브러리로 사용함으로써, 새로운 이모티콘 출시 시 감성 평가의 지표로 활용할 수 있다. 축적된 감성 라이브러리와 기업의 판매 데이터, 매출 정보, 소비자 데이터를 결합하여 본 연구에서 제안한 추천 시스템을 복합형 추천 시스템으로 발전시켜 단순 소비자의 편의성이나 매출 증가뿐만 아니라 기업에서 전략적으로 활용 가능한 지적 자산으로 활용할 수 있을 것으로 판단한다.