• 제목/요약/키워드: 클러스터링모형

검색결과 60건 처리시간 0.023초

Generalized Clustering Network를 이용한 전방향 학습 알고리즘 (Feed-forward Learning Algorithm by Generalized Clustering Network)

  • 민준영;조형기
    • 한국정보처리학회논문지
    • /
    • 제2권5호
    • /
    • pp.619-625
    • /
    • 1995
  • 본 연구에서는 역전파(backpropagationlk)학습 알고리즘에 대체될 수 있는 전방향 학습 알고리즘에 준하는 혼합 인식모형을 구성한다. 본 알고리즘은 Nikhil R. Pal (1993)이 제안한 GLVQ(Generalized Learning Vector Quantization)를 이용하여 패턴을 클러스터링 한 다음 비유사성(dissimilarity)을 가진 패턴끼리 재구성(regrouping) 하여 단순 퍼셉트론(simple perceptron)을 이용하여 group별 학습을 한다. 일반적으로 역전파학습인 학습시간이 많이 소요된다는 단점이 있다[1]. 본 알고리즘의 특징으로 는 feed-forward학습이기 때문에 학습시간이 단축될 뿐만 아니라 전체 패턴을 그룹별 로 나누어 학습을 하기 때문에 인식률도 향상 시킬 수 있다. 본 알고리즘에 적용한 데 이타는 250개의 ASCII코드를 16$\times$8격자에 정규화시킨 비트 패턴(bit pattern)을 이용 하였다. 실험결과 250개의 패턴을 10개의 클러스터로 나누어 학습을 시켰을 때 각 클 러스터별 평균반복횟수 94.7회만에 250개의 ASCII코드를 100% 인식할 수 있었다.

  • PDF

Personalized Size Recommender System for Online Apparel Shopping: A Collaborative Filtering Approach

  • Dongwon Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.39-48
    • /
    • 2023
  • 본 연구는 의류의 디자인 간 치수의 불일치와 비표준화로 인해 온라인 구매 시 발생하는 치수 선택의 오류 문제를 해결할 수 있는 방안을 제시하기 위해 수행되었다. 본 논문은 구매자에게 개인화된 치수를 제시할 수 있는 기계 학습 기반 추천 시스템의 구현 방안을 다루고 있다. 온라인 상거래로부터 발생된 구매 데이터를 사용하여 비음수 행렬 분해(NMF), 특이값 행렬 분해(SVD), k-최근접 이웃(KNN), 공동 클러스터링(Co-Clustering) 등 여러 검증된 협업 필터링 알고리즘을 훈련하였고, 이들 간에 성능을 비교하였다. 연구 결과, 비음수 행렬 분해 (NMF) 알고리즘이 다른 알고리즘들보다 뛰어난 성능을 보임을 확인할 수 있었다. 동일한 계정을 사용하는 여러 구매자가 포함되는 구매 데이터의 특성에도 불구하고, 제안 모형은 충분한 정확도를 보였다. 본 연구의 결과는 치수 선택의 오류로 인한 반품률을 감소하고 전자상거래 플랫폼에서의 고객 경험을 향상시키는 데 기여할 것으로 기대된다.

강소농의 공간적 분포특성과 결정요인 분석 -사과를 중심으로- (The Spatial Distribution Characteristics and Determinants of Strong Small Farm: Focusing on Apples)

  • 김현중;이성우
    • 농촌지도와개발
    • /
    • 제19권4호
    • /
    • pp.961-987
    • /
    • 2012
  • 본 연구는 강소농의 개념 정립을 통해 사과를 대상으로 강소농의 공간적 분포특성과 결정요인을 분석하였으며, 2010년 농림어업총조사 자료를 활용하였다. 공간적 분포특성은 공간 클러스터링 기법을 이용하여 과수 강소농 가구가 어느 지역에 집중적으로 분포하는지를 분석하였다. 강소농과 비강소농의 이산적인 형태의 종속변인을 구성한 후, 프로빗 모형을 활용, 인구 경제적, 경영 특성 등의 독립변인을 통제한 상태에서 사과 강소농의 결정요인을 분석하였다. 분석결과, 2010년 현재 사과 강소농은 모두 1,529가구로 분석되었으며, 이들 가구들은 경상북도에 밀집하여 분포하는 것으로 드러났다. 강소농의 결정요인은 농가의 소득 결정요인과 유사한 결과를 보였다. 사과 주산지에 입지하고 있고, 정보화가 높은 농가일수록, 그리고 생산자 조직에 참여하고 있으며, 직접 판매를 하는 농가일수록 강소농일 확률이 높게 나타났다. 본 연구의 분석결과는 강소농 정책을 육성하는데 있어 반드시 요구되는 강소농의 특성을 파악하였다는 측면에서 향후 강소농 육성 정책에 다양한 기초자료를 제공할 수 있으리라 판단된다.

개발도상국의 과학기술단지(STP) 건립을 위한 한국의 전략 : 에콰도르, 카자흐스탄의 사례를 중심으로 (The Korean Strategy for the Science and Technology Park of the Developing Countries : The cases of Ecuador and Kazakhstan)

  • 김종진;최종인
    • 벤처창업연구
    • /
    • 제7권4호
    • /
    • pp.131-141
    • /
    • 2012
  • 우리나라의 단기간 내 급성장은 많은 개발도상국의 벤치마킹 대상이 되고 있다. 이 가운데 과학기술분야의 과학기술단지(STP) 경험은 각국이 도입하기 위해 노력중이다. 자원강대국인 에콰도르와 카자흐스탄은 ODA 협력대상국으로 대덕특구의 STP 모형을 벤치마킹 중에 있다. 이 들 두 국가의 요구를 파악하고, 우리가 제공 가능한 요인은 무엇인지, 그리고 어떻게 이를 효과적으로 실천에 옮길 수 있는가를 파악하고자 한다. 본 논문은 현지국에 STP를 건립하는데 대덕특구의 건립 및 운영경험을 토대로 여섯 가지 제안을 하고 있다. 첫째, 인적자원 확보 전략이다. 개발도상국에서 필요한 것은 지식과 기술이며 이 지식과 기술은 사람에 체화된 지식이므로 인적자원의 확보가 급선무이다. 둘째, 산학협력의 엔지니어링 센터의 설립이다. 기술을 습득하고 협상력을 갖기 위해 각 분야별 기술엔지니어링 센터를 설립한다. 셋째, 기술 사업화에 필요한 하드웨어와 소프트웨어의 확보이다. 기술사업화에 필요한 공간 등의 보육시설과 함께 컨설팅 서비스를 수행할 보육매니저, 보완자산 등이 필요하다. 넷째, 시장과의 연계노력이다. 개발도상국의 STP의 완성은 기업의 탄생과 성장 및 연계에 있다. 다섯째, 사이언스 파크 등의 설립을 통해 클러스터링 효과를 극대화하도록 하는 것이다. 여섯째, 흡수능력을 향상시키는 리더십의 구축이다.

  • PDF

특허정보분석을 이용한 기술파급효과 측정에 관한 연구 (A Study on the Measurement of Technological Impact using Citation Analysis of Patent Information)

  • 유선희;이용호;원동규
    • 기술혁신학회지
    • /
    • 제10권4호
    • /
    • pp.687-705
    • /
    • 2007
  • 본 연구는 특허의 인용정보를 이용하여 비체화 지식의 흐름이라 할 수 있는 기술군간의 파급효과를 측정하는 방법론을 개발하고 실제 사례를 통해 적용 타당성을 제시하고자 하였다. 이를 위해, 기술파급효과에 기존연구를 리뷰하였고, 특허정보의 인용분석과 관련된 지표에 대해 개괄적으로 분석하여 효과적인 특허인용 분석 방법론을 설계하였다. 그리고, KISTI에서 보유하고 있는 미국특허 데이터베이스(USPA)를 이용하여 기술군간 인용관계를 계수하여 기술군간 비체화 지식의 흐름행렬을 도출하였고, 이를 활용하여 기술적 파급효과를 나타낼 수 있는 지수 모형을 연구함과 동시에 네트워크 분석을 통한 기술군간의 파급 유형을 클러스터링하여 기술군간 내생적 속성을 분석하였다. 본 연구의 결과는 어떤 기술군의 타기술군간의 상호 관계에 대해 정량적으로 내생적 속성을 표현하도록 함에 따라 연구개발의 사전기획시 기술적 파급효과에 대한 현안을 제시할 수 있을 뿐만 아니라 기술의 융복합 현상을 이해하는데 기초정보를 제공할 수 있을 것으로 판단된다.

  • PDF

극치강수량의 시공간적 특성을 이용한 지역빈도분석 (Regionalization of Extreme Rainfall with Spatio-Temporal Pattern)

  • 이정주;권현한;김병식;윤석영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1429-1433
    • /
    • 2010
  • 수공구조물의 설계, 수자원 관리계획의 수립, 재해영향 검토 등을 수행할 때, 재현기간에 따른 확률개념의 강우량, 홍수량, 저수량 등을 산정하여 사용하게 되며, 보통 대상지역의 장기 수문관측 자료를 이용하여 수문사상의 확률분포를 산정한 후 재현기간을 연장하여 원하는 설계빈도에 해당하는 양을 추정하게 된다. 미계측지역 또는 관측자료의 보유기간이 짧은 지역의 경우는 지역빈도 분석 결과를 이용하게 된다. 지역빈도해석을 위해서는 강우자료들의 동질성을 파악하는 것이 가장 기본적인 과정이 되며 이를 위해 통계학적인 범주화분석이 선행되어야 한다. 지점 빈도분석의 수문학적 동질성 판별을 위해 L-moment 방법, K-means 방법에 의한 군집분석 등이 주로 사용되며 관측소 위치좌표를 이용한 공간보간법을 적용하여 시각화하고 있다. 강수량은 시공간적으로 변하는 수문변량으로서 강수량의 시간적인 특성 또한 강수량의 특성을 정의하는데 매우 중요한 요소이다. 이러한 점에서 본 연구를 통해 강수지점의 공간적인 좌표 및 강수량의 양적인 범주화에 초점을 맞춘 기존 지역빈도분석의 범주화 과정에 덧붙여 시간적인 영향을 고려할 수 있는 요소들을 결정하고 이를 활용할 수 있는 범주화 과정을 제시하고자 한다. 즉, 극치강수량의 발생 시기에 대한 정량적인 분석이 가능한 순환통계기법을 이용하여 관측 지점별 시간 통계량을 산정하고, 이를 극치강수량과 결합하여 시 공간적인 특성자료를 생성한 후 이를 이용한 군집화 해석 모형을 개발하는데 연구의 목적이 있다. 분석 과정에 있어서 시간속성의 정량화 및 일반화는 순환통계기법을 사용하였으며, 극치강수량과 발생시점의 속성자료는 각각의 평균과 표준편차를 이용하였다. K-means 알고리즘을 이용해 결합자료를 군집화 하고, L-moment 방법으로 지역화 결과에 대한 검증을 수행하였다. 속성 결합 자료의 군집화 효과는 모의데이터 실험을 통해 확인하였으며, 우리 나라의 58개 기상관측소 자료를 이용하여 분석을 수행하였다. 예비해석 단계에서 100회의 군집분석을 통해 평균적인 centroid를 산정하고, 해당 값을 본 해석의 초기 centroid로 지정하여, 변동적인 클러스터링 경향을 안정화시켜 해석이 반복됨에 따라 군집화 결과가 달라지는 오류를 방지하였다. 또한 K-means 방법으로 계산된 군집별 공간거리 합의 크기에 따라 군집번호를 부여함으로써 군집의 번호순서대로 물리적인 연관성이 인접하도록 설정하였으며, 군집간의 경계선을 추출할 때 발생할 수 있는 오류를 방지하였다. 지역빈도분석 결과는 3차원 Spline 기법으로 도시하였다.

  • PDF

3차원 형상복원 정보 기반의 검색 자동화를 위한 스테레오 X-선 검색장치에 관한 연구 (The study of the stereo X-ray system for automated X-ray inspection system using 3D-reconstruction shape information)

  • 황영관;이남호
    • 한국정보통신학회논문지
    • /
    • 제18권8호
    • /
    • pp.2043-2050
    • /
    • 2014
  • X-선 탐지장치는 검색 대상물에 대한 단면 정보만을 제공하기 때문에 내용물에 대한 판정의 한계가 있다. 스테레오 X-선 탐지 장치는 검색 대상체에 대한 단면 정보와 논문에서 제안된 볼륨기반의 3차원 형상복원 알고리즘을 통해 3차원 정보를 제공하여 검색효율을 높일 수 있다. 또한, 고속 검색을 위해 자동화 검색에 대한 식별자로 형상복원 결과를 적용하고자 유사한 모형의 15개 샘플에 대한 형상 복원 및 검출율을 분석하였다. 검색대상 모델에 대한 복원 결과는 실측 모델과 비교할 때 각각 폭 (2.56%), 높이 (6.15 %)와 깊이 (7.12 %)의 오차를 보이며 높은 정확도를 나타내었다. 또한 K-Mean 클러스터링 알고리즘을 적용하여 실험한 결과 97 %의 검출 효율이 보였다. 본 논문의 결과는 자동화 시스템을 위한 새로운 검색식별자를 제시하며 추가연구를 통해 검색 시스템의 효율성 향상을 위한 연구를 진행할 것이다.

한국과 스페인의 스마트시티 산업 특성 비교 (Comparing the Industrial Characteristics of Smart City in Korea and Spain)

  • 조성수;이상호
    • 지역연구
    • /
    • 제38권3호
    • /
    • pp.19-39
    • /
    • 2022
  • 본 연구의 목적은 한국과 스페인의 스마트시티 산업 특성을 비교 분석하는 것이다. 각 국가의 특성은 스마트 산업의 점유, 침투, 생산경로, 네트워크 클러스터를 중심으로 비교되었다. 연구의 자료는 1995년과 2015년의 한국 및 스페인의 투입산출표이며, 8개와 25개 산업으로 재분류되었다. 분석모형은 Smart SPIN Model을 활용하였다. 분석 결과는 다음과 같다. 첫째, 한국이 스페인보다 IT 제조업에서 점유율과 침투율이 더 높은 것으로 분석되었다. 반면, 스페인은 한국보다 IT 서비스업과 지식서비스업이 점유율 및 침투율 모두 더 큰 것으로 나타났다. 둘째, 생산경로 측면에서는 한국이 IT 서비스업과 지식서비스업이 스페인보다 높게 나타났으며, 스페인은 IT 제조업 분야가 더 많은 생산경로를 갖는 것으로 분석되었다. 셋째, 네트워크 분석 결과, 한국의 스마트 산업은 전통 산업에 종속되어있으며, 스마트 산업이 독자적으로 발달하기 어려운 특성이 있는 것으로 나타났다. 스페인은 스마트 산업의 대부분이 하나의 산업 클러스터로 나타나고 있어 독립적인 형태를 보이는 것으로 분석되었다. 즉, 한국은 IT 제조업 기반의 스마트시티 산업 특성을 가지며, 스페인은 IT 서비스와 지식서비스 기반의 스마트시티 산업 특성을 갖는 것으로 나타났다. 본 연구의 결과는 스마트시티 부문에서 있어 우리나라가 앞으로 나아가야 할 방향 및 정책 수립에 대한 기초자료를 제공해 줄 수 있을 것으로 기대한다.

이차원 고객충성도 세그먼트 기반의 고객이탈예측 방법론 (A Methodology of Customer Churn Prediction based on Two-Dimensional Loyalty Segmentation)

  • 김형수;홍승우
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.111-126
    • /
    • 2020
  • CRM의 하위 연구 분야로 진행되었던 고객이탈예측은 최근 비즈니스 머신러닝 기술의 발전으로 인해 빅데이터 기반의 퍼포먼스 마케팅 주제로 더욱 그 중요도가 높아지고 있다. 그러나, 기존의 관련 연구는 예측 모형 자체의 성능을 개선시키는 것이 주요 목적이었으며, 전체적인 고객이탈예측 프로세스를 개선하고자 하는 연구는 상대적으로 부족했다. 본 연구는 성공적인 고객이탈관리가 모형 자체의 성능보다는 전체 프로세스의 개선을 통해 더 잘 이루어질 수 있다는 가정하에, 이차원 고객충성도 세그먼트 기반의 고객이탈예측 프로세스 (CCP/2DL: Customer Churn Prediction based on Two-Dimensional Loyalty segmentation)를 제안한다. CCP/2DL은 양방향, 즉 양적 및 질적 로열티 기반의 고객세분화를 시행하고, 고객세그먼트들을 이탈패턴에 따라 2차 그룹핑을 실시한 뒤, 이탈패턴 그룹별 이질적인 이탈예측 모형을 독립적으로 적용하는 일련의 이탈예측 프로세스이다. 제안한 이탈예측 프로세스의 상대적 우수성을 평가하기 위해 기존의 범용이탈예측 프로세스와 클러스터링 기반 이탈예측 프로세스와의 성능 비교를 수행하였다. 글로벌 NGO 단체인 A사의 협력으로 후원자 데이터를 활용한 분석과 검증을 수행했으며, 제안한 CCP/2DL의 성능이 다른 이탈예측 방법론보다 우수한 성능을 보이는 것으로 나타났다. 이러한 이탈예측 프로세스는 이탈예측에도 효과적일 뿐만 아니라, 다양한 고객통찰력을 확보하고, 관련된 다른 퍼포먼스 마케팅 활동을 수행할 수 있는 전략적 기반이 될 수 있다는 점에서 연구의 의의를 찾을 수 있다.

ERGM 기반의 모수적 및 비모수적 방법을 활용한 수출 유망국가 분석: 정보통신 및 가전 산업 사례를 중심으로 (Analysis of promising countries for export using parametric and non-parametric methods based on ERGM: Focusing on the case of information communication and home appliance industries)

  • 전승표;서진이;유재영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.175-196
    • /
    • 2022
  • 우리나라의 주력 산업 중 하나였던 정보통신 및 가전 산업은 점차 수출 비중이 낮아지는 등 수출 경쟁력이 약화되고 있다. 본 연구는 이런 정보통신 및 가전 산업의 수출 제고를 돕기 위해서 객관적으로 수출경쟁력을 분석하고 수출 유망국가를 제시하고자 했다. 본 연구는 수출경쟁력 평가를 위해서 네트워크 분석 중 구조적 특징, 중심성 그리고 구조적 공백 분석을 수행했다. 유망 수출 국가를 선정하기 위해서는 기존에 경제적 요인 외에도 이미 형성된 글로벌 무역 네트워크(ITN) 즉 글로벌 밸류체인(GVC)의 특성을 고려할 수 있는 새로운 변수를 제안했다. 국가간 무역 네트워크 분석에서 Exponential Random Graph Model(ERGM)을 통해 도출된 개별적인 링크에 대한 조건부 로짓값(log-odds)을 수출가능성을 나타낼 수 있는 대리변수로 가정했다. 이런 ERGM의 링크 연결 가능성까지 고려해 수출 유망국가를 추천하는 데는 모수적 접근 방법과 비모수적 접근 방법을 각각 활용했다. 모수적 방법에서는 ERGM에서 도출된 네트워크의 링크별 특성값을 기존의 경제적 요인에 추가 고려하여 우리나라 정보통신 및 가전 산업 수출액을 예측하는 회귀분석 모형을 개발했다. 또한 비모수적 접근 방법에서는 클러스터링 방법을 바탕으로 한 Abnormality detection 알고리즘을 활용했는데, 2개 Peer(동배)에서 벗어난 이상값을 찾는 방법으로 수출 유망국가를 제안했다. 연구 결과에 따르면, 해당 산업 수출 네트워크의 구조적 특징은 이전성이 높은 연결망이었으며, 중심성 분석결과에 따르면 우리나라는 수출에 규모에 비해서 영향력이 약한 것으로 나타났고, 구조적 공백 분석결과에서 수출 효율성이 약한 것으로 나타났다. 본 연구가 제안한 추천모델에 따르면 모수 분석에서는 이란, 아일랜드, 북마케도니아, 앙골라, 파키스탄이 유망 수출 국가로 나타났으며, 비모수 분석에서는 카타르, 룩셈부르크, 아일랜드, 북마케도니아, 파키스탄이 유망 국가로 분석되었으며, 분석방법에 따라 추천된 국가에서는 일부 차이가 나타났다. 본 연구결과는 GVC에서 우리나라 정보통신과 가전 산업의 수출경쟁력이 수출 규모에 비해서 높지 않음을 밝혔고, 따라서 수출이 더욱 감소될 수 있음을 보였다. 또한 본 연구는 이렇게 약화된 수출경쟁력을 높일 수 있는 방안으로 다른 국가들과의 GVC 네트워크까지 고려해 수출유망 국가를 찾는 방법을 제안했다는데 의의가 있다.