• 제목/요약/키워드: Cluster Systems

검색결과 1,226건 처리시간 0.024초

협업 필터링 및 하이브리드 필터링을 이용한 동종 브랜드 판매 매장간(間) 취급 SKU 추천 시스템 (SKU recommender system for retail stores that carry identical brands using collaborative filtering and hybrid filtering)

  • 조용민;남기환
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.77-110
    • /
    • 2017
  • 최근 인터넷 기반의 웹 및 모바일 기기를 통한 소비 패턴의 다양화와 개성화가 급진전됨에 따라 전통적 유통채널인 오프라인 매장의 효율적 운영이 더욱 중요해졌다. 매장의 매출과 수익 모두를 제고하기 위해 매장은 소비자에게 가장 매력적인 상품을 적시에 공급-판매 해야 하는데 많은 상품들 중에서 어떤 SKU를 취급하는 것이 판매 확률을 높이고 재고 비용을 낮출 수 있는지에 대한 연구가 부족한 실정이다. 특히, 여러 지역에 걸쳐 다수의 오프라인 매장을 통해 상품을 판매하는 기업의 경우 고객에게 매력적인 적절한 SKU를 추천 받아 취급할 수 있다면 매장의 매출 및 수익률 제고에 도움이 될 것이다. 본 연구에서는 개인화 추천에 이용되어 왔던 협업 필터링과 하이브리드 필터링 등의 추천 시스템(Recommender System)을 국가별, 지역별로 복수의 판매 매장을 통해 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하였다. 각 매장의 취급 품목별 구매 데이터를 활용하여 각 매장 별 유사성(Similarity)을 계산하고 각 매장의 SKU별 판매 이력에 따라 협업 필터링을 하여 최종적으로 매장에 개별 SKU를 추천하였다. 또한 매장 프로파일 데이터를 활용하여 주변수 분석 (PCA : Principal Component Analysis) 및 군집 분석(Clustering)을 통하여 매장을 4개의 군집으로 분류한 뒤 각 군집 내에서 협업 필터링을 적용한 하이브리드 필터링 방식으로 추천 시스템을 구현하고 실제 판매 데이터를 바탕으로 두 방식의 성능을 측정하였다. 현존하는 대부분의 추천 시스템은 사용자에게 영화, 음악 등의 아이템을 추천하는 방식으로 연구가 진행되어 왔고 실제로 산업계에서의 적용 또한 개인화 추천 시스템이 주류를 이루고 있다. 그 동안 개인화 서비스 영역에서 주로 다루어져 왔던 이러한 추천 시스템을 동종 브랜드를 취급하는 유통 기업의 매장 단위에 적용하여 각 매장의 취급 SKU를 추천하는 방식에 대한 연구는 거의 이루어지지 않고 있는 실정이다. 기존 추천 방법론의 추천 적용 대상이 '개인의 영역이었다면 본 연구에서는 국가별, 지역별로 복수의 판매 매장을 통해 개인의 영역을 넘어 매장의 영역으로 확대하여 동종 브랜드를 취급하는 유통 기업의 매장 단위 취급 SKU 추천 방식을 제안하고 있다. 또한 기존의 추천시스템은 온라인에 한정되었다면 이를 오프라인으로 활용 범위를 넓히고, 기존 개인을 기반으로 분석을 하는 것보다 매장영역으로 확대 적용하기에 적합한 알고리즘을 개발하기 위해 데이터마이닝 기법을 적용하여 추천 방법을 제안한다. 본 연구의 결과가 갖는 의의는 개인화 추천 알고리즘을 동일 브랜드를 취급하는 복수의 판매 매장에 적용하여 의미 있는 결과를 도출하고 실제 기업을 대상으로 시스템으로 구축하여 활용할 수 있는 구체적 방법론을 제시했다는 데에 있다. 개인화 영역을 위주로 이루어졌던 기존의 추천 시스템과 관련한 학계의 연구 영역을 동종 브랜드를 취급하는 기업의 판매 매장으로 확장시킨 첫 시도라는 데에도 의미가 있다. 2014년 03주차 ~ 05주차 전(全) 매장 판매 수량 실적 Top 100개 SKU로 추천의 대상을 한정하여 협업 필터링과 하이브리드 필터링 방식으로 52개 매장 별로 취급 SKU를 추천하고, 추천 받은 SKU에 대한 2014년 06주차 매장별 판매 실적을 집계하여 두 추천 방식의 성과를 비교하였다. 두 추천 방식을 비교한 이유는 본 연구의 추천 방법이 기존 추천 방식 보다 높은 성과를 입증하기 위해 단순히 오프라인에 협업필터링을 적용한 것을 기준 모델로 정의하였다. 이 기준 모델에 오프라인 매장 관점의 특성을 잘 반영한 본 연구 모델인 하이브리드 필터링 방법과 비교 함으로써 성과를 입증한다. 연구에서 제안한 방식은 기존 추천 방식보다 높은 성과를 나타냈으며, 이는 국내 대기업 의류업체의 실제 판매데이터를 활용하여 입증하였다. 본 연구는 개인 수준의 추천시스템을 그룹수준으로 확장하여 효율적으로 접근하는 방법을 이론적인 프레임 워크를 만들었을 뿐 아니라 실제 데이터를 기반으로 분석하여 봄으로써 실제 기업들이 적용해 볼 수 있다는 점에서 연구의 가치가 크다.

대구·경북지역 섬유산업의 정책변화와 혁신과제 (Policy Change and Innovation of Textile Industry in Daegu·Kyungbuk Region)

  • 신진교;김요한
    • 경영과정보연구
    • /
    • 제31권3호
    • /
    • pp.223-248
    • /
    • 2012
  • 본 연구는 대구경북지역 섬유산업의 경쟁력 회복을 위해 1999년부터 소위 '밀라노프로젝트'로 시작된 대구지역 섬유산업진흥사업을 중심으로 지난 10년간의 대구지역 섬유산업의 정책변화와 지역 섬유산업의 구조변화에 대한 현황분석을 토대로 향후 대구경북지역 섬유산업의 혁신과제를 제안하고자 하였다. 분석결과를 요약하면 다음과 같다. 1단계 밀라노프로젝트('99-'03)는 기획 수립단계에서부터 섬유산업의 중장기 발전시나리오에 기초한 비전과 전략의 부재로 체계적인 사업기획 및 단위사업 선정이 미흡함으로써 패션어패럴밸리 조성 등 사업의 추진일정이 지연된 문제점이 노출되었지만, 신제품개발지원센터, 염색디자인실용화센터 등 차별화 제품의 개발을 지원할 수 있는 기반을 구축하게 되었다는 점에서 성과의 의의가 있다. 2단계 대구섬유산업진흥사업('04-'08)은 경상북도의 도비 매칭을 통하여 대구경북지역의 광역사업으로 추진되었으며, 기 구축된 인프라를 중심으로 지원된 기술개발지원 사업은 특허출원 등 기술적 성과와 신상품 매출액 비중 증가 등의 경제적 성과가 가시화되고 있는 것으로 나타났다. 아울러 섬유업계는 1990년대 후반부터 한계업체 퇴출, 설비매각 이전 등 고강도의 구조조정이 진행되어 왔으나, 현재 영업중인 섬유업체는 재무구조, 생산성, 수익성 측면에서는 기업의 경영성과가 호전되었다. 산업 구조적인 측면에서는 의류용섬유소재분야에서 산업용섬유소재분야로 구조전환이 이루어지고 있는 것으로 나타났다. 기업의 혁신역량 분석에서는 타 산업과 비교할 때 큰 차이는 없으나, 최고경영자의 기술혁신의지, 기업가 정신, 연구개발 역량과 인적자원분야에서 혁신역량이 다소 떨어지는 것으로 나타났다. 향후 섬유산업의 지속발전을 위한 경쟁력 제고를 위해서는 하이테크 섬유소재와 생활용 섬유분야에 대한 선택과 집중이 필요하며, 향후 물리적 집적기반보다는 신뢰와 협력에 기반한 네트워크를 통해 '혁신 시너지'를 창출할 수 있도록 소프트웨어적 인프라 구축에 보다 집중하여야 할 것이다. 특히 지역 섬유산업이 지역 전략산업으로 선정되어 10년 이상 지속적인 지원을 받아 온 만큼, 이제 전통 주력산업에서 미래 성장산업으로 변모하기 위해서는 기업의 기술혁신의지와 기업가정신에 기초한 기업주도의 '혁신 클러스터'를 반드시 창출해야 할 것이다.

  • PDF

패스트 패션을 위한 지능형 신속대응시스템(IQRS-FF)에 관한 연구 (A Study on the Intelligent Quick Response System for Fast Fashion(IQRS-FF))

  • 박현성;박광호
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.163-179
    • /
    • 2010
  • 최근 패션산업에서는 고객의 니즈가 다양해지고 공급 리드타임이 크게 단축됨에 따라 최신 유행을 즉각 반영한 디자인, 빠른 상품 회전율로 승부하는 패스트 패션이 각광받고 있다. 또한, 기업간 경쟁도 심화되면서 얼마나 신속하게 효율적으로 고객의 니즈를 만족시킬 것인가가 패션산업의 중요한 성공요인으로 강조되고 있다. 따라서, 다품종 소량 신속생산이 강조되는 패스트 패션 산업에서는 트랜드 변화에 신속 대응을 지원하는 지능형 신속대응시스템(Intelligent Quick Response System : IQRS) 구축 및 지원을 절실히 요구하고 있다. 본 논문은 패스트 패션 산업 IQRS 구축에서 요구되는 신속대응 프로세스 수립, 지능적 판단을 지원하는 신속대응 기준 및 실행, 신속대응 물량 산정 및 시기 의사결정 모델을 제시하였다. 또한, 신속대응 의사결정의 합리성을 검증할 수 있는 KPI(Key Performance Indicator)를 설계하여 모델의 신뢰도를 향상시켰다. 제시된 각 모델은 A사의 ERP 구현사례를 통해 실용성을 검증하였다.

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.

장소별 완속충전기 적정 보급 비율에 관한 연구 : 전기차 이용자의 통행 및 충전행태에 따른 이질성을 중심으로 (Exploring a Balanced Share of Slow Charging Options by Places Based on Heterogeneous Travel and Charging Behavior of Electric Vehicle Users)

  • 이재현;윤서연;김현미
    • 한국ITS학회 논문지
    • /
    • 제21권6호
    • /
    • pp.21-35
    • /
    • 2022
  • 최근 정부의 적극적인 지원정책과 함께 전기차 이용자들이 급증하고 있으며, 이로 인해 이용자 중심의 충전인프라 구축에도 많은 관심을 쏟아지고 있다. 다양한 정책의 수립과 함께 건물 특성에 기반한 총량적인 전기차 충전기 보급대수 기준은 마련되고 있으나, 장소별 특성에 기반한 완속과 급속충전기 적정 보급 비율에 대한 연구는 제한적이다. 이에 본 연구에서는 전기차 이용자들을 대상으로 진행한 설문조사를 통해 수집한 장소 유형별 공용 완속충전기 보급 비율 자료를 바탕으로 적정 보급비율을 도출하고, 개인별로 충전 환경 요구가 어떻게 차별적으로 유형화되고 이들이 어떠한 특성과 연관되는지 분석하였다. 분석 결과, 10% 이하의 완속 충전기가 필요한 유형, 40-60% 수준의 완속충전기가 필요하여 완속과 급속충전기의 균등 분배가 필요한 유형, 완속이 80% 이상 필요한 유형 등 총 세 가지 장소 유형을 도출할 수 있었다. 또한 잠재계층 군집분석을 통해 개인별로 서로 다른 장소유형별 완속충전기 필요 수준을 분류한 결과 5개 군집으로 유형화할 수 있었으며, 이들은 사회경제적 변수, 차량의 특성, 통행 및 충전행태와 연관된 것으로 나타났다. 특히, 충전행태와 주말 통행행태 그리고 성별, 소득과의 연관성이 높은 것으로 나타났다. 본 연구의 분석결과는 향후 충전인프라 정책 수립 및 전기차 시장의 변화에 따른 충전인프라 보급 기준 마련에 활용될 수 있을 것으로 사료된다.

만경강유역의 개간과정과 취락형성발달에 관한 연구 (A Study on the Cultivation Processes and Settlement Developments on the Mangyoung River Valley)

  • 남궁봉
    • 한국지역지리학회지
    • /
    • 제3권2호
    • /
    • pp.37-87
    • /
    • 1997
  • 만경강유역을 하나의 연장선상에 놓고 연구한 결과, 그 공간상에서 역사와 더불어 형성발달해온 시공연속체를 확인할 수 있었다. 만경강상류에서 하류 하구연안에 이르는 면장공간상에서의 개간과정은 여말에서 부터 시작되어 오늘에 이른 것으로 볼 수 있다. [기원지-지향지] 지향가설에서 본 개간과정에서 개간의 기원지는 만경강상류 산간계곡의 지류곡지 개간을 효시로 하여 기원지가 이루어지고, 조선조 중기까지는 수방대책의 발달과 더불어 하천 중류까지 진출하고, 하천 본류에 대한 하류지역의 계간은 하천의 규모와 유수량의 증가로 인한 하안의 홍수와 범람을 극복할 수 있는 인공제방을 축조할 수 있는 기술수준에 이른 1920년대에 들어서야 본격화되고, 그후 연이어 하구연안의 간석지 개간도 시행되어 개간의 개척첨단이 이들 지향지인 해안간석지일대에 형성되는 것을 볼 수 있다. 시간의 흐름과 더불어 각 시기마다 공간의 변화도 수반되어 시공연속체가 발달하는 것을 볼 수 있다. 취락의 경우 개간과정에 따라 산간계곡 산록일대에서는 주변입지적 집촌, 하천중류와 하류에서는 중앙입지적 집촌, 하천하구 간석지에서는 중앙입지적 열촌형태가 우세하게 나타났다.

  • PDF

하기도 감염 환아에서 분리된 Adenovirus 1, 2, 5 혈청형의 유전체형 분석 (Genome Type Analysis of Adenovirus Serotypes 1, 2 and 5 Isolated from Children with Lower Respiratory Tract Infections in Korea)

  • 박기원;최은화;정지태;이환종;박기호
    • Pediatric Infection and Vaccine
    • /
    • 제12권2호
    • /
    • pp.166-177
    • /
    • 2005
  • 목 적 : DNA 제한 효소 분석법을 이용한 아데노바이러스의 유전체형 분석 방법은 많은 연구자들이 서로 다른 종류의 제한 효소와 명명법을 사용하여 분류함으로써, 아직까지 체계적인 분류 체계가 정립되어 있지 않다. 본 연구는 Li와 Wadell이 제안한 제한 효소 분석법과 명명법을 이용하여 국내에서 최근 14년 동안 분리된 아데노바이러스 혈청형 1, 2, 5형에 대한 유전체형을 분류하고, 그 분자 역학과 유전체형 상호 간의 연관성을 밝히고자 시행하였다. 방 법 : 1990년 11월부터 2003년 2월까지 하기도 감염으로 서울대학교병원 소아과에 입원하였거나, 인접 지역의 종합병원 소아과에 입원한 소아들로부터 채취한 비인두 흡인물을 검체로 하여 HEp-2 세포주에서 배양 후 간접면역형광검사로 확인하고, 분리된 아데노바이러스를 항혈청 1, 2, 3, 4, 5, 6, 7, 11에 대한 세포독성 효과를 관찰함으로 혈청형을 결정하였다. 혈철형 1, 2, 5형을 대상으로 DNA를 추출하고 12가지 제한 효소 BamHI, BcI, BglI, BglII, BstEII, EcoRI, HindIII, HpaI, SalI, SmaI, XbaI, XhoI로 절단한 후 전기영동 시키고 나타나는 분절 형태를 각 혈청형의 표준주와 비교하여 분석하였다. 유전체형간의 상관성을 비교하기 위하여 PCRF 분석을 시행하였다. 결 과 : 아데노바이러스 분리주 382주를 대상으로 혈청형을 확인한 결과, 1형 33(9%), 2형 45(12%), 3형 107(28%), 4형 16(4%), 5형 24(6%), 6형 8(2%), 7형 116(30%), 11형 9(2%), 그 외의 형들이 24(6%)주로 각각 나타났다. 변이 유전체형은 혈청형 1형 18종류, 2형 25종류, 5형 10종류가 분류되었으며 Ad1p1-Ad1p7, Ad1a, Ad1b, Ad1b1-Ad1b3, Ad1c, Ad1d, Ad1e, Ad1e1, Ad1e2, Ad1f; Ad2p1-Ad2p11, Ad2a, Ad2a1-Ad2a6, Ad2b, Ad2c, Ad2d, Ad2e, Ad2e1-Ad2e3; Ad5p1, Ad5p2, Ad5a, Ad5a1-Ad5a7로 명명되었다. 본 연구에서는 표준주나 이전에 보고 된 유전체형과 일치하는 유전체형은 분리되지 않았다. 대부분의 유전체형은 전 연구기간 동안 1~2주만 분리되었고 일부 유전체형들은 산발적으로 2회 이상 반복 분리되었다. 유전체형 Ad1p5나 Ad5a1와 같이 유행성으로 분포하는 유전체형도 관찰되었다. 혈청형 1형 유전체형 간의 PCRF는 79~99%로 Genomic cluster 1과 2로 구분되었고, 2형과 5형은 각각 82~99%와 84~99%로 모두 80% 이상이었다. 결 론 : 본 연구를 통하여 국내에서 분리된 아데노바이러스 혈청형 1, 2, 5형의 다양한 유전체형을 체계적으로 분석할 수 있었다. 혈청형 1, 2, 5형이 주로 산발성 감염을 일으키는 것으로 알려져 왔으나, 유전체형에 따라 역학적 특징이 다르게 나타날 수 있으며, 이는 DNA의 변형에 의한 유전체형의 변화가 바이러스의 감염력과 생존력에 변화를 일으켰을 가능성을 시사한다. 본 연구 결과는 혈청형 1, 2, 5형의 비교 자료로 활용될 수 있을 뿐만 아니라, 변이 유전체형들에 대한 정보를 제공함으로써 백신 개발을 위한 기초 자료로 활용될 수 있을 것으로 기대된다.

  • PDF

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.

시계열 군집분석을 통한 디지털 음원의 순위 변화 패턴 분류 (Derivation of Digital Music's Ranking Change Through Time Series Clustering)

  • 유인진;박도형
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.171-191
    • /
    • 2020
  • 본 연구는 현대 사회에서 가장 가치 있는 문화자산이자 한류의 흐름에서 특히 중요한 위치를 차지하는 디지털 음악에 초점을 두었다. 디지털 음악에 대하여 공신력 있는 음원 차트인 '가온 차트'에 진입한 음원들의 73주간 순위 변화를 수집하였으며 유사한 특징을 가지는 패턴들로 분류하였다. 이후 각 순위 변화 패턴으로부터 주목할 만한 특징에 대한 설명적 분석을 수행하였다. 구체적으로 음원에 대한 신뢰도 이슈가 발생하기 이전 기간의 국내 발매된 디지털 음원들로 한정하여 시점을 일치시킨 후 시계열 군집분석을 통해 패턴을 도출하고자 하였다. 데이터 수집과 전처리를 통하여 742건의 중복되지 않는 음원들을 확보하였고, 시계열 순위 변화에 대한 시계열 군집분석 결과 16개의 패턴들이 도출되었다. 이후 도출된 패턴들을 기반으로 '스테디셀러'와 '원 히트 원더'의 두 가지 유형의 대표적인 패턴을 확인하였다. 나아가 두 패턴에 대하여 차트 내에서 음원의 생존 기간과 음원 순위에 관점에서 다섯 가지의 세분화된 패턴으로 분류하였다. 각 패턴들이 가지는 중요한 특징들은 다음과 같다. 원 히트 원더형 패턴에서 아티스트의 슈퍼스타 효과와 편승효과가 강하게 나타났으며, 소비자들의 디지털 음원 선택에 강한 영향을 미친다는 것을 확인하였다. 나아가 스테디셀러형 패턴을 통해서 매우 오랜시간 소비자들의 선택을 받는 음원들을 확인하였고, 소비자의 니즈를 관통하며 가장 많은 선택을 받는 음원들이 오히려 원 히트 원더형 패턴이 아니라 스테디셀러: 중기 패턴에 포진하고 있음을 확인하였다. 특히 주목할 만한 점은 스테디셀러형 패턴을 통해 기존의 패턴과는 상반되는 '차트 역주행' 현상을 확인했다는 것이다. 본 연구는 디지털 음원을 중심으로 상대적으로 소외되었던 분야인 시간의 흐름에 따른 음원의 순위 변화에 초점을 두었고, 음원의 흥행과 순위를 예측하는 것이 아니라 순위 변화의 패턴을 세분화함으로써 음원 연구에 대한 새로운 접근을 시도하였다는 점에서 의의가 있다.

이미지 감성분류를 위한 CNN과 K-means RGB Cluster 이-단계 학습 방안 (A Two-Stage Learning Method of CNN and K-means RGB Cluster for Sentiment Classification of Images)

  • 김정태;박은비;한기웅;이정현;이홍주
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.139-156
    • /
    • 2021
  • 이미지 분류에서 딥러닝 모형을 사용하는 가장 큰 이유는 이미지의 전체적인 정보에서 각 지역 특징을 추출하여 서로의 관계를 고려할 수 있기 때문이다. 하지만 이미지의 지역 특징이 없는 감정 이미지 데이터는 CNN 모델이 적합하지 않을 수 있다. 이러한 감정 이미지 분류의 어려움을 해결하기 위하여 매년 많은 연구자들이 감정 이미지에 적합한 CNN기반 아키텍처를 제시하고 있다. 색깔과 사람 감정간의 관계에 대한 연구들도 수행되었으며, 색깔에 따라 다른 감정이 유도된다는 결과들이 도출되었다. 딥러닝을 활용한 연구에서도 색깔정보를 활용하여 이미지 감성분류에 적용하는 연구들이 있어왔으며, 이미지만을 가지고 분류 모형을 학습한 경우보다 이미지의 색깔 정보를 추가로 활용한 경우가 이미지 감성 분류 정확도를 더 높일 수 있었다. 본 연구는 사람이 이미지의 감정을 분류하는 기준 중 많은 부분을 차지하는 색감을 이용하여 이미지 감성 분류 정확도를 향상시키는 방안을 제안한다. 이미지의 RGB 값에 K 평균 군집화 방안을 적용하여 이미지를 대표하는 색을 추출하여, 각 감성 클래스 별 해당 색깔이 나올 확률을 가중치 식으로 변형 후 CNN 모델의 최종 Layer에 적용하는 이-단계 학습방안을 구현하였다. 이미지 데이터는 6가지 감정으로 분류되는 Emotion6와 8가지 감정으로 분류되는 Artphoto를 사용하였다. 학습에 사용한 CNN 모델은 Densenet169, Mnasnet, Resnet101, Resnet152, Vgg19를 사용하였으며, 성능 평가는 5겹 교차검증으로 CNN 모델에 이-단계 학습 방안을 적용하여 전후 성과를 비교하였다. CNN 아키텍처만을 활용한 경우보다 색 속성에서 추출한 정보를 함께 사용하였을 때 더 좋은 분류 정확도를 보였다.