• 제목/요약/키워드: Classification tree

검색결과 937건 처리시간 0.03초

발굴유적 외부공간의 유형별 경관계획 및 조경시공 원칙 연구 (A Study on the Landscape Planning and Landscape Architecture Construction Principles by the Type Outside Relics)

  • 신현실
    • 한국전통조경학회지
    • /
    • 제36권4호
    • /
    • pp.58-69
    • /
    • 2018
  • 본 연구는 다양한 유적지 공간에서의 경관계획 및 시공기준에 대해 조경 분야에 적용 가능한 구체적 경관계획과 시공기준을 살펴보았으며, 이에 도출된 결과는 다음과 같다. 첫째, 유적지의 유형은 보존상태 및 처리기법에 따라 분류되는데 보존 상태에 따른 분류는 건조물이나 구조물 등 지상에 노출된 유적과 매장문화재와 같이 지하에 매장된 유적, 유적에 대한 기록이나 명성이 전해져 오고 있으나 장소만 남은 유적 등으로 구분된다. 전시 처리기법에 따른 분류는 유적 주변을 격리하는 폐쇄와 유적 지상에서 관람할 수 있는 관통, 별도의 보호시설을 유적 위에 설치하는 중첩 등의 기법들로 분류되었다. 둘째, 유적지 관람 전시를 위한 조경계획의 원칙을 수립해보면, 유적을 구성하는 항목으로 영역의 구분, 유적의 표면처리, 수목식재, 시설물 설치 등으로 구분된다. 유적은 원형의 공간이 아닐 경우 구성요소간의 소재를 달리하여 공간을 구분하는 영역의 구분이 필요하다. 유구의 보존이 필요할 경우 복토가 바람직하며, 이를 위해서는 잔디나 관목류 등을 사용하는 것이 효율적으로 판단된다. 수목의 식재는 공간의 성격에 따라 도입을 검토해야 한다. 시설물은 유적의 영역과 성격에 따라 경관에 미치는 영향과 유적의 추가 발굴 등을 검토하여 신중한 접근이 요구된다. 셋째, 유적지 공간에서의 조경시공 원칙을 살펴본 결과 도출된 정비방법은 현상보존, 보호시설 설치, 복토, 수복, 복원, 이전, 재현 등으로 분류되었다. 현상보존은 제한적인 조경계획이 필수적이며, 기존 유적의 원형에 영향을 미치지 않아야 한다. 보호시설은 유적의 보호를 위해 불가피할 경우 설치되어야 하며, 복토가 이루어질 경우 유적을 훼손할 수 있는 수목을 제거하고 성토 후 토사유실방지를 위해 표면처리가 요구된다. 수복은 원형에 대한 단서를 근거로 원형보존에 준하는 조경계획의 수립이 이루어져야 한다. 이전은 기존 유적의 외부공간과 유사한 환경을 조성하기 위한 조경계획이 필요하며, 본래 유적의 가치나 장소성을 부각할 수 있어야 한다. 재현은 현재 사라진 유적에 대해 과거의 경관과 분위기를 살릴 수 있는 조경계획이 수립되어야 한다. 넷째, 조경 분야는 발굴유적의 보존 및 전시효과 상승을 동시에 만족시킬 수 있는 분야로서 과거의 흔적을 보호하고 오늘날 폐허의 장소에 생기를 부여하기 위해 구체적 방안의 모색이 요구되며, 유적의 기능과 가치를 살린 유적지 공원 조성, 연계콘텐츠의 형상화 등이 대안으로 제시될 수 있다.

에셀나무(Tamarix aphylla)의 명칭문제에 대한 고찰 (An Investigation of Local Naming Issue of Tamarix aphylla)

  • 김영숙
    • 한국전통조경학회지
    • /
    • 제37권1호
    • /
    • pp.56-67
    • /
    • 2019
  • 성경에 쓰인 에셀나무(Tamarix aphylla)의 올바른 명칭문제를 고찰하기 위해서 식물의 형태분류학적인 특성 분석, Tamarix속에 대한 상징성 고찰, 한국고전과 중국고전에서의 용례 분석, 그리고 한중일 성경에 나타난 에셀나무 번역상에 나타난 문제점에 대한 고찰 결과는 다음과 같다. 식물분류학적으로 Tamarix속 유사종의 구별은 잎과 꽃의 형태로 구분하지만, 그 크기가 2-4mm 정도로 매우 작기 때문에 육안으로 구분하기 어렵다. 그러나 이스라엘 광야에 분포하는 T. aphylla와 중국과 한국의 T. chinensis는 가지가 처지는 모양이나 개화기간에서 확연한 차이점을 나타내고 있다. Tamarix속은 고대 메소포타미아와 한(漢)나라에서는 궁궐 안뜰에 심을 정도로 귀한 나무였고, 고대 이집트에서는 죽은 사람에게 생명을 주는 나무로 여겼다. 또한 성경에서는 아브라함이 하느님께서 함께하심을 드러내는 계약의 표지로, 예언자 사무엘을 상징하기도 하고 사무엘의 법정을 상징하였다. 한국고전 용례를 통해서 볼 때 Tamarix속은 이미 조선시대에 일반화된 용어로 쓰였는데 '정류(檉柳)'는 의학적인 용어로 많이 쓰인 반면에, '위성류(渭城柳)'는 문학적 용어로 쓰였다. 중국의 본초서 가운데 정류(檉柳)와 관련된 문헌들의 연대와 명칭을 고증한 결과에 의하면 모두 16개 용어가 쓰였는데, 이 용어들 가운데 중국 성경에 쓰였던 '수사류(垂絲柳)'라는 단어는 없었다. 또한 당나라 왕유(王維 699-759)의 시 때문에 생겨난 '위성류(渭城柳)'라는 단어도 없었고, 오히려 주나라와 관계있는 '하류(河柳)'라는 용어가 많이 쓰이고 있다. 그런데 현재 사용하고 있는 중국의 학술용어를 조사해 보면 '수사류(垂絲柳)'와 '정류(檉柳)'가 대등하게 나타나기 때문에, 중국성경에서 에셀에 관한 번역은 '수사류(垂絲柳)'로 하던지 '정류(檉柳)'로 하던지 문제가 없어 보인다. 일본성경은 명치역 "구신약전서(舊新約全書)(1887)"에서 'やなぎ(버드나무)'로 번역하는 오류가 있었는데, "구어역(口語譯) 성서(聖書)(1955)"부터 'ぎょりゅう(정류(檉柳))'로 번역하고 있다. 그러나 일본에서 'ぎょりゅう(정류(檉柳))'는 야생종이 아니라 에도시대 도입종이라는 주장이 있기 때문에 용어 설정을 재검토할 필요성이 있다. 한국고전 용례분석에서 나타난 것과 같이, 한국의 T. chinensis는 약용 및 관상용으로 일찍부터 한반도에서 생육하였을 가능성이 매우 높다. 그러므로 한국 성경에서 의약학 용어인 '정류(檉柳)' 사용하거나 혹은 문학적인 용어인 '위성류'를 사용하더라도 큰 문제는 없을 수도 있다. 그러나 '위성류'라는 용어는 중국에서 조차 사용빈도가 극히 낮은 용어이고, 조선시대 문학하던 분들의 모화사상과 연결될 수 있는 부분이므로 이 용어 사용에 신중한 검토가 필요하다. 그러므로 성경에서는 논란이 있는 용어를 사용하기 보다는 히브리어로 음역하여 '에셀나무'라고 하는 것이 타당하다.

효율적 자원 탐색을 위한 소셜 웹 태그들을 이용한 동적 가상 온톨로지 생성 연구 (Dynamic Virtual Ontology using Tags with Semantic Relationship on Social-web to Support Effective Search)

  • 이현정;손미애
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.19-33
    • /
    • 2013
  • 본 논문에서는 네트워크 기반 대용량의 자원들을 효율적으로 검색하기 위해 사용자의 요구사항에 기반해 검색에 요구되는 태그들 간의 의미론에 기반한 동적 가상 온톨로지(Dynamic Virtual Ontology using Tags: DyVOT)를 추출하고 이를 이용한 동적 검색 방법론을 제안한다. 태그는 소셜 네트워크 서비스를 지원하거나 이로부터 생성되는 정형 및 비정형의 다양한 자원들에 대한 자원을 대표하는 특성을 포함하는 메타적 정보들로 구성된다. 따라서 본 연구에서는 이러한 태그들을 이용해 자원의 관계를 정의하고 이를 검색 등에 활용하고자 한다. 관계 등의 정의를 위해 태그들의 속성을 정의하는 것이 요구되며, 이를 위해 태그에 연결된 자원들을 이용하였다. 즉, 태그가 어떠한 자원들을 대표하고 있는 지를 추출하여 태그의 성격을 정의하고자 하였고, 태그를 포함하는 자원들이 무엇인지에 의해 태그간의 의미론적인 관계의 설정도 가능하다고 보았다. 즉, 본 연구에서 제안하는 검색 등의 활용을 목적으로 하는 DyVOT는 태그에 연결된 자원에 근거해 태그들 간의 의미론적 관계를 추출하고 이에 기반 하여 가상 동적 온톨로지를 추출한다. 생성된 DyVOT는 대용량의 데이터 처리를 위해 대표적인 예로 검색에 활용될 수 있으며, 태그들 간의 의미적 관계에 기반해 검색 자원의 뷰를 효과적으로 좁혀나가 효율적으로 자원을 탐색하는 것을 가능하도록 한다. 이를 위해 태그들 간의 상하 계층관계가 이미 정의된 시맨틱 태그 클라우드인 정적 온톨로지를 이용한다. 이에 더해, 태그들 간의 연관관계를 정의하고 이에 동적으로 온톨로지를 정의하여 자원 검색을 위한 동적 가상 온톨로지 DyVOT를 생성한다. DyVOT 생성은 먼저 정적온톨로지로부터 사용자 요구사항을 포함하는 태그를 포함한 부분-온톨로지들을 추출하고, 이들이 공유하는 자원의 정도에 따라 부분-온톨로지들 간의 새로운 연관관계 여부를 결정하여 검색에 요구되는 최소한의 동적 가상 온톨로지를 구축한다. 즉, 태그들이 공유하는 자원이 무엇인가에 의해 연관관계가 높은 태그들 간에는 이들의 관계를 설명하는 새로운 클래스를 가진 생성된 동적 가상 온톨로지를 이용하여 검색에 활용한다. 온톨로지의 인스턴스는 자원으로 정의되고, 즉 이는 사용자가 검색하고자 하는 해로서 정의된다. 태그들 간의 관계에 의해 생성된 DyVOT를 이용해 기존 정적 온톨로지나 키워드 기반 탐색에 비해 검색해야 할 자원의 량을 줄여 검색의 정확성과 신속성을 향상 시킨다.

갓 (Brassica juncea) 품종구분을 위한 ITS 영역 및 MITE Family 정보를 이용한 분자표지 개발 (Development of molecular markers for varietal identification of Brassica juncea on the basis of the polymorphic sequence of ITS regions and MITE families)

  • 양기웅;이고은;아리프 하산 칸 로빈;정남희;이용혁;박종인;김회택;정미영;노일섭
    • 원예과학기술지
    • /
    • 제34권2호
    • /
    • pp.305-313
    • /
    • 2016
  • 갓(Brassica juncea; 2n = 4x = 36, AABB genome, 1,068Mb)은 U's triangle의 배추와 흑겨자 사이의 복이배체 작물로 구분한다. 본 연구는 갓 15 품종의 ribosomal DNA ITS 영역과 MITE를 이용하여 갓의 유연관계 및 품종구분 분자표지를 확인하였다. Ribosomal DNA ITS 영역은 종 및 품종의 유연관계를 알아보는 연구로 많이 사용되고 있어서, 이를 이용하여 갓 15 품종의 유연관계를 알아보았다. 또한, MITE는 매우 많은 copy 수를 가지고 있고, 유전적으로 안정적이기 때문에 유전체 및 진화 연구에 매우 적합한 재료이다. MITE를 이용한 갓의 품종구분 분자표지를 확인하기 위해 MITE super-families 중 Stowaway(BraSto) 관련 70점, Tourist(BraTo) 관련 79점, hAT(BrahAT) 관련 6점, Mutator(BraMu) 관련 5점으로 품종구분 표지를 알아보았다. 총 160점의 분자표지 중 32점이 갓 15 품종에서 뚜렷한 다형성을 보였다. 특히, 흑갓은 표현형뿐만 아니라 유전자형도 매우 다르게 나타났다. 또한 8점의 MITE 분자표지를 활용하여 47점의 유전자원에서 다형성 및 품종구분 표지로의 활용 가능성을 확인하였다. 이러한 다형성 표지들은 갓의 품종구분 및 품종 보호에 매우 유용하게 사용할 수 있을 것이라 기대한다.

추천시스템관련 학술논문 분석 및 분류 (A Literature Review and Classification of Recommender Systems on Academic Journals)

  • 박득희;김혜경;최일영;김재경
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.139-152
    • /
    • 2011
  • 1990년대 중반에 협업 필터링의 출현으로 인하여 추천시스템에 관련된 연구가 늘어나게 되었다. 협업 필터링의 출현 이후 내용 기반 필터링, 협업 필터링과 내용 기반 필터링이 혼합된 하이브리드 필터링 등 새로운 기법들이 출현함으로써 2000년대에는 추천시스템의 연구가 눈에 띄게 증가하였다. 하지만 현재까지 추천시스템에 관련된 문헌들에 대한 리뷰와 분류가 체계적으로 되어있지 않다. 이와 같은 문제에 대한 해결방안으로써, 본 연구에서는 2001년부터 2010년도까지의 추천시스템에 관련된 문헌들 중 MIS Journal Ranking의 125개의 저널에서 추천시스템(Recommender system, Recommendation system), 협업 필터링(Collaborative Filtering), 내용 기반 필터링(Content based Filtering), 개인화 시스템(Personalized system) 등의 5가지 키워드로 제한하여 조사하였다. 총 37개의 저널에서 논문을 검색하였으며, 검색되어진 논문을 분석한 결과 추천시스템과 관련이 없는 논문을 제외한 총 187개의 논문을 선정하여 분석하였다. 이 연구에서는 그러나 컨퍼런스 논문, 석사, 박사학위 논문, 영어로 작성되지 않은 논문, 완성되지 않은 논문 등은 제외하였다. 본 연구에서는 187개의 논문을 분석하여 2001년부터 2010년까지의 각각의 년도 별 추천시스템의 연구에 대한 동향 분석, Journal별 추천시스템의 게재 분류, 추천시스템 어플리케이션의 사용 분야(책, 문서, 이미지, 영화, 음악, 쇼핑, TV 프로그램, 기타)별 분류 및 분석, 추천시스템에 사용된 데이터마이닝 기술(연관 규칙, 군집화, 의사 결정나무, 최근접 이웃 기법, 링크 분석 기법, 신경망, 회귀분석, 휴리스틱 기법)별 분류 및 분석을 수행하였다. 따라서 본 연구에서 제안한 각각의 분류 및 분석 결과들을 통하여 현재까지 추천시스템의 연구에 대한 연구 동향을 파악 할 수 있었으며, 분석결과를 통해 추천시스템에 관심이 있는 연구자와 전문가에게 미래의 추천시스템의 연구에 대한 가이드라인을 제시 할 수 있을 것이라고 기대한다.

송이생산지의 생태적 관리를 위한 소나무비오톱 유형화 및 지도 작성: 강원도 양양군 동서고속도로 건설구간을 중심으로 (Biotope Types and Mapping for Ecological Management of Tricholoma matsutake Production Area: The Case of Expressway in Yangyang-gun, Gangwon-do)

  • 김정호;최송현;윤용한
    • 환경정책연구
    • /
    • 제11권3호
    • /
    • pp.25-47
    • /
    • 2012
  • 송이생산을 고려한 소나무비오톱유형화 및 지도 작성을 통한 송이생산지의 생태적 관리방안을 제시하고자 하였다. 연구대상지는 동서고속도로 신설구간 중 송이가 다량 생산되는 양양군구간을 대상으로 도로노선중앙에서 좌우 700m씩 범위내 총 $19.79km^2$을 설정하였다. 연구의 내용은 4단계로 구분하였으며 첫째, 양양군 송이관련특성, 둘째, 송이관련 선행연구 고찰, 셋째, 송이생산을 고려한 소나무비오톱유형화 기준 및 프로세스 정립, 넷째, 송이생산을 고려한 소나무비오톱지도화 등이다. 송이생산에 적합한 경사도 $30{\sim}40^{\circ}C$ 지역은 24.77%, 남향계열은 17.44%이었고 식생구조는 소나무군락 26.00%, 평균수령, $38{\pm}8.34$ 년생, 교목층 평균식생밀도 $9.55{\pm}4.98$ 주/$100m^2$ 등으로 송이생산에 최적 식생구조였다. 토양산도(pH)는 5.0~5.6(47.96%) > 5.6~7.0(42.90%) > 4.0~5.0(9.14%)로서 송이발생에 적합한 약산성 토양인 pH 4.0~5.6의 면적은 57.10%였다. A0층의 깊이는 평균 $3.39{\pm}2.14cm$이며 4~6cm(78.03%) > 0~2cm(18.10%) > 2~4cm(3.87%)였다. 선행연구와 현장조사 결과를 바탕으로 현존식생(소나무우점비율), 지형(지형특성 및 경사도), 수령, 토양특성(토양산도와 A0층 깊이), 식생밀도를 유형화 기준으로 설정하여 총 6개 송이생산을 고려한 소나무비오톱유형으로 구분하였다. 유형별 분포면적은 송이생산잠재(II)소나무비오톱유형(32.86%) > 송이생산 부적합 소나무비오톱유형(22.17%) > 송이생산적합(II)소나무비오톱유형(17.79%) > 송이생산적합(I)소나무비오톱유형(14.86%) > 송이생산잠재(I)소나무비오톱유형(9.77%) > 송이생산소나무비오톱유형(2.55%) 등의 순이었다.

  • PDF

지표변화와 지리공간정보의 연관성 분석을 통한 공주지역 지표환경 변화 분석 (Change Detection of land-surface Environment in Gongju Areas Using Spatial Relationships between Land-surface Change and Geo-spatial Information)

  • 장동호
    • 대한지리학회지
    • /
    • 제40권3호
    • /
    • pp.296-309
    • /
    • 2005
  • 본 연구는 공주지역의 지표변화를 분석하기 위해 우도비 기반의 베이지안 예측모델을 이용하여 지리공간 정보와 지표변화와의 연관성 및 미래의 지표변화를 탐지하였다. 지표변화 지역은 위성사진을 토지피복분류 한 후 선분류 후비교법을 이용하여 변화지역을 추출하였다. 지표변화와 관련이 있는 지리공간 정보는 GIS 환경에서 구축하였으며, 우도비를 이용하여 지표변화 예측도를 작성하였다. 분석결과, 도시지역 및 농업지역 지표변화에 가장 큰 영향을 미치는 주제도는 고도, 하계망, 인구밀도, 도로, 인구이동, 총사업체수, 지가 등이다. 또한 산림지역 지표변화에 영향을 미치는 주제도는 고도, 경사도, 인구밀도, 인구이동, 지가 등이다. 지표변화 분석결과, 도시지역은 금강을 중심으로 구도심과 신도심지역의 도시 확산이 이루어지고, 인터체인지 및 국도를 따라 시가화 지역이 확산 될 것으로 예측되었다. 농업지역은 금강의 소지류 및 인접지역과 연결되는 국도주변 지역이 변화가 일어날 확률이 높다. 산림지역은 대부분 남동쪽에 위치하고 있는데, 그 원인은 밤나무 재배단지가 본 지역에 넓게 나타나면서 산림훼손이 일어날 확률이 높은 것으로 예측되었다. 예측비율 곡선을 이용하여 검증한 결과, 지표변화가 일어날 확률이 가장 높은 상위 $10\%$지역에서 도시지역은 $80\%$, 농업지역은 $55\%$, 산림지역은 $40\%$정도의 예측능력을 보였다. 따라서, 본 통합 모델은 산림지역 예측에는 부적합한 것으로 볼 수 있어서, 향후 새로운 주제도 선정 및 예측모델 등이 필요하다. 결론적으로 본 방법은 향후 토지피복 변화 연구를 위한 효과적인 방법 중의 하나로 적용될 수 있을 것으로 기대된다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

오대산국립공원 월정사 전나무숲 식생구조 분석 (Vegetation Structure of Abies holophylla Forest near Woljeong Temple in Odaesan National Park)

  • 이경재;김지석;최진우;한봉호
    • 한국환경생태학회지
    • /
    • 제22권2호
    • /
    • pp.173-183
    • /
    • 2008
  • 본 연구는 오대산국립공원 월정사 일주문에서 금강교 사이에 분포하는 전나무 숲의 식생구조를 파악하기 위하여 진행되었다. 대상지내 흉고직경(DBH) 20cm이상 전나무는 총 977주이었으며, 2006년 조사당시 생육이 불량하거나 고사한 수목은 96주로 전체의 9.8%이었다. 전나무 수령은 $41\sim135$년(DBH $11\sim82cm$)이었으며, DBH 100cm이상 대경목은 8주이었고 가장 큰 전나무는 DBH 175cm, 수고 31m이었다. 전나무 밀도는 $400m^2(20\times20m)$당 6.1개체이었으며, DBH $20\sim70cm$까지의 개체가 $400m^2$당 5.1개체로 가장 많았다. TWINSPAN을 이용하여 식물군집구조를 분석한 결과 4개의 군집으로 분류되었고 소나무전나무군집은 전나무군집으로 변화가 예상되었으며 나머지 3개 군집은 전나무 군집으로써 피나무, 고로쇠나무 등 낙엽활엽수와의 경쟁이 예상되었다. 오대산국립공원 월정사 주변 전나무 숲은 지속 가능한 문화경관관광자원으로서 가치가 높기 때문에 보전 및 관리를 위해 전체 전나무 중 생육불량 수목과 고사목 발생 원인을 규명하고 대책을 마련해야 할 것이다 또한 전나무 숲 내 아교목층 또는 관목층에 출현하는 피나무, 고로쇠나무 등 낙엽활엽수는 전나무와 지속적으로 경쟁할 가능성이 높으므로 제거 등의 적극적 관리를 해야 하며, 발아 후 초기 생장이 매우 느려 주변 수목에 의한 피압 우려가 있는 전나무 치수는 지속적인 관리가 필요하다.

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.