• 제목/요약/키워드: Site Validation

검색결과 266건 처리시간 0.026초

빅데이터 기반 추천시스템 구현을 위한 다중 프로파일 앙상블 기법 (A Multimodal Profile Ensemble Approach to Development of Recommender Systems Using Big Data)

  • 김민정;조윤호
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.93-110
    • /
    • 2015
  • 기존의 협업필터링 추천시스템 연구는 상품에 대한 고객의 평점(rating)이나 구매 여부 데이터로부터 하나의 프로파일을 생성하고 이를 기반으로 추천 성능을 향상시킬 수 있는 새로운 알고리즘을 개발하는 위주로 진행되어 왔다. 그러나 빅데이터 환경이 도래하면서 기업이 수집할 수 있는 고객 데이터가 풍부해지고 다양해짐에 따라, 보다 정확하게 고객의 선호도나 행태를 파악하는 것이 가능하게 되었고 이러한 데이터, 즉 퍼스널 빅데이터(personal big data)를 추천시스템에 활용하는 연구의 필요성이 대두되고 있다. 본 연구에서는 마케팅의 시장세분화 이론에 근거하여 퍼스널 빅데이터로부터 고객의 선호도나 행태를 다양한 관점에서 표현할 수 있는 5종의 다중 프로파일(multimodal profile)을 개발하고, 이를 활용하여 협업필터링 추천시스템의 성능을 개선하고자 한다. 제안하는 5종의 다중 프로파일은 프로파일 통합 유사도, 개별 프로파일 유사도 평균, 개별 프로파일 유사도 가중 평균이라는 세 가지 앙상블 기법을 통해 협업필터링의 이웃(neighborhood) 탐색과정에 적용된다. 실제 퍼스널 빅데이터에 본 연구에서 제안하는 방법론을 적용한 결과, 단일 프로파일을 사용하는 협업필터링 알고리즘보다 추천 성능이 상당히 개선되었으며 앙상블 방법 중에서는 개별 프로파일 유사도 가중 평균 기법이 가장 높은 추천 성능을 보여주었다. 본 연구는 빅데이터 환경에서 추천시스템을 개발하고자 할 때, 어떠한 성격의 데이터로부터 고객의 특성을 규명하는 프로파일을 만들고 이를 어떻게 결합하여 사용하는 것이 효과적인 지 처음으로 제안하였다는 점에서 그 의의가 있다.

연직바람관측장비와 레윈존데의 비교를 통한 난류 에너지 감소률의 특성 분석 (An Analysis on Characteristics of Turbulence Energy Dissipation Rate from Comparison of Wind Profiler and Rawinsonde)

  • 강우경;문윤섭;정옥진
    • 한국지구과학회지
    • /
    • 제37권7호
    • /
    • pp.448-464
    • /
    • 2016
  • 본 연구의 목적은 우리나라 추풍령 기상관측소에서 연직바람관측장비와 레윈존데 간 풍속 자료의 유효화를 통해 연직바람관측장비의 운영 프로그램인 PCL 1300 내 일관성 검사와 관련된 매개변수를 최적화하는 것이다. 그런 다음 2009년 3월부터 2010년 2월까지 맑은 날과 강수 발생일에 대한 난류 에너지 감소률의 특성(${\varepsilon}$)을 분석하는 것이다. 2010년 4월 22일부터 4월 23일까지 레윈존데와 연직바람관측장비의 바람 관측 자료를 비교한 결과, 동서(u) 성분과 남북(v) 성분의 바람에서 고도 3,000 m 이후에서 $10ms^{-1}$ 이상의 큰 차이를 나타내었다. 두 기기 사이 u 성분과 v 성분의 바람에 대한 풍속 차가 $10ms^{-1}$를 넘는 경우를 제외할 경우 두 바람 성분에 대한 상관계수는 각각 0.92와 0.88이었고, 제곱근 평균 오차는 각각 $3.07ms^{-1}$$1.06ms^{-1}$이었다. 이들 결과에 준하여 PCL1300 프로그램의 자료 처리 시간을 30분으로 조정하고, 최소 이용 자료는 전체의 60%로 조정할 경우가 비교적 작은 편의를 나타내었다. 한편 PCL1300 운영프로그램에서 u, v 성분의 일관성 검사에 대한 민감도 분석 결과, 시선속도 일관성, 동시성, 풍속 일관성 검사에서 u 성분에 대해서는 과소평가 되었고, 반면 v 성분에 대해서는 과대평가 되었다. 최종적으로 PCL1300 운영 프로그램의 최적화를 통해 맑은 날과 강수 발생일의 난류 에너지 감소률(${\varepsilon}$)을 분석한 결과, 각 고도에서 ${\varepsilon}$의 일별 및 계절별 평균은 강수 발생일이 맑은 날에 비해 높게 나타났는데, 이는 상승하강 기류에 따른 연직속도가 증가하였기 때문이다. 그리고 맑은 날과 강수 발생일 모두 계절별 ${\varepsilon}$ 평균은 겨울이 낮게 나타났는데, 이는 겨울이 다른 계절에 비해 수평 풍속이 강했기 때문이다. 결과적으로 연직속도가 ${\pm}10cm\;s^{-1}$ 이상에 해당하는 맑은 날과 강수 발생일의 ${\varepsilon}$ 값을 제외할 경우 강수발생일은 맑은 날에 비해 약 6-7배 ${\varepsilon}$이 높게 나타났으며, 연직속도를 모두 고려할 경우는 약 4-5배 더 높게 나타났다.

연세에어로졸 알고리즘을 이용하여 정지궤도위성 센서(AHI, GOCI, MI)로부터 산출된 에어로졸 광학두께 비교 연구 (Intercomparing the Aerosol Optical Depth Using the Geostationary Satellite Sensors (AHI, GOCI and MI) from Yonsei AErosol Retrieval (YAER) Algorithm)

  • 임현광;최명제;김미진;김준;고수정;이서영
    • 한국지구과학회지
    • /
    • 제39권2호
    • /
    • pp.119-130
    • /
    • 2018
  • 동아시아 지역의 에어로졸 광학정보에 대하여 천리안 위성에 탑재된 GOCI, MI, 그리고 Himawari 8 위성에 탑재된 AHI 센서들의 측정자료를 연세 에어로졸 알고리즘(YAER)을 이용하여 산출하였다. 본 연구에서는 각 센서에서 산출되는 에어로졸 광학두께(Aerosol optical depth, AOD)를 상호비교하고, 지상장비인 AERONET과의 검증결과도 보였다. 사용한 AOD 자료는 세 종류의 센서에서 최소반사도 방법(Minimum reflectance method, MRM)을 이용하여 산출된 AOD, 그리고 AHI에서는 단파적외선이용 지표면정보산출방법(Estimated surface reflectance from SWIR, ESR)을 이용한 방법의 AOD까지 총 네가지이다. 세 위성간의 산출결과에서 육지와 해양에서 일관된 결과를 보이고 있으나, MI와 GOCI에서는 구름제거에 한계가 존재하며 AOD의 과대 추정 문제가 보인다. 한편 지상장비인 AERONET과의 비교검증결과는 MI, GOCI, 그리고 AHI 의 MRM 방법, ESR 방법 에서 기대오차 내에 들어오는 비율(% within Expected error, EE)이 36.3, 48.4, 56.6, 68.2%로 각각 나타났다. MI의 경우는 단일 채널을 이용하여 에어로졸광학정보를 산출하고 있고, 계절에 따른 에어로졸 유형을 고정하고 있어, 다양한 오차가 포함되어 낮은 EE를 보이고 있다. 5, 6월에는 ESR 방법의 결과물은 높은 EE 를 나타내고 있는데 이는 GOCI, MI, MRM 방법 에서 사용하고 있는 최소반사도 방법보다 정확한 지면반사도를 산출하기 때문으로 추정된다. 이 결과는 AERONET 사이트 별로 RMSE 와 EE 로 설명하고 있으며, 검증한 총 22개 사이트 중 15개 사이트에서 ESR 방법이 가장 높은 EE 를 보이고 있고, RMSE는 13개 사이트에서 가장 낮게 나타났다. 또한 정지궤도 위성의 특징을 이용하여 시간대별 오차를 각 산출물 별로 보였다. 00~06 Universal Time Coordinated (UTC)에서 한 시간별로 최대로 나타나는 absolute median bias error 는 0.05, 0.09, 0.18, 0.18, 0.14, 0.09, 0.10 로 나타나며 00UTC에서는 GOCI 에서, 나머지 시간대에서는 MI에서 최대오차를 보였다.

뉴트리아(Myocastor coypus) 분포밀도 및 잠재적 서식가능지역 예측에 따른 관리방향 (A Management Plan According to the Estimation of Nutria (Myocastorcoypus) Distribution Density and Potential Suitable Habitat)

  • 김아름;김영채;이도훈
    • 환경영향평가
    • /
    • 제27권2호
    • /
    • pp.203-214
    • /
    • 2018
  • 본 연구는 국내에 서식하는 뉴트리아의 집중분포지역과 잠재적인 서식가능지역을 예측하여 효과적인 관리방향 설정에 유용한 자료를 제공하고자 하였다. 뉴트리아의 전국 분포 자료를 토대로 CVh(가능도 교차타당성)값을 띠폭(bandwidth)에 적용하여 분포밀도를 분석한 결과, 부산광역시, 대구광역시, 경상남도 소재 11개 시 군, 경상북도 소재 1개 군 등 낙동강수계에 위치한 14개 행정구역 내에서 우선적인 제거가 필요한 집중분포지역이 확인되었다. MaxEnt 모델을 이용한 잠재적인 서식가능지역 예측에서는 낙동강 중 하류 일대와 섬진강 하류, 가화천 일대에서 출현 가능성이 나타났다. 모형의 변수별 기여도는 고도, 건조한 달의 강수량, 가장 추운달의 최저온도, 수계로부터의 거리 순으로 높은 기여도를 보였으며, 출현확률과의 관계를 살펴보면, 고도 34m 이하의 저지대, 가장 추운달의 최저온도가 $-5.7^{\circ}C$이상 $-0.6^{\circ}C$ 이하인 지역, 가장 건조한 달의 강수량이 15-30mm, 수계로부터 1,373m 이하인 지역에서 임계값보다 높은 출현확률을 보였다. 뉴트리아의 생태적 특성과 본 연구결과를 종합하면, 고도, 물과의 접근성 및 이용성, 겨울철 낮은 기온이 뉴트리아의 정착과 확산에 영향을 주는 주요 요인으로 판단되므로 향후 서식가능지역의 검출과 확산 예측 모델링에 있어 중요한 변수로 검토될 수 있다. 뉴트리아와 같은 침입외래생물의 집중분포지역과 관리대상지역을 구분하고 그에 적합한 관리전략을 수립하여 관리현장에 적용하는 것은 영구적인 제어 목적의 관리에 있어 필수적인 사항이다. 본 연구에서 제시된 결과는 우선관리대상지역의 신속한 관리와 확산가능지역에 대한 사전 예방적 관리 등 전략적인 관리의 실행에 있어 유용한 자료로 활용될 수 있다.

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.

이어도 해양과학기지 관측 파고와 인공위성 관측 유의파고 차이의 특성 연구 (2004~2016) (Characteristics of the Differences between Significant Wave Height at Ieodo Ocean Research Station and Satellite Altimeter-measured Data over a Decade (2004~2016))

  • 우혜진;박경애;변도성;이주영;이은일
    • 한국해양학회지:바다
    • /
    • 제23권1호
    • /
    • pp.1-19
    • /
    • 2018
  • 이어도 해양과학기지 유의파고 자료와 인공위성(GFO, Jason-1, Envisat, Jason-2, Cryosat-2, SARAL) 고도계 유의파고 자료를 비교하기 위하여 2004년 12월부터 2016년 5월까지 약 12년 동안의 위성-이어도 관측 유의파고 사이의 일치점 데이터베이스를 생산하였다. 위성 유의파고는 이어도 해양과학기지 유의파고에 대하여 약 0.34 m의 평균 제곱근 오차와 0.17 m의 양의 편차를 나타내었다. 위성과 이어도 관측 유의파고 차는 특이한 계절변동이나 경년변동을 보이지 않고 위성이 중복 관측하는 기간에 대해서 유사한 변동 특성을 보여 위성 자료의 일관성을 확인할 수 있었다. 위성-이어도 유의파고 차이에 대한 바람장의 영향을 조사한 결과 모든 위성에 대해 평균적으로 0.17 m 정도의 양의 편차가 나타났다. 지형 및 해양과학기지 구조물의 영향을 파악하기 위하여 파향에 대한 파고 오차의 특이성을 분석하였으나 통계적으로 유의미한 특성이 나타나지 않았다. 위성-이어도 일치점의 거리에 따른 영향을 조사하기 위하여 위성-이어도 간의 거리에 대한 함수로 오차의 특성을 분석한 결과 평균은 거리와 무관하게 0.14 m로 거의 일정하게 유지되는 반면에 오차의 최댓값과 최솟값 사이의 진폭은 이어도로부터 멀어질수록 선형적으로 증가하는 특성이 발견되었다. 반면에 동해 해양기상위성부이를 활용한 위성 유의파고 자료의 정확도 평가 결과, 위성-실측 자료 사이의 평균 제곱근 오차는 0.27 m로 상대적으로 작은 오차가 발생하였으며, 이어도 파고 자료와 같이 특이한 오차 특성은 발견되지 않았다. 이어도 파고 관측 기기의 상이성을 고려하여 이 연구에서는 위성 유의파고 자료를 기반으로 이어도 유의파고 자료를 보정하는 식을 제안하였다. 또한 이어도 해양과학기지가 국제적인 해양관측 기지로 격상되기 위해서는 자료의 신뢰도 확보가 우선되어야 함을 강조하고 방법과 전략을 제시하였다.