• 제목/요약/키워드: Embedded-system

검색결과 4,509건 처리시간 0.031초

Support Vector Regression을 이용한 GARCH 모형의 추정과 투자전략의 성과분석 (Estimation of GARCH Models and Performance Analysis of Volatility Trading System using Support Vector Regression)

  • 김선웅;최흥식
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.107-122
    • /
    • 2017
  • 주식시장의 주가 수익률에 나타나는 변동성은 투자 위험의 척도로서 재무관리의 이론적 모형에서뿐만 아니라 포트폴리오 최적화, 증권의 가격 평가 및 위험관리 등 투자 실무 영역에서도 매우 중요한 역할을 하고 있다. 변동성은 주가 수익률이 평균을 중심으로 얼마나 큰 폭의 움직임을 보이는가를 판단하는 지표로서 보통 수익률의 표준편차로 측정한다. 관찰 가능한 표준편차는 과거의 주가 움직임에서 측정되는 역사적 변동성(historical volatility)이다. 역사적 변동성이 미래의 주가 수익률의 변동성을 예측하려면 변동성이 시간 불변적(time-invariant)이어야 한다. 그러나 대부분의 변동성 연구들은 변동성이 시간 가변적(time-variant)임을 보여주고 있다. 이에 따라 시간 가변적 변동성을 예측하기 위한 여러 계량 모형들이 제안되었다. Engle(1982)은 변동성의 시간 가변적 특성을 잘 반영하는 변동성 모형인 Autoregressive Conditional Heteroscedasticity(ARCH)를 제안하였으며, Bollerslev(1986) 등은 일반화된 ARCH(GARCH) 모형으로 발전시켰다. GARCH 모형의 실증 분석 연구들은 실제 증권 수익률에 나타나는 두터운 꼬리 분포 특성과 변동성의 군집현상(clustering)을 잘 설명하고 있다. 일반적으로 GARCH 모형의 모수는 가우스분포로부터 추출된 자료에서 최적의 성과를 보이는 로그우도함수에 대한 최우도추정법에 의하여 추정되고 있다. 그러나 1987년 소위 블랙먼데이 이후 주식 시장은 점점 더 복잡해지고 시장 변수들이 많은 잡음(noise)을 띠게 됨에 따라 변수의 분포에 대한 엄격한 가정을 요구하는 최우도추정법의 대안으로 인공지능모형에 대한 관심이 커지고 있다. 본 연구에서는 주식 시장의 주가 수익률에 나타나는 변동성의 예측 모형인 GARCH 모형의 모수추정방법으로 지능형 시스템인 Support Vector Regression 방법을 제안한다. SVR은 Vapnik에 의해 제안된 Support Vector Machines와 같은 원리를 회귀분석으로 확장한 모형으로서 Vapnik의 e-insensitive loss function을 이용하여 비선형 회귀식의 추정이 가능해졌다. SVM을 이용한 회귀식 SVR은 두터운 꼬리 분포를 보이는 주식시장의 변동성과 같은 관찰치에서도 우수한 추정 성능을 보인다. 2차 손실함수를 사용하는 기존의 최소자승법은 부최적해로서 추정 오차가 확대될 수 있다. Vapnik의 손실함수에서는 입실론 범위내의 예측 오차는 무시하고 큰 예측 오차만 손실로 처리하기 때문에 구조적 위험의 최소화를 추구하게 된다. 금융 시계열 자료를 분석한 많은 연구들은 SVR의 우수성을 보여주고 있다. 본 연구에서는 주가 변동성의 분석 대상으로서 KOSPI 200 주가지수를 사용한다. KOSPI 200 주가지수는 한국거래소에 상장된 우량주 중 거래가 활발하고 업종을 대표하는 200 종목으로 구성된 업종 대표주들의 포트폴리오이다. 분석 기간은 2010년부터 2015년까지의 6년 동안이며, 거래일의 일별 주가지수 종가 자료를 사용하였고 수익률 계산은 주가지수의 로그 차분값으로 정의하였다. KOSPI 200 주가지수의 일별 수익률 자료의 실증분석을 통해 기존의 Maximum Likelihood Estimation 방법과 본 논문이 제안하는 지능형 변동성 예측 모형의 예측성과를 비교하였다. 주가지수 수익률의 일별 자료 중 학습구간에서 대칭 GARCH 모형과 E-GARCH, GJR-GARCH와 같은 비대칭 GARCH 모형에 대하여 모수를 추정하고, 검증 구간 데이터에서 변동성 예측의 성과를 비교하였다. 전체 분석기간 1,487일 중 학습 기간은 1,187일, 검증 기간은 300일 이다. MLE 추정 방법의 실증분석 결과는 기존의 많은 연구들과 비슷한 결과를 보여주고 있다. 잔차의 분포는 정규분포보다는 Student t분포의 경우 더 우수한 모형 추정 성과를 보여주고 있어, 주가 수익률의 비정규성이 잘 반영되고 있다고 할 수 있다. MSE 기준으로, SVR 추정의 변동성 예측에서는 polynomial 커널함수를 제외하고 linear, radial 커널함수에서 MLE 보다 우수한 예측 성과를 보여주었다. DA 지표에서는 radial 커널함수를 사용한 SVR 기반의 지능형 GARCH 모형이 가장 우수한 변동성의 변화 방향에 대한 방향성 예측력을 보여주었다. 추정된 지능형 변동성 모형을 이용하여 예측된 주식 시장의 변동성 정보가 경제적 의미를 갖는지를 검토하기 위하여 지능형 변동성 거래 전략을 도출하였다. 지능형 변동성 거래 전략 IVTS의 진입규칙은 내일의 변동성이 증가할 것으로 예측되면 변동성을 매수하고 반대로 변동성의 감소가 예상되면 변동성을 매도하는 전략이다. 만약 변동성의 변화 방향이 전일과 동일하다면 기존의 변동성 매수/매도 포지션을 유지한다. 전체적으로 SVR 기반의 GARCH 모형의 투자 성과가 MLE 기반의 GARCH 모형의 투자 성과보다 높게 나타나고 있다. E-GARCH, GJR-GARCH 모형의 경우는 MLE 기반의 GARCH 모형을 이용한 IVTS 전략은 손실이 나지만 SVR 기반의 GARCH 모형을 이용한 IVTS 전략은 수익으로 나타나고 있다. SVR 커널함수에서는 선형 커널함수가 더 좋은 투자 성과를 보여주고 있다. 선형 커널함수의 경우 투자 수익률이 +526.4%를 기록하고 있다. SVR 기반의 GARCH 모형을 이용하는 IVTS 전략의 경우 승률도 51.88%부터 59.7% 사이로 높게 나타나고 있다. 옵션을 이용하는 변동성 매도전략은 방향성 거래전략과 달리 하락할 것으로 예측된 변동성의 예측 방향이 틀려 변동성이 소폭 상승하거나 변동성이 하락하지 않고 제자리에 있더라도 옵션의 시간가치 요인 때문에 전체적으로 수익이 실현될 수도 있다. 정확한 변동성의 예측은 자산의 가격 결정뿐만 아니라 실제 투자에서도 높은 수익률을 얻을 수 있기 때문에 다양한 형태의 인공신경망을 활용하여 더 나은 예측성과를 보이는 변동성 예측 모형을 개발한다면 주식시장의 투자자들에게 좋은 투자 정보를 제공하게 될 것이다.

온라인 쇼핑에서 웹루밍으로의 쇼핑전환 의도에 영향을 미치는 요인에 대한 연구 (An Empirical Study on Influencing Factors of Switching Intention from Online Shopping to Webrooming)

  • 최현승;양성병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.19-41
    • /
    • 2016
  • 정보통신기술의 발전과 모바일 기기 사용의 생활화로 인해 최근 많은 소비자들이 멀티채널 쇼핑(multi-channel shopping)이라는 새로운 쇼핑 행태를 보이고 있다. 온라인 쇼핑이 등장한 이후, 온라인 매장에서 상품을 구매하기 전 오프라인 매장에서 상품을 먼저 확인하는 쇼루밍(showrooming) 형태의 멀티채널 쇼핑이 한 때 대세를 이루었으나, 최근에는 스마트폰, 태블릿 PC, 스마트워치 등 스마트 기기 사용의 폭발적 증가와 옴니채널(omni-channel) 전략으로 대표되는 오프라인 채널의 대대적 반격으로 인해 오프라인 매장에서 상품을 구매하기 전 온라인(혹은 모바일)으로 정보를 먼저 확인하는 웹루밍(webrooming) 현상이 도드라지게 나타나 온라인 소매업자를 위협하고 있다. 이러한 상황에서 소비자의 온라인 쇼핑에서 웹루밍으로의 쇼핑전환 의도에 영향을 미치는 요인을 분석하는 것이 의미가 있음에도 불구하고, 기존 대부분의 선행연구는 싱글채널(single-channel) 혹은 멀티채널 쇼핑 자체에만 초점을 맞추고 있다. 이에, 본 연구에서는 밀고-당기기-이주이론(push-pull-mooring theory)을 바탕으로 소비자의 온라인 채널 쇼핑이 웹루밍 형태의 쇼핑으로 전환되는 과정을 상품정보 탐색과 구매행위로 각각 구분하여 그 영향을 실증하였다. 연구모형을 검증하기 위하여, 웹루밍 경험이 있는 수도권 소재 대학생을 대상으로 280개의 설문 표본을 수집하였다. 본 연구의 결과는 현업 마케팅 종사자에게 멀티채널 소비자들을 관리하는 데 있어 실무적인 시사점을 제공함과 동시에, 향후 다양한 형태의 멀티채널 쇼핑전환 연구로의 확장에 기여할 수 있을 것으로 기대한다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

수술을 시행한 비소세포 폐암 환자에서 EGFR, MMP-9 및 C-erbB-2의 발현과 환자 생존율과의 관계 (The Relationship between Expression of EGFR, MMP-9, and C-erbB-2 and Survival Time in Resected Non-Small Cell Lung Cancer)

  • 이승헌;정진용;이경주;이승현;김세중;하은실;김정하;이은주;허규영;정기환;정혜철;이승룡;이상엽;김제형;신철;심재정;인광호;강경호;유세화;김철환
    • Tuberculosis and Respiratory Diseases
    • /
    • 제59권3호
    • /
    • pp.286-297
    • /
    • 2005
  • 서 론 : 비소세포 폐암은 악성 종양 관련 사망의 중요한 원인 질환으로, 주요 병태생리 기전에 관여하는 EGFR, MMP-9 및 C-erbB-2의 발현 양상을 관찰 하는 것이 환자의 예후와 향후 치료 방향을 결정하는데 도움이 될 수 있다. 방 법 : 1995년 부터 2001년 까지 고려 대학교 의료원에 내원 후 원발성 비소세포 폐암 확진 후 외과절제술을 받은 81명 환자의 조직에 EGFR, MMP-9 및 C-erbB-2 면역 조직 화학 염색 및 정량화 후, 환자들의 특성 및 생존 기간과 함께, 조직 및 수술 병기에 따른 생물학적 표지자의 발현 양상을 후향적 고찰 하였다. 결 과 : 각 종양 조직 부위의 20%이상 염색되는 Grade 2 이상의 염색 양성률은, 편평상피세포암과 선암에서 EGFR은 75.0%와 63.4%, MMP-9은 43.3%와 43.9%, C-erbB-2는 23.3%와 22.0%를 보였다. 수술 병기가 I, II, IIIa 일때 EGFR 염색 양성률은 각각 75.0%, 66.7%, 76.9%, MMP-9은 41.7%, 47.6%, 46.2%, 그리고 C-erbB-2는 19.4%, 40.0%, 30.8%를 보였다. EGFR 양성군은 중앙 생존기간이 33.5개월로 EGFR 음성군의 71.8개월보다 유의한 불량한 예후를 나타냈다.(p<0.05). 그리고 MMP-9 양성군은 중앙 생존기간 35개월로 MMP-9 음성군의 65.3개월보다 불량한 생존 곡선의 양상을 보였으나 통계적 유의성은 없었다. 또한 C-erbB-2 양성군은 중앙 생존기간이 44.2개월, C-erbB-2 음성군은 58.4개월을 나타냈으나 통계적 유의한 차이는 없었다. EGFR과 MMP-9 동시 양성군은 전체 환자의 34.2%로서 중앙 생존기간이 26.9개월로 EGFR과 MMP-9 동시 음성군의 77.0개월보다 유의한 불량한 예후를 나타냈다(p<0.05) 결 론 : 비소세포 폐암 에서 EGFR의 양성군에서 음성군 보다 환자의 생존기간이 불량하였고, EGFR과 MMP-9의 동시 양성군에서 동시 음성군보다 생존기간이 불량하였다. C-erbB-2는 다른 생물학적 표지자에 비해서 낮은 염색 양성률을 나타냈으며 특이한 상관관계는 보이지 않았다.

병기 IB 자궁경부암에서 혈관내피세포성장인자(VEGF)의 발현이 예후에 미치는 영향 (The Expression of Vascular Endothelial Growth Factor (VEGF) is a Highly Significant Prognostic Factor in Stage IB Carcinoma of the Cervix)

  • 이익재;박경란;이종영;이강규;송지선;이광길;차동수;최현일
    • Radiation Oncology Journal
    • /
    • 제19권4호
    • /
    • pp.335-344
    • /
    • 2001
  • 목적 : 본 연구에서는 자궁경부암에서 VEGF의 발현과 기존의 예후인자들인 종양의 크기, 골반내 림프절 전이, 자궁경부 심부침윤, 림프계 침윤, 혈관계 침윤과의 상관관계를 분석하고, 생존율을 분석하여 VEGF의 예후 예측인자로서의 임상적 의의에 대해 알아보고자 하였다. 대상 및 방법 : 대상환자들은 1986년 1월부터 1998년 10월까지 연세대학교 원주의과대학 원주기독병원에서 자궁경부암으로 진단 받고 자궁근치 절제술과 양측 골반 림프절 절제술을 받은 FIGO 병기 IB인 환자 118명으로, 88명은 수술 후 화학요법이나 방사선치료가 시행되었다. VEGF 발현은 수술을 시행한 파라핀 조직을 가지고 면역조직화학 염색을 시행하여 평가하였다. 분석은 염색의 강도에 따라 0, +, ++, +++로 판정하였으며 0에서 ++까지를 저발현(low expression), + + +를 고발현(high expression)으로 분류하였다. 결과 : 대상 환자 118명중 VEGF 고발현을 보이는 환자는 35명$(29.7\%)$이었으며 VEGF 발현은 자궁경부 심부침윤(p=0.01)과 골반내 림프절 전이(p=0.03)와 유의한 상관관계가 있었다. 5년 생존율과 무병생존율은 VEGF 발현이 낮을 때 각각 $85.6\%,\;79.7\%$이었고, 고발현일때는 $98.5\%,\;100\%$로 의미 있는 차이를 보였다(p=0.03, <0.001). 다변량분석에서 생존율에 의미 있는 예후인자는 VEGF 발현(p=0.03)과 골반내 림프절전이(p=0.03)였고 무병생존율에 의미 있는 예후인자는 VEGF 발현(p<0.001), 그리고 종양의 크기(p=0.01)였다. 전 118예 중 12예에서 재발을 보였는데(골반내 재발 7예, 원격전이 5예) 이 중 11예가 VEGF 고발현을 보인 환자이었고 단 1예에서 VEGF 저발현을 보여, VEGF 발현이 높은 환자에서 골반내 재발(p=0.001)과 원격전이(p<0.001)가 의미 있게 높았다. 결론 : 면역조직화학염색을 통한 VEGF 발현의 정도는 조기 자궁경부암에서 기존의 치료 후 재발의 위험도가 높은 환자들을 찾아내는데 가장 의미 있는 예후 인자의 하나로 생각되며 나아가서 향후 VEGF 항체 등의 새로운 혈관억제요법의 임상연구를 시도하는데 있어서도 적합한 대상 환자들을 찾아내는데 유용한 지표로 사용될 수 있을 것으로 생각된다.

  • PDF

4-, 6-, 10-MV X-선원에서 공기동이 흡수선량에 미치는 효과 : 후두모형 (Air Cavity Effects on the Absorbed Dose for 4-, 6- and 10-MV X-ray Beams : Larynx Model)

  • 김창선;양대식;김철용;최명선
    • Radiation Oncology Journal
    • /
    • 제15권4호
    • /
    • pp.393-402
    • /
    • 1997
  • 목적 : 공기동을 포함한 병소 부위에 X-선원을 조사할 경우 공동과 근접한 영역에서의 저흡수선량 효과는 잘 알려져 있다. 공기-연조직 사이의 불균질면의 한 예로 후두 모형 즉, 조직 둥가물질과 그 사이에 삽입되어 있는 공기동을 만들었다. 본 연구에서는 방사선의 선질 조사면의 크기 공기동의 크기에 따른 공동 가까이에서의 흡수선량의 변화를 살펴보았다. 대상 및 방법 : 4-, 6-, 10-MV X-선원을 이용하여 2cm(폭)$\times$L(cm, 길이)$\times$2cm(높이)인 공기동을 포함한 후두 모형의 아크릴 팬톰에 대하여 흡수선량을 측정하였다. 흡수선량의 측정장비로 평행판전리함과 전리계를 이용하였다. 제작한 후두의 기하학적 치수는 상부 연조직$\cdot$공기동$\cdot$하부 연조직의 두께가 각각 4-, 2-, 4-cm이었다. 공기동이 없이 균일한 연조직 팬톰에 대한 공기동이 있는 경우의 흡수선량의 비(O/E)를 공기 공동-연조직의 경계로부터 거리를 변화시키면서 측정하였다. 표준화된 중강곡선과 최대흡수선량에 대한 입사면 반대쪽 표면에서의 흡수선량의 비를 초사면의 크기를 변화시키면서 측정하였다. 공기동의 크기에 따른 효과를 알기 위하여 여러 가지 조사면에 대하여 투영된 크기가 4cm(폭)$\times$L인 공기동의 높이(Z)를 변화시켜서 측정하였다. 결과 : 4-MV선원에서 $5cm\times5cm$ 이상의 조사면에서는 저흡수선량 효과가 없었다. 6-이나 10-MV선원에서 작은 조사야 즉, $4cm\times4cm$$5cm\times5cm$에서는 후두에 저흡수선량 부위가 나타났으며 $6cm\times6cm$ 이상의 조사면에서는 이 효과가 관찰되지 않았다. 선원의 선질이 증가할수록 저흘수선량인 조직층이 증가하였고 이때 표면 흡수선량의 크기는 변하지 않았다. 조사면의 크기가 $4cm\times4cm$에서 $8cm\times8cm$로 증가할 때 최대흡수선량에 대한 입사면 반대쪽의 공기동의 표면 선량은 4-, 6-, 10-MV 선원에서 각각 0.95, 0.92, 0.91에서 0.99로 증가하였다. 6-이나 10-MV 선원에서 공기동 표면에서의 흡수선량은 $5cm\times5cm$ 조사면에 있어서 예상값보다 각각 2-, 3-퍼센트의 감소가 있었고 또 4-MV에서는 감소효과를 발견할 수 없었다. $4cm\timesL\timesZ$ 공기동에서 그높이(Z)를 0.6에서 4.8cm까지 변화시켰을 때 조사면의 크기가 $8cm\times8cm$에서 공동의 크기에 무관하게 O/E>1.0이 관찰되었다. 결론 : 조사면내 공기동에 의한 저흘수선량 효과는 방사선의 선질$\cdot$조사면의 크기$\cdot$공기동의 크기에 의존된다. 이상의 연구 결과에서 고선질 선원이 공동을 포함한 병소 특히, 종양이 공기동의 표면까지 미치는 부위에 조사될 째 특별한 주의가 필요함을 알 수 있다. 이 경운 가능하면 조사되는 부위가 저전량이 되지않도록 저선질의 선원(예를 들면, 4-MV)을 쓰고 또 조사면을 넓혀야한다. 6-이나 10-MV 등의 고선질의 X-선을 쓰는 경우에는 조사면의 부위에 저선랸 부위가 생기므로 한번의 추가 조사를 더 시행할 필요가 있다.

  • PDF

쇼핑몰 이미지 저작권보호를 위한 영상 워터마킹 (Image Watermarking for Copyright Protection of Images on Shopping Mall)

  • 배경율
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.147-157
    • /
    • 2013
  • 디지털 환경의 도래와 언제 어디서나 접근할 수 있는 고속 네트워크의 도입으로 디지털 콘텐츠의 자유로운 유통과 이용이 가능해졌다. 이러한 환경은 역설적으로 다양한 저작권 침해를 불러 일으키고 있으며, 온라인 쇼핑몰에서 사용하는 상품 이미지의 도용이 빈번하게 발생하고 있다. 인터넷 쇼핑몰에 올라오는 상품 이미지와 관련해서는 저작물성에 대한 시비가 많이 일어나고 있다. 2001년 대법원 판결에 의하면 햄 광고를 위하여 촬영한 사진은 단순히 제품의 모습을 전달하는 사물의 복제에 불과할 뿐 창작적인 표현이 아니라고 적시하였다. 다만 촬영자의 손해액에 대해서는 인정함으로써 광고사진 촬영에 소요되는 통상적인 비용을 손해액으로 산정하게 하였다. 상품 사진 이외의 실내사진이라 하여도 '한정된 공간에서 촬영되어 누가 찍어도 동일한 사진'이 나올 수 밖에 없는 경우에는 창작성을 인정하지 않고 있다. 2003년 서울지방법원의 판례는 쇼핑몰에 사용된 사진에서 피사체의 선정, 구도의 설정, 빛의 방향과 양의 조절, 카메라 각도의 설정, 셔터의 속도, 셔터찬스의 포착 기타 촬영방법, 현상 및 인화 등의 과정에서 촬영자의 개성과 창조성이 인정되면 저작권법에 의하여 보호되는 저작물에 해당한다고 선고하여 손해를 인정하였다. 결국 쇼핑몰 이미지도 저작권법상의 보호를 받기 위해서는 단순한 제품의 상태를 전달하는 것이 아니라 촬영자의 개성과 창조성이 인정될 수 있는 노력이 필요하다는 것이며, 이에 따라 쇼핑몰 이미지를 제작하는 비용이 상승하고 저작권보호의 필요성은 더욱 높아지게 되었다. 온라인 쇼핑몰의 상품 이미지는 풍경사진이나 인물사진과 같은 일반 영상과 달리 매우 독특한 구성을 갖고 있으며, 따라서 일반 영상을 위한 이미지 워터마킹 기술로는 워터마킹 기술의 요구사항을 만족시킬 수 없다. 쇼핑몰에서 주로 사용되는 상품 이미지들은 배경이 흰색이거나 검은색, 또는 계조(gradient)색상으로 이루어져 있어서 워터마크를 삽입할 수 있는 공간으로 활용이 어렵고, 약간의 변화에도 민감하게 느껴지는 영역이다. 본 연구에서는 쇼핑몰에 사용되는 이미지의 특성을 분석하고 이에 적합한 이미지 워터마킹 기술을 제안하였다. 제안된 이미지 워터마킹 기술은 상품 이미지를 작은 블록으로 분할하고, 해당 블록에 대해서 DCT 양자화 처리를 함으로써 워터마크 정보를 삽입할 수 있도록 하였다. 균일한 DCT 계수 양자화 값의 처리는 시각적으로 영상에 블록화 현상을 불러오기 때문에 제안한 알고리즘에서는 블록의 경계 면에 붙어있는 영상 값에 대해서는 양자화 값의 분배를 작게 하고, 경계 면에서 멀리 떨어져있는 영상 값에 대해서는 양자화 값의 분배를 크게 함으로써 영상의 객관적 품질뿐 아니라 시각적으로 느끼는 주관적 품질도 향상 시켰다. 제안한 알고리즘에 의해서 워터마크가 삽입된 쇼핑몰 이미지의 PSNR(Peak Signal to Noise Ratio)은 40.7~48.5[dB]로 매우 우수한 품질을 보였으며, 일반 쇼핑몰 이미지에서 많이 사용되는 JPEG 압축은 QF가 70 이상인 경우에는 BER이 0이 나왔다.

온라인 상품평의 내용적 특성이 소비자의 인지된 유용성에 미치는 영향 (Impact of Semantic Characteristics on Perceived Helpfulness of Online Reviews)

  • 박윤주;김경재
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.29-44
    • /
    • 2017
  • 인터넷 상거래에서, 소비자들은 기존에 제품을 구매한 다른 사용자들이 작성한 상품평에 많은 영향을 받는다. 그러나, 상품평이 점차 축적되어감에 따라, 소비자들이 방대한 상품평을 일일이 확인하는데 많은 시간과 노력이 소요되고, 또한 무성의하게 작성된 상품평들은 오히려 소비자들의 불편을 초래하기도 한다. 이에, 본 연구는 온라인 상품평의 유용성에 영향을 미치는 요인들을 분석하여, 소비자들에게 실제로 도움이 될 수 있는 상품평을 선별적으로 제공하는 예측모형을 도출하는 것을 목적으로 한다. 이를 위해, 텍스트마이닝 기법을 사용하여, 상품평에 포함되어있는 다양한 언어적, 심리적, 지각적 요소들을 추출하였으며, 이러한 요소들 중에서 상품평의 유용성에 영향을 미치는 결정요인이 무엇인지 파악하였다. 특히, 경험재인 의류군과 탐색재인 전자제품군에 대한 상품평의 특성 및 유용성 결정요인이 상이할 수 있음을 고려하여, 제품군별로 상품평의 특성을 비교하고, 각각의 결정요인을 도출하였다. 본 연구에는 아마존닷컴(Amazon.com)의 의류군 상품평 7,498건과 전자제품군 상품평 106,962건이 사용되었다. 또한, 언어분석 소프트웨어인 LIWC(Linguistic Inquiry and Word Count)를 활용하여 상품평에 포함된 특징들을 추출하였고, 이후, 데이터마이닝 소프트웨어인 RapidMiner를 사용하여, 회귀분석을 통한, 결정요인 분석을 수행하였다. 본 연구결과, 제품에 대한 리뷰어의 평가가 높고, 상품평에 포함된 전체 단어 수가 많으며, 상품평의 내용에 지각적 과정이 많이 포함되어 있는 반면, 부정적 감정은 적게 포함된 상품평들이 두 제품 모두에서 유용하다고 인식되는 것을 알 수 있었다. 그 외, 의류군의 경우, 비교급 표현이 많고, 전문성 지수는 낮으며, 한 문장에 포함된 단어 수가 적은 간결한 상품평이 유용하다고 인식되고 있었으며, 전자제품의 경우, 전문성 지수가 높고, 분석적이며, 진솔한 표현이 많고, 인지적 과정과 긍정적 감정(PosEmo)이 많이 포함된 상품평이 유용하게 인식되고 있었다. 이러한 연구결과는 향후, 소비자들이 효과적으로 유용한 상품평들을 확인하는데 도움이 될 것으로 기대된다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.