• 제목/요약/키워드: Test mining

검색결과 520건 처리시간 0.034초

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.

k-Structure를 이용한 한국어 상품평 단어 자동 추출 방법 (Automatic Extraction of Opinion Words from Korean Product Reviews Using the k-Structure)

  • 강한훈;유성준;한동일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.470-479
    • /
    • 2010
  • 감정어 추출과 관련하여 기존 영어권 연구에서 제시된 방법의 대부분은 한국어에 직접 적용이 쉽지 않다. 한국어권 연구에서 제시된 방법 중 수작업에 의한 방법은 감정어 추출에 많은 시간이 걸린다는 문제점이 있다. 영어 시소러스 기반 한국어 감정어 추출 기술은 한국어와 영어 단어간 일대일 부정합에서부터 기인하는 정확도의 저하를 제고해야 하는 과제를 갖고 있다. 한국어 구문 분석기를 기반으로 한 연구는 출현 빈도가 낮은 감정어를 선정하지 못할 수 있는 문제점을 내포하고 있다. 본 논문에서는 한국어 상품평 중 단순한 문장에서 감정어를 자동으로 추출하는 데 있어 기존에 제안된 한국어권 연구에 상호 보완적으로 정확도를 향상시킬 수 있는 k-Structure(k=5 또는 8) 기법을 제안한다. 단순한 문장이라 함은 패턴 길이를 최대 3으로 한다. 이는 평가 대상 상품(예를 들어 '카메라')의 속성 명 f (예를 들어 카메라의 '배터리')를 기준으로 ${\pm}2$의 거리에 감정어가 포함되어 있는 문장을 의미한다. 성능 실험은 국내 주요 쇼핑몰로부터 수집한 1,868개의 상품평을 대상으로 미리 주어진 8개의 속성 명에 대한 감정어를 k-Structure를 이용하여 자동으로 추출하고 그 정확도를 평가하였다. 그 결과, k=5일 경우 평균 79.0%의 재현률, 87.0%의 정확률을 보였고, k=8일 경우 평균 92.35%의 재현률, 89.3%의 정확률을 얻을 수 있었다. 또한, 영어권 연구에서 제안된 방법 중 PMI-IR(Pointwise Mutual Information-Information Retrieval) 기법을 이용하여 실험을 수행하였다. 이 결과, 평균 55%의 재현률과 57%의 정확률을 보였다.

조사목적별 기준에 부합하는 오염부지 조사방법의 최적화 방안에 관한 연구 (Optimization of Contaminated Land Investigation based on Different Fitness-for-Purpose Criteria)

  • Jong-Chun Lee;Michael H. Ramsey
    • 자원환경지질
    • /
    • 제36권3호
    • /
    • pp.191-200
    • /
    • 2003
  • 중금속으로 오염된 폐광산 주변부나 유류누출로 인한 토양오염 등과 같은 오염토양부지에 대한 조사를 위해서는 우선 조사의 목적과 상황에 알맞은 기준을 설정하고, 이를 토대로 조사방법을 설계하여야 한다. 이러한 상황별 조사방법은 조사결과의 질적 수준 뿐만 아니라 모방결합에 영향을 미치게 되는데 그 수준을 제한하는 요인으로는 보통 총 조사비용, 관련규제법이 요구하는 조사수준, 그리고 전문적 경험에 의한 주관적 기준 등이 그 예가 될 수 있다. 본 논문에서는 조사 목적에 따라 달리하는 각 기준(fitness-for-purpose criteria)을 만족시키게끔 조사방법을 설계하는 예를 들어보았다. 먼저, 경제적 요소와 측정된 자료의 질적 수준을 참고하는 방법을 고안하여 보았다. 이를 위해 측정불확도(measurement uncertainty)로 평가되는 측정결과의 질적 수준이 의사결정의 오류에 영향을 미치는 확률을 확률적손실계산식을 이용하여 평가하고, 이를 이용하여 비용경제적인 측면에서 조사를 최적화하는 방안을 고안하였다. 이와 더불어 위해성 평가를 위한 부지의 평균오염도수준 산출의 예와 같이 의사결정의 오류에 의한 손실보다는 측정된 평균값의 오차와 측정에 요구되는 비용을 최소화 해야 하는 경우와, 또한 측정값에 대한 일정한 질적 수준이 요구되는 경우의 조사방법, 그리고 제한된 비용을 최대한 활용할 수 있는 시료수와 분석수의 최적비율 등을 도출하는 방법을 다루었다. 각 방법은 영국의 두 오염지역에 적용하여 그 타당성을 평가하여보았다.

중금속 오염 토양에서 안정화제가 청경채의 초기 생육과 중금속 흡수량에 미치는 영향 (Effects of Soil Amendments on the Early Growth and Heavy Metal Accumulation of Brassica campestris ssp. Chinensis Jusl. in Heavy Metal-contaminated Soil)

  • 김민석;구남인;김정규;양재의;이진수;박관인
    • 한국토양비료학회지
    • /
    • 제45권6호
    • /
    • pp.961-967
    • /
    • 2012
  • 본 연구에서는 6 종류의 안정화제의 중금속 안정화 효율을 평가하기 위해 생물학적 평가 방법을 이용하였다. 12 종의 식물을 대상으로 한 스크린 실험에서 청경채를 선발하여 이를 안정화제 평가에 사용하였다. 식물 독성실험 결과 농용석회와 제강슬래그는 청경채의 뿌리 신장에, 백운석은 지상부 신장에 각각 악영향을 주었다. 화학적 평가 방법뿐만 아니라 생물학적 평가 방법을 고려하였을 때에는 AMD 슬러지가 가장 추천되어질 만한 것으로 판단된다. 그러나 토양 환경과 청경채의 특수성 때문에 위 결과를 일반화 하는 것은 어려우며 명확한 결과 도출을 위해서 재배기간의 조정과 추가적인 화학 침출 평가 방법 등이 필요해 보인다.

온라인 문서 마이닝 접근법을 활용한 크라우드펀딩의 성공여부 예측 방법 (Online Document Mining Approach to Predicting Crowdfunding Success)

  • 남수현;진윤선;권오병
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.45-66
    • /
    • 2018
  • 크라우드펀딩(Crowdfunding)은 최근 벤처 기업의 기금 모금을 위한 엔젤 기금보다 인기가 있다. 이에 따라 크라우드펀딩의 성공 요인을 파악하는 것은 기금 조성자 및 투자자로 하여금 크라우드펀딩 프로젝트와 관련된 효과적 의사결정을 내리기 위해 크라우드펀딩 성공 여부를 선험적으로 예측하는데 유용할 것이다. 이에 최근까지 프로젝트의 목표 및 관련 SNS의 수와 같은 몇 가지 수치적 요인을 독립변인으로 제안하여 이들이 크라우드펀딩 캠페인의 성공에 어떤 영향을 미치는지 등이 연구되어오고 있었다. 그러나 수치가 아닌 비정형 데이터를 통한 크라우드펀딩 캠페인의 성공에 대한 예측은 거의 이루어진 바 없으며, 특히 프로젝트를 소개하는 문서에 대한 특성 분석을 통해 해당 프로젝트의 성공여부를 예측하려는 연구는 아직 이루어지지 않았다. 사실 프로젝트를 소개하는 문서는 공개되어 있어 확보에 드는 비용이 적게 들기 때문에 매우 유용하다. 따라서 본 연구의 목적은 Wadiz 등 온라인상으로 공개되어 있는 프로젝트에 대한 소개 문서를 기반으로 크라우드펀딩 프로젝트의 성공을 예측하는 새로운 방법을 제안하는 것이다. 제안된 방법의 성능을 테스트하기 위해, 본 연구에서는 1,980개의 실제 크라우드펀딩 프로젝트와 관련된 텍스트를 수집하고 경험적으로 분석했다. 텍스트 데이터 세트에서 카테고리, 응답 수, 자금 조달 목표, 기금 모금 방법, 보상, SNS 추종자 수, 이미지 및 비디오 수 및 기타 숫자 데이터와 같은 프로젝트에 대한 세부 정보를 수집하였다. 분석 결과 이러한 요인들은 분류 알고리즘에서 분류 성능을 제고하는데 의미 있는 변인으로 확인되었다. 즉, 제안된 방법이 최근에 제안된 비정형 텍스트 기반 방법보다 정확도나 F-점수 및 수행 경과 시간에서 성능이 우수하였다.

소셜빅데이터를 이용한 온라인 소비자감성지수(e-CCSI) 개발 (Electronic-Composit Consumer Sentiment Index(CCSI) development by Social Bigdata Analysis)

  • 김유신;홍성관;강희주;정승렬
    • 인터넷정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.121-131
    • /
    • 2017
  • 인터넷, 소셜미디어, 모바일 등의 등장이후 소비자들은 개인의 의견을 온라인을 통해 적극적으로 표명하기 시작했고 이의 확산 또한 실시간으로 이루어지고 있다. 인터넷 기반의 다양한 커뮤니케이션 활동들을 통해 생산되는 텍스트는 인터넷을 사용하는 사용자들이 공유하고 공감하는 자원으로서 단순한 소통의 도구를 넘어 분석의 가치가 있는 새로운 정보의 창고가 되고 있다. 세계 각국의 정부와 기업은 인터넷과 소셜미디어를 통해 생산되는 소셜 빅데이터를 활용하여 사회/경제적 문제의 해결과 정부의 정책을 효과적으로 추진하는데 적극 활용하고 있다. 특히 경제와 관련해서는 경기현황에 대한 경제주체들의 움직임을 보다 빠르고 정확하게 분석하고 예측하여 이에 알맞은 정책을 적기에 실시할 수 있도록 다각적인 활동을 펼치고 있다. 본 연구에서는 소셜 미디어에 내재된 소비자의 직적접이고 즉시성 있는 의견을 경제적 측면에서 활용할 수 있는 온라인 소비자감성지수 모형을 제시하고 구현하였다. 이를 위해 한국은행의 소비자동향조사(CSI)와 소비자심리지수(CCSI)를 온라인으로 수행할 수 있는 어휘분류체계(온톨로지)와 감성사전을 구축하고 감성분석을 실시하여 생활형편, 경제상황, 소비와 수입 4가지 영역의 소셜감성지수를 도출하였다. 또한 이들을 결합한 온라인 소비자감성지수(e-CCSI)를 개발하고 소비자심리지수와 비교를 통해 유용성을 확인하였다.

주방식 광산의 패널 광주 수직응력 추정을 위한 수치해석 연구 (Numerical Study on Vertical Stress Estimation for Panel Pillars at Room and Pillar Mines)

  • 윤동호;송재준
    • 터널과지하공간
    • /
    • 제30권5호
    • /
    • pp.473-483
    • /
    • 2020
  • 본 연구에서는 3차원 유한차분법(FDM) 프로그램인 FLAC3D를 이용하여 주방식 채광장을 모사하고 채굴적 형성에 의한 현지응력 교란으로 광주에 집중되는 수직응력의 변화를 분석하였다. 오차율과 해석시간을 고려하여 적절한 조합의 요소망 크기를 선정하고 지류론 암반을 모사하여 요소망 조합과 개발 심도에 따른 해석 성능을 검증하였다. 본 해석에서는 개발 영역 내에 1개(1×1)~ 121개(11×11)의 패널 광주가 생성되도록 채굴적을 형성하여 가장 높은 수준의 응력집중이 발생하는 중앙부 광주의 상부 수평단면에 작용하는 수직응력을 측정하였다. 40 m~320 m까지 40 m 단위로 굴착심도를 변경하여 동일한 과정을 반복 수행하였다. 해석 결과, 개발 규모(NP)가 클수록, 개발심도(HOB)가 작을수록 중앙부 광주의 수직응력 값이 지류론 추정값에 가까워지는 것을 확인하였다. 또한, 개발 규모가 작고 대심도인 경우에는 지류론에 의한 추정 시 수직응력이 과대평가될 수 있으며, 동일한 개발규모인 경우 심도가 증가할수록 수직응력계수(VSF)가 일정한 값으로 수렴하는 경향이 있음을 확인하였다.

석회석 광산에서 발생한 대규모 암반사면의 붕괴원인 분석에 관한 연구 (A Study on the Failure Cause of Large Scale Rock Slope in Limestone Quarries)

  • 이상은;김학성;장윤호
    • 터널과지하공간
    • /
    • 제24권4호
    • /
    • pp.255-274
    • /
    • 2014
  • 본 연구는 강원도 강릉시 소재의 ${\bigcirc}{\bigcirc}$ 석회석 광산에서 2012년 8월 23일 오후 7시경 붕괴된 대규모 암반사면을 대상으로 한다. 붕괴 이전에 사면의 높이는 약 200 m이고 평균경사는 $45^{\circ}$로 형성되어 있다. 사면 붕괴 후 추정된 붕괴량은 $1,500,000m^3$ 정도이다. 사면 붕괴의 원인을 분석하기 위하여 시추, 물리탐사, 지표지질조사, 선구조분석, 공내영상촬영, 입체사진영상촬영, 실내시험 및 현장시험, 년도별 채광현황 및 강우량 분석등의 현장 및 지반조사를 실시하였다. 사면의 안정성을 파악하기 위하여 SMR, 평사투영법, 한계평형법, 연속체 및 불연속체 해석을 수행하였다. 이 결과들로부터 사면붕괴의 원인은 지형, 강우, 암종 및 암질, 불연속면, 석회암 공동이나 단층의 지질구조적 특성 등 여러 요인들이 복합적으로 작용하여 사면활동이 발생한 것으로 추정되지만, 석회암 공동을 고려하지 않을 경우 사면 붕괴는 발생하지 않는 것으로 분석되었다. 석회암 공동을 고려한 연속체 해석에서 사면 안전율이 0.66으로 나타났다. 따라서 대규모 사면붕괴의 근본적인 원인은 단층대를 따라 발달하고 있는 석회암 공동의 영향에 기인하는 것으로 판단된다.

동결융해시험에 의한 "CSG" 재료의 장기강도 및 내구 특성 (Long-Term Compressive Strength and Durability Properties of "CSG" Materials by Freezing-Thawing Test)

  • 김광일;김기영;문홍득;권혁춘
    • 한국지반환경공학회 논문집
    • /
    • 제17권12호
    • /
    • pp.35-43
    • /
    • 2016
  • 시공기술의 발전과 더불어 댐 제방 건설과 환경문제가 크게 대두되고 있는 실정이다. 최근 여러 국가에서 댐 제방 건설시 골재, 시공성, 기초지반에 대한 요구가 상대적으로 높지 않은 CSG(Cemented Sand and Gravel)재료를 활발히 연구, 적용하고 있다. CSG 재료는 시공현장 하상골재, 현장에서 발생하는 암버럭 등을 인위적으로 입도조정하지 않고 최대골재 치수만을 선별하여 소량의 시멘트와 혼합하여 강도증가 및 급속시공이 가능하다. CSG 재료는 인위적인 석산개발 등에 의한 환경파괴를 최소화함으로써 환경부하저감 및 공사비 등의 측면에서 비교적 경제적이며 친환경적이다. CSG 재료의 외부환경은 일반콘크리트가 접하는 수화열환경과는 달리 건습반복, 동결융해 등의 환경에 노출되게 된다. 그러므로 댐 제방구조물의 중요성을 감안하여 CSG 재료의 내구성에 대한 연구가 필요하다. 본 연구는 CSG 재료의 내구성에 대하여 고찰하고자 현장채취 CSG 코어재료에 대하여 동결융해 시험을 실시하였다. 시험결과, CSG 재료의 내구성 지수는 시멘트함량 $0.4{\sim}0.6kN/m^3$의 경우 30~40, $0.8{\sim}1.0kN/m^3$의 경우 40 이상으로 나타났다. 일축압축강도는 $0.4{\sim}0.6kN/m^3$에서 동결융해 전의 30~50%, $0.8~1.0kN/m^3$에서 동결융해 전의 40~70%로 감소하는 것으로 나타났다. 결과적으로 시멘트함량 $0.8kN/m^3$이상의 경우 강도 및 내구성 측면에서 비교적 타당한 것으로 판단된다.

SNS감성 분석을 이용한 주가 방향성 예측: 네이버 주식토론방 데이터를 이용하여 (Stock Price Prediction Using Sentiment Analysis: from "Stock Discussion Room" in Naver)

  • 김명진;류지혜;차동호;심민규
    • 한국전자거래학회지
    • /
    • 제25권4호
    • /
    • pp.61-75
    • /
    • 2020
  • 주식의 가격을 이해하고 예측하기 위해서 활용되는 데이터의 범위는 기존의 정형화된 데이터에서 비정형화된 다양한 종류의 데이터로 확대되고 있다. 본 연구는 SNS에서 수집된 댓글 데이터가 주식의 미래 가격의 변동에 영향을 미치는지를 조사한다. 가장 많은 주식투자자가 참여하는 커뮤니티인 네이버 주식토론방에서 20개 종목에 대한 6개월 간의 댓글 데이터를 수집하여, 이들 데이터가 1시간 후의 가격 변동의 방향과 가격 변동의 폭에 대한 예측력을 가지는지 조사한다. 예측 관계는 LSTM과 CNN등의 딥뉴럴네트워크 기법을 활용하여 모델링하였다. 20개 종목에 대해 조사하여 13개 종목에서 미래의 주가 이동 방향을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었고, 16개 종목에서 미래의 주가 변동폭을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었다. 본 연구는 네이버 주식토론방과 같은 SNS에서 형성된 여론이 주식 종목의 수급에 영향을 주어 가격의 변동 요인으로도 작용할 수 있다는 점을 확인한다.