• 제목/요약/키워드: mining system

검색결과 1,851건 처리시간 0.029초

설명가능한 그래프 신경망을 활용한 리뷰 콘텐츠 기반의 유용성 예측모형 (The Prediction of the Helpfulness of Online Review Based on Review Content Using an Explainable Graph Neural Network)

  • 김은미;야오즈옌;홍태호
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.309-323
    • /
    • 2023
  • 온라인 리뷰의 역할이 중요해짐에 따라 유용한 리뷰를 선별하기 위해 많은 연구들이 이루어져 왔다. 유용한 리뷰는 고객들이 유용하다고 인지하는 리뷰이며, 평점, 리뷰길이, 리뷰내용 등에 영향을 받는 것으로 많은 연구에서 검증되었다. 유용한 리뷰는 소비자들의 투표에 의한 '좋아요' 수에 의해 결정되며 유용성 투표가 많을수록 소비자의 구매의사결정에 중요한 영향을 미치는 것으로 간주된다. 그러나 최근에 작성되어 많은 고객들에게 노출되지 않은 리뷰는 상대적으로 '좋아요' 수가 적을 수 있으며, 투표에 응하지 않아 '좋아요' 수가 없을 수도 있다. 따라서 유용한 리뷰를 판단하기 위해 '좋아요' 수에 의존하기 보다는 리뷰 내용을 기반으로 유용한 리뷰를 분류하고자 한다. 리뷰의 텍스트는 리뷰 유용성에 가장 큰 영향을 미치는 요인으로, 토픽 모델링, 감정분석 등 텍스트 마이닝 기법을 적용하여 리뷰 텍스트에 포함된 콘텐츠와 감정의 영향을 다양하게 분석하고 있다. 본 연구에서는 글로벌 영화정보 사이트인 IMDb의 영화리뷰를 활용하여 리뷰 콘텐츠 기반의 리뷰 유용성 예측모형을 제안한다. 설명가능한 그래프 신경망인 GNN(Graph Neural Network)을 적용하여 리뷰 유용성 예측모형을 구축하고, 설명가능한 인공지능을 통해 예측모형의 한계인 모형의 해석에 대한 문제를 해결한다. 설명가능한 그래프 신경망은 리뷰들 간의 연결관계도 확인할 수 있어 유용한 리뷰 또는 유용하지 않은 리뷰에 대해 보다 신뢰할 수 있는 정보를 제공할 수 있을 것이라 기대한다.

지속가능한 자원관리를 위한 섬 지역 관광자원의 공간정보와 소셜미디어 빅데이터 분석 결과를 활용한 격차분석 (A Gap Analysis Using Spatial Data and Social Media Big Data Analysis Results of Island Tourism Resources for Sustainable Resource Management)

  • 이성희;이주경;손용훈;김용진
    • 농촌계획
    • /
    • 제30권2호
    • /
    • pp.13-24
    • /
    • 2024
  • This study conducts an analysis of social media big data pertaining to island tourism resources, aiming to discern the diverse forms and categories of island tourism favored by consumers, ascertain predominant resources, and facilitate objective decision-making grounded in scientific methodologies. To achieve this objective, an examination of blog posts published on Naver from 2022 to 2023 was undertaken, utilizing keywords such as 'Island tourism', 'Island travel', and 'Island backpacking' as focal points for analysis. Text mining techniques were applied to sift through the data. Among the resources identified, the port emerged as a significant asset, serving as a pivotal conduit linking the island and mainland and holding substantial importance as a focal point and resource for tourist access to the island. Furthermore, an analysis of the disparity between existing island tourism resources and those acknowledged by tourists who actively engage with and appreciate island destinations led to the identification of 186 newly emerging resources. These nascent resources predominantly clustered within five regions: Incheon Metropolitan City, Tongyeong/Geoje City, Jeju Island, Ulleung-gun, and Shinan-gun. A scrutiny of these resources, categorized according to the tourism resource classification system, revealed a notable presence of new resources, chiefly in the domains of 'rural landscape', 'tourist resort/training facility', 'transportation facility', and 'natural resource'. Notably, many of these emerging resources were previously overlooked in official management targets or resource inventories pertaining to existing island tourism resources. Noteworthy examples include ports, beaches, and mountains, which, despite constituting a substantial proportion of the newly identified tourist resources, were not accorded prominence in spatial information datasets. This study holds significance in its ability to unearth novel tourism resources recognized by island tourism consumers through a gap analysis approach that juxtaposes the existing status of island tourism resource data with techniques utilizing social media big data. Furthermore, the methodology delineated in this research offers a valuable framework for domestic local governments to gauge local tourism demand and embark on initiatives for tourism development or regional revitalization.

부산항 항만안전 주요 이슈 동향에 관한 연구 (A Study on Trends of Key Issues in Port Safety at Busan Port)

  • 이정민;하도연;김주혜
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.34-48
    • /
    • 2024
  • 글로벌 공급망에 예측 불가능한 위험성이 확산되면서 세계의존도가 높은 항만물류산업의 위험부담이 높아지고 있다. 이에 본 연구에서는 기초적인 연구로 국내 항만의 안전성에 위험을 주는 다양한 이슈들을 알아보고자 하였다. 이를 위해 부산항의 항만안전과 관련된 뉴스 기사 데이터를 활용하여 LDA토픽모델링 분석과 시계열 선형회귀분석을 진행하였고 부산항 항만안전 주요 이슈들의 변화와 그 동향을 파악하였다. 본 연구의 분석 결과는 다음과 같다. 지난 30년동안 부산항 항만안전과 관련된 주요 이슈는 총 9개이며 이들을 5년 주기의 시기별로 살펴본 결과, 지난 30년 동안 해상안전 이슈, 수입화물 검역 안전 이슈, 노조파업 관련 이슈, 자연재해 관련 이슈가 지속해서 등장했다. 부산항 항만안전 주요 이슈는 주로 예측 불가능한 성격이 큰 사회환경적 유형과 자연현상적 유형으로 글로벌 불확실성의 영향을 많이 받고 있음을 알 수 있었다. 따라서 분석 결과로 도출된 항만안전 주요 이슈들을 위주로 부산항 항만안전 강화를 위한 정책을 체계적으로 수립할 필요가 있으며 예측 불가능한 위험상황을 대비한 부산항 항만안전 회복탄력성을 강화할 필요가 있다. 끝으로 다양하게 변화하는 사회적 여건에 맞춰 항만안전 강화를 도모할 수 있는 선진적인 연구 활동이 필요할 것이다.

주관적 웰빙 상태 측정을 위한 비정형 데이터의 상황기반 긍부정성 분석 방법 (Analyzing Contextual Polarity of Unstructured Data for Measuring Subjective Well-Being)

  • 최석재;송영은;권오병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.83-105
    • /
    • 2016
  • 의료IT 서비스의 유망 분야인 정신건강 증진을 위한 주관적 웰빙 서비스(subjective well-being service) 구현의 핵심은 개인의 주관적 웰빙 상태를 정확하고 무구속적이며 비용 효율적으로 측정하는 것인데 이를 위해 보편적으로 사용되는 설문지에 의한 자기보고나 신체부착형 센서 기반의 측정 방법론은 정확성은 뛰어나나 비용효율성과 무구속성에 취약하다. 비용효율성과 무구속성을 보강하기 위한 온라인 텍스트 기반의 측정 방법은 사전에 준비된 감정어 어휘만을 사용함으로써 상황에 따라 감정어로 볼 수 있는 이른바 상황적 긍부정성(contextual polarity)을 고려하지 못하여 측정 정확도가 낮다. 한편 기존의 상황적 긍부정성을 활용한 감성분석으로는 주관적 웰빙 상태인 맥락에서의 감성분석을 할 수 있는 감정어휘사전이나 온톨로지가 구축되어 있지 않다. 더구나 온톨로지 구축도 매우 노력이 소요되는 작업이다. 따라서 본 연구의 목적은 온라인상에 사용자의 의견이 표출된 비정형 텍스트로부터 주관적 웰빙과 관련한 상황감정어를 추출하고, 이를 근거로 상황적 긍부정성 파악의 정확도를 개선하는 방법을 제안하는 것이다. 기본 절차는 다음과 같다. 먼저 일반 감정어휘사전을 준비한다. 본 연구에서는 가장 대표적인 디지털 감정어휘사전인 SentiWordNet을 사용하였다. 둘째, 정신건강지수를 동적으로 추정하는데 필요한 비정형 자료인 Corpora를 온라인 서베이로 확보하였다. 셋째, Corpora로부터 세 가지 종류의 자원을 확보하였다. 넷째, 자원을 입력변수로 하고 특정 정신건강 상태의 지수값을 종속변수로 하는 추론 모형을 구축하고 추론 규칙을 추출하였다. 마지막으로, 추론 규칙으로 정신건강 상태를 추론하였다. 본 연구는 감정을 분석함에 있어, 기존의 연구들과 달리 상황적 감정어를 적용하여 특정 도메인에 따라 다양한 감정 어휘를 파악할 수 있다는 점에서 독창성이 있다.

토픽모델링을 활용한 국내 문헌정보학 연구동향 분석 (A Study on the Research Trends in Library & Information Science in Korea using Topic Modeling)

  • 박자현;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.7-32
    • /
    • 2013
  • 본 연구는 국내 문헌정보학 분야의 연구동향을 규명하기 위하여 문헌정보학 주요 학술지인, 정보관리학회지, 한국문헌정보학회지, 한국도서관 정보학회지, 한국비블리아학회지의 1970년도부터 2012년도까지 발표 논문 초록을 수집하여 LDA(Latent Dirichlet Allocation)기반의 토픽 모델링 실험을 수행하였다. 그 결과를 종합하면 다음과 같다. 첫째, 토픽모델링 실험에서 도출된 연구주제를 문헌정보학 주제분류표와 비교 분석한 결과, '정보학'영역의 디지털도서관, 이용연구, 인터넷, 전문가시스템, 계량정보학, 자동화, 정보검색, 정보시스템, '도서관 서비스'영역의 정보서비스, 도서관 유형별 서비스, 이용자 교육/정보리터러시, 서비스 평가, '문헌정보학 기초'영역의 도서관과 사회, 전문성, '자료조직'영역의 분류, 편목, 메타데이터, '도서관 경영'영역의 도서관 평가, 장서개발/관리, '서지학'영역의 고서지, '도서관 체제'영역의 도서관 및 정보정책, '출판'영역의 도서/출판, '기록관리학'영역의 하위주제 등과 연결할 수 있었다. 또한 가장 많은 연구주제가 발견된 학문영역은 정보학과 도서관서비스로 나타났다. 둘째, 문헌정보학의 주요 연구주제에서 도서관 유형별 서비스 및 평가, 인터넷, 메타데이터의 연구주제는 상승세를 보였으나, 도서, 분류, 편목, 고서지에 관한 연구주제는 하강세를 보였다. 셋째, 학술지를 구분하여 비교 분석한 결과, 정보관리학회지는 도서관에 관한 연구주제보다 정보학에 관한 연구주제가 많이 출현하였고, 한국문헌정보학회지와 한국도서관 정보학회지, 한국비블리아학회지는 도서관에 관한 연구주제가 정보학에 관한 주제보다 많이 나타났다.

집단지성을 이용한 한글 감성어 사전 구축 (Building a Korean Sentiment Lexicon Using Collective Intelligence)

  • 안정국;김희웅
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.49-67
    • /
    • 2015
  • 최근 다양한 분야에서 빅데이터의 활용과 분석에 대한 중요성이 대두됨에 따라, 뉴스기사와 댓글과 같은 비정형 데이터의 자연어 처리 기술에 기반한 감성 분석에 대한 관심이 높아지고 있다. 하지만, 한국어는 영어와는 달리 자연어 처리가 어려운 교착어로써 정보화나 정보시스템에의 활용이 미흡한 실정이다. 이에 본 연구는 감성 분석에 활용이 가능한 감성어 사전을 집단지성으로 구축하였고, 누구나 연구와 실무에 사용하도록 API서비스 플랫폼을 개방하였다(www.openhangul.com). 집단지성의 활용을 위해 국내 최대 대학생 소셜네트워크 사이트에서 대학생들을 대상으로 단어마다 긍정, 중립, 부정에 대한 투표를 진행하였다. 그리고 집단지성의 효율성을 높이기 위해 감성을 '정의'가 아닌 '분류'하는 방식인 폭소노미의 '사람들에 의한 분류법'이라는 개념을 적용하였다. 총 517,178(+)의 국어사전 단어 중 불용어 형태를 제외한 후 감성 표현이 가능한 명사, 형용사, 동사, 부사를 우선 순위로 하여, 현재까지 총 35,000(+)번의 단어에 대한 투표를 진행하였다. 본 연구의 감성어 사전은 집단지성의 참여자가 누적됨에 따라 신뢰도가 높아지도록 설계하여, 시간을 축으로 사람들이 단어에 대해 인지하는 감성의 변화도 섬세하게 반영하는 장점이 있다. 따라서 본 연구는 앞으로도 감성어 사전 구축을 위한 투표를 계속 진행할 예정이며, 현재 제공하고 있는 감성어 사전, 기본형 추출, 카테고리 추출 외에도 다양한 자연어 처리에 응용이 가능한 API들도 제공할 계획이다. 기존의 연구들이 감성 분석이나 감성어 사전의 구축과 활용에 대한 방안을 제안하는 것에만 한정되어 있는 것과는 달리, 본 연구는 집단지성을 실제로 활용하여 연구와 실무에 활용이 가능한 자원을 구축하여 개방하여 공유한다는 차별성을 가지고 있다. 더 나아가, 집단지성과 폭소노미의 특성을 결합하여 한글 감성어 사전을 구축한 새로운 시도가 향후 한글 자연어 처리의 발전에 있어 다양한 분야들의 융합적인 연구와 실무적인 참여를 이끌어 개방적 협업의 새로운 방향과 시사점을 제시 할 수 있을 것이라 기대한다.

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.

달성중석광산(達城重石鑛山) 산성폐수(酸性廢水) 처리(處理)를 위(爲)한 인공소택지(人工沼澤池) 개념(槪念) 설계(設計) (Conceptual Design of Constructed Wetlands to Treat Acid Mine Drainage from the Dalsung W-CU Mine, Korea)

  • 홍영국;;나현준
    • 자원환경지질
    • /
    • 제29권1호
    • /
    • pp.65-75
    • /
    • 1996
  • 대구(大邱) 달성중석(達城重石) 폐광산(廢鑛山)에서 유출(流出)되는 유해(有害)한 산성광산(醒性鑛山) 폐수처리(廢水處理)를 위한 인공(人工) 소택지(沼澤池) 방법(方法)을 제시(提示)하였다. 황산염(黃酸鹽) 환원(環元) 박테리아 (SRB)를 이용(利用)한 약 2개월(個月)의 실내실험(室內實驗) 결과(結果) 폐수중(廢水中) 중금속(重金屬) 원소(元素) 제거효율(除去效率)은 Fe, Al, Cd, Cu와 Zn은 99-100%, Mn은 90%이며 pH는 5.12에서 7.60으로 상승(上昇)되었다. 황산염(黃醒鹽) 환원(還元) 박테리아의 먹이인 기질(基質)들 (Substrates)과 달성광산(連城鑛山) 폐수(廢水)의 실험(實驗)에서는 버섯퇴비(堆肥)가 참나무 퇴비(堆肥)보다 11배(倍) 정도(程度) SRB의 영향분(營養分)인 Lactate가 유출(抽出)됨이 밝혀졌다. 황산염(黃酸鹽) 환원(還元) 박테리아 소택지(沼澤池)의 내용물(內容物) 구성(構成)은 다음과 같다; 1) 최하부(最下部)에 25cm 높이의 고품질(高品質) 석회석(石灰石)(직경(直徑) 5cm)을 채운다 : 2) 70% 참나무 퇴비(堆肥)와 30% 버섯 퇴비(堆肥)의 혼합퇴비(混合堆肥)와 황산염(黃酸鹽) 환원(還元) 박테리아 입자(粒子)들을 잘 섞어서 25cm 높이로 석회암층(石灰岩層)위에 둔다 : 3) 혼합퇴비(混合堆肥)에 의한 석회암(石灰岩) 사이의 간극축소(間隙縮小)를 막기 위하여 석회암층(石灰岩層)과 혼합퇴비(混合堆肥) 중간(中間)에 Geotextile을 깔아둔다. 실제(實際) 현장적용(現場適用)을 위(爲)한 소택지(沼澤池) 크기는 중금속(重金屬) 부하량(負荷量)과 투수율(透水率) 에 따라서 계산(計算)한 결과(結果)-1편(片)은 $15m{\times}15m{\times}1m$, -2편(片)은 $5.3m{\times}5.5m{\times}1m$, 그리고 -3편(片) 하부(下部)에 $52m{\times}52m{\times}1m$임이 밝혀졌다. 그러나, -3편(片)의 경우는 소택지(沼澤池)가 너무 크므로 동일(同一) 소택지(沼澤池) 5~15개(個)의 작은 cell들로 분리함이 좋다.

  • PDF

경북 울진 코리아 광상의 자수정에 대한 유체포유물 연구 (Fluid Inclusions in Amethyst from the Korea Amethyst Deposit, Uljin, Gyeongbuk)

  • 이미령;양경희;이주연;김교태
    • 한국광물학회지
    • /
    • 제22권3호
    • /
    • pp.207-216
    • /
    • 2009
  • 경북 울진 분천화강편마암에 배태된 코리아 자수정광상에 산출되는 자수정은 킹크밴드와 파동소광을 가지는 조립의 석영결정과 이들 사이에 변형의 흔적이 없는 세립의 석영으로 이루어진 쌍봉 입자분포를 보이며 세 유형의 유체포유물을 포획하고 있다. Type I 은 액상이 풍부한 포유물(액체+기포)로, 시스템이 완전히 어는 최초 온도($T_e$)는 $-52{\sim}-20^{\circ}C$, 얼음이 최초로 형성되는 온도($T_{m-ice}$)는 $-5{\sim}0^{\circ}C$(7~0 wt% NaCl), 균질화 온도($T_{h-total}$)는 $91{\sim}231^{\circ}C$로 측정되었다. Type II는 기체상(80~90 vol%)이 풍부한 포유물(액체+기포)로서, $T_e$$-56{\sim}-23^{\circ}C$, $T_{m-ice}$$-4{\sim}-2^{\circ}C$ (6~3 wt% NaCl), $T_{h-total}$$230{\sim}278^{\circ}C$로 측정되었다. Type III는 액체가 풍부하고 액체+기포+확인되지 않은 딸결정 ${\pm}$ 칼리암염(KCl)로 구성되어 있다. Type III의 $T_{h-total}$$210{\sim}271^{\circ}C$, 유체의 염도는 32~36 wt% NaCl로 측정되었다. 석영과 자수정이 보이는 조직적 특성과 유체포유물의 성분은 자수정이 모암과 함께 동력재결정작용을 받았음을 제시한다. 또한 포획된 유체포유물은 변성기원으로 변성작용은 적어도 $271{\sim}278^{\circ}C$ 이상의 환경에서 이루어졌음을 지시한다. 울진 코리아 자수정은 합성 자수정이나 산지가 다른 자수정의 감별증거로 볼 수 있는 독특한 유체포유물들이 포획되어 있다. 울진 코리아 자수정 내의 유체포유물은 화강암과 관련된 언양과 삼천포 자수정에 비해 NaCl 암염과 $CO_2$ 유체포유물이 산출되지 않고 있는 점이 주목할 만하다.

해저면 영상 관찰을 통한 망간단괴 채광 장애지역 분포 특성 연구 (A Study on the Distributional Characteristics of Unminable Manganese Nodule Area from the Investigation of Seafloor Photographs)

  • 김현섭;정미숙;박정기;고영탁
    • 지구물리와물리탐사
    • /
    • 제10권3호
    • /
    • pp.173-182
    • /
    • 2007
  • 북동태평양 클라리온-클리퍼톤 균열대 지역의 해저평원에는 여러 유용 금속을 함유한 망간단괴가 다량 분포하는 것으로 알려져 있다. 심해저카메라(DSC)를 이용하여 지형과 단괴 부존량과의 상관관계를 제시하는 연구 결과마다 단괴 생산 유망 지역의 단괴부존량과 지형과의 관계를 다르게 설명하고 있다. 또한, 수중에 위치하는 DSC 위치추정 방법론에 대한 정확한 근거가 명확하게 제시되지 않았다. 북동태평양 대한민국 심해연구(KODOS) 지역에서 현장탐사를 수행하여 지형에 따른 단괴 채광조건의 변화를 관찰하였다. 이 연구에서는 망간단괴 분포 경향 및 채광가능지역을 분석하고자 할 때, DSC를 이용한 근접 해저면 영상관찰 방법의 활용가능성을 제시하고자 하였다. 이를 위해 해저산이 없는 심해평원지역인 KODOS 지역의 남쪽구역($132^{\circ}10'W$, $9^{\circ}45'N$ 부근)에서 DSC 영상으로부터 단괴 부존량을 추출하고 다중빔음향측심기를 사용하여 해저면 수심 변화를 동시에 측정하였다. 또한, DSC 수중 위치추정의 정확성을 제고하고자, DSC 위치 계산 방식에 적절한 가정을 도입하였고, DSC 측선의 교차점에서 측정한 부존량을 이용하여 간접적으로 위치 추정의 정확도를 검증하였다. DSC 영상을 관찰하면 단괴 및 퇴적물뿐만 아니라 해저면의 함몰지역인 균열대를 다수 발견할 수 있다. 또한, DSC 영상을 통해 관찰된 해저 균열대의 발견시간 자료로 부터 채광 장애지역으로 예상되는 균열대의 위치 추정을 시도하였다. 분석 결과 채광장비가 주행할 수 없는 채광 장애지역은 해저사면과 해저구릉지역임을 확인할 수 있었다.