• 제목/요약/키워드: 구조적 토픽 모델링

검색결과 48건 처리시간 0.024초

토픽맵을 이용한 이 기종 상품분류체계 온톨로지 통합에 관한 연구 (A Study of Integrating Ontologies of Heterogeneous Product Classification Schemes Using XML Topic Maps(XTM))

  • 고세영;김성혁
    • 한국전자거래학회지
    • /
    • 제8권4호
    • /
    • pp.151-166
    • /
    • 2003
  • 상품분류체계 중 가장 많이 사용하는 UNSPSC와 HS를 선정하여 각 상품분류체계의 구성 및 구조와 그 특징을 파악하고 분류명에 대한 온톨로지를 분석하였다. 상품분류체계의 번호체계 및 각 자릿수에 대한 이해를 충분히 하고 UML을 이용하여 모델링을 하였다. 상품분류체계 중 대상 범위에 대한 토픽맵을 개발한 뒤 그래프로 표현하고 최종적으로 개별 상품분류체계에 대한 토픽맵을 통합하여 상품분류체계의 온톨로지를 통합함으로써 계층 및 구조가상이한 상품분류체계 간의 정보교환을 용이하게 할 수 있게 하였다.

  • PDF

K-means 클러스터링과 토픽 모델링을 기반으로 한 국민청원 사이트의 카테고리 재구성 (Reconstruction of Categories on the National Petition Site Using K-Means clustering and Topic Modeling)

  • 우윤희;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.302-305
    • /
    • 2019
  • 국민 청원 사이트가 뛰어난 접근성과 신속성으로 인하여 국민들로부터 많은 관심을 받고 있다. 현재 국민청원 사이트의 카테고리 분류는 '미래', '성장동력' 등을 포함한 16개의 카테고리 및 기타로 구성되어 있으나 그 기준이 모호하여 많은 청원글들이 기타 카테고리로 분류되고 있는 상황이다. 이는 청원글의 내용을 명확히 반영하지 않고 미리 정의된 카테고리 구조를 사용하고 있는데서 기인한다고 할 수 있다. 본 논문에서는 보다 구체적으로 정의된 카테고리를 정의하고자 추천 순으로 1,500개의 청원글을 수집하였고, 수집된 청원글의 내용을 바탕으로 카테고리 구조를 추출하였다. 먼저, k-평균 알고리즘을 적용하여 청원글을 군집하여 대분류를 정의하였고, 보다 구체적인 세부 분류를 정의하기 위하여 토픽모델링을 실시하였다. 본 논문에서 제시하는 계층적 카테고리 구조는 청원글의 내용을 바탕으로 대분류와 세부분류로 구성된 것이므로 새로운 청원글을 등록하거나 분류하는 데 적절한 것으로 보인다.

대학생의 중도탈락의도에 미치는 요인에 관한 연구: 토픽모델링과 구조방정식모형을 중심으로 (A Study on Factors Affecting College Dropout Intention: An Hybrid Approach of Topic Modeling and Structural Equation Modeling)

  • 김재경
    • 한국산업정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.81-92
    • /
    • 2022
  • 본 연구는 재학생들의 타대학 입학 및 편입으로 인한 중도탈락에 대한 원인을 찾기 위해, 먼저, 자퇴신청원에 기재된 면담 내용을 딥러닝 토픽모델링인 BERTopic을 활용하여 분석하여 주요 토픽으로 부모의 영향, 학업 부진, 전공 불만족을 도출하였다. 그 후, 해당 토픽을 중도탈락에 영향을 미치는 요인으로 구성한 구조방정식 모형을 설계한 후 199명의 재학생을 대상으로 설문조사를 통한 실증적 연구를 수행하였다. 분석 결과, 타의에 의한 대학 선택은 학업적응과 전공만족에 부정적 영향을 끼치며, 학업적응과 전공만족은 중도탈락의도에 부정적 영향을 끼치는 것으로 나타났다. 또한, 타의에 의한 대학 선택은 학업적응과 전공만족을 통해 중도탈락의도에 간접으로 정적 영향을 끼치는 것으로 나타났다. 이는 중토탈락의도를 낮추기 위해서는 부모의 영향으로 대학을 선택하는 대학생들을 입학 초기에 파악하고 이들의 전공만족이나 학업적응을 높이기 위한 프로그램을 제공하는 것이 필요함을 시사한다.

토픽 모델링을 이용한 사운드스케이프 연구 주제어 분석 (Analysis on Topics in Soundscape Research based on Topic Modeling)

  • 최수환
    • 한국콘텐츠학회논문지
    • /
    • 제19권7호
    • /
    • pp.427-435
    • /
    • 2019
  • 사운드스케이프(soundscape)는 소리를 통해 문화와 환경, 사회적 변화를 이해하는데 중요한 역할을 하는 자료이지만, 자료의 기록, 보존, 분류, 분석을 위한 체계적인 연구 프레임워크의 구축은 아직 초기 단계에 있다. 토픽 모델링(topic modeling)은 문서에 숨겨져 있는 테마 구조를 드러내주는 알고리즘으로 연구 동향 분석과 같이 대량의 문서에 내재된 주제어를 찾아내기에 적합한 기법이다. 본 연구에서는 사운드스케이프 연구 분야의 대표적 학술지인 의 논문을 토픽 모델링 기법으로 분석하여 사운드스케이프 연구 동향을 파악할 수 있는 주제어를 도출해 보고, 이를 사운드스케이프 온톨로지(Soundscape Ontology) 및 사운드 아카이브의 메타데이터 설계 시 활용할 수 있는 방안에 대해 살펴보고자 한다. 이는 향후 시맨틱 웹 기술인 링크드 데이터(Linked Data) 기반의 사운드스케이프 아카이브 구축을 위한 메타데이터 설계의 기초 연구가 될 것이다.

건설신기술에 대한 토픽 모델링 및 토픽 변화추이 분석 (Topic modeling and topic change trend analysis for advanced construction technologies)

  • 정성윤;김남곤
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.102-110
    • /
    • 2021
  • 현재 국내 건설기술의 발전을 도모하기 위해 건설신기술 지정 제도를 운영하고 있다. 이 제도를 통해 지정된 건설신기술과 관련하여 중요도가 높은 출현 어휘와 어휘들 간의 관계를 분석함으로써 건설신기술에 내재된 암묵적인 의미를 살펴보고자 하였다. 이를 위해 918건의 건설신기술정보를 수집하였다. 수집된 건설신기술의 고시연도와 요약 내용을 기초로 하여 건설신기술별로 출현어휘의 중요도를 측정하였다. LDA 모형을 기반으로 한 4개의 토픽별로 연관된 어휘들 간의 영향정도를 평가하였다. 기술적용분야에 따른 토픽을 분석하였다. 1990년부터 2021년까지의 토픽별로 영향력이 높은 어휘들의 변화 추이를 유추하였다. 향후 환경·기계·설비 토픽과 구조물의 보수 보강 토픽의 영향정도 변화와 이에 관련한 적용기술 분야를 예측하였다. 토픽의 개발방향을 예측하였다.

플랫폼노동 연구 동향 분석 (Investigating the Trends of Research for the Platform Work)

  • 방미현;이영민
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.430-440
    • /
    • 2021
  • 본 연구에서는 토픽 모델링과 주제어 네트워크 분석 방법을 활용하여 국내 플랫폼노동에 관한 학술논문 288편을 분석하였다. 다양한 학문 분야의 플랫폼노동에 관한 연구 동향을 양적, 질적 두 가지 방법을 혼합 활용하여 분석 방법의 한계를 보완하고, 연구의 근간이 되는 주요 이론을 도출하여 종합정리함으로 플랫폼노동에 관한 양면성을 고찰하였다. 학문 분야별로는 법학, 경영학, 경제학 순으로 연구가 많이 진행되었고, 플랫폼노동 보호방안, 공유경제의 직·간접적 영향에 관한 주제 연구가 다수 이루어졌다. 핵심 주제어로는 기반이 되는 인프라, 구조적인 변화를 촉진하는 두 가지 측면에서 디지털, 가치, 산업, 노동을 선정하였다. 주요 토픽은 플랫폼 노동자 보호, 공유 서비스 가치, 디지털 패러다임, 공유경제 모델, 플랫폼 규제가 도출되었다. 분석 결과를 토대로, 거시적인 맥락에서의 구조적인 분석 프레임 완성과 플랫폼노동의 다양한 유형을 포함한 사례 분석과 기술 보완의 일반화, 지속성과 공유경제의 본질적인 공생 가치 실현을 위한 개인 수준의 역량 개발 탐구, 맞춤형 직업교육훈련 프로그램 설계를 제언하였다.

토픽모델링을 활용한 한국과 미국의 산업수학 이슈 비교 (Comparison of Industrial Mathematics Issues between Korea and the US Using Topic Modeling)

  • 김성연
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.30-45
    • /
    • 2022
  • 본 연구에서는 텍스트마이닝을 활용해 한국과 미국의 온라인 뉴스와 포럼에서 산업수학과 관련한 이슈를 파악하고, 그 결과를 비교 분석하였다. 이를 위해 한국의 주요 포털 사이트인 네이버의 뉴스 기사, 클리앙의 게시글과 댓글, 그리고 미국의 New York Times와 CNN의 뉴스 기사, Reddit의 게시글과 댓글에서 산업수학과 관련한 텍스트 데이터를 수집하여 구조적 토픽모델링 분석을 수행하였다. 주요 분석결과는 다음과 같다. 첫째, 한국의 뉴스는 산업수학의 필요성과 정부의 지원 측면에 대해, 미국에서는 산업수학이 활용되는 다양한 분야에 대해 다루는 것으로 나타났다. 둘째, 한국에서는 온라인 뉴스와 포럼에서 각기 다른 주제로 동일한 개수의 이슈가 나타났지만, 미국에서는 온라인 포럼보다 뉴스 기사에서 더 많은 이슈를 다루고 있는 것으로 나타났다. 이를 토대로 한국에서 산업수학이 정착하는 데 있어 연구자들에게는 학술적, 그리고 정부에는 실무적 시사점을 제시하였다.

공유숙박업에서 고객 충성도에 영향을 미치는 요인: 구조 방정식 모형과 토픽 모델링 분석 (Antecedents of Customer Loyalty in the Context of Sharing Accommodation: Analysis of Structural Equation Modelling and Topic Modelling)

  • 김선주;김병수
    • 지식경영연구
    • /
    • 제22권3호
    • /
    • pp.55-73
    • /
    • 2021
  • 공유 경제는 쓰지 않은 자원을 다른 사람들과 나누어 쓰는 협력적 소비로 인식되고 있다. 본 연구에서는 공유 숙박업 이용 고객들의 충성도에 영향을 미치는 요인들을 살펴보고자 하였다. 고객들이 공유 숙박업 경험에서 느낀 감정과 자아 이미지 일치성, 인지된 가치를 고객 충성도에 영향을 주는 선행요인으로 고려하였다. 그리고 진정한 경험, 숙소 시설, 가격 공정성을 공유 숙박업의 선택속성으로 고려하였다. Airbnb가 공유 숙박업에서 가장 큰 업체이기 때문에 설문 대상으로 선정하였다. 294명의 Airbnb 이용 고객 데이터를 바탕으로 구조 방정식 모형을 활용하여 요인들 간 관계를 분석하였다. 또한, Airbnb를 이용한 고객이 작성한 리뷰를 통해 고객이 어떤 사항을 중요하게 고려하였는지 살펴보았다. 이를 위해 네이버 블로그에서 Airbnb 리뷰를 수집하여 LDA기반 토픽모델링을 실시하였다. 본 연구 결과를 통해 공유 숙박업에 대한 고객들의 충성도에 영향을 미치는 요인들에 대한 이해를 바탕으로, 효과적인 마케팅 전략과 운영 관리 전략을 수립하는데 도움을 줄 수 있을 것으로 기대된다.

사용자 리뷰 토픽분석을 활용한 모바일 쇼핑 앱 고객만족도에 관한 연구 (A Study on Customer Satisfaction of Mobile Shopping Apps Using Topic Analysis of User Reviews)

  • 김광국;김용환;김자희
    • 한국전자거래학회지
    • /
    • 제23권4호
    • /
    • pp.41-62
    • /
    • 2018
  • 현재 모바일 쇼핑 시장의 빠른 성장에도 불구하고 주요 사업자들은 심한 경쟁 속에서 지속적인 영업적자를 기록하고 있다. 이 문제를 해결하기 위해서는 모바일 쇼핑 시장은 과도한 경쟁보다는 고객만족도와 고객충성도를 높이기 위한 연구들이 요구된다. 그러나 기존의 연구들은 기술수용 모형과 문헌연구를 기반으로 요인을 추출하고 있어 고객의 직접적인 요구를 반영하는 데 한계가 있다. 본 연구는 모바일 쇼핑 앱 사용자들의 직접적인 요구사항을 도출하기 위하여 사용자 리뷰 토픽분석을 시행하여 고객만족도에 영향을 미치는 구체적이고 다양한 요인들을 도출하였다. 그리고 미국 고객만족도 지표 모형을 참조한 구조방정식 연구모형을 수립하여 도출된 요인들이 고객만족도에 미치는 중요도를 평가하고 고객만족도가 고객 불평과 고객충성도에 주는 영향을 실증 분석하였다. 본 연구에서 제안한 토픽분석과 구조방정식을 연계한 연구 프레임워크는 다른 모바일 서비스의 고객만족도 연구에도 적용될 수 있을 것으로 기대된다.

토픽모델링과 언어네트워크분석을 활용한 스마트팜 연구 동향 분석 (A Study on Research Trends in the Smart Farm Field using Topic Modeling and Semantic Network Analysis)

  • 오주연;이준명;홍의기
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.203-215
    • /
    • 2022
  • 본 연구의 목적은 토픽모델링과 언어네트워크분석을 활용하여 한국의 스마트팜 분야 연구 동향과 지식구조를 파악하는 것이다. 연구목적을 달성하기 위하여 KCI(Korea Citation Index)의 스마트팜 관련 국내 학술지 104편을 대상으로 핵심어와 핵심어들의 연결 관계를 분석하고, LDA 토픽모델링 기법을 이용하여 연구주제와 관련된 토픽들을 분석하였다. 언어네트워크분석 결과, 국내 스마트팜 관련 연구 분야의 주요핵심어는 '환경', '시스템', '사용', '기술', '재배' 등이 나타났으며, 연결중심성, 매개중심성, 위세중심성 결과도 제시하였다. 토픽모델링분석결과, Topic 1은 '스마트팜 도입 분석', Topic 2는 '친환경 스마트팜과 스마트팜의 경제적 효율성', Topic 3은 '스마트팜 플랫폼 설계', Topic 4는 '스마트팜 생산 최적화', Topic 5는 '스마트팜 생태계', Topic 6은 '스마트팜 시스템 구현', Topic 7은 '스마트팜 관련 정부 정책'으로 나타났다. 본 연구는 국내 스마트팜 관련 연구 동향을 살펴봄으로써, 향후 국내의 스마트팜을 발전시키는 데 필요한 정책개발과 연구 방향성을 설정하는데 기초자료가 될 것으로 기대한다.