• 제목/요약/키워드: 계층 분류

검색결과 923건 처리시간 0.036초

금융회사 클라우드 운영 모델 결정 방법론 (A Methodology for Determining Cloud Deployment Model in Financial Companies)

  • 김용호;곽찬희;이희석
    • 경영정보학연구
    • /
    • 제21권4호
    • /
    • pp.47-68
    • /
    • 2019
  • 클라우드 서비스 및 운영 방식이 다양해지면서 선택할 수 있는 클라우드 컴퓨팅의 종류가 많아지고 있는 만큼 금융회사에는 각 전산시스템에 적합한 클라우드를 선택할 수 있는 의사결정 방법이 필요한 상황이다. 본 연구에서는 기업의 비전 및 전략 수립을 위해 사용되는 BSC(Balanced Scorecard, 균형성과 관리) 프레임워크를 활용하여 금융회사에서 클라우드 도입을 위해 고려해야 할 요인들을 BSC의 4대 관점(재무, 고객, 내부 프로세스, 학습과 성장)에 따라 분류하고 최종 12개의 고려 요인을 선정하였으며, 다기준 의사결정 방법 중의 하나인 AHP(Analytic Hierarchy Process, 분석적 계층 프로세스) 기법에 따라 평가 항목들을 성과 평가 관점과 클라우드 고려 요인으로 계층화하여 최종 의사결정모형을 제안하였다. 나아가 금융회사의 시스템을 계정계, 정보계, 채널계 시스템으로 구분하고 금융회사 두 곳의 금융 전문가와 정보 기술 전문가의 의사 결정 결과를 취합하여 각 시스템 별 클라우드 도입 시 고려 요인에 대한 중요도 및 클라우드 운영 모델의 적합도에 대한 비교 분석을 수행하였다. 분석결과 모든 시스템에서 공통적으로 중요하게 평가된 일부 고려 요인도 있었지만 대부분의 고려 요인은 시스템 별 중요도가 매우 다르게 평가되었으며, 실제 시스템 별 적합한 클라우드 운영 모델은 서로 상이하였다. 이를 통해, 각 금융회사에서는 클라우드 컴퓨팅 도입 시 각 시스템 별 클라우드 고려요인을 평가하여 운영 모델을 선정해야 한다는 시사점을 주었으며, 더불어 본 연구에서 제시하는 일련의 절차와 방법론을 통하여 금융회사의 클라우드 컴퓨팅 도입에 대한 인식을 제고하고 클라우드 컴퓨팅 도입 확산에 기여할 것으로 기대한다.

연관 규칙 학습과 군집분석을 활용한 멸종위기 기수갈고둥과 생태계 내 종 간 연관성 분석 (Analyzing the Co-occurrence of Endangered Brackish-Water Snails with Other Species in Ecosystems Using Association Rule Learning and Clustering Analysis)

  • 임성호;도윤호
    • 생태와환경
    • /
    • 제57권2호
    • /
    • pp.83-91
    • /
    • 2024
  • 본 연구는 한국의 멸종위기야생생물 II급으로 분류된 기수갈고둥 (Clithon retropictum)과 생태계 내 다른 종들 사이의 공동출현 양상을 분석하고자, 연관 규칙 학습과 군집분석 방법론을 통합적으로 사용했다. 이 연구의 주요 목적은 기수갈고둥과 다른 생물종 사이의 공동출현 패턴을 파악하는 것이다. 대규모 데이터 세트를 통한 연관 규칙 학습으로 종 간의 공동 출현 패턴과 그들사이의 연관성을 탐색하였고, K-mean와 계층적 군집분석을 통해 종들 간의 생태적 유사성과 차이에 기반으로 한 그룹화를 진행하였다. 연구 결과는 기수갈고둥과 다른 종들 사이에 상당한 공동 출현 관계가 있음을 보여주며, 이러한 공동 출현은 특정 환경 조건과 밀접하게 연결되어 있음을 나타냈다. 특히, 기수갈고둥이 출현하는 지점에서는 특정종의 출현 빈도가 높게 나타나는 패턴을 보였고, 이는 기수갈고둥이 생태계 내에서 중요한 생물지표종으로서의 역할을 수행하고 있음을 시사한다. 이러한 접근 방식은 기수갈고둥과 같은 멸종 위기종의 보존과 생태계 관리 전략 수립에 있어 중요한 의미를 지닌다. 생태계 내에서 공동으로 출현하는 종들 간의 복잡한 연관성을 이해함으로써, 보다 효과적인 보존 전략을 개발하고 생태계의 건강과 안정성을 유지하는 데 기여할 수 있다. 본 연구는 생태계 연구에 있어 데이터기반 접근법의 중요성을 강조하며, 생물 다양성 보존을 위한 새로운 방향을 제시한다.

한국 산맥론(I) : DEM을 이용한 산맥의 확인과 현행 산맥도의 문제점 및 대안의 모색 (Discussions on the Distribution and Genesis of Mountain Ranges in the Korean Peninsular (I) : The Identification Mountain Ranges using a DEM and Reconsideration of Current Issues on Mountain Range Maps)

  • 박수진;손일
    • 대한지리학회지
    • /
    • 제40권1호
    • /
    • pp.126-152
    • /
    • 2005
  • 현재 한국 사회에서는 산맥의 개념 규정에 대한 혼동과 함께 교과서에 수록되어 있는 산맥의 존재 여부에 대해 많은 논란이 일고 있다. 이 연구에서는 지리학적 산맥과 유역분수계 개념의 차이점 그리고 산맥 개념의 사회적 논란에 대한 원인 분석을 바탕으로, 산맥의 정의 및 기존 산맥도와 관련된 한반도 지체구조와 산맥의 형성과정에 대해 살펴보았다. 한반도의 DEM에서 추출한 지표곡면도와 음영기복도, 그리고 지체구조선과 지질분포도를 이용하여 현재 및 과거에 표기되어 왔던 산맥들의 공간적인 분포를 비교$\cdot$검증하였다. 이 연구의 결과 현재 일반에게 알려져 있는 산맥들의 실체를 대부분 확인할 수 있었으며, 이들 산맥은 한반도의 지형적인 특성을 결정해 온 지체구조의 발달사와 지형발달과정을 이해하는 데 유용한 틀을 제시해 주고 있다는 사실이 입증되었다. 하지만 한반도의 산맥들은 형태와 성인적 특성에서 매우 다양하다. 현재 표기되고 있는 산맥들을 성인에 따라 5가지 유형으로 분류할 수 있었다. 형성 시기와 성인을 중심으로 살펴보면 1) 제3기 동해의 형성과정에서 나타난 한반도 전체의 융기 현상에 의해 형성된 융기산맥(함경산맥, 낭림산맥, 태백산맥), 2) 제3기 융기운동에 의해 2차적으로 나타난 단층운동과 융기 현상으로 형성된 산맥(마천령산맥, 소백산맥, 북서백산맥), 3) 중생대 광범위한 화강암의 관입에 의해 그 근간이 만들어진 습곡산맥(적유령산맥, 광주산맥, 차령산맥, 노령산맥), 4) 제3기 이후 하천의 침식으로 형성된 산지 중에서 유역의 분수계를 이루는 분수계형 침식산맥(마식령산맥, 묘향산맥), 5) 제3기 이후 하천의 침식에 의해 남겨진 분수계들을 하천과 수직으로 연결한 침식면형 침식산맥(강남산맥, 언진산맥, 멸악산맥) 등으로 구분할 수 있었다. 현재 한국 사회에서 나타나고 있는 산맥의 유무에 관한 논란은 부분적으로는 산맥의 설정 목적과 성인에 대한 지리학계의 명확한 설명이 제시되지 않았기 때문일 것이다. 이를 극복하기 위해서는 성인별로 분류된 산맥을 표현 목적과 사용되는 지도의 축척, 그리고 교육의 목적에 따라 계층적으로 제시하는 작업이 필요하다. 특히 일반인들의 산맥에 대한 이때를 높이기 위한 산맥의 성인과 형태에 관한 효과적이고 광범위한 교육과 홍보가 요구된다.

백운산의 삼림식생과 토양환경 (Forest Vegetation and Soil Environment on Mt. Paekun)

  • 이호준;배병호;정흥락;전영문;홍문표
    • 환경생물
    • /
    • 제17권1호
    • /
    • pp.35-50
    • /
    • 1999
  • 백운산의 삼림식생과 토양환경을 파악하기 위하여 식물사회학적 조사방법에 의하여 삼림식생을 분류하고, 각 군락의 구조적 특성을 밝혔으며, 토양환경을 조사하였다. 삼림식생은 신갈나무군락(전형 하위군락, 철쭉꽃하위군락), 굴참나무군락, 물푸레나무군락, 소나무군락 등 4개의 자연군락과 일본잎갈나무식재림, 잣나무식재림 등 2개의 식재림으로 분류되었다. 식생의 계층구조는 매우 발달한 편으로 신갈 나무군락은 백운산의 거의 전역에 걸쳐 표고 500m이상부터 분포하고, 굴참나무군락은 주로 남동-남서 사면의 고도 325~700 m, 소나무군락은 표고 290~700 m, 물푸레나무군락은 표고 600 m 이상의 계곡 주연부에 주로 분포하였다. DBH분포는 신갈나무가 6~10cm급, 굴참나무가 11~15cm급, 소나무가 26~30 cm급, 물푸레나무가 2~5 cm급, 일본잎갈나무가 11~15 cm급, 잣나무가 11~15 cm급에서 각각 가장 높게 나타났다. 토양환경은 비교적 양호한 편이었으며 신갈나무군락, 소나무군락, 굴참나무군락, 일본잎갈나무군락의 토양함수량은 17.81~51.20%, 16.24~25.41%, 16.17%, 19.16~39.26%로 각각 나타나 신갈나무군락의 토양함수량이 가장 높게 나타났다. 한편 신갈나무군락의 유기물함량은 5.51~14.90%로 다른 군락보다는 상대적으로 높게 나타났다. 이러한 경향은 N, P, K에서도 유사하였으나 Ca, Mg, CEC는 다른 군락보다 낮게 측정되었으며, 양이온치환능과 pH는 $Y_{CEC}$=15.855X$_{ph}$ -56.037의 상관으로 유의성이 높게 나타났다. 한편, 백운산의 대부분의 면적을 점유하고 있는 신갈나무림은 2차림으로써 인위적인 방해로부터 점차 식생이 회복되고 있으며 소나무림-굴참나무림-신갈나무림으로의 천이경로를 보일 것으로 판단된다.

  • PDF

중장년층 일자리 요구사항 분석 및 인력 고용 매칭 시스템 개발 (Job Preference Analysis and Job Matching System Development for the Middle Aged Class)

  • 김성찬;장진철;김성중;진효진;이문용
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.247-264
    • /
    • 2016
  • 저출산 및 인구 고령화가 가속화되면서, 중장년 퇴직자 등 노동 소외 계층의 취업난 해결은 우리 사회의 핵심 과제로 등장하고 있다. 온라인에는 수많은 일자리 요구 정보가 산재해 있으나, 이를 중장년 구직자에게 제대로 매칭시키지는 못하고 있다. 워크넷 취업 로그에 따르면 구직자가 선호하는 직종에 취업하는 경우는 약 24%에 불과하다. 그러므로, 이러한 문제를 극복하기 위해서는 구직자에게 일자리 정보를 매칭시킬 때 선호하는 직종과 유사한 직종들을 추천하는 소프트 매칭 기법이 필수적이다. 본 연구는 중장년층에 특화된 소프트 직업 매칭 알고리즘과 서비스를 고안하고 개발하여 제공하는 것을 목표로 한다. 이를 위하여 본 연구에서는 1) 대용량의 구직 활동 기록인 워크넷 로그로부터 중장년층의 일자리 특성 및 요구 추세를 분석하였다. 2) 중장년층의 일자리 추천을 위해 직종 유사도 기준으로 일자리 분류표(KOCM)를 재정렬하였다. 이 결과를 이용하여, 3) 중장년에 특화된 인력 고용 소프트 매칭 직업 추천 알고리즘(MOMA)을 개발하여 구인 구직 웹사이트에 적용하였다. 자체 저작한 중장년층 특화 일자리 분류표(KOCM)를 이용한 소프트 일자리 매칭 시스템의 정확도를 측정하였을 때, 실제 고용 결과 기준, 하드 매칭 대비 약 20여 배의 성능 향상을 보였다. 본 연구내용을 적용하여 개발한 중장년층 특화 구직 사이트는 중장년층의 구직 과정에서 입력 정보 부담을 최소화하고 소프트 매칭을 통해 사용자의 요구직종에 적합한 일자리를 정확하고 폭넓게 추천함으로 중장년층의 삶의 질 향상에 기여할 수 있을 것으로 기대된다.

강화도 마니산 산림식생의 군집구조 특성 (Characteristics of Community Structure for Forest Vegetation on Manisan, Ganghwado)

  • 신학섭;신재권;김혜진;한상학;이원희;윤충원
    • 한국농림기상학회지
    • /
    • 제16권1호
    • /
    • pp.11-21
    • /
    • 2014
  • 본 연구의 목적은 산림식생에 대한 기본 정보를 확인하고, 강화도 마니산에있는 산림의 효율적인 관리를 위한 산림식생의 계층구조와 관련된 식생학적 자료를 축적하는 데 있다. 샘플은 2010 년 8월에서 10월까지 수집된 32개소의 조사구에 대해 ZM학파의 식물사회학적 분석방법으로 식생군락을 구분하였고, 중요치 분석을 수행하였다. 식물사회학적 식생분석결과 산림식생은 여러 종들의 구분에 의해 2개 군락, 2개 군, 4개 소군으로 분류되었고, 복잡한 환경인자들에 의해 결정되어진 것으로 사료되는 식생유형은 총 5단위로 나타났다. 5개의 식생유형 중 식생단위1의 중요치는 소나무 54.31 (18.10%)로 나타났으며, 신갈나무 39.21 (13.07%), 식생단위2의 서어나무가 37.29 (12.43%), 신갈나무 89.43 (22.23%), 진달래 63,525 (14.43%)로 나타났다. 식생단위3에서 때죽나무의 중요치 53.97 (13.50%), 당단풍 33.60 (8.40%), 서어나무 26.48 (6.62%), 졸참나무 22.51 (5.64%)로 나타났으며, 식생단위4에서는 서어나무 47.70 (11.92%), 상수리나무 38.40 (9.60%)로 나타났고, 식생단위5의 쉬나무가 80.59 (20.14%), 아까시나무 35.00 (8.74%), 칡의 중요치가 28.63 (7.15%), 떡갈나무 28.20 (7.05)의 순으로 중요치가 나타났다. 이는 1997년 강화도의 기후와 산림생태계 현황(Lee, 1997)에서 온대중부림의 생태적 천이는 소나무에서 참나무류를 거쳐 서어나무류의 순서라는 학설이 거의 입증되었는데, 강화도 마니산의 산림식생은 천이발달의 중간단계로 보고한 바 있는데, 현재의 산림식생은 소나무군집, 신갈나무군집, 때죽나무군집, 서어나무군집, 쉬나무군집으로 분류되고, 각 식생단위에서 서어나무의 중요치가 높게 나타나는 것으로 미루어 인위적, 자연적 교란이 없는 한 서어나무로의 천이가 진행될 것으로 사료된다.

세계문화유산 하회와 양동의 식생경관 진정성 유지를 위한 평가항목 설정 기초 연구 (A Basic Study on the Establishment of Evaluation Items for the Resiliency of Planting Landscape in Hahoe and Yangdong of World Cultural Heritage)

  • 이창훈;신현실
    • 한국전통조경학회지
    • /
    • 제36권2호
    • /
    • pp.21-29
    • /
    • 2018
  • 본 연구는 하회와 양동마을 내 식생경관의 진정성 유지를 위한 가치평가 항목을 선정하는 것을 목적으로 하였다. 먼저, FGI를 실시하여 선정된 43개의 항목에 대해 적합성 검증을 하였으며, AHP 전문가 설문을 통해 가중치를 산정하여 평가항목 개발을 위한 지표의 중요도를 설정하였다. 전문가 분석결과 대분류 2개 항목, 중분류 6개 항목, 세부 분류 11개 주요 항목을 도출하였으며, 연구의 결과를 요약하면 다음과 같다. 첫째, 하회와 양동의 식생경관 진정성 유지를 위한 평가항목 선정과 상대적 중요도를 분석한 결과 문화적 가치가 생물학적 가치에 비해 상대적으로 높은 것으로 평가되었다. 특히 수목의 생물학적 가치 중에서 수종의 특수성과 수목의 형태 항목을 제외한 세부항목은 상대적으로 낮은 값이 도출되었다. 둘째, FGI에서 우선 선정된 43개 항목에 대한 적합성 검증 결과 근원직경, 수관폭, 수령, 수세, 수형, 특수성, 민속성, 기록성, 기념성, 시간성, 기관관리 여부 총 11개의 세부항목이 선정되었다. 셋째, AHP분석기법을 통한 산정된 식생경관 평가항목의 가중치는 생물학적 가치의 특수성(0.187), 수형(0.094), 수관폭(0.076), 근원직경(0.073), 수세(0.071), 수령(0.052)의 순서로 평가되었다. 가장 높은 가중치를 보인 특수성과 가장 적은 값이 도출된 '수령' 항목을 제외한 '수관폭', '근원직경', '수세' 항목에서는 상대적으로 큰 차이가 없었다. 넷째, 역사적 가치에 목표한 가치 속성의 중요도 평가 결과는 기관관리 여부(0.134), 기록성(0.092), 시간성(0.088), 기념성(0.063), 민속성(0.050)의 순서로 나타났다. 하회와 양동을 구성하는 식생경관의 역사적 가치 중요도 평가항목은 지정관리 여부에 대한 선행작업이 문화와 역사를 포함하는 식생경관의 유지에 중요한 것으로 평가되었으며, 식생경관 유지에 있어서 수목이 갖는 민속성은 상대적으로 낮은 가중치로 평가되었다. 본 연구의 AHP기법을 통하여 산정된 세계문화유산 하회와 양동마을의 식생경관 가치평가 항목과 가중치 값은 마을 내 수목에 대한 실질적인 진정성 평가에 적용할 수 있을 것으로 판단된다. 이에 도출된 하회와 양동마을 식생경관 가치평가 항목과 가중치 값을 적용한 평가기준 마련을 위한 후속 연구는 추후 과제로 남기고자 한다.

벼의 생산력 분석(分析) -IV. 수기(受器)의 충전속도(充塡速度)와 수기(受器)-급기(給器) 관계(關係) (Analysis of Productivity in Rice Plant -IV. Sink-filling rate and sink-source relation)

  • 박훈
    • 한국토양비료학회지
    • /
    • 제6권2호
    • /
    • pp.95-105
    • /
    • 1973
  • IR667 계통(系統)(Suwon 213 및 214)과 장려품종(진흥(振興) 및 팔달(八達))의 수용기(受用器)(Sink) 및 급여기(給與器)(Source)의 크기와 그들간(間) 거리(距離), 동화산물의 형태(形態), 기상인자(氣象因子)와 관련(關聯) 수기(受器)(곡실(穀實))충전(充塡) 속도(速度)를 검토(檢討)하여 다음과 같은 결과(結果)를 얻었다. 1. IR667 계통(系統)은 장려 품종보다 최고수기충전속도(最高受器充塡速度)가 크고 빨리온다. 충전속도곡선(充塡速度曲線)의 양상(樣相)은 IR667 계(系)는 준봉형(峻峰型)을 장려품종은 구릉형(丘陵型)을 보인다. 2. 기상인자(氣象因子)는 충전곡선(充塡曲線)의 양상(樣相)에 큰 변화(變化)를 주지 못하는 것 같다. 3. 수기일급기간(受器一給器間) 기능거리(機能距離)(실거리(實距離)${\times}$각엽(各葉)의 생산기여율는 상위엽의존형(上位葉依存型)인 IR667 계(系)에서는 상위엽(上位葉)이 짧고 하위엽의존형(下位葉依存型)인 장려품중에서는 하위엽(下位葉)이 짧다. IR667의 상위엽의존성(上位葉依存性)이 유난히 짧은 제(第)1간장(稈長)(상부(上部)로부터)에 기인(基因)하는것 같다. 4. 간(稈)과 엽초의 유리당(遊離糖)/전분비(澱粉比)에 따라 IR667계(系)는 고당형(高糖型)으로 장려품종은 고전분형(高澱粉型)으로 분류(分類)되었으며 전이성(轉移性)(당(糖))과 비전이성(非轉移性) 동화산물(전분(澱粉))의 비(比)가 수기충전속도(受器充塡速度)와 관련되고 고당형(高糖型)이 생산효율이 높을 것으로 예상된다. 5. 군락구조(群落構造)의 각생산계층내의 균등도(均等度)가 클수록 곡실생산의 효율성이 높다는 가설(假說)을 제시(提示)하고 다수성(多收性) 및 안전성(安全性)과 관련(關聯)하여 검토(檢討)하였다. 6. 엽위별(葉位別) 엽신(葉身)의 N.P.K. 잔존률양상(殘存率樣相)이 진흥(振興)에서는 상부잔존형(上部殘存型)으로, IR667은 중앙부(中央部) 잔존형(殘存型)으로 구분(區分)되어 생산구조 보전형식(保存型式)의 원인(原因)으로 해석되었다. 7. 기관별(器管別) N.P.K 농도(濃度)와 함량분포비율(含量分布比率)에 의(依)하여 IR667은 엽초중심형으로 진흥(振興)은 엽신중심형(葉身中心型)으로 분류(分類)되었다. 8. 동일품종내(同一品種丙)에서 N.P간(間) N.P.K 각양분내(各養分內)에서 품종간(品種間) 수(穗)로의 전이율(轉移率)이 큰 경우 엽신잔존율(葉身殘存率)도 크다.

  • PDF

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

BERTopic을 활용한 불면증 소셜 데이터 토픽 모델링 및 불면증 경향 문헌 딥러닝 자동분류 모델 구축 (Topic Modeling Insomnia Social Media Corpus using BERTopic and Building Automatic Deep Learning Classification Model)

  • 고영수;이수빈;차민정;김성덕;이주희;한지영;송민
    • 정보관리학회지
    • /
    • 제39권2호
    • /
    • pp.111-129
    • /
    • 2022
  • 불면증은 최근 5년 새 환자가 20% 이상 증가하고 있는 현대 사회의 만성적인 질병이다. 수면이 부족할 경우 나타나는 개인 및 사회적 문제가 심각하고 불면증의 유발 요인이 복합적으로 작용하고 있어서 진단 및 치료가 중요한 질환이다. 본 연구는 자유롭게 의견을 표출하는 소셜 미디어 'Reddit'의 불면증 커뮤니티인 'insomnia'를 대상으로 5,699개의 데이터를 수집하였고 이를 국제수면장애분류 ICSD-3 기준과 정신의학과 전문의의 자문을 받은 가이드라인을 바탕으로 불면증 경향 문헌과 비경향 문헌으로 태깅하여 불면증 말뭉치를 구축하였다. 구축된 불면증 말뭉치를 학습데이터로 하여 5개의 딥러닝 언어모델(BERT, RoBERTa, ALBERT, ELECTRA, XLNet)을 훈련시켰고 성능 평가 결과 RoBERTa가 정확도, 정밀도, 재현율, F1점수에서 가장 높은 성능을 보였다. 불면증 소셜 데이터를 심층적으로 분석하기 위해 기존에 많이 사용되었던 LDA의 약점을 보완하며 새롭게 등장한 BERTopic 방법을 사용하여 토픽 모델링을 진행하였다. 계층적 클러스터링 분석 결과 8개의 주제군('부정적 감정', '조언 및 도움과 감사', '불면증 관련 질병', '수면제', '운동 및 식습관', '신체적 특징', '활동적 특징', '환경적 특징')을 확인할 수 있었다. 이용자들은 불면증 커뮤니티에서 부정 감정을 표현하고 도움과 조언을 구하는 모습을 보였다. 또한, 불면증과 관련된 질병들을 언급하고 수면제 사용에 대한 담론을 나누며 운동 및 식습관에 관한 관심을 표현하고 있었다. 발견된 불면증 관련 특징으로는 호흡, 임신, 심장 등의 신체적 특징과 좀비, 수면 경련, 그로기상태 등의 활동적 특징, 햇빛, 담요, 온도, 낮잠 등의 환경적 특징이 확인되었다.