• 제목/요약/키워드: text mining analysis

검색결과 1,198건 처리시간 0.023초

스마트도시 구현을 위한 시민참여의 역할과 방향에 관한 연구 (Civic Participation in Smart City : A Role and Direction)

  • 남우민;박건철
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.79-86
    • /
    • 2022
  • 본 연구는 스마트도시 구축과정에서 시민참여 활성화를 위한 연구동향을 파악하고자 한다. 이를 바탕으로 스마트도시에서 시민참여의 역할과 방향을 제시하고 시민참여를 유인할 수 있는 정책적·산업적·학술적·방향성을 제시하는데 있다. 전 세계적으로 급격하게 진행되는 도시화와 도시인구 증가로 교통, 환경, 에너지 등 각종사회 문제가 도시를 중심으로 확산 및 심화되고 있다. 세계 각국은 이런 도시문제 해결 및 지속가능한 발전을 이루기 위해 스마트도시를 도입하고 있다. 최근에는 인프라 확대 등 스마트도시 건설을 위한 기존의 하향식(Top-Down) 도시계획 방식에서 벗어나 시민들이 직·간접적으로 도시건설 과정에 참여 및 상호작용할 수 있는 상향식(Bottom-Up) 방식으로의 접근이 경주되고 있다. 한편, 국내에서도 국가전략관점에서 스마트도시 건설이 추진되고 있지만, 스마트도시에 대한 일반 시민의 인식과 참여는 낮은 것으로 나타나고 있다. 이런 상황을 극복하기 위해 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 연구가 시급한 상황이다. 따라서 본 연구에서는 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 전략모색을 위해 Scopus DB에서 'Smart City'와 'Participation(Engagement)'가 동시에 포함된 문헌 995건을 수집 후 토픽모델링 기법을 활용하여 관련 연구주제를 유형화하고, 연구동향을 분석하였다. 이를 통해 스마트도시에서 시민참여에 관한 연구방향을 이해하고, 향후 관련 연구에 대한 방향성을 제시하는 근거자료로 활용될 수 있을 것으로 기대된다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

미래신호 탐지 기법을 활용한 위성산업 시장의 진입 전략 수립 연구 (A Study on Establishing a Market Entry Strategy for the Satellite Industry Using Future Signal Detection Techniques)

  • 김세형;박재형;이한솔;강주영
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.249-265
    • /
    • 2023
  • 우주 산업은 세계적으로 잠재력이 높은 산업 분야로 여겨지지만, 국내에서는 아직 글로벌 시장에 비해 비교적 관심이 저조한 실정이다. 국내에서도 최근 위성산업은 전통적인 정부 주도의 산업에서 벗어난 민간 주도의 '뉴스페이스(New Space)' 패러다임에 관심을 기울이고 있다. 따라서, 본 연구의 목적은 국내 위성산업 관련 민간 기업의 시장 진입 전략을 결정하는 데 도움이 될 수 있는 미래의 신호를 탐색하는 것이다. 이를 위해 본 연구에서는 미래신호 이론과 Keyword Portfolio Map 등의 이론적 배경을 활용하여, 키워드 성장률과 키워드 등장 빈도 등을 바탕으로 특허 문서 데이터 내 키워드 잠재력을 분석한다. 또한, 뉴스 데이터를 추가로 수집하여 미래신호를 각각 first symptom, early information으로 구분하였다. 이는 해당 키워드가 특허문서 이외에 어떻게 실질적인 잠재력을 드러내는지에 대한 해석적 지표로 활용된다. 본 연구는 미래신호 탐색을 위한 데이터 수집과 분석 과정을 수록하였고, 키워드 맵의 시각화 자료를 통해 어떤 형태로 활용될 수 있는지 구체적으로 시각화함으로써 수집된 문서의 각각의 키워드가 약신호에서 강신호로 발전하는 과정을 추적하는 일련의 과정을 수록하였다. 본 연구의 과정은 기존 미래신호에 관한 연구의 방법론적인 기여와 활용 범위의 확장에 기여할 수 있고, 결과물은 위성 산업에서의 신산업 기획 및 연구 방향성 수립에 기여할 수 있다.

지방자치단체의 스마트시티 조례 분석: 토픽모델링을 활용하여 (Analysis of Municipal Ordinances for Smart Cities of Municipal Governments: Using Topic Modeling)

  • 서형준
    • 정보화정책
    • /
    • 제30권1호
    • /
    • pp.41-66
    • /
    • 2023
  • 본 연구는 72개 지자체의 74개 스마트시티 조례를 대상으로, 지자체 스마트시티 조례의 방향성을 확인하고자 토픽모델링을 활용하여 조례의 주요 키워드를 확인하고, 조례의 키워드에 따른 주제분류를 진행하였다. 분석결과 주요 키워드는 스마트도시위원회의 구성 및 운영에 관한 키워드가 조례 내에서 높은 빈도를 보였다. 조례에 대한 토픽모델링 Latent Dirichlet Allocation(LDA) 분석결과 관련 키워드에 따라 총 8개의 주제로 분류할 수 있었다. 구체적으로 주제-1(스마트시티 추진사항 보안), 주제-2(스마트시티 산업진흥), 주제-3(스마트시티 주민협의체 구성), 주제-4(스마트시티 추진체계 지원), 주제-5(개인정보 관리), 주제-6(스마트시티 데이터 활용), 주제-7(지능정보화 행정구현), 주제-8(스마트시티 홍보) 등으로, 주제의 비중은 주제-6, 주제-4, 주제-1 등의 순으로 나타났다. 권역별 주제분류는 수도권은 주제-5, 주제-6, 주제-8 의 비중이 높았고, 지방권은 주제-2, 주제-3, 주제-4의 비중이 높아 수도권은 스마트시티의 실질 운영 관련 주제가 높았고, 지방권은 스마트시티 추진을 위한 준비단계 관련 주제 비중이 높았다.

LDA 토픽모델링을 활용한 국내 치유시설과 치유프로그램 연구 동향 (Research Trends in Korean Healing Facilities and Healing Programs Using LDA Topic Modeling)

  • 이주홍;이경진;성정한
    • 한국조경학회지
    • /
    • 제51권3호
    • /
    • pp.95-106
    • /
    • 2023
  • 국내 치유 연구는 치유에 대한 사회적 관심 증가와 함께 최근 20년 동안 발전해왔다. 치유를 연구하는 분야는 다양하며, 법제화된 자연-기반(natural-based) 치유를 포함한다. 본 연구에서는 KCI와 RISS에 게재된 2,202편의 학술지, 석·박사학위논문 초록을 수집하여 분석하였다. 연구방법은 LDA 토픽모델링을 활용하여 연구의 주제를 분류하였고, 시계열적 논문 발행 추이를 살펴보았다. 연구 결과, 국내 치유 연구의 주제가 5개의 유형과 4개의 매개어로 연결되었음을 규명하였다. 5개의 연구 유형은 "치유관광", "마음·예술치유", "산림치유", "치유공간", "청소년회복치유"였고, 4개의 매개 단어는 "산림", "자연", "문화", "교육"이었다. 또한 국내 치유 연구에서 법제화된 치유 연구만 추출하여 토픽을 분석하였다. 그 결과, 법제화된 치유 연구의 주제 유형이 4개로 분류되었다. 4개의 연구 유형은 "공간환경계획치유", "치유요법실험", "농업교육체험치유", "치유관광요인"이었다. 법제화된 치유에서 연구의 양이 가장 많은 산림치유, 식물을 매개로 유사한 프로그램을 운영하는 치유농업과 정원치유, 해양자원을 활용하는 해양치유의 연구 토픽 또한 분석하였다. 그 결과, 개별 치유 연구만의 독특한 특성을 보여주는 토픽과 모든 치유 연구에서 범용되는 것으로 생각되는 토픽을 도출하였다. 본 연구는 텍스트마이닝의 LDA 토픽모델링을 활용하여 국내 치유시설과 치유프로그램 연구의 전반적 경향을 파악하였다는 데 의의가 있다.

스마트 관광 활성화를 위한 트립어드바이저 애플리케이션 리뷰 분석 : 토픽 모델링을 중심으로 (Analyzing TripAdvisor application reviews to enable smart tourism : focusing on topic modeling)

  • 이유나;한무명초;유선영;소미기;노미진
    • 스마트미디어저널
    • /
    • 제12권8호
    • /
    • pp.9-17
    • /
    • 2023
  • 정보통신의 발달과 스마트 기기의 발전 및 보급 향상은 관광 형태의 변화를 야기하였고, 이후 스마트 관광이라는 개념이 등장하였다. 이에 스마트 관광 정책 및 설문에 관한 연구가 진행되고 있으나 애플리케이션 리뷰에 관한 연구는 미비한 편이다. 본 연구는 구글 플레이 스토어 내 스마트 관광 분야의 대표적인 애플리케이션인 트립어드바이저 애플리케이션 리뷰 데이터를 수집하여 LDA(Latent Dirichlet Allocation) 토픽 모델링을 통해 사용 용도와 사용자 만족을 파악하고자 한다. 분석 결과 4개의 토픽이 도출되었으며 2개의 토픽에서는 긍정적인 평가를 나머지 2개의 토픽에서는 부정적인 평가를 하고 있었다. 사용자들은 해당 애플리케이션의 숙박 및 관광 명소 추천 시스템에 만족하고 있음을 알 수 있었으며 검색 시 설정한 필터가 적용되지 않거나 업데이트 후 리뷰가 게시되지 않음에 불편을 겪고 있음을 알 수 있었다. 이에 다양한 추천 카테고리를 애플리케이션에 추가하여 사용자에게 다양한 경험을 제공하는 것이 만족도 향상에 도움이 될 것으로 기대된다. 또한 필터 기능을 포함한 애플리케이션 문제를 파악하여 애플리케이션 환경 점검과 해당 기능 오류 개선을 한다면 사용자 만족도를 향상시킬 수 있을 것으로 기대된다.

민원 자료를 활용한 반려견 관련 옥외 공공공간 갈등 분석 (Analysis of Dog-Related Outdoor Public Space Conflicts Using Complaint Data)

  • 유예슬;손용훈;조경진
    • 한국조경학회지
    • /
    • 제52권1호
    • /
    • pp.34-45
    • /
    • 2024
  • 반려견이 사회의 일원으로 인식되기 시작하면서 도시의 옥외 공공공간을 함께 이용하는 주체로 부상하고 있다. 그러나 이러한 흐름은 위생, 소음 등의 문제를 발생시키거나 반려인과 비반려인 간 갈등을 야기하는 요인이 되기도 한다. 본 연구는 '반려견', '반려동물', '강아지'와 관련된 공개민원 자료를 텍스트마이닝 기법을 통해 분석하여, 반려견 관련 공간갈등의 원인과 주요 이슈를 밝히기 위해 수행되었다. 연구의 주요 결과는 다음과 같다. 첫째, 반려견과 관련된 민원자료 중 대다수는 옥외 공공공간의 이용과 연관이 있었다. 둘째, 주요 옥외 공공공간 유형별로 공간의 이슈가 다르게 발생하고 있다. 셋째, 반려견 관련 민원자료의 주제는 총 4개로, '반려견 놀이터 조성 요구', '동물 관련 안전 문제 제기', '반려견 전용구역 외 시설에 대한 이용 문제 제기', '펫티켓 관련 공원 관리·단속 강화 요청'이다. 본 연구는 동물이 이용할 수 있는 공공공간의 범위가 확대되는 시점에서, 반려견을 둘러싼 시민들의 인식을 분석했다. 특히, 시민들이 문제점과 요구사항을 명확하게 제시하는 민원자료를 분석 대상으로 채택함으로써, 시민들의 의견을 수렴하는 새로운 방식을 적용한 점에서 의의가 있다.

온라인 정보 보호: 소셜 미디어 내 정보 유출 반응 분석 (Online Privacy Protection: An Analysis of Social Media Reactions to Data Breaches)

  • 서승우;고영준;이홍주
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2024
  • 최근 개인 정보 유출 사건이 빈번히 발생하고 빈도가 갈수록 증가하는 추세이지만, 개인 정보 유출 사건에 대한 사회나 정보주체인 시민들의 반응은 크게 대두되고 있지 않다. 또한, 개인 정보 유출 사건들에 대한 정보 주체의 반응을 여러 해 기간동안의 데이터에 기반하여 비교하는 연구는 많이 수행되어 있지 않다. 따라서, 본 연구는 2014년 1월부터 2022년 10월까지 국내에서 발생한 주요 개인정보 유출 사건들에 대한 정보주체의 소셜미디어 반응 변화를 분석하였다. 각 사건들이 발생한 직후 일주일간의 기간 동안 네이버 블로그에 작성된 총 1,317건의 포스팅을 수집하였다. 이 포스팅들에 대해 LDA 토픽 모델링 기법을 적용하여 주제를 분석한 결과, 개인정보 유출, 해킹, 정보기술 등 5개의 주요 토픽이 도출되었다. 토픽 분포의 시간변화를 분석한 결과, 개인정보 유출 사건 직후에는 해당 사건에 대한 직접적인 언급 토픽의 비중이 가장 높았으나, 시간이 지나면서 개인정보 유출과 간접적으로 관련된 토픽의 언급 비중이 증가하는 것을 확인하였다. 이는 개인정보 유출 사건 발생 후 정보주체의 관심이 시간이 지남에 따라 해당 사건에서 벗어나 관련 토픽으로 옮겨지고, 개인정보 보호에 대한 관심 또한 줄어든다는 것을 의미한다. 본 연구 결과는 향후 개인정보 유출 사건 이후 정보주체의 프라이버시 인식 변화에 대한 연구의 필요성을 시사한다.

데이터 분석을 통한 UX 방법론 연구 고객 세그먼트 분류를 통한 페르소나 도출을 중심으로 (UX Methodology Study by Data Analysis Focusing on deriving persona through customer segment classification)

  • 이슬이;박도형
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.151-176
    • /
    • 2021
  • 정보기술 산업이 발전됨에 따라 다양한 종류의 데이터가 생겨나고 있고 이를 가공하여 산업에 활용하는 것이 필수인 시대가 되었다. 온 오프라인 상에서 수집된 다양한 디지털 데이터를 분석하여 활용하는것은 산업 내의 고객에게 적합한 경험을 제공하기 위해서 꼭 필요한 과정이다. 새로운 비즈니스, 제품, 서비스를 창출하기 위해서는다방면에서 수집된 고객 데이터를 활용하여잠재고객의 니즈를 깊게 파악하고 행동패턴을 분석하여 숨겨진 욕망의 신호를 잡아내는것이 필수이다. 그러나 효과적인 서비스 개발을 위해서 병행해서 진행되어야 할 데이터 분석, UX 방법론을 활용한 연구는 각각 따로 진행되고 있고 산업 내의 활용 예시가 부족한 것이 사실이다. 본 연구에서는 데이터 분석 방법과 UX 방법론을 응용하여 하나의 프로세스를 제작하였다. 행복을 주제로 진행된 설문조사에서 추출된 고객 데이터를 활용하여 고객의 특성을 파악하기 위한 데이터 분석을 진행하였다. 요인, 회귀분석을 실시하여 행복 데이터 설문의 요인 간의 연관 관계를 확인하였다. 그 다음 연관 관계를 군집을 분류하고 가장 최적의 군집 수를 추출하여분류하였다. 이러한 결과를 바탕으로 교차분석을 진행하여 군집 별로 인구통계학적 특성을 확인하였다. 세그먼트를 분류하기 전 서비스 정의를 하기 위하여 뉴스 기사 및 SNS 문장들을 바탕으로 텍스트 마이닝을 통해 주요 키워드를 바탕으로 아이디어를 도출하였고 이중에 가장 타당한 서비스를 선택하였다. 이러한 결과를 바탕으로 세그먼트및 목표 고객을 선정한 후 세그먼트의 특성대로 대상자를 선정하여 인터뷰를진행하였다. 그 후 특성 및 프로파일정보를 활용하여 페르소나를 제작하여고객의 행동과 최종 목표를 서술하였다. 일반적인페르소나와 데이터를 활용한 페르소나를 비교하여 각각의 특성을 비교 분석하였다. 본 연구를 통해 도출된 프로세스는 다변화되는 서비스의 변화 상황에서 적절한 타겟 고객의 정의 및 정확한 분류 체계로 나뉘어진 고객군을파악 할 수 있는 방법을 제시 한 것에 의의가 있다.

토픽 모델링을 활용한 한국의 창업생태계 트렌드 변화 분석 (Analysis on Dynamics of Korea Startup Ecosystems Based on Topic Modeling)

  • 손희영;이명종;변영조
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.315-338
    • /
    • 2022
  • 1986년, 한국은 국가발전의 주축인 중소기업 창업지원을 위한 법 제도를 마련하였다. 이를 기반으로 지난 30여년간 창업정책의 수립 및 발전을 거듭하여 매년 100만 개가 넘는 신규 창업기업이 설립되는 역동적인 창업생태계를 구축하였다. 국가의 정책 방향과 사회, 경제, 문화 등의 외부환경 영향, 그리고 창업지원의 역사를 주요 이슈별로 분석하여 도출된 핵심문장 또는 키워드는 시대별 지원의 특징과 국가지원의 중심내용 등을 확인하는 데 매우 유용하다. 본 연구는 한국의 창업생태계 트렌드 변화를 분석하기 위해 1991년부터 2020년 12월까지 30년간의 언론기사에서 '창업', '벤처', '스타트업' 키워드가 포함된 118만여 건을 추출하고 네트워크 분석과 토픽 모델링을 활용하였다. 분석결과, 한국의 창업생태계 트렌드는 기업 및 산업육성, 확산 그리고 규제 완화, 활황 등, 정부 중심으로 스타트업 생태계의 변화와 발전이 이루어졌음을 파악할 수 있었으며, 다빈도 키워드 분석결과, 생태계 구성요인 간의 연계 활동을 통하여 기업가적인 생산성이 창출되었다. 생산성 창출의 주요 요인으로 한국은 대기업의 휴대폰 산업 발전과 이와 관련된 콘텐츠 스타트업의 성장, 인터넷과 쇼핑몰 중심의 플랫폼 기업의 발전, 그리고 청년창업과 글로벌 진출, 모바일과 인터넷 인프라 중심의 창업기업육성 노력 등으로 파악할 수 있었다. 본 연구는 30년간의 언론기사를 텍스트마이닝과 토픽 모델링을 활용하여 트렌드를 도출하였다. 이는 선행연구가 기존 정부와 정책의 변경 시기를 기준으로 트렌드 변화를 분석한 것과 달리, 언론기사의 키워드와 토픽 변화를 기준으로 창업생태계의 트렌드 변화를 분석하였다는 점에서 학술적 의의뿐만 아니라, 30년 간의 창업생태계 변화 및 주요이슈를 조명해 봄으로써 향후 창업지원의 방향성을 예측할 수 있는 실무적 시사점을 제공하였다.