• 제목/요약/키워드: 빅데이터 분석 기법

검색결과 588건 처리시간 0.028초

미세먼지 저감을 위한 그린인프라 계획요소 도출 - 텍스트 마이닝을 활용하여 - (Derivation of Green Infrastructure Planning Factors for Reducing Particulate Matter - Using Text Mining -)

  • 석영선;송기환;한효주;이정아
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.79-96
    • /
    • 2021
  • 그린인프라 계획은 미세먼지 저감을 위한 대표적인 조경 계획 방안 중 하나이다. 이에, 본 연구에서는 미세먼지 저감을 위한 그린인프라 계획 시 활용될 수 있는 요소를 텍스트 마이닝 기법을 활용하여 도출하고자 하였다. 미세먼지 저감계획, 그린인프라 계획 요소 등의 키워드를 중심으로 관련 선행연구, 정책보고서 및 법률 등을 수집하여 텍스트 마이닝을 통해 단어 빈도-역 문서 빈도(Term Frequency-Inverse Document Frequency, 이하 TF-IDF) 분석, 중심성 분석, 연관어 분석, 토픽 모델링 분석을 실시하였다. 연구결과, 첫째, TF-IDF 분석을 통해 미세먼지 및 그린인프라와 관련된 주요 주제어는 크게 환경문제(미세먼지, 환경, 탄소, 대기 등), 대상 공간(도시, 공원, 지역, 녹지 등), 그리고 적용 방법(분석, 계획, 평가, 개발, 생태적 측면, 정책적 관리, 기술, 리질리언스 등)으로 구분할 수 있었다. 둘째, 중심성 분석 결과, TF-IDF와 유사한 결과가 도출되었으며, 주요 키워드들을 연결하는 중심단어는 '그린뉴딜', '유휴부지'임을 확인할 수 있었다. 셋째, 연관어 분석 결과, 미세먼지 저감을 위한 그린인프라 계획 시, 숲과 바람길의 계획이 필요하며, 미기후 조절의 측면에서 수분에 대한 고려가 반드시 필요한 것으로 확인되었다. 또한, 유휴공간의 활용 및 혼효림의 조성, 미세먼지 저감 기술의 도입과 시스템의 이해가 그린인프라 계획 시 중요한 요소가 될 수 있음을 확인할 수 있었다. 넷째, 토픽 모델링 분석을 통해 그린인프라의 계획요소를 생태적·기술적·사회적 기능을 중심으로 분류하였다. 생태적 기능의 계획요소는 그린인프라의 형태적 부분(도시림, 녹지, 벽면녹화 등)과 기능적 부분(기후 조절, 탄소저장 및 흡수, 야생동물의 서식처와 생물 다양성 제공 등), 기술적 기능의 계획요소는 그린인프라의 방재 기능, 완충 효과, 우수관리 및 수질정화, 에너지 저감 등, 사회적 기능의 계획요소는 지역사회 커뮤니티 기능, 이용객의 건강성 회복, 경관 향상 등의 기능으로 분류되었다. 이와 같은 결과는 미세먼지 저감을 위한 그린인프라 계획 시 리질리언스 및 지속가능성과 같은 개념적 키워드 중심의 접근이 필요하며, 특히, 미세먼지 노출 저감의 측면에서 그린인프라 계획요소의 적용이 필요함을 시사한다고 볼 수 있다.

공간자기상관을 고려한 고용창출중심지 추정: 창원시 사례를 중심으로 (Estimation of Employment Creation Center considering Spatial Autocorrelation: A Case of Changwon City)

  • 정하영;이태헌;황인식
    • 한국지리정보학회지
    • /
    • 제25권1호
    • /
    • pp.77-100
    • /
    • 2022
  • 저성장·고령화시대에 접어들면서 지방의 많은 도시들이 인구감소문제를 경험하고 있다. 생산인 력감소, 재정감축, 삶의 질 저하, 공동체 기반 붕괴 등 다양한 형태의 쇠퇴현상들이 연쇄적으로 발생하면서 지방소멸의 벼랑 끝으로 몰리고 있다. 본 연구는 저성장·고령화 시대 인구감소도시의 효율적인 공간관리 정책으로써 컴팩시티 계획을 적용하기 위해 공간통계기법과 GIS를 활용하여 도시 내 고용창출중심지 추정과 고용 권역을 설정하는 방법론을 제안하였다. 구체적으로 컴팩시티에 관한 선행연구 검토를 통하여 종사자수, 정주인구수, 개발용지 면적을 고려한 새로운 지표 '고용복합지수'를 정의하고, 국지적 모란지수와 핫스팟 분석을 적용하여 고용창출중심지를 추정하였다. 창원시를 대상으로 2013년, 2015년, 2017년, 2019년의 4개 년도를 사례분석을 실시하여 고용창출중심지의 압축된 다핵구조를 확인하였다. 이 결과를 바탕으로 지속적 도시 성장을 위한 산업중심 권역 설정과 컴팩시티 공간정책의 시사점을 제시하였다. 본 분석 결과는 지역활성화 플랫폼을 위한 기능적·제도적 권역 거버넌스의 기초자료로써 인구감소, 지역총생산, 에너지 절감에 대응할 수 있는 공공시설배치, 교통계획, 의료보건 계획 등 공간정책 의사 결정에 필요한 유의미한 정보를 제공할 수 있을 것으로 기대한다.

증류탑을 위한 머신러닝 기반 플랫폼 개발 (Development of Machine Learning-Based Platform for Distillation Column)

  • 오광철;권혁원;노지원;최영렬;박현도;조형태;김정환
    • Korean Chemical Engineering Research
    • /
    • 제58권4호
    • /
    • pp.565-572
    • /
    • 2020
  • 본 연구는 증류탑 분리공정 시스템 최적화를 위하여 인공지능 머신러닝이 적용된 소프트웨어 플랫폼을 개발하였다. 증류탑 분리공정은 석유화학 산업의 대표적이고 핵심적인 공정이다. 하지만 다양한 운전조건과 연속식공정 특성으로 인하여 안정적인 운전이 어려우며 운전자 숙련도에 의하여 공정효율에 차이가 발생된다. 이를 해결하기 위하여 이론적 시뮬레이션을 활용한 제어방법이 개발되어 사용되고 있지만 특수하거나 복잡한 반응이 포함된 공정에는 적용이 어려우며, 거대한 시스템에 대하여 분석이 이루어질 경우 계산비용 증대로 인하여 실시간 제어와 연동이 어려운 한계점을 지니고 있다. 따라서 본 연구에서는 이러한 문제점을 해결하기 위하여 머신러닝을 기반으로 한 경험적 시뮬레이션 모델을 개발하고 이를 통하여 최적의 공정운영방법을 제시하고자 한다. 경험적 시뮬레이션 개발은 실제 공정에서 수집된 빅 데이터, 데이터마이닝을 통한 특성추출, 공정을 대표하는 데이터 선별, 화학공정 특성에 맞는 모델 선정으로 이루어졌으며, 현장검증 및 테스트를 통하여 증류탑 분리공정 플랫폼이 개발되었다. 최종적으로 개발된 플랫폼을 통하여 운전 조작변수의 예측이 가능하며, 최적화된 운전조건을 제공하여 효율적인 공정운영을 달성할 수 있다. 본 논문은 머신러닝 기법을 화학공정에 적용한 기초연구로서 이후 다양한 공정에 적용하여 4차 산업의 스마트 팩토리의 초석이 되어 널리 활용될 수 있을 것이라 판단된다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

'미술'과 '언어' 활동 융합형의 아동 발달지원 교육 프레임워크 개발을 위한 탐색적 연구: 텍스트 마이닝을 중심으로 (An exploratory study for the development of a education framework for supporting children's development in the convergence of "art activity" and "language activity": Focused on Text mining method)

  • 박윤미;김시정
    • 한국융합학회논문지
    • /
    • 제12권3호
    • /
    • pp.297-304
    • /
    • 2021
  • 이 연구는 학령기 아동의 발달지원을 위하여 기존의 미술 치료 및 교육에서 시행되어 온 시각적 사고 중심의 접근에 더하여, 언어 교육 및 치료적 접근을 융합하고자 한 것이다. 이에 언어와 미술의 서로 다른 영역의 융합 가능 영역을 탐색하기 위하여 텍스트 마이닝 기법을 적용하였다. 이에 따라 이 연구는 기초 연구, 예비 DB구축, 텍스트 선별, DB 전 처리 및 확정, 불용어 처리, 텍스트 마이닝 분석 및 융합 가능 역 도출'의 절차에 따라 연구를 진행하였다. 연구 결과, 미술 치료 및 교육과 언어 치료 및 교육 분야에서 나타나는 문헌상의 각 군집을 연계하여 의사소통 및 학습 기능, 문제해결 및 감각 기관, 예술 및 지능, 정보와 의사소통, 가정 및 장애, 주제와 개념화 및 또래, 통합과 재구성 및 태도 등과 관련된 융합역을 도출할 수 있었다. 결론적으로 본 연구를 통하여 향후 미술과 언어의 활동 중심 융합형 프로그램을 설계할 수 있는 프레임워크를 마련하고 아동발달 지원을 위한 총체적 접근을 시도하였다는 점에서 연구의 의의가 있다.

사회연결망분석을 활용한 한국 남자축구대표팀 경기성과 분석: 벤투 감독 경기를 중심으로 (Analyzing the Performance of the South Korean Men's National Football Team Using Social Network Analysis: Focusing on the Manager Bento's Matches)

  • 정연식 ;강은경 ;양성병
    • 지식경영연구
    • /
    • 제24권2호
    • /
    • pp.241-262
    • /
    • 2023
  • 스포츠 경기에서 발생하는 현상이나 경기기록을 분석하는 스포츠 경기분석 분야에 첨단기술과 다양한 과학적 분석기법이 적용되고 있으며, 그 중 패스네트워크 분석에 사회연결망분석 방법이 활발히 활용되고 있다. 축구는 선수 간 패스라는 상호작용을 통해 경기가 이루어지는 대표적인 스포츠인 만큼 사회연결망분석을 이용하여 기존에는 측정할 수 없었던 경기에 대한 새로운 정보를 제공하고자 노력하고 있다. 이에, 본 연구에서는 단일 축구팀의 (1) 시간 흐름에 따른 패스네트워크의 변화를 분석하고, (2) 전술의 변화에 영향을 미치는 주요 요인 중 경기의 성격 변화(카타르월드컵 vs. A매치)와 (3) 상대팀 변화(FIFA랭킹 상위팀 vs. FIFA랭킹 하위팀)에 대한 패스네트워크까지 총 세 가지 상황을 비교∙분석하고자 하였다. 보다 구체적으로, 벤투 감독 부임 이후 한국 남자축구국가대표팀의 경기 중 10 경기를 선별하고, 이에 대한 네트워크 지표를 추출하였으며, 축구팀 경기력 평가모델의 네 가지 지표(효율성, 응집력, 취약성, 활동성/리더십)를 추출된 데이터에 적용한 후 세 가지 상황을 각각 분석하였다. 연구결과, 시간 흐름에 따른 경기력 분석에서 응집력이 유의하게 상승하고, 취약성이 유의하게 하락하는 것을 확인할 수 있었고, 경기성격 변화에 따른 비교분석에서는 카타르월드컵 경기가 A매치 경기보다 평가모델의 모든 항목에서 경기력이 우수한 것으로 나타났다. 마지막으로, 상대팀의 변화에 따른 비교분석에서는 FIFA랭킹 하위팀과의 경기가 상위팀과의 경기보다 평가모델의 모든 항목에서 경기력이 우수하게 나타났다. 본 연구의 결과가 축구팀의 감독 선임 및 경기 전략을 수립하는데 주요한 기초자료로 활용되어 축구팀의 경기력 향상에 기여할 수 있기를 기대한다.

영화 흥행에 영향을 미치는 새로운 변수 개발과 이를 이용한 머신러닝 기반의 주간 박스오피스 예측 (Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning)

  • 송정아;최근호;김건우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.67-83
    • /
    • 2018
  • 2013년 누적인원 2억명을 돌파한 한국의 영화 산업은 매년 괄목할만한 성장을 거듭하여 왔다. 하지만 2015년을 기점으로 한국의 영화 산업은 저성장 시대로 접어들어, 2016년에는 마이너스 성장을 기록하였다. 영화산업을 이루고 있는 각 이해당사자(제작사, 배급사, 극장주 등)들은 개봉 영화에 대한 시장의 반응을 예측하고 탄력적으로 대응하는 전략을 수립해 시장의 이익을 극대화하려고 한다. 이에 본 연구는 개봉 후 역동적으로 변화하는 관람객 수요 변화에 대한 탄력적인 대응을 할 수 있도록 주차 별 관람객 수를 예측하는데 목적을 두고 있다. 분석을 위해 선행연구에서 사용되었던 요인 뿐 아니라 개봉 후 역동적으로 변화하는 영화의 흥행순위, 매출 점유율, 흥행순위 변동 폭 등 선행연구에서 사용되지 않았던 데이터들을 새로운 요인으로 사용하고 Naive Bays, Random Forest, Support Vector Machine, Multi Layer Perception등의 기계학습 기법을 이용하여 개봉 일 후, 개봉 1주 후, 개봉 2주 후 시점에는 차주 누적 관람객 수를 예측하고 개봉 3주 후 시점에는 총 관람객 수를 예측하였다. 새롭게 제시한 변수들을 포함한 모델과 포함하지 않은 모델을 구성하여 실험하였고 비교를 위해 매 예측시점마다 동일한 예측 요인을 사용하여 총 관람객 수도 예측해보았다. 분석결과 동일한 시점에 총 관람객 수를 예측했을 경우 보다 차주 누적 관람객 수를 예측하는 것이 더 높은 정확도를 보였으며, 새롭게 제시한 변수들을 포함한 모델의 정확도가 대부분 높았으며 통계적으로 그 차이가 유의함으로써 정확도에 기여했음을 확인할 수 있었다. 기계학습 기법 중에는 Random Forest가 가장 높은 정확도를 보였다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.