• 제목/요약/키워드: Text frequency analysis

검색결과 459건 처리시간 0.033초

SNS감성 분석을 이용한 주가 방향성 예측: 네이버 주식토론방 데이터를 이용하여 (Stock Price Prediction Using Sentiment Analysis: from "Stock Discussion Room" in Naver)

  • 김명진;류지혜;차동호;심민규
    • 한국전자거래학회지
    • /
    • 제25권4호
    • /
    • pp.61-75
    • /
    • 2020
  • 주식의 가격을 이해하고 예측하기 위해서 활용되는 데이터의 범위는 기존의 정형화된 데이터에서 비정형화된 다양한 종류의 데이터로 확대되고 있다. 본 연구는 SNS에서 수집된 댓글 데이터가 주식의 미래 가격의 변동에 영향을 미치는지를 조사한다. 가장 많은 주식투자자가 참여하는 커뮤니티인 네이버 주식토론방에서 20개 종목에 대한 6개월 간의 댓글 데이터를 수집하여, 이들 데이터가 1시간 후의 가격 변동의 방향과 가격 변동의 폭에 대한 예측력을 가지는지 조사한다. 예측 관계는 LSTM과 CNN등의 딥뉴럴네트워크 기법을 활용하여 모델링하였다. 20개 종목에 대해 조사하여 13개 종목에서 미래의 주가 이동 방향을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었고, 16개 종목에서 미래의 주가 변동폭을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었다. 본 연구는 네이버 주식토론방과 같은 SNS에서 형성된 여론이 주식 종목의 수급에 영향을 주어 가격의 변동 요인으로도 작용할 수 있다는 점을 확인한다.

해양사고 온톨로지 구축 및 데이터 관리방안 연구: 서해남부해역 선박사고 상황보고서 분석을 중심으로 (A Study on Marine Accident Ontology Development and Data Management: Based on a Situation Report Analysis of Southwest Coast Marine Accidents in Korea)

  • 이영재;강성경;구자영
    • 해양환경안전학회지
    • /
    • 제25권4호
    • /
    • pp.423-432
    • /
    • 2019
  • 매년 해양활동이 증가하며 해양사고 발생빈도가 높아지고 있다. 이에 따라 해양안전을 위한 각종 연구 활동과 정책이 실행되고 있다. 하지만 이러한 노력에도 불구하고 매년 해양사고가 증가하고 있어 이들의 실효성에 대한 문제가 제기되고 있다. 문헌연구 결과에 따르면, 통계연보를 활용한 선행연구는 통계제공항목 간 비교를 통해 두드러지는 항목에 대한 예방책을 제시하고 있다. 2000년대 이후에는 대형 해양사고가 반복적으로 발생하면서 '사고대응'에 대한 사례연구(case study)가 진행되고 있다. 국내 해양안전을 위한 정책수립 연구과정에서 통계연보나 사고사례를 주 자료로 활용하고 있으나 현재 자료는 사후결과 요약정도의 수준이다. 따라서 본 연구에서는 해양사고 사례분석 및 개선방안 관련 문헌연구를 통해 현행 해양관련 연구와 정책의 한계를 탐색하였다. 또한 자료 활용 한계를 개선하기 위한 방안의 일환으로 선박사고 상황보고서 속성분석, 텍스트 마이닝을 통해 해양사고 정보 분류체계인 온톨로지(ontology)를 수정 보완하였다. 해당 항목은 '신고자, 신고수단, 구조세력, 대응 조치사항, 대응취약성, 적재물, 유류유출경위, 피해유형, 사고처리결과'이며, 이 항목들은 분류체계 표준용어를 활용해 향후 지속적으로 수집 활용할 수 있다. 마지막으로 온톨로지를 실질적으로 활용하기 위한 데이터 수집 및 품질확보 방안을 제시했다. 결과적으로 현재 해양안전이 직면한 문제를 명확히 파악하고 '품질이 확보된 충분한 정보'를 활용한다면 보다 다양한 연구와 실효성 있는 정책 실현이 가능할 것이다.

교통부문 디지털 격차 현황 분석 (Analysis of Digital Divide in Transportation Section )

  • 조아해;서지훈;조정우;김성훈;김영호
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.145-166
    • /
    • 2023
  • 최근 코로나19로 인해 사회 전반적인 분야에서 대부분의 서비스가 비대면/무인화로 제공되고 있다. 하지만 여전히 디지털 격차를 해소하기 위한 연구는 요인 분석에 그치고 있으며, 특히 교통분야에서의 디지털 격차와 관련된 연구는 전무한 상황이다. 이에 본 논문은 설문조사를 기반으로 교통부문에서의 디지털 격차의 현황에 대해 파악하고자 한다. 첫째, 전국 성인남녀를 대상으로 디지털 기기 이용현황을 조사하여 연령, 학력, 소득 등으로 구분하여 디지털 취약계층을 선정하였다. 둘째, Chi-squared Text를 활용하여 디지털 취약계층과 비 취약계층을 대상으로 교통부문 모바일 앱 이용현황을 비교하였다. 그 결과, 모바일 앱의 인지도와 선호도에서 취약계층이 비 취약계층에 비해 낮은 것으로 나타났고 이용 횟수에서도 유의한 수준으로 낮은 것으로 나타났다. 셋째, 교통부문 모바일 앱 능숙도를 비교하였다. 마찬가지로 취약계층이 비취약계층에 비해 모바일 앱 이용 절차 전반에서 능숙도가 유의한 수준으로 낮은 것으로 나타났다. 이러한 조사 결과가 향후 교통부문에서의 디지털 격차를 개선하기 위한 정책수립의 기초자료로 활용될 것으로 기대한다.

2009 개정 기술·가정 교과서 『가정생활영역』의 안전교육 내용 분석 (Analysis of Safety Education Contents of 『Field of home life』 in Technology·Home Economics Textbook developed by the revised curriculum in 2009)

  • 김남은
    • 한국가정과교육학회지
    • /
    • 제29권2호
    • /
    • pp.23-39
    • /
    • 2017
  • 본 연구의 목적은 2009 개정 중학교 기술 가정 교과서의 '가정생활 영역'에서 안전교육 내용 분석을 통해 중학생에게 실질적인 도움이 되는 안전교육의 내용을 선정하고 개선하기 위한 기초자료를 제공하는데 있다. 분석대상은 2009개정 교육과정으로 12개 출판사에서 각각 집필된 중학교 교과서 12종 총 24권이다. 분석기준은 교육부(2015)에서 제시한 안전교육 7대 표준안을 바탕으로 안전교육 관련 선행연구를 참조하여 학자들의 검토를 토대로 하여 연구자가 개발하였다. 이러한 분석기준으로 각 교과서를 읽고 '안전'이라고 직접 언급한 단어, '심리적 안전'과 '행복한 삶'을 의미하는 단어, '주의', '유의', '안정'과 관련된 단어 등 안전교육 분석기준의 내용과 관련이 있는 단어들을 모두 추출한 후 가정교과서 단원에 따른 안전교육 내용을 분석틀로 하여 빈도와 퍼센트를 내는 내용분석법을 사용하였다. 교과서 분석결과, 안전교육 내용 쪽수는 기술 가정 교과서 12종의 총 쪽수 3412쪽 중 336.3쪽으로 9.8%로 나타났고 권별로 안전교육 관련 내용의 비중을 분석하여 보면, 1권의 경우 안전교육 내용 비중이 총 224.9쪽, 2권의 안전교육 내용 비중이 총 111.9쪽으로 학년이 올라갈수록 가정 교과서의 안전교육 비중이 낮아졌다. 안전교육 내용 가장 많은 단원은 '청소년의 자기관리' 단원으로 3개의 안전교육 영역을 포함하고 있었고 '청소년의 생활', '녹색생활의 실천' 단원 등과 같이 주로 실천과 체험, 실습이 강조되는 단원의 경우 '생활안전'영역의 안전교육 내용을 많이 다루고 있는 것으로 나타났다. 학생들이 가장 많이 당하는 안전사고와 관련 있는 가정 내 사고(1.4%), 실험 실습사고(0.3%)등에 대한 내용은 낮은 편으로 나타났고, 유니버설주거와 학교폭력 내용은 교과서 1권과 2권에 중복해서 제시되었다. 12종 교과서에서 가장 많이 다른 안전교육 내용은 바람직한 성태도, 식생활문제, 가족 갈등, 식품의 선택이며, 가장 적게 다룬 안전교육 내용은 유해약물, 가정 복지, 인터넷 중독, 산업재해보상보험 등이었다. 본 연구는 2009 개정 교육과정을 중심으로 개발된 교과서 12종을 분석하였기에 2015 개정 교육과정에 의해 집필된 교과서와의 비교를 통해 안전교육의 내용 체계를 분명히 하고 내용의 중복을 피할 수 있는 후속 연구가 필요하다. 또한, 교과서를 보조할 수 있는 안전교육 프로그램을 개발하여 보급할 필요가 있다.

토픽 모델링을 활용한 한국의 창업생태계 트렌드 변화 분석 (Analysis on Dynamics of Korea Startup Ecosystems Based on Topic Modeling)

  • 손희영;이명종;변영조
    • 지식경영연구
    • /
    • 제23권4호
    • /
    • pp.315-338
    • /
    • 2022
  • 1986년, 한국은 국가발전의 주축인 중소기업 창업지원을 위한 법 제도를 마련하였다. 이를 기반으로 지난 30여년간 창업정책의 수립 및 발전을 거듭하여 매년 100만 개가 넘는 신규 창업기업이 설립되는 역동적인 창업생태계를 구축하였다. 국가의 정책 방향과 사회, 경제, 문화 등의 외부환경 영향, 그리고 창업지원의 역사를 주요 이슈별로 분석하여 도출된 핵심문장 또는 키워드는 시대별 지원의 특징과 국가지원의 중심내용 등을 확인하는 데 매우 유용하다. 본 연구는 한국의 창업생태계 트렌드 변화를 분석하기 위해 1991년부터 2020년 12월까지 30년간의 언론기사에서 '창업', '벤처', '스타트업' 키워드가 포함된 118만여 건을 추출하고 네트워크 분석과 토픽 모델링을 활용하였다. 분석결과, 한국의 창업생태계 트렌드는 기업 및 산업육성, 확산 그리고 규제 완화, 활황 등, 정부 중심으로 스타트업 생태계의 변화와 발전이 이루어졌음을 파악할 수 있었으며, 다빈도 키워드 분석결과, 생태계 구성요인 간의 연계 활동을 통하여 기업가적인 생산성이 창출되었다. 생산성 창출의 주요 요인으로 한국은 대기업의 휴대폰 산업 발전과 이와 관련된 콘텐츠 스타트업의 성장, 인터넷과 쇼핑몰 중심의 플랫폼 기업의 발전, 그리고 청년창업과 글로벌 진출, 모바일과 인터넷 인프라 중심의 창업기업육성 노력 등으로 파악할 수 있었다. 본 연구는 30년간의 언론기사를 텍스트마이닝과 토픽 모델링을 활용하여 트렌드를 도출하였다. 이는 선행연구가 기존 정부와 정책의 변경 시기를 기준으로 트렌드 변화를 분석한 것과 달리, 언론기사의 키워드와 토픽 변화를 기준으로 창업생태계의 트렌드 변화를 분석하였다는 점에서 학술적 의의뿐만 아니라, 30년 간의 창업생태계 변화 및 주요이슈를 조명해 봄으로써 향후 창업지원의 방향성을 예측할 수 있는 실무적 시사점을 제공하였다.

고등학교 가정과 교육에서 보조학습 교재.교구의 활용실태 연구 (A Study on the Use of Supplementary Teaching Materials and Implements in the High School Home Economics Education)

  • 조은경;김용숙
    • 한국가정과교육학회지
    • /
    • 제9권1호
    • /
    • pp.1-17
    • /
    • 1997
  • This study was conducted to obtain basic materials to improve the teaching method of Home Economics by theoretically looking into the supplementary teaching materials or implements usable in teaching Costume History area. And based on these data, the types and the applications of the supplementary teaching materials or implements highschool owned were examined. The subjects of this study were 111 Home Economics and Housework curriculum highschool teachers who give a lecture in the country by using self-administered questionnaires. SAS program was used to calculate frequency, percentage, average, standard deviation, and $\chi$(sup)2-test analysis. The results of the study were as follows; 1. Most of the highschool teachers used the school expenses for experiments in preparing the supplementary teaching materials or implements. 2. Of the supplementary teaching materials and implements concerning Costume History, visual implements such as slides and pictures were the mostly owned. CD and audio implements as cassette-tapes were not used. 3. Most of the teachers recognized the importance of the audio-visual teaching materials and implements concerning Costume History. 4. Among the audio-visual materials and implements concerning Costume History by which can be made by school teachers of Home Economics and Housework curriculum, the mostly used one was ‘cutting pictorials from magazines and newspapers’, and the next were ‘orbital materials’, and ‘copy the pictorials’, and the least was ‘recording from the radio’. 5. Most of the annual expenses assigned to the department of Home Economics was used in cooking practice, and the least of the expenses was assigned in buying audio-visual teaching materials and implements. 6. Time assigned to the area of Home Economics was for the most part one or two hours per week, and among this, time assigned to the history of western costume and the history ok korean costume was for the most part five to eight hours. 7. The areas that the highschool teachers felt difficulties mostly during clothing and textiles curriculum were ‘textiles’and the next were ‘knitting’, ‘western costume history’, and ‘korean clothing construction’. 8. The difficulties the highschool teachers faced while teaching Costume History were mostly that ‘the pictorials in the text is not fully explainable’, the next were ‘most of the supplementary teaching materials or implements are not owned’, ‘have to explain very much in a short time’, and ‘the lectural explanation is insufficient’. 9. The solution for the difficulties that the highschool teachers faced while teaching Costume History was mostly ‘the information, on which audio-visual materials and implements are distributed in the market, should be easy to obtain’, the next opinions were ‘the school should provide enough experiment and practice expenses to buy audio-visual materials and implements’, and ‘education facilities of the Home Economics Department should be the main aspects in improving the teaching methods and should give special lectures about it’.

  • PDF

Word2Vec 기반의 의미적 유사도를 고려한 웹사이트 키워드 선택 기법 (Web Site Keyword Selection Method by Considering Semantic Similarity Based on Word2Vec)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제23권2호
    • /
    • pp.83-96
    • /
    • 2018
  • 문서를 대표하는 키워드를 추출하는 것은 문서의 정보를 빠르게 전달할 수 있을 뿐만 아니라 문서의 검색, 분류, 추천시스템 등의 자동화서비스에 유용하게 사용 될 수 있어 매우 중요하다. 그러나 웹사이트 문서에서 출현하는 단어의 빈도수, 단어의 동시출현관계를 통한 그래프 알고리즘 등의 기반으로 키워드를 추출할 경우 웹페이지 구조상 잠재적으로 주제와 관련이 없는 다양한 단어를 포함하고 있는 문제점과 한국어 형태소 분석의 정확성이 떨어지는 형태소 분석기 성능의 한계점 때문에 의미적인 키워드를 추출하는데 어려움이 존재한다. 따라서 본 논문에서는 의미적 단어 위주로 구축된 후보키워드들의 집합과 의미적 유사도 기반의 후보 키워드를 선택하는 방법으로써 의미적 키워드를 추출하지 못하는 문제점과 형태소 분석의 정확성이 떨어지는 문제점을 해결하고 일관성 없는 키워드를 제거하는 필터링 과정을 통해 최종 의미적 키워드를 추출하는 기법을 제안한다. 실 중소기업 웹페이지를 통한 실험 결과, 본 연구에서 제안한 기법의 성능이 통계적 유사도 기반의 키워드 선택기법보다 34.52% 향상된 것을 확인하였다. 따라서 단어 간의 의미적 유사성을 고려하고 일관성 없는 키워드를 제거함으로써 문서에서 키워드를 추출하는 성능을 향상시켰음을 확인하였다.

영아-아버지 그림책 읽기에 대한 아버지의 인식과 참여 실태 (Fathers' Awareness and Practice of Picture Book Reading with Toddlers)

  • 김명순;배선영;김지연
    • 한국보육지원학회지
    • /
    • 제9권5호
    • /
    • pp.277-297
    • /
    • 2013
  • 본 연구에서는 영아 자녀를 둔 아버지 221명을 대상으로 설문조사를 실시하였으며 그림책 읽기에 대한 인식과 참여가 어떻게 이루어지고 있는가를 살펴보았다. 연구결과는 첫째, 59%의 아버지는 12개월 이전부터 자녀와 그림책을 읽어야하고, 36%는 자녀가 원할 때까지 함께 그림책을 읽어야 한다고 인식하고 있었다. 그림책 읽기의 효과로는 책을 통해 얻는 정서적 측면을 중요시하고 있었다. 둘째, 아버지와 자녀가 함께 그림책을 읽는 빈도가 1주일에 1-2회(46%), 3-4회(37%)이었으며, 1회 평균 책읽기 시간이 6-10분(37%), 11-15분(24%)으로 나타났다. 그림책 읽기 상호작용 시, 60%의 아버지는 내용과 그림을 설명해주고, 24%는 자녀의 질문에 답한다고 응답하였다. 또한 아버지는 영아의 선택과 요구를 존중하고, 영아의 반응에 긍정적인 태도를 보이려는 경향을 보였다. 그림책 읽기 시 어려운 점으로 시간과 기술의 부족이라고 응답하였다. 본 연구결과는 아버지들의 그림책 읽기 인식과 실태에 관한 기초자료를 제공하였으며, 추후 아버지 교육프로그램 개발과 지속적인 연구가 이루어져야함을 제안하였다.

토핑 모델링을 활용한 동해안 관광의 변화 분석 (The Analysis of Changes in East Coast Tourism using Topic Modeling)

  • 정은희
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권6호
    • /
    • pp.489-495
    • /
    • 2020
  • 4차혁명이 진행되고 있는 초연결사회에선 다양한 IT기기를 통해 데이터량이 증가하고 있고, 이렇게 생산된 데이터를 분석하여 새로운 가치를 창출 할 수 있다. 본 연구에서는 빅카인즈에서 2017년부터 2019년까지 중앙지, 경제지, 지역조합지, 주요방송사 등에서 "(동해안 관광 또는 동해안 여행) 그리고 강원도"라는 키워드로 기사를 총 1,526건을 수집하였다. 수집된 1,526건의 기사를 분석하기 위해 R언어로 구현된 LDA 알고리즘을 이용하여 토픽 모델링을 수행하였다. 2017년부터 2019년까지 각각의 년도별 키워드를 추출하고, 각 년도별로 빈도수가 높은 키워드를 분류하여 비교하였다. Log Likelihood와 Perplexity를 이용하여 최적의 토픽 수를 8로 설정한 후, 깁스 샘플링 방법으로 8가지의 토픽을 추론하였다. 추론된 토픽들은 강릉과 해변, 고성과 금강산, KTX와 동해북부선, 주말바다여행, 속초와 통일전망대, 양양과 서핑, 체험관광, 교통망 인프라이다. 추론된 8개의 토픽의 비중을 이용해 동해안 관광에 대한 기사들의 변화를 분석하였다. 그 결과, 통일전망대와 금강산의 비중은 큰 변화가 없는 것으로 나타났고, KTX와 체험관광의 비중은 증가하였고, 그 외의 토픽들의 비중은 2017년에 비해 2018년에 감소하였다. 2019년에는 KTX와 체험관광의 비중은 감소하였으나, 나머지 토픽들의 비중은 큰 변화가 없는 것으로 나타났다.

미래신호 탐지 기법을 활용한 위성산업 시장의 진입 전략 수립 연구 (A Study on Establishing a Market Entry Strategy for the Satellite Industry Using Future Signal Detection Techniques)

  • 김세형;박재형;이한솔;강주영
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.249-265
    • /
    • 2023
  • 우주 산업은 세계적으로 잠재력이 높은 산업 분야로 여겨지지만, 국내에서는 아직 글로벌 시장에 비해 비교적 관심이 저조한 실정이다. 국내에서도 최근 위성산업은 전통적인 정부 주도의 산업에서 벗어난 민간 주도의 '뉴스페이스(New Space)' 패러다임에 관심을 기울이고 있다. 따라서, 본 연구의 목적은 국내 위성산업 관련 민간 기업의 시장 진입 전략을 결정하는 데 도움이 될 수 있는 미래의 신호를 탐색하는 것이다. 이를 위해 본 연구에서는 미래신호 이론과 Keyword Portfolio Map 등의 이론적 배경을 활용하여, 키워드 성장률과 키워드 등장 빈도 등을 바탕으로 특허 문서 데이터 내 키워드 잠재력을 분석한다. 또한, 뉴스 데이터를 추가로 수집하여 미래신호를 각각 first symptom, early information으로 구분하였다. 이는 해당 키워드가 특허문서 이외에 어떻게 실질적인 잠재력을 드러내는지에 대한 해석적 지표로 활용된다. 본 연구는 미래신호 탐색을 위한 데이터 수집과 분석 과정을 수록하였고, 키워드 맵의 시각화 자료를 통해 어떤 형태로 활용될 수 있는지 구체적으로 시각화함으로써 수집된 문서의 각각의 키워드가 약신호에서 강신호로 발전하는 과정을 추적하는 일련의 과정을 수록하였다. 본 연구의 과정은 기존 미래신호에 관한 연구의 방법론적인 기여와 활용 범위의 확장에 기여할 수 있고, 결과물은 위성 산업에서의 신산업 기획 및 연구 방향성 수립에 기여할 수 있다.