• 제목/요약/키워드: Text Data Analysis

검색결과 1,555건 처리시간 0.032초

정보보호 컨설턴트의 역할: 미국과 한국의 구인광고 분석 (Information Security Consultants' Role: Analysis of Job Ads in the US and Korea)

  • 박상우;김태성;전효정
    • 경영정보학연구
    • /
    • 제22권3호
    • /
    • pp.157-172
    • /
    • 2020
  • 정보보호 인증을 통합한 ISMS-P의 등장, 유럽의 개인정보보호법(GDPR)의 시행 그리고 각종 보안사고 등 이슈로 정보보호 컨설턴트에 대한 수요가 증가할 것으로 전망된다. 본 논문에서는 기업의 수요를 명시적으로 확인할 수 있는 구인광고 사이트의 광고를 수집하여 정보보호 컨설턴트의 역할을 분석하였다. 한국과 미국의 대표적인 구인광고 사이트를 선정하여 2014년과 2019년에 정보보호 컨설턴트의 구인광고 명세를 수집하였다. 수집된 데이터를 텍스트마이닝을 이용한 시각화, 비모수적 방법을 이용한 분석 등을 사용하여 정보보호 컨설턴트의 역할에 변화가 있었는지를 확인하였다. 연구결과로 정보보호 컨설턴트에게 요구하는 조건들의 변화는 미미한 것으로 밝혀졌다. 이는 5년의 시간차이를 두고 역할의 변화가 크지 않다는 것을 의미한다. 연구 결과는 관련 정책 수립자, 정보보호 컨설턴트 구직희망자 그리고 정보보호 컨설턴트 채용자에게 도움이 될 것으로 기대된다.

LDA 토픽 모델링 기법을 활용한 무용공연의 연구 동향 분석 (Trend Analysis of Dance Performance Research Using Keywords and Topic Modeling of LDA Techniques)

  • 시유
    • 산업융합연구
    • /
    • 제22권3호
    • /
    • pp.13-25
    • /
    • 2024
  • 본 연구는 빅데이터를 기반으로 국내에서 발표된 무용공연 관련 연구 주제를 탐색하고, 시대 흐름에 따라 변화하는 연구동향을 살펴본다. 토픽모델링 분석하여 도출한 결과는 다음과 같다. (1)무용공연 마케팅전략 및 발전방안 연구, (2)무용공연 공간 및 공연만족 재관람요인 연구, (3)무대환경이 무용공연의 대중성 활성화와 기여도 연구, (4)무용공연 현황 및 무용단 운영사례 융합 연구, (5)다양한 소셜미디어 활용한 무용공연 확정성 연구, (6)기술적용 무용공연 콘텐츠 방향 및 개발 연구 6개의 주요 토픽이 도출되었다. 이에 무용공연을 비롯해 무용 분야 관련 연구의 시기, 사회 변화에 따른 연구 트렌드와 주제를 파악하고, 연구자들의 변화 관심 주제의 주요 핵심어를 추출해 키워드를 분석하였으며 시기별 주요 키워드를 비교 분석하였다. 이에 다각화되고 융합되면서 신기술이 적용되는 최신 연구 동향에 대한 발전적 연구의 필요성을 고민하고 제시하였다.

기술예측을 위한 특허 키워드 네트워크 분석 (Keyword Network Analysis for Technology Forecasting)

  • 최진호;김희수;임남규
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.227-240
    • /
    • 2011
  • 특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다. 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다. 나아가 본 연구에서 제시한 방법론을 통해 도출된 특허 키워드 조합 정보를 활용하면 미래에 어떤 개념들이 합쳐져서 새로운 특허 단위로 만들어 질지 가늠해볼 수 있고, 새로운 특허를 개발할 때 참고할 수 있는 유용한 정보로 활용할 수 있다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

텍스트마이닝을 활용한 공개데이터 기반 기업 및 산업 토픽추이분석 모델 제안 (Development of Topic Trend Analysis Model for Industrial Intelligence using Public Data)

  • 박선영;이진무;김유일;서진이
    • 기술혁신연구
    • /
    • 제26권4호
    • /
    • pp.199-232
    • /
    • 2018
  • 빅데이터 분석을 통한 기업 경영환경에 대한 이해와 통찰을 구하고자 하는 요구가 산업 및 기업 경영 전반에 증가하고 있다. 이러한 사회적 요구에 따라 산업의 이해와 기업 경영의 이해를 위하여 기업의 경영실적 및 향후 계획을 포괄적으로 담고 있는 기업공시정보를 활용한 연구가 주목을 받고 있다. 이러한 기업공시정보는 대표적인 비정형 데이터로써 텍스트마이닝 방법론을 적용하여 그 범위와 수준에 대한 다양한 접근을 통하여 산업 수준 및 기업 수준에서 다양한 활용이 가능하다. 그러나 아직은 이러한 기업공시자료를 활용한 산업 및 기업 레벨에서 적용가능한 수준의 분석모델이 부족한 것으로 파악된다. 따라서 본 연구에서는 실제 활용 가능한 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 제안하고자 한다. 미국상장기업의 공시자료인 미국 SEC EDGAR 자료를 기반으로 텍스트마이닝 알고리즘을 적용하여 산업 및 기업 수준의 경영주제(토픽)에 대한 추이분석이 가능한 모델을 제안하고자한다. SEC EDGAR의 10-K 문서를 대상으로 LDA 토픽 모델링을 통하여 산업 수준에서 전체 산업의 주제분야 분류를 파악하였고, 산업간 비교 측면에서 소프트웨어 산업과 하드웨어 산업 분야의 사례를 통해 최근 20년간의 토픽추이를 비교분석 하였다. 또한 최근 20년간의 기업의 경영주제 변화를 소프트웨어 산업에 속한 2개 기업을 중심으로 살펴보았다. 이를 통해 산업 및 기업 수준에서의 경영주제의 추이 변화를 파악하여 쇠퇴 및 성장 추세에 있는 경영주제를 확인 할 수 있었다. 한편 word2vec 워드 임베딩 모델과 주성분분석을 통한 차원 축약을 통해 소프트웨어 산업분야의 기업 및 특정 제품(혹은 서비스)에 대한 매핑을 통해 유사한 경영주제(토픽)를 가지는 기업 및 제품(서비스)을 사례를 통해 파악하였으며, 이를 시간적 흐름에 따른 변화 양상도 관찰할 수 있었다. 본 연구의 목적이 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 개발하기 위한 방법론을 제안한 측면에서, 해외 데이터를 사용하여 산업의 경영주제 변화 추이, 기업의 경영주제 변화 추이를 거시적으로 조망할 수 있는 실무적인 방법론의 제안에서 의의가 있을 수 있다. 한편 기업의 기술경영전략 측면에서 기업의 경영토픽의 잦은 변화, 경영주제의 변화의 속도 등 다양한 변화 양상의 차이에 따른 기업의 매출 등의 경영성과와의 연관성 분석, 실제 기업의 제품포트폴리오의 구성에 따른 기업 간의 경쟁상황 등을 파악하는 미시적 모델 제안을 위한 추가 연구가 요구된다.

직원을 위한 내부마케팅이 기업의 시가 총액 변동률에 미치는 영향 분석: 잡플래닛 기업 리뷰를 중심으로 (An Analysis of the Internal Marketing Impact on the Market Capitalization Fluctuation Rate based on the Online Company Reviews from Jobplanet)

  • 최기철;이상용
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.39-62
    • /
    • 2018
  • 컴퓨터 연산능력의 향상과 데이터를 수집하고 가공해 분석이 가능하도록 데이터를 정형화 시키는 기술이 발달함에 따라, 소셜미디어 및 인터넷 공간에서 생산되는 다양한 텍스트 데이터를 수집하고 그것을 분석하는 시도가 늘고 있다. 본 연구는 이와 같은 기술의 발전과 새롭게 시도되고 있는 분석법을 활용해 텍스트 데이터를 분석하여 과거에 설문조사 방법을 통해 확인했던 "내부마케팅"의 효과를 기존과는 다른 방식으로 확인해 보고자 하였다. 이와 같은 분석을 위해, 전/현직자들이 해당 기업의 구직자들에게 기업의 리뷰를 제공하는 플랫폼 잡플래닛(www.jobplanet.co.kr)의 리뷰 데이터를 웹크롤러를 생성하여 약 4만 건을 수집하였다. 또한 수집된 비정형 데이터를 정형화하기 위한 형태소 분석을 진행하여 명사만을 추출한 후, 미리 생성해 놓은 단어주머니에 들어있는 단어와 같을 경우 그 숫자를 세어 분류화를 진행하였다. 분류화된 내부마케팅 영역별 단어 수의 변화를 독립변수로, 시가총액 변동률을 종속변수로 활용하여, 내부마케팅과 시가총액간의 관계를 확인하고자 하였다. 그 결과, 대부분의 기존 연구와는 다르게 내부마케팅의 효과는 제한적인 영역에서만 기업의 성과에 긍정적인 영향을 미치며 대부분의 환경에서는 음의 영향을 미치는 것으로 나타났다. 산업군으로 나누었을 때, 제조업에서는 여성지원과 교육 훈련 부문에서 기업성과에 긍정의 영향을 미치는 것으로 나타났으나, 유통업에서는 직원 복지, 일-가정 양립 그리고 바이오/제약 업종에서는 직원 복지, 일-가정 양립, 사내 커뮤니케이션 그리고 보상 부문에서 모두 기업성과에 음의 영향을 미치는 것으로 나타났다. 또한 기업의 규모가 크고 역사가 오래된 기업에서는 직원 복지가 기업성과에 악영향을 미치는 것으로 나타났으나, 교육 훈련 부문에서는 종속변수에 긍정적 영향을 미치는 것을 확인할 수 있었으며, 기업의 규모가 작고 역사가 짧은 기업에서는 직원 복지, 사내 커뮤니케이션 그리고 일-가정 양립에서 종속변수와 음의 관계를, 여성지원 에서는 종속변수와 양의 관계를 갖는 것으로 나타났다. 본 연구는 이러한 결과들을 분석하여 이론적 의미뿐만 아니라, 실무적 함의를 제시하고자 하였다.

제7차 초등학교 교육과정에 제시된 보건교육 내용 분석 (An Analysis on the Health Education Content Suggested in the 7th Curriculum of Elementary School Education)

  • 김가옥;박영수
    • 한국학교ㆍ지역보건교육학회지
    • /
    • 제2권2호
    • /
    • pp.39-55
    • /
    • 2001
  • The purpose of this study was to provide the necessary fundamental data in composing a systematic text content of the public health by analyzing each text, domain, and teaching contents suggested in the textbooks as well as teachers' guides of the 7th elementary school education curriculum, while the study subjects were as follows. 1. The health education content suggested in the 7th physical education curriculum were analyzed and examined. 2. The health teaching content of each textbook in the 7th elementary school curriculum was to be analyzed and examined. In order to resolve the above research issues, the physical, spiritual, and social domain along with the (1) Proper living habit, (2) Health and nutrition, (3) Sex education, (4) Prevention of the sense-organic diseases, (5) Cleanliness of food, (6) Oral hygiene, (7) Individual health and public health, (8) Safety in living, (9) Abuse and usage of medication, educational content suggested in the 7tand (10) Environment pollution focused around the health of the elementary school education curriculum was analyzed and its outcome was as below First, compared with the 6th elementary school education curriculum, the health content suggested in the 7th elementary school education curriculum was decreased. Second, although each grade's teaching content of the health domain in the physical education was considered in its structure following after the according systems, they were preponderant in partial subjects such as the safety in living, nutrition, proper living habit, sport, and health in sport. oo. Third, the health education content was organized in 4 units such as the physical growth and development, prevention of diseases, safe living, and leisure living(leisure, spiritual health, and etc.) for the 3rd and 4th grade. Then, as for 5th and 6th grade, it was organized in 3 units such as the understanding the human body, prevention of disease, and leisure and safe living. Fourth, in the physical educational health domain, a strong point was constructed within the physical, spiritual, and social areas of the elementary school physical education. Fifth, the number of the public health education contents directly related with the health education was 43 as with 25 indirect contents. Sixth, each grade's domain unit structure of the public health content was heavy upon the physical and social area throughout every grade while in opposite, the spiritual domain' s unit structure was weak. In according to each grade, the physical domain was stressed in 4, 5, and 6 grades while the social domain was stressed in 1, 5, and 6 grades.

  • PDF

교육적으로 유의미한 의사소통을 위한 지구과학 관련 전시 라벨의 서술 특징 (Descriptive Characteristics of the Label Texts Related to Earth Science: Toward Educationally Meaningful Communication)

  • 김찬종;박은지;윤세열;이선경
    • 한국지구과학회지
    • /
    • 제33권1호
    • /
    • pp.94-109
    • /
    • 2012
  • 본 연구는 국내 주요 과학관 및 자연사 박물관의 지구과학 관련 전시 라벨 텍스트의 서술 특징을 분석하고자 하였다. 이를 위해, 국립 중앙 과학관과 서대문 자연사 박물관에서 자료를 수집하였고, 체계기능언어학을 일부 적용한 분석틀을 사용하였다. 연구 결과, 라벨들은 1) 대부분 평서형 문장, 2) 적절한 과학적 정보의 양, 3) '사실' 위주의 정보 제시, 4) 모두 논리적 설명 장르로 구성되어 있었다. 특히, 국립 중앙 과학관의 라벨들은 5) 전체 어휘 중 과학 용어의 비율이 높고 6) 주어의 절반 이상이 생략되거나 긴 명사화 형태였다. 결론적으로, 분석 대상 라벨들은 전시물과 관람객들 사이에서 과학 문화에 관한 양 방향적 의사소통을 이끌기보다 일 방향적인 의사소통을 일으킬 가능성이 높은 것으로 해석할 수 있었다. 이를 토대로, 과학 문화와 관람객의 일상 문화 사이의 열린 구조를 만들어 보다 교육적으로 유의미한 의사소통을 가능하게 하는 라벨 텍스트의 서술 특징들을 제안하였다.

북한 교과서 중 지구과학 내용의 탐구 경향성 분석 (A Study of Inquiry Tendency of Earth Science Contents presented in North Korean Textbooks)

  • 박기락;박현주
    • 한국지구과학회지
    • /
    • 제40권2호
    • /
    • pp.188-199
    • /
    • 2019
  • 이 연구의 목적은 2013 교육강령의 북한 교과서 중 지구과학 내용의 탐구 경향성을 조사하여 향후 북한 지구과학교육의 이해를 위한 기초 자료로 제공하는 것이다. 연구대상은 초급중학교의 자연과학1 2와 조선지리2, 고급중학교의 지리1 교과서이며, 교과서의 지구과학 내용을 Romey 분석법에 따라 본문 삽화 문제 활동지수 측면에서 분석하였다. 이 연구의 결과는 다음과 같다. 첫째, 대기과학 문제와 천문학 본문은 탐구적 경향을 나타내었다. 둘째, 해양학의 비중은 상대적으로 작았다. 셋째, 비 탐구적 문제가 많거나 탐구적 문제가 과도하여 문제의 균형이 필요하였다. 넷째, 탐구학습을 강조하지 않는 경향을 보였다. 마지막으로 탐구 경향성의 양적 및 질적 수준의 제고가 필요한 것으로 조사되었다. 향후 북한 교과서 중 지구과학 내용의 질적 분석 및 남북한 교과서 중 지구과학 내용의 탐구 경향성 비교 분석 등을 제안하였다.