• 제목/요약/키워드: Frequency Keyword Analysis

검색결과 316건 처리시간 0.025초

텍스트 마이닝에 기반한 U-City 서비스 이슈 및 동향분석 - 네트워크분석 및 정보량계측기법을 활용하여 - (Study on U-City Service Issue and Trends based Text Mining - Using the Network Analysis and Information Measure Method -)

  • 정다운;유지송;이미숙;신동빈
    • Spatial Information Research
    • /
    • 제23권3호
    • /
    • pp.35-44
    • /
    • 2015
  • 최근 정부는 U-City 활성화를 위한 발전전략을 통해 시민들이 체감하는 서비스를 발굴 및 제공하는 것을 목표로 하고 있다. 이에 본 연구는 신문기사 중 U-City 서비스관련 기사를 대상으로 시사분석을 통해 서비스 이슈와 동향을 분석하여 시민체감형 서비스 추진방향을 모색하는데 목적이 있다. 분석을 위해 2009년부터 2014년까지 수집된 723개 신문기사는 전처리과정을 거쳐 키워드 빈도분석을 실시했으며, 빈도분석 결과를 바탕으로 네트워크 분석과 정보계측기법을 활용했다. 네트워크 분석결과 연결 중심성, 매개 중심성, 근접 중심성이 높은 키워드는 정보, IT, 환경, 기술, 센터 순으로 나타났다. 5개의 키워드는 지난 6년 동안 U-City를 추진하는데 있어 중요한 요소였다는 것을 알 수 있다. 정보계측기법결과 기존에 추진된 U-City는 인프라 구축에 중심을 뒀으며, 공공중심의 서비스를 제공했다는 동향을 파악할 수 있었다. 2009년은 관광, 2010년은 방범 방재, 2011년은 시설물 관리, 2012년은 행정, 2013년 2014년은 시설물 관리 분야를 중심적으로 서비스를 개발했다. 이에 기존에 구축된 인프라를 기반으로 시민체감도가 높은 서비스분야의 발굴 및 제공이 필요하다는 시사점을 도출하였다. 본 연구는 추후 U-City를 추진하는 지자체의 계획수립에 참고적인 역할을 할 수 있을 것으로 기대된다.

전화통화 빅데이터 분석에 관한 연구 (A Study on Phon Call Big Data Analytics)

  • 김정래;정찬기
    • 정보화연구
    • /
    • 제10권3호
    • /
    • pp.387-397
    • /
    • 2013
  • 본 연구는 전화통화에 의해 생성된 데이터에 대한 빅데이터 분석 접근을 제안한다. 전화통화 데이터의 분석모형은 자연어의 어휘식별을 위한 PVPF(Parallel Variable-length Phrase Finding) 알고리즘과 키워드의 사용빈도 측정을 위한 워드 카운트 알고리즘으로 구성된다. 제안한 분석모형에서는 먼저 PVPF 알고리즘에 의해 연계 단어 추출을 통해 어휘를 식별하며, MapReduce의 워드 카운트 알고리즘을 사용하여 식별된 어휘 및 단어의 사용빈도를 측정한다. 그 결과는 다양한 관점에서 해석될 수 있다. 제안 분석모형의 효과성을 보이기 위해 HDFS(Hadoop Distributed File System)를 기반으로 분석모형을 설계 구현하였으며, 전화통화 데이터를 실험 적용한다. 실험결과, 키워드 상관관계 분석 및 사용빈도 변화 분석을 통해 유의미한 결과를 도출한다.

문서의 의미론적 분석에 기반한 키워드 추출에 관한 연구 (A Study on Keywords Extraction based on Semantic Analysis of Document)

  • 송민규;배일주;이수홍;박지형
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.586-591
    • /
    • 2007
  • 지식 관리 시스템, 정보 검색 시스템, 그리고 전자 도서관 시스템 등의 문서를 다루는 시스템에서는 문서의 구조화 및 문서의 저장이 필요하다. 문서에 담겨있는 정보를 추출하기 위해 가장 우선시되어야 하는 것은 키워드의 선별이다. 기존 연구에서 가장 널리 사용된 알고리즘은 단어의 사용 빈도를 체크하는 TF(Term Frequency)와 IDF(Inverted Document Frequency)를 활용하는 TF-IDF 방법이다. 그러나 TF-IDF 방법은 문서의 의미를 반영하지 못하는 한계가 존재한다. 이를 보완하기 위하여 본 연구에서는 세 가지 방법을 활용한다. 첫 번째는 문헌 속에서의 단어의 위치 및 서론, 결론 등의 특정 부분에 사용된 단어의 활용도를 체크하는 문헌구조적 기법이고, 두 번째는 강조 표현, 비교 표현 등의 특정 사용 문구를 통제 어휘로 지정하여 활용하는 방법이다. 마지막으로 어휘의 사전적 의미를 분석하여 이를 메타데이터로 활용하는 방법인 언어학적 기법이 해당된다. 이를 통하여 키워드 추출 과정에서 문서의 의미 분석도 수행하여 키워드 추출의 효율을 높일 수 있다.

  • PDF

A Study on the Change of Tourism Marketing Trends through Big Data

  • Se-won Jeon;Gi-Hwan Ryu
    • International journal of advanced smart convergence
    • /
    • 제13권2호
    • /
    • pp.166-171
    • /
    • 2024
  • Recently, there has been an increasing trend in the role of social media in tourism marketing. We analyze changes in tourism marketing trends using tourism marketing keywords through social media networks. The aim is to understand marketing trends based on the analyzed data and effectively create, maintain, and manage customers, as well as efficiently supply tourism products. Data was collected using web data from platforms such as Naver, Google, and Daum through TexTom. The data collection period was set for one year, from December 1, 2022, to December 1, 2023. The collected data, after undergoing refinement, was analyzed as keyword networks based on frequency analysis results. Network visualization and CONCOR analysis were conducted using the Ucinet program. The top words in frequency were 'tourists,' 'promotion,' 'travel,' and 'research.' Clusters were categorized into four: tourism field, tourism products, marketing, and motivation for visits. Through this, it was confirmed that tourism marketing is being conducted in various tourism sectors such as MICE, medical tourism, and conventions. Utilizing digital marketing via online platforms, tourism products are promoted to tourists, and unique tourism products are developed to increase city branding and tourism demand through integrated tourism content. We identify trends in tourism marketing, providing tourists with a positive image and contributing to the activation of local tourism.

WCTT: HTML 문서 정형화 기반 웹 크롤링 시스템 (WCTT: Web Crawling System based on HTML Document Formalization)

  • 김진환;김은경
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.495-502
    • /
    • 2022
  • 오늘날 웹상의 본문 수집에 주로 이용되는 웹 크롤러는 연구자가 직접 HTML 문서의 태그와 스타일을 분석한 후 수집 채널마다 다른 수집 로직을 구현해야 하므로 유지 관리 및 확장이 어렵다. 이러한 문제점을 해결하려면 웹 크롤러는 구조가 서로 다른 HTML 문서를 동일한 구조로 정형화하여 본문을 수집할 수 있어야 한다. 따라서 본 논문에서는 태그 경로 및 텍스트 출현 빈도를 기반으로 HTML 문서를 정형화하여 하나의 수집 로직으로 본문을 수집하는 웹크롤링 시스템인 WCTT(Web Crawling system based on Tag path and Text appearance frequency)를 설계 및 구현하였다. WCTT는 모든 수집 채널에서 동일한 로직으로 본문을 수집하므로 유지 관리 및 수집 채널의 확장이 용이하다. 또한, 키워드 네트워크 분석 등을 위해 불용어를 제거하고 명사만 추출하는 전처리 기능도 제공한다.

2010~2015년 사회네트워크분석(SNA) 방법 활용 국내외 영재교육 연구동향 분석 (Investigating Trends of Gifted Education in Domestic and Foreign Countries through Social Network Analysis from 2010 to 2015)

  • 윤진아;김수진;서혜애
    • 영재교육연구
    • /
    • 제26권2호
    • /
    • pp.347-363
    • /
    • 2016
  • 본 연구는 사회네트워크분석(Social Network Analysis: SNA)방법을 활용하여 최근 6년간(2010~2015년)의 국내 및 해외 영재교육의 연구동향을 분석하는 데 목적을 두었다. 연구대상은 영재교육 관련 국내 KCI등재지인 '영재교육연구'(한국영재학회)와 '영재와 영재교육'(한국영재교육학회)에 게재된 논문 457편과 해외 SSCI학술지 'The Gifted Child Quarterly,' 'Journal for the Education of the Gifted,' 'High Ability Studies'에 게재된 논문 347편으로 선정하였으며, 각 논문의 영문 키워드를 추출한 후 SNA방법으로 키워드 네트워크와 연결중심성 분석을 실시하였다. 연구결과, 국내외 공통적으로 academically gifted, science gifted, gifted를 중심으로 achievement, identification, intelligence의 키워드 빈도가 가장 높게 나타났다. 따라서 영재를 대상으로 성취, 판별, 지능에 관련된 연구들이 가장 많이 이루어진 것으로 나타났다. 이외에도 cognitive, motivation, self-concept이 공통적인 관심 주제로 나타났다. 한편 국내에서는 creativity, gifted education, gifted education teacher를, 해외에서는 foreign countries, student attitudes를 키워드로 한 연구가 주를 이루었다. 국내 영재교육 연구에서는 해외와 달리 외국사례, 학생태도, 성별차이 관련 키워드 빈도가 거의 나타나지 않았다. 결론적으로 국내 영재교육 연구는 보다 다양한 관점에서 연구가 이루어져야 하는 것으로 해석되었다.

키워드 분석을 활용한 한·중 모바일 결제 서비스에 대한 소비자 반응 탐색적 분석 -카카오페이와 알리페이를 중심으로- (Exploratory Analysis of Consumer Responses to Korea-China Mobile Payment Service using Keyword Analysis -Focus on Kakao Pay and Alipay-)

  • 가정;윤동화;안진현
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.514-523
    • /
    • 2021
  • 최근 모바일 간편 결제 서비스의 확산은 사람들의 삶에 점점 더 많은 영향을 미치고 있다. 중국과 한국의 모바일 간편 결제 서비스에 대한 연구 증가를 통해 향후 모바일 간편 결제 서비스의 지속적인 발전이 매우 중요함을 알 수 있다. 본 논문은 소셜미디어 상에서 소비자의 카카오페이와 알리페이에 대한 반응의 차이를 알아보기 위해 카카오페이와 알리페이가 언급된 네이버 블로그 글을 수집하고 텍스트마이닝 기법을 활용해 키워드 분석을 했다. 품사별 키워드 빈도수 분석을 하였고 한 문장에 동시에 언급되는 공기어 빈도수 분석을 했다. 특히, 카카오페이와 알리페이를 언급한 글에서 공통적으로 언급된 단어를 추출하고 그에 대해 같이 언급된 단어들을 분석함으로써 같은 주제에 대해 어떤 다른 반응을 보이는지를 살펴봤다. 분석 결과 카카오페이의 신뢰성에 대한 소비자들의 우려가 존재했고 알리페이의 혜택에 대한 소비자들의 반응이 부정적이었다. 이러한 분석 결과를 토대로, 모바일 결제 서비스가 경쟁력을 갖추기 위해서는 다양한 부가 서비스를 추가하거나 보안 문제를 해결하는 노력을 할 필요가 있다는 점을 도출할 수 있다.

클라우드 컴퓨팅 관련 논문의 서지정보 및 인용정보를 활용한 연구 동향 분석: 사회 네트워크 분석의 활용 (Research Trend Analysis Using Bibliographic Information and Citations of Cloud Computing Articles: Application of Social Network Analysis)

  • 김동성;김종우
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.195-211
    • /
    • 2014
  • 클라우드 컴퓨팅 서비스는 IT 자원을 사용자 요구에 따라 서비스 형태로 제공하며, IT 자원을 소유하는 기존의 개념에서 빌려서 사용하는 개념으로 새로운 IT 패러다임 전환을 이끌고 있다. 이러한 클라우드 컴퓨팅은 과거의 네트워크 컴퓨팅, 유틸리티 컴퓨팅, 서버 기반 컴퓨팅, 그리드 컴퓨팅 등에 대한 연구들을 기반으로 진화해온 IT 서비스로서, 추후 여러분야에 접목 가능성이 높음에 따라 다양한 분야에서의 연구가 지속적으로 이루어지고 있다. 본 연구에서는 1994년부터 2012년까지 주요 해외 저널에 게재된 클라우드 컴퓨팅 관련 연구 논문들의 서지정보 및 인용정보를 수집하였으며, 사회 네트워크 분석 척도를 활용하여 연구 논문간의 인용 관계와 동일 논문에 출현하는 키워드간의 관계로부터 연구 주제들 간 네트워크 변화를 분석하였다. 이를 통해서 클라우드 컴퓨팅 관련 분야의 연구 주제들간의 관계를 파악할 수 있었고, 추후 잠재성이 높은 신규 연구 주제들을 도출하였다. 또한 본 연구에서는 클라우드 컴퓨팅에 대한 연구 동향 맵(research trend map)을 작성하여, 클라우드 컴퓨팅과 관련된 연구 주제들의 동태적인 변화를 확인하였다. 이러한 연구 동향 맵을 통해서 클라우드 컴퓨팅 주요 연구들의 추이를 쉽게 파악 할 수 있으며, 진화 형태 또는 유망 분야를 설명할 수 있다. 논문 인용 관계 분석 결과, 클라우드 컴퓨팅 보안과 분산 처리, 클라우드 컴퓨팅에서의 광네트워크에 관한 연구 논문들이 페이지랭크 척도를 기준으로 상위에 나타났다. 연구 논문의 핵심 주제를 나타내는 키워드에 대한 결과는 2009년에는 클라우드 컴퓨팅과 그리드 컴퓨팅이 높은 중심성 수치를 보였으며, 2010~2011년에는 데이터 아웃소싱, 에러검출 방법, 인프라구축 등 주요 클라우드 요소 기술에 관한 키워드가 높은 중심성 수치를 나타내었다. 2012년에는 보안, 가상화, 자원 관리 등이 높은 중심성 수치를 보였으며, 이를 통해서 클라우드 컴퓨팅 기술들에 대한 관심이 점차 증가함을 확인 할 수 있다. 연구 동향 맵 작성 결과, 보안은 유망영역에 위치하고 있으며, 가상화는 유망영역에서 성장 영역으로 이동하였고, 그리드 컴퓨팅과 분산 시스템은 쇠퇴 영역으로 이동하고 있음을 확인 할 수 있다.

트위터에서의 COVID-19와 관련된 반시민성 주제 탐색: 혐오 대상 및 키워드 분석 (Investigating Topics of Incivility Related to COVID-19 on Twitter: Analysis of Targets and Keywords of Hate Speech)

  • 김규리;오찬희;주영준
    • 정보관리학회지
    • /
    • 제39권1호
    • /
    • pp.331-350
    • /
    • 2022
  • 본 연구는 코로나바이러스감염증-19 (이하 코로나19)로 인해 생겨난 코로나19 반시민성 주제와 코로나19 혐오 정서를 파악하기 위해 소셜미디어 중 하나인 트위터의 코로나19 관련 게시물을 분석하였다. 2019년 12월 1일부터 2021년 8월 31일까지 21개월 동안 작성된 코로나19 관련 혐오 대상별(지역, 공공시설 혐오, 특정 인구 집단 혐오, 종교 혐오) 게시물 수집 및 전처리를 진행하여 총 63,802개의 게시물을 분석하였다. 혐오 대상별 빈도 분석, 다이나믹 토픽 모델링, 키워드 동시 출현 네트워크 분석 기법을 통하여 혐오 대상별 반시민성 주제와 혐오 키워드를 파악하였다. 첫째, 빈도 분석 결과, 지역, 공공시설 혐오는 상대적으로 증가하는 추세를 보이고 특정 인구 집단과 종교 혐오는 상대적으로 감소하는 추세를 확인할 수 있었다. 둘째, 다이나믹 토픽 모델링 분석 결과, 지역, 공공시설 혐오는 '대구, 경북지방 혐오', '지역 간 혐오', '공공시설 혐오'로 나타났고, 특정 인구 집단 혐오는 '중국 혐오', '바이러스 전파자', '실외(야외)활동 제재'로 나타났으며, 종교 혐오는 '신천지', '기독교', '종교 내 감염', '방역 의무 거부', '확진자 동선 비난'으로 나타났다. 셋째, 키워드 동시 출현 네트워크 분석 결과, 지역, 공공시설 혐오(코로나, 대구, 확진자, 신천지, 경북, 지역), 특정 인구 집단 혐오(코로나바이러스, 우한폐렴, 우한, 중국, 중국인, 사람, 입국, 금지), 종교 혐오(신천지, 코로나, 교회, 대구, 확진자, 감염) 등을 핵심 키워드로 확인할 수 있었다. 본 연구는 소셜 미디어를 활용한 국내 코로나19 혐오 대상 및 키워드 파악을 통해 코로나19 관련한 대중의 반시민성 여론을 파악하고자 하였다. 특히 기존의 선행연구에서 시도하지 않았던 주제인 코로나19 관련 혐오에 데이터 마이닝기법을 이용하여 소셜 미디어에서 표출하는 대중의 반시민성 주제와 혐오 정서 탐색은 대중들의 여론을 파악하는 것이 의의가 있다. 더불어 본 연구 결과는 포스트 코로나 시대를 대비하는 문화적 소통 방안의 제도 및 정책 수립 기여를 위한 기본 자료에 기초할 수 있다는 점에서 실질적 함의를 시사한다.

키워드 네트워크 분석을 통해 살펴본 기술경영의 최근 연구동향 (A Study on Recent Research Trend in Management of Technology Using Keywords Network Analysis)

  • 고재창;조근태;조윤호
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.101-123
    • /
    • 2013
  • 최근 경제 패러다임의 변화로 인해 기업이 글로벌 경쟁우위 및 미래 성장동력 확보하기 위해서는 기술과 경영을 통합적으로 이해할 수 있는 학제적 지식을 바탕으로 기술연구의 동향을 파악하고 융합기술 및 유망기술 예측하여 지속적 혁신, 핵심역량 강화, 핵심기술 보유, 기술 융합 등을 통해 새로운 가치를 창출할 필요가 있다. 따라서 본 연구는 기술경영관련 연구의 거시적인 흐름을 분석하기 위해 동시단어 분석기반의 계량서지학적 방법론을 사용하였다. 즉, 최근 10년 동안 기술경영분야의 주요 해외 저널에 게재된 논문의 키워드를 수집한 다음, 빈도 분석, 초기 키워드 네트워크의 구조 분석, 시간이 지남에 따른 새로 생성된 키워드의 선호적 연결 및 성장 분석, 전체 네트워크에 대한 컴포넌트 분석 및 중심성 분석을 수행하였다. 이를 통해 기술경영분야의 논문에 대한 구체적인 연구 주제를 파악할 수 있고, 이들 간의 관계를 파악함으로써, 학제적 연구와 통섭을 위한 구체적인 연구주제들의 조합을 제시할 수 있다. 본 연구결과를 살펴보면 다음과 같다. 첫째, 논문 별 키워드는 1개~23개의 분포를 지니고 있으며, 평균적으로 논문 당 4.574개의 키워드가 있다. 또한 키워드 중 90%가 10년 동안 3번 이하로 사용되었다. 특히 1번만 사용된 키워드는 약 75%의 비중을 차지하고 있음을 확인하였다. 둘째, 키워드 네트워크는 좁은 세상 네트워크 및 척도 없는 네트워크의 특징을 따르고 있음을 확인하였다. 특히 기술경영관련 논문에 사용된 키워드 중 소수의 키워드의 독점화 경향이 높음을 확인할 수 있었다. 셋째, 선호적 연결 및 성장 분석을 통해 기술경영분야의 키워드는 시간이 지남에 따라 선호적 연결을 통한 생존과 소멸 과정에 의해 부익부 빈익빈 현상이 고착되고 있고 있음을 확인하였다. 또한 신규 키워드의 선호적 연결 정도 분석을 통해 신규 연구분야 또는 새로운 연구영역을 창출할 가능성이 있는 키워드 관련 연구 주제에 대한 관심이 시간이 지남에 따라 증가하다가 일정 시점이 지나면 감소함을 확인하였다. 넷째, 컴포넌트 분석 및 중심성 분석을 통해 기술경영관련 연구 동향을 확인하였다. 특히 중심성 분석을 통해 Innovation(혁신), R&D(연구개발), Patent(특허), Forecast(예측), Technology transfer(기술이전), Technology(기술), SME(중소기업) 등의 키워드가 연결중심성, 매개중심성, 근접중심성이 높음을 확인하였다. 본 연구의 분석결과는 기술경영의 연구 동향, 타 학문과의 통섭 및 신규 연구주제 선정 시 참고할 수 있는 유용한 정보로 활용될 수 있다.