• 제목/요약/키워드: 키워드빈도분석

검색결과 363건 처리시간 0.026초

2020 구글 스칼라 매트릭스에 색인된 국내 주요 학술지에 대한 계량서지학적 분석 (A Bibliometric Analysis of the Major Korean Journals Indexed in 2020 Google Scholar Metrics)

  • 김동훈;김규리;주영준
    • 정보관리학회지
    • /
    • 제38권1호
    • /
    • pp.53-69
    • /
    • 2021
  • 본 연구에서는 다학제적 연구가 활발해진 국내 연구의 동향을 파악하기 위하여 2020 구글 스칼라 매트릭스에 색인된 국내 주요 학술지 데이터를 활용하여 전 학문분야를 포괄하는 네트워크 분석(대학협력 네트워크, 키워드 동시출현 네트워크, 학술지 인용 네트워크, 학문분야 인용 네트워크)을 실시하였다. 대학협력 네트워크 분석결과, 서울대학교, 계명대학교, 성균관대학교 등 협력연구를 활발히 진행하는 대학을 파악할 수 있었고, 키워드 동시출현 네트워크 분석결과, 이직의도, 직무만족 등 직무관련 키워드가 높은 빈도로 나타남을 확인하였다. 학술지 인용 네트워크에서는 한국콘텐츠학회논문지, 한국사회학, 한국심리학회지: 문화 및 사회문제 등 인용이 많이 되고 있는 핵심 학술지들을 확인하였으며, 학문분야 인용 네트워크에서는 교육학, 경영학, 사회복지학이 다른 학문에 가장 많은 영향을 미치는 학문임을 확인하였다. 본 연구에서는 기존의 국내 계량서지분석연구에서 시도하지 않았던 구글 스칼라 매트릭스 데이터를 처음 활용하였으며, 키워드, 학술지, 학문분야로 범위를 확장시켜가며 단계적 네트워크 분석을 실시하였다는 점에서 학술적 의의를 가지며, 연구결과는 국내 대학 간 공동연구의 전략 수립 및 다학제적 융합연구 기획에 활용될 수 있다는 점에서 실질적인 함의를 시사한다.

Google Trends 의 키워드 빅데이터 분석을 활용한 글로벌 스타트업 트렌드 분석: 2017~2022 (Analyzing Global Startup Trends Using Google Trends Keyword Big Data Analysis: 2017~2022)

  • 김재억;전병훈
    • Journal of Platform Technology
    • /
    • 제11권4호
    • /
    • pp.19-34
    • /
    • 2023
  • 글로벌시대의 환경속에서 '스타트업'의 트렌드와 인사이트를 파악하기 위해 빅데이터 분석 플랫폼인 Google Trends를 활용하여 최근 글로벌 스타트업 생태계를 심층 트렌드 분석을 실시하였다. 분석의 타당성을 위해 BIGKinds를 통해 핵심 키워드 '스타트업'과 '글로벌'의 상관관계를 검증하였다. 또한 '스타트업' 키워드나 용어의 검색 빈도를 파악하기 위해 Google Trends를 이용하여 추출한 데이터를 기반으로 네트워크 분석을 수행하였다. 연구결과, 키워드 사이에 강한 양적 선형관계를 보여주어 통계적으로 유의미한 상관관계를 나타냈다(상관계수: +0.8906). Google Trends를 사용한 글로벌 스타트업 트렌드를 탐색한 결과 '그림4'와 같이 각 국가들의 시기별 관심도가 증가하거나 감소하는 매우 비슷한 선형적 형태를 나타났다. 특히 스타트업 관심도가 2020년 중반부터 코로나-19 팬데믹으로 인해 35~76 범위내에서 낮게 나타났지만, 2022년 3월 이후 스타트업 관심도가 눈에 띄게 상승하는 트렌드를 보였다. 또한, 한국을 제외한 각 국가별 Startups 관심도는 아주 비슷한 추세이고, 관련 주제는 startup company, technology, investment, funding, 키워드 검색어는 best startup, tech, business, invest, health, fintech 등이 공통적으로 나타나 매우 높은 상관관계가 있음을 확인하였다.

  • PDF

포털사이트에서의 피검색빈도와 주식수익률 (Search Frequency in Internet Portal Site and the Expected Stock Returns)

  • 반주일;김명애;전용호
    • 한국산업정보학회논문지
    • /
    • 제21권5호
    • /
    • pp.73-83
    • /
    • 2016
  • 국내 1위 인터넷포털 사업자인 네이버는 사용자가 지정하는 키워드가 특정 기간 동안에 네이버에서 얼마나 자주 검색되었는지에 관한 피검색빈도자료를 제공한다. 본 연구는 네이버의 피검색빈도자료를 활용하여 기업명의 피검색빈도와 그 기업의 미래 주식수익률과의 관계에 대해 분석하였다. 그 결과는 다음과 같다. 첫째, 기업명의 피검색빈도는 극단적 수익률 및 거래회전율과 같은 기존의 투자자 관심(investor attention)변수와 중복되지 않는 새로운 투자자 관심변수이다. 둘째, 금주의 피검색빈도가 높은 기업일수록 그 다음 주의 주간수익률이 높다. 셋째, 피검색빈도가 높은 기업은 이후에도 수익률 반전현상이 관찰되지 않으므로, 피검색빈도는 해당 기업에 대한 본질적 정보를 포함하는 것으로 볼 수 있다. 넷째, 피검색빈도가 주식수익률에 미치는 영향은 시장 수준의 투자자 관심사건(market-wide attention grabbing events)이 발생한 이후 더욱 강하게 나타난다.

텍스트 마이닝을 활용한 융합인재교육정책 동향 분석 -2009년~2020년 교육부보도, 언론보도, 학술지 초록 비교분석- (Analysis of Trends in Education Policy of STEAM Using Text Mining: Comparative Analysis of Ministry of Education's Documents, Articles, and Abstract of Researches from 2009 to 2020)

  • 유정민;김성원
    • 한국과학교육학회지
    • /
    • 제41권6호
    • /
    • pp.455-470
    • /
    • 2021
  • 본 연구는 2009년부터 2020년까지 융합인재교육과 관련된 교육부 보도자료, 언론보도, 학술지 초록을 수집 및 비교 분석하여 키워드 및 주제의 변화 흐름을 정책단계별로 살피고 향후 융합인재교육의 발전 방향과 그 교육적 시사점을 도출하고자 하였다. 교육부 보도자료는 교육부 홈페이지의 뉴스홍보란, 언론보도는 한국언론재단의 빅카인즈, 학술지 초록은 학술연구정보서비스(RISS)에서 수집되었다. 수집된 자료 중 교육부 보도자료는 42건, 언론보도는 1,534건, 학술지 초록은 880건이 연구대상으로 선정하였다. 파이썬 프로그램을 통해 융합인재교육정책단계별로 키워드 빈도분석, 키워드 네트워크분석, 토픽모델링을 수행하였다. 분석 결과, 융합인재교육정책단계에 따라 매체별로 융합인재교육과 관련된 키워드의 빈도와 네트워크에 차이가 나타났다. 매체별로 주로 사용하거나 중요하게 사용되는 키워드와 토픽에 차이가 나타나 융합인재교육정책에 대한 관심의 차이가 존재한다는 것을 확인하였다. 끝으로 교육부 보도자료의 토픽 대부분은 언론보도에서 도출된 토픽과 대응되는 것으로 나타났다. 이 연구의 결과를 통해 도출된 융합인재교육정책에 대한 시사점은 다음과 같다. 정책의제설정 시기부터 지금까지 다양한 주제와 연계하고 대상을 확대하여 변화하고 있는 융합인재교육은 인문학을 포함한 다양한 주제를 연계하는 방안에 대해 고려할 필요가 있다. 또한 매체별로 융합인재교육정책에 관한 관심의 차이가 존재하므로 이에 대한 이해를 통해 정책의 협력적인 발전 방향이 모색될 필요가 있다. 그리고 융합인재교육의 목표인 미래인재 양성을 위한 핵심역량 강화와 융합 소양에 대한 교육부의 지원과 언론의 융합인재교육에 대한 대중의 이해도를 높이기 위한 노력이 요구된다. 끝으로 융합인재교육정책의 평가 및 변동 과정에서 나타날 주제들에 대해 지속해서 분석할 필요가 있다.

주제어 프로파일링 및 동시출현분석을 통한 지능정보시스템 연구의 정체성에 관한 연구 (A Study on the Intelligence Information System's Research Identity Using the Keywords Profiling and Co-word Analysis)

  • 윤승정;김민용
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.139-155
    • /
    • 2016
  • 본 연구는 한국지능정보시스템학회의 고유한 연구영역을 파악하고자 지능정보연구 학술지에 최근 3년 동안 게재된 논문들을 대상으로 키워드를 수집하여 프로파일링 기법과 동시출현빈도를 분석하였다. 이를 통하여 지능정보시스템 연구의 정통성과 정체성을 밝히는 동시에 향후 추구해야할 연구영역을 제시하고자 한다. 연구 정체성에 대한 상대적 위치를 파악하기 위하여 한국지능정보시스템학회 뿐만 아니라 유사학회에 해당하는 한국경영정보학회 그리고 한국정보시스템학회의 키워드 및 연구방법론을 수집하여 비교하였다. 또한, 한국지능정보시스템학회에서 인공지능/데이터마이닝, 지능형인터넷, 지식경영에 대한 주요 분야를 중점적으로 다루고 있음을 고려할 때 각 분야의 대표적인 학회로 한국빅데이터서비스학회 및 한국빅데이터학회, 한국인터넷전자상거래학회, 한국지식경영학회의 연구 경향을 각각 비교 분석하였다. 키워드 분석 결과만을 요약하면, 한국지능정보시스템학회는 키워드 부문에서는 텍스트마이닝, 데이터 마이닝 및 추천시스템에 집중하고 있다는 것을 알 수 있었다. 인공지능/데이터마이닝 분야에서는 빅데이터 개념 자체와 감성분석에 초점을 두고 있고, 지능형인터넷 분야에서는 SNS와 구매의도, 신뢰, 기술수용모델에 집중하고 있었다. 지식경영 분야에서는 지식관리, 지식 공유 키워드에 집중함을 발견할 수 있었다. 더 나아가 한국지능정보시스템학회 뿐만 아니라 유사 연구 분야에서 생태계 전반적 융합 가능성을 진단해 보았다.

빅데이터 분석을 활용한 웰에이징 요인에 관한 연구 : 신문기사를 중심으로 (A Study on the Factors of Well-aging through Big Data Analysis : Focusing on Newspaper Articles)

  • 이종형;강경희;김용하;임효남;구진희;김광환
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.354-360
    • /
    • 2021
  • 사람들은 개인의 삶의 만족을 위하여 일과 삶의 균형을 맞추며 건강하고 행복하게 살아가는 것을 희망하고 있다. 따라서 걱정 없이 행복하고 건강하게 나이가 들어가는 것을 의미하는 웰에이징(well-aging)에 대한 관심이 높아지고 있다. 본 연구는 웰에이징 관련 신문기사를 분석하여 웰에이징과 연관된 요인들을 파악하고자 하였다. 파이썬(Python) 기반의 웹 크롤링(web crawling)을 활용하여 2020년 11월까지 포탈 사이트 다음(daum)의 뉴스 서비스에 게재된 1,199편의 기사를 수집하였으며, 이중 연구 주제에 일치하는 기사 374편을 연구대상으로 선정하였다. 텍스트마이닝의 빈도분석 결과, '노인', '건강', '피부', '웰에이징', '제품', '사람', '노화', '여성', '국내', '은퇴' 등의 순서로 상위 10개의 키워드가 중요하게 파악되었다. 또한 출현 빈도가 높은 45개의 중요 키워드를 기반으로 사회 네트워크 분석을 수행한 결과 '피부-주름', '피부-노화', '노인-건강'이 강한 연결 관계를 나타났다. CONCOR 분석을 수행한 결과 45개의 중요 키워드들은 '삶과 행복', '질병과 죽음', '영양과 운동', '힐링', '헬스산업', '노화와 안티에이징', '건강', '노인서비스'의 8개 군집으로 구성되어, 신문기사들을 기반으로 나타나는 웰에이징과 관련된 요인들을 유추할 수 있었다.

Efficient Keyword Extraction from Social Big Data Based on Cohesion Scoring

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.87-94
    • /
    • 2020
  • 블로그나 SNS 피드 등의 소셜 리뷰는 고객 관점의 의견이나 불만 사항을 반영한 키워드를 추출하기 위한 목적으로 광범위하게 활용되고 있으며, 최근 트렌드를 반영한 신조어나 고유명사를 포함하는 경우가 많다. 이들 단어는 사전에 포함되어 있지 않아 기존 형태소 분석기가 잘 인지하지 못하는 경우가 많으며, 동시에 상당한 처리 시간이 소요되어 키워드 분석 결과를 실시간으로 제공하는데 어려움이 있다. 본 논문에서는 응집도 점수 개념을 기반으로 소셜 리뷰로부터 키워드를 효율적으로 추출하기 위한 방법을 제안한다. 응집도 점수는 단어의 빈도수를 기반으로 계산되어 별도의 사전이 필요없다는 장점이 있으나, 띄어쓰기가 되지 않은 입력 데이터에 대해서는 정확도가 떨어질 수 있다. 이와 관련하여 본 논문에서는 단어 트리 구조를 이용하여 기존의 응집도 점수 계산 방법을 개선한 알고리즘을 제시한다. 또한 실험을 통해 제안하는 방법이 15.5%의 오류율을 보이는 동시에, 1,000개의 리뷰를 처리하는데 0.008초 정도 소요됨을 확인하였다.

초록데이터를 활용한 국내외 통계학 분야 연구동향 (Research trends in statistics for domestic and international journal using paper abstract data)

  • 양종훈;곽일엽
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.267-278
    • /
    • 2021
  • 시간이 갈 수록, 정부, 기업, 국내, 해외를 막론하고 데이터의 양이 증가하고 있다. 이에따라 학계에서도 빅데이터에 대한 연구들이 늘어나고 있다. 통계학은 빅데이터 연구의 중심이 되는 학문들 중 하나이며, 늘어나는 통계학 분야 논문 빅데이터를 통해 통계학의 연구동향을 파악해 보는 것도 재미있을 것이다. 본 연구에서는 국내와 해외의 통계학 논문들의 초록데이터를 통해 어떤 연구들이 이루어지고 있는지 분석을 진행하였다. 저자들이 선정한 논문들의 키워드 데이터 빈도를 통해 국내외 연구 동향을 분석하였고, Word Embedding 방법을 통해 해당 키워드들의 관계성을 시각화 하였다. 여기서 저자들이 선정한 키워드들 외에 Textrank를 통해 선정된 통계학 분야 논문들에서 중요하게 사용되는 단어들도 추가적으로 시각화 하였다. 마지막으로 초록 데이터에 LDA 기법을 적용하여 10가지 토픽을 알아보았다. 각 토픽들에 대한 분석을 통해 어떤 연구 주제들이 자주 연구되며, 어떤 단어들이 중요하게 사용되는지 알아보았다.

음절 n-gram 기반의 미등록 어휘 추정기 구현 (Out of Vocabulary Word Extractor based on a Syllable n-gram)

  • 신준수;홍초희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-141
    • /
    • 2013
  • 다양한 콘텐츠가 생성됨에 따라 신조어 및 미등록어도 다양한 형태로 나타나고 있다. 이러한 신조어 및 미등록어는 텍스트 처리 단계에서 오분석 되어 성능 저하의 원인이 된다. 본 논문은 이러한 문제를 해결하기 위해서 대량의 문서로부터 신조어 및 미등록 어휘를 추정하는 방법에 대해서 제안한다. 제안 방법은 대량의 문서로부터 음절 n-gram을 추출한 뒤, 각 n-gram에서 n을 한음절 축소 및 확장 시켜, (n+1)gram, (n-1)gram을 추가적으로 추출한다. 추출된 음절 n-gram을 기준으로 (n+1)gram, (n-1)gram과의 빈도 차이를 계산하여 빈도차가 급격하게 발생하는 구간을 신조어 및 미등록 어휘로 추정한다. 실험결과 신조어 뿐만 아니라 트위터, 미투데이 등과 같은 도메인에 종속적인 미등록 어휘도 추출되는 것을 확인할 수 있었다.

  • PDF

데이터 마이닝을 이용한 국내외 사서 채용 동향 분석 (A Study on the Trends of Librarian Recruitment in Korea and Overseas Using Data Mining)

  • 채하영;이지수
    • 정보관리학회지
    • /
    • 제40권4호
    • /
    • pp.201-228
    • /
    • 2023
  • 본 연구는 국내외 사서 채용 동향을 분석하기 위해 수행되었다. 연구 대상으로 국내데이터는 인터넷 포털 사이트인 "사서e마을"에 게시된 사서 채용 공고를 총 489개를 수집하였고, 해외데이터는 "ALAJobList"에서 6,600개의 자료를 수집하였다. 기간은 2020년 1월부터 2022년 8월까지이며 수집된 데이터를 대상으로 지역 분포도 분석, 빈도 분석, 토픽모델링을 수행하였다. 연구 결과, 채용 공고의 지역분포도는 국내데이터에서 서울이 280건으로 가장 많았으며, 해외데이터는 캘리포니아(California)가 662건으로 상위로 도출되었다. 빈도분석 결과, 국내데이터의 담당업무에서는 '관리' 23.42% 키워드가 높게 나왔고, 자격요건은 '자격증' 16.61%이 가장 많은 비율을 차지했다. 해외데이터의 담당업무에서는 'LibraryService' 8.72% 비율이 높게 나왔으며, 자격요건은 'CommunicationSkills' 10.13% 키워드가 가장 높은 순위에 위치함을 확인했다. 토픽모델링에서는 국내외 담당업무, 자격요건으로 나눠 총 4가지의 영역을 살펴보았다. 분석 결과, 국내외 채용 공고에서 도출된 사서의 담당업무 및 자격요건이 미국도서관협회(ALA) 및 한국도서관협회 등 주요 도서관 관련 협회에서 제시한 핵심 역량과 연관이 있음을 확인하였다.