• 제목/요약/키워드: Research topic

검색결과 2,397건 처리시간 0.024초

토픽 모델링 기반의 국내외 공공데이터 연구 동향 비교 분석 (Topic Modeling-Based Domestic and Foreign Public Data Research Trends Comparative Analysis)

  • 박대영;김덕현;김건욱
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.1-12
    • /
    • 2021
  • 최근 4차 산업혁명으로 빅데이터의 성장과 가치는 지속적으로 증가하고 있으며, 정부에서도 공공데이터 개방과 활용에 적극적으로 노력하고 있다. 하지만 여전히 시민들의 공공데이터 활용 요구수준에는 미치지 못하는 상황이며, 현 시점에서 공공데이터 분야의 연구동향 파악과 발전 방향을 모색할 필요가 있다. 이에 본 연구에서는 공공데이터와 관련된 연구 동향을 파악하기 위해서 텍스트 마이닝 기법에서 주로 활용되는 토픽 모델링을 활용하여 분석하였다. 이를 위해 국내외 학술논문 중 '공공데이터', 'Public Data'의 키워드가 포함된 논문(국내 1,437건, 국외 9,607건)을 수집하여 LDA 알고리즘 기반의 토픽 모델링을 수행하였으며, 국내외 공공데이터 연구 동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 공공분야 정책 연구가 주를 이루고 있으며, 국외는 의료, 건강 관련 연구가 높게 나타났다. 토픽별 시계열로 살펴보면 국내는 '개인정보보호', '공공데이터 관리', '도시 환경' 분야의 연구가 증가하였으며, 국외는 '도시정책', '세포 생물학', '딥러닝', '클라우드·보안' 분야 연구가 활성화되고 있음을 확인할 수 있었다.

토픽 모델 기반의 국가 별 SNS 관심 이슈 분석 시스템 (Analysis System for SNS Issues per Country based on Topic Model)

  • 김성훈;윤지원
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1201-1209
    • /
    • 2016
  • 전 세계적으로 SNS의 이용이 활발해짐에 따라, 그와 관련한 다양한 연구가 활발히 진행 중에 있다. 특히 기존의 문서 내 주제 추출에 활용되던 토픽 모델이 SNS 분석에 효과가 있음이 밝혀짐에 따라, 토픽 모델 기반의 이슈 분석과 관련한 연구들이 대거 등장하였다. 이에 본 연구에서는 기존 토픽 모델 기반의 SNS 이슈 분석 기술에 전 세계 지도 시각화 및 이슈 매칭 기술을 결합하여, 전 세계의 각 국가 별 특정 주제와 관련한 관심 이슈와 그 분포의 변화 추이를 분석할 수 있는 시스템을 제안한다. 시스템 구성 요소는 트윗 수집 및 국가 별 분류 모듈, 토픽 모델 기반의 국가 별 토픽 및 분포 추출 모듈, Google geochart 기반의 토픽 및 분포 시각화 모듈이 있다. 미국과 UK 두 국가에서 발생한 5월 한 달간의 ISIS 관련 트윗을 대상으로 실험한 결과, 두 국가의 ISIS 관련 관심 이슈와 그 변화 추이를 확인할 수 있었다.

Is Text Mining on Trade Claim Studies Applicable? Focused on Chinese Cases of Arbitration and Litigation Applying the CISG

  • Yu, Cheon;Choi, DongOh;Hwang, Yun-Seop
    • Journal of Korea Trade
    • /
    • 제24권8호
    • /
    • pp.171-188
    • /
    • 2020
  • Purpose - This is an exploratory study that aims to apply text mining techniques, which computationally extracts words from the large-scale text data, to legal documents to quantify trade claim contents and enables statistical analysis. Design/methodology - This is designed to verify the validity of the application of text mining techniques as a quantitative methodology for trade claim studies, that have relied mainly on a qualitative approach. The subjects are 81 cases of arbitration and court judgments from China published on the website of the UNCITRAL where the CISG was applied. Validation is performed by comparing the manually analyzed result with the automatically analyzed result. The manual analysis result is the cluster analysis wherein the researcher reads and codes the case. The automatic analysis result is an analysis applying text mining techniques to the result of the cluster analysis. Topic modeling and semantic network analysis are applied for the statistical approach. Findings - Results show that the results of cluster analysis and text mining results are consistent with each other and the internal validity is confirmed. And the degree centrality of words that play a key role in the topic is high as the between centrality of words that are useful for grasping the topic and the eigenvector centrality of the important words in the topic is high. This indicates that text mining techniques can be applied to research on content analysis of trade claims for statistical analysis. Originality/value - Firstly, the validity of the text mining technique in the study of trade claim cases is confirmed. Prior studies on trade claims have relied on traditional approach. Secondly, this study has an originality in that it is an attempt to quantitatively study the trade claim cases, whereas prior trade claim cases were mainly studied via qualitative methods. Lastly, this study shows that the use of the text mining can lower the barrier for acquiring information from a large amount of digitalized text.

LDA 및 BERTopic 기반 해외건설시장 뉴스 기사 토픽모델링 성능평가 (Evaluation of Topic Modeling Performance for Overseas Construction Market Analysis Using LDA and BERTopic on News Articles)

  • 백준우;정세환;지석호
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.811-819
    • /
    • 2023
  • 해외건설사업 시, 현지 상황을 정확하고 빠르게 파악하는 것은 프로젝트 성공을 위해 매우 중요한 요소이다. 이는 토픽모델링을 활용한 뉴스 기사 분석을 통해 실현될 수 있다. 본 연구는 Latent Dirichlet Allocation(LDA)과 BERTopic 두 토픽모델링 기법을 활용하여 뉴스 기사를 분석하고, 최적의 기법을 찾고자 하였다. 모델링 결과로 자동생성된 토픽과 실제 문서 주제와의 일치 여부를 확인하기 위해 BBC 뉴스 기사 6,273건 을 수집하여 ground truth를 생성하고, 이를 모델링된 토픽과 비교하였다. 그 결과 LDA의 F1 score는 0.011, BERTopic은 0.244로 나타났다. 이를 통해 BERTopic이 실제 뉴스 기사의 주제를 잘 파악하며, 해외건설시장의 주요 이슈를 자동으로 이해하는 데 더욱 용이하다는 것을 확인할 수 있었다

한국과 미국 간 모바일 앱 리뷰의 감성과 토픽 차이에 관한 탐색적 비교 분석 (An Exploratory Study on Mobile App Review through Comparative Analysis between South Korea and U.S.)

  • 조혁준;강주영;정대용
    • 한국IT서비스학회지
    • /
    • 제15권2호
    • /
    • pp.169-184
    • /
    • 2016
  • Smartphone use is rapidly spreading due to the advantage of being able to connect to the Internet anytime, anywhere--and mobile app development is developing accordingly. The characteristic of the mobile app market is the ability to launch one's app into foreign markets with ease as long as the platform is the same. However, a large amount of prior research asserts that consumers behave differently depending on their culture and, from this perspective, various studies comparing the differences between consumer behaviors in different countries exist. Accordingly, this research, which uses online product reviews (OPRs) in order to analyze the cultural differences in consumer behavior comparatively by nationality, proposes to compare the U.S. and South Korea by selecting ten apps which were released in both countries in order to perform a sentimental analysis on the basis of star ratings and, based on those ratings, to interpret the sentiments in reviews. This research was carried out to determine whether, on the basis of ratings analysis, analysis of review contents for sentiment differences, analysis of LDA topic modeling, and co-occurrence analysis, actual differences in online reviews in South Korea and the U.S. exist due to cultural differences. The results confirm that the sentiments of reviews for both countries appear to be more negative than those of star ratings. Furthermore, while no great differences in high-raking review topics between the U.S. and South Korea were revealed through topic modeling and co-occurrence analyses, numerous differences in sentiment appeared-confirming that Koreans evaluated the mobile apps' specialized functions, while Americans evaluated the mobile apps in their entirety. This research reveals that differences in sentiments regarding mobile app reviews due to cultural differences between Koreans and Americans can be seen through sentiment analysis and topic modeling, and, through co-occurrence analysis, that they were able to examine trends in review-writing for each country.

토픽모델링 및 주성분 분석 기반 검색 질의 유형 분류 연구 (A Study on Search Query Topics and Types using Topic Modeling and Principal Components Analysis)

  • 강현아;임희석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.223-234
    • /
    • 2021
  • 4차 산업 혁명 시대의 도래에 따라 쇼핑의 행태는 더욱 빠르게 오프라인에서 온라인으로 이동하고 있다. 온라인 쇼핑에서 고객의 정보요구를 가장 집약적으로 보여주는 것이 바로 검색 질의이다. 하지만 검색 분야에서도 검색 질의 관련 연구 사례는 많지 않으며 대부분의 검색 질의 연구 분야 선행 연구들은 연구자의 정성적인 판단에 근거하여 제한적인 주제와 데이터 기반으로 연구되어 왔다. 이에 본 연구는 검색 질의 연구 분야에 기계학습을 적용하여 검색 질의와 검색 이후 이용자가 조회한 문서명 로그를 기반으로 토픽모델링 수행 후 검색 질의 주제를 정의함으로써 데이터 기반의 정량적 방법론으로 15개의 검색 질의 주제 유형을 정의하였다. 또한 기존 검색어 자체만을 보고 판단하던 주제 유형에서 나아가 검색 행동특성을 반영한 유형을 정의하기 위하여 주성분 분석을 통해 주요 변수를 추출 후 각 주제별 검색 행동특성을 분석함으로써 검색 탐색 활성도, 상품 관여도에 따른 4가지의 새로운 검색 질의 유형 분류체계를 제시하였다. 본 연구결과는 효과적인 검색서비스 구축 및 검색 시스템 개발에 기여할 것으로 기대된다.

COVID-19 발생 전·후 언론보도에 나타난 간호사 이미지에 대한 텍스트 네트워크 분석 및 토픽 모델링 (Images of Nurses Appeared in Media Reports Before and After Outbreak of COVID-19: Text Network Analysis and Topic Modeling)

  • 박민영;정석희;김희선;이은지
    • 대한간호학회지
    • /
    • 제52권3호
    • /
    • pp.291-307
    • /
    • 2022
  • Purpose: The aims of study were to identify the main keywords, the network structure, and the main topics of press articles related to nurses that have appeared in media reports. Methods: Data were media articles related to the topic "nurse" reported in 16 central media within a one-year period spanning July 1, 2019 to June 30, 2020. Data were collected from the Big Kinds database. A total of 7,800 articles were searched, and 1,038 were used for the final analysis. Text network analysis and topic modeling were performed using NetMiner 4.4. Results: The number of media reports related to nurses increased by 3.86 times after the novel coronavirus (COVID-19) outbreak compared to prior. Pre- and post-COVID-19 network characteristics were density 0.002, 0.001; average degree 4.63, 4.92; and average distance 4.25, 4.01, respectively. Four topics were derived before and after the COVID-19 outbreak, respectively. Pre-COVID-19 example topics are "a nurse who committed suicide because she could not withstand the Taewoom at work" and "a nurse as a perpetrator of a newborn abuse case," while post-COVID-19 examples are "a nurse as a victim of COVID-19," "a nurse working with the support of the people," and "a nurse as a top contributor and a warrior to protect from COVID-19." Conclusion: Topic modeling shows that topics become more positive after the COVID-19 outbreak. Individual nurses and nursing organizations should continuously monitor and conduct further research on nurses' image.

빈도 분석 및 토픽모델링을 활용한 수학 교과에서 기초학력 관련 연구 동향 분석 (An Analysis of Research Trends on Basic Academic Abilities in Mathematics with Frequency Analysis and Topic Modeling)

  • 조미경
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제37권4호
    • /
    • pp.615-633
    • /
    • 2023
  • 본 연구는 수학 교과에서 기초학력 및 학습부진에 관련한 연구가 나아갈 방향을 제안하고자 2023년 8월까지의 국내 연구 동향을 분석하였다. 이를 위해 국내 연구 197편의 국문 초록을 자료로 수집하여 빈도 분석 및 LDA 기반 토픽모델링을 실시하였다. 연구결과, 첫째, TF 및 TF-IDF 기준으로 '학업성취', '영향', '효과', '변인'은 모두 상위권에 위치하였다. 둘째, LDA 기반 토픽모델링을 실시한 결과, 기초학력 미달 발생 원인, 수학 학습부진학생의 학습 실태, 수학 학습부진학생 지도 교사의 전문성, 수학 학습부진학생 지원 프로그램, 국가수준 학업성취도 평가 결과로 5개 토픽이 도출되었다. 이러한 결과를 바탕으로 향후 수학 교과의 기초학력 및 학습부진에 관한 연구가 나아가야 할 방향으로 학습부진학생의 성장에 초점을 둔 연구, 수학 교과에서 학습지원을 필요로 하는 학생에게 제공하는 프로그램을 체계화하는 연구, 수학 교과에서 학습지원대상학생을 지도하기 위한 교사의 전문성 신장에 관한 연구 등을 제안하였다.

Qualitative Research in Healthcare: Necessity and Characteristics

  • Jeehee Pyo;Won Lee;Eun Young Choi;Seung Gyeong Jang;Minsu Ock
    • Journal of Preventive Medicine and Public Health
    • /
    • 제56권1호
    • /
    • pp.12-20
    • /
    • 2023
  • Quantitative and qualitative research explore various social phenomena using different methods. However, there has been a tendency to treat quantitative studies using complicated statistical techniques as more scientific and superior, whereas relatively few qualitative studies have been conducted in the medical and healthcare fields. This review aimed to provide a proper understanding of qualitative research. This review examined the characteristics of quantitative and qualitative research to help researchers select the appropriate qualitative research methodology. Qualitative research is applicable in following cases: (1) when an exploratory approach is required on a topic that is not well known, (2) when something cannot be explained fully with quantitative research, (3) when it is necessary to newly present a specific view on a research topic that is difficult to explain with existing views, (4) when it is inappropriate to present the rationale or theoretical proposition for designing hypotheses, as in quantitative research, and (5) when conducting research that requires detailed descriptive writing with literary expressions. Qualitative research is conducted in the following order: (1) selection of a research topic and question, (2) selection of a theoretical framework and methods, (3) literature analysis, (4) selection of the research participants and data collection methods, (5) data analysis and description of findings, and (6) research validation. This review can contribute to the more active use of qualitative research in healthcare, and the findings are expected to instill a proper understanding of qualitative research in researchers who review qualitative research reports and papers.