• 제목/요약/키워드: Multinomial-Dirichlet 모형

검색결과 4건 처리시간 0.016초

마이크로데이터 제공에 따른 임계모집단 크기 결정 (The Decision of Critical Population Size for Releasing Micro Data Files)

  • 남궁 평;소정현
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.791-801
    • /
    • 2010
  • 마이크로데이터 제공시 발생될 수 있는 노출(disclosure)과 노출위험을 나타내는데 사용되는 측도인 유일성(uniqueness) 그리고 모집단 유일성의 개수를 추정하기 위한 초모집단 모형으로 Multinomial-Dirichlet 모형, Takemura의 Poisson-Gamma 모형, Modified Multinomial-Dirichlet 모형, Bethlehem의 Poisson-Gamma 모형을 다룬다. 이 4개의 모형에 대해 마이크로데이터 제공에 따른 임계모집단 크기(critical population size)를 결정한다.

Analysis of Research Topics and Trends on COVID-19 in Korea Using Latent Dirichlet Allocation (LDA)

  • Heo, Seong-Min;Yang, Ji-Yeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.83-91
    • /
    • 2020
  • 본 연구에서는 DBpia에 등록된 코로나19 관련 논문을 대상으로 연구 토픽을 밝히고 연구 변화 추세를 검토한다. 잠재 디리슐레 할당(Latent Dirichlet Allocation) 알고리즘을 적용한 결과, 7개의 연구 토픽을 도출하였고, 각 토픽은 "International Dynamics", "Technology & Security", "Psychological Impact", "Biomedical-Related", "Economic Impact", "Online Education", "Religion-Related"에 관한 내용이었다. 또한 다범주 로짓모형을 사용하여 연구 토픽의 추세 변화를 살펴본 결과, 2020년 6월 전에는 국제적 역학관계 및 생물 의학 관련 논문이 주를 이루었다면, 이후에는 다양한 분야로 연구 주제가 확대되었다. 특히 경제적인 영향, 온라인 교육, 심리적인 영향에 관한 연구가 꾸준히 증가함을 확인할 수 있었다. 이러한 결과는 향후 코로나19 관련 공동 연구의 가이드 라인을 제시하고, 활발한 연구 활동을 위한 기초자료로 활용될 수 있을 것이다.

국내 갑상선암 논문 토픽에 대한 융합연구 (Convergence Study on Research Topics for Thyroid Cancer in Korea)

  • 양지연
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.75-81
    • /
    • 2019
  • 본 연구는 통계적인 기법을 융합 활용하여 국내 갑상선암과 관련된 연구 토픽의 동향 및 변화 추세를 알아보기 위함이다. DBpia에 등록되어 있는 갑상선암 관련 논문을 대상으로 LDA(latent Dirichlet allocation) 기반의 토픽 모형을 적용한 결과, 4개의 연구 토픽을 도출하였으며 각 토픽은 "Surgery", "Disease aggressiveness", "Survival analysis", "Well-being of patients"에 관한 내용으로 확인되었다. 다범주 로짓모형을 이용하여 연구 토픽의 시대적 추이를 확인한 결과, 2000년 이전에는 "Surgery", 2000년대에는 "Disease aggressiveness"와 "Survival analysis", 2010년 이후에는 "Survival analysis"와 특히 "Well-being of patients"에 관한 연구가 많이 이루어졌음을 확인하였다. 이는 향후 갑상선암 연구의 방향 모색에 필요한 기초자료로 활용될 수 있을 것이며, 최근 환자의 복지로 크게 전환된 연구 토픽의 변화가 다른 질병에서도 관찰되는지 추후 검토할 필요가 있다.

디지털 전환: D.N.A.(Data, Network, AI) 키워드를 활용한 토픽 모델링 (Digital Transformation: Using D.N.A.(Data, Network, AI) Keywords Generalized DMR Analysis)

  • 안세환;고강욱;김영민
    • 지식경영연구
    • /
    • 제23권3호
    • /
    • pp.129-152
    • /
    • 2022
  • 디지털 전환의 핵심 인프라로서 데이터·네트워크·인공지능(D.N.A.) 분야의 확산과 유망 산업의 등장은 경제 전반에 걸쳐 활발한 디지털 혁신의 기반이 되고 있다. 본 연구에서는 텍스트마이닝 방법론을 적용하여 WoS 데이터베이스의 SCIE 급 색인에 해당하는 연구의 초록, 출판연도 및 연구분야를 입력변수로 활용하여 주요 토픽을 도출하였다. 우선, 단어 출현 빈도에 기반한 TF 및 TF-IDF 분석을 통해 주요 키워드를 확인하고, 이어서 g-DMR(Generalized Dirichlet-Multinomial Regression)을 이용하여 토픽 모델링을 수행하였는데, 다양한 형태의 변수를 메타정보로 활용 가능한 해당 토픽 모형의 이점으로 단순하게 토픽을 도출하는 것 이상의 의미를 적절하게 탐색할 수 있었다. 분석 결과에 따르면, 비즈니스 인텔리전스, 제조 생산 시스템, 서비스 가치 창출, 원격 진료, 디지털 교육 등의 토픽들이 디지털 전환에서 주요 연구주제인 것으로 식별되었다. 토픽 모델링의 결과를 요약하자면, 1) COVID-19 이후 비즈니스 인텔리전스를 주제로 하는 연구가 전 영역에서 활발하게 수행되고 있으며, 2) 제조 분야에서 지능형 제조 솔루션 및 메타버스 등의 이슈가 등장함에 따라 제조 생산 시스템에 관한 주제가 다시 한번 주목받고 있음을 확인하였다. 마지막으로, 3) 주제어 자체는 기술과 서비스의 측면에서 분리하여 볼 수 있지만, 다수의 연구에서 해당 기술들을 접목하여 적용된 다양한 서비스를 포괄적으로 다루고 있으므로 이를 별개로 해석하는 것이 바람직하지 못하다는 점을 알 수 있었다.