• 제목/요약/키워드: 리뷰 데이터

검색결과 313건 처리시간 0.028초

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.

바이오차를 이용한 밭 토양 탄소 저장: 동아시아 지역 연구 리뷰 및 데이터 분석 (Soil Carbon Storage in Upland Soils by Biochar Application in East Asia: Review and Data Analysis)

  • 이선일;강성수;최은정;권효숙;이형석;이종문;임상선;최우정
    • 한국환경농학회지
    • /
    • 제40권3호
    • /
    • pp.219-230
    • /
    • 2021
  • BACKGROUND: Biochar is a solid material converted from agricultural biomass such as crop residues and pruning branch through pyrolysis under limited oxygen supply. Biochar consists of non-degradable carbon (C) double bonds and aromatic ring that are not readily broken down by microbial degradation in the soils. Due to the recalcitrancy of C in biochar, biochar application to the soils is of help in enhancing soil carbon sequestration in arable lands that might be a strategy of agricultural sector to mitigate climate change. METHODS AND RESULTS: Data were collected from studies on the effect of biochar application on soil C content conducted in East Asian countries including China, Japan and Korea under different experimental conditions (incubation, column, pot, and field). The magnitude of soil C storage was positively correlated (p < 0.001) with biochar application rate under field conditions, reflecting accumulation of recalcitrant black C in the biochar. However, The changes in soil C contents per C input from biochar (% per t/ha) were 6.80 in field condition, and 12.58 in laboratory condition. The magnitude of increment of soil C was lower in field than in laboratory conditions due to potential loss of C through weathering of biochar under field conditions. Biochar production condition also affected soil C increment; more C increment was found with biochar produced at a high temperature (over 450℃). CONCLUSION: This review suggests that biochar application is a potential measures of C sequestration in agricultural soils. However, as the increment of soil C biochar was affected by biochar types, further studies are necessary to find better biochar types for enhanced soil C storage.

네트워크 분석 논문의 고찰: 계량서지적 분석과 내용분석을 중심으로 (An Investigation on the Network Analysis Papers by Content Analysis and Bibliometric Analysis)

  • 정은경
    • 정보관리학회지
    • /
    • 제38권1호
    • /
    • pp.169-190
    • /
    • 2021
  • 네트워크 분석 기법을 활용한 연구가 다양한 학문 분야에서 수행되고 있다. 본 연구는 2003년부터 2021년까지 국내 학술지에 게재된 네트워크 분석 논문 총 2,187건을 대상으로 계량서지적 분석과 내용분석을 수행하였다. 분석결과는 살펴보면, 논문 생산에 있어서 교육학, 학제간연구, 컴퓨터학, 문헌정보학, 행정학, 경영학 등의 우위를 확인할 수 있다. 학술지 단위로 보면, 메가 학술지의 강세가 나타난다. 그러나 피인용 기반의 영향력을 살펴보면, 행정학, 문헌정보학, 교육학의 영향력을 뚜렷하게 확인할 수 있다. 저자 단위로 분석한 결과 역시 언론정보학, 행정학, 문헌정보학의 우위를 확인할 수 있다. 파악된 1,537명의 저자 중에서 극소수의 저자가 활발한 연구활동을 하는 것으로 나타났으며, 이를 통해 연구자 저변 확대의 필요성도 확인할 수 있다. 내용분석의 결과를 살펴보면, 논문을 데이터셋으로 하여 가중/비방향네트워크를 형성하는 것이 가장 일반적인 네트워크 형태로 나타났다. 노드는 단어, 링크는 동시출현으로 표현되는 것이 보편적이며, 분석을 위해서는 KrKwic, UCINET, NetMiner, NetDraw 의 활용이 가장 두드러졌다.

조직의 CSR 전략 이행과정에서 직원 인식 중요성 : '진정성' 개념을 바탕으로 (The Importance of Employee's Perceptions When Conducting a Company's CSR Strategy : The Concept of 'Authenticity')

  • 정지영;김상준
    • 중소기업연구
    • /
    • 제43권4호
    • /
    • pp.27-57
    • /
    • 2021
  • CSR 수행과정에서 나타나는 진정성은 기업의 CSR 전략 이행 과정에 어떤 영향을 미치는가? 진정성이란 직원이 조직과의 관계에서 느끼는 내/외적 정렬 상태로 직원의 생각, 감정 등의 경험을 통해 그것이 자신에게도 진실하고 유익한지를 판단하는 것을 의미하는데, CSR을 시행하고자 하는 조직의 전략과 이를 수행하는 내부 이해관계자인 직원의 인식 사이 의미 형성 과정으로 이해할 수 있다. 이를 심층적으로 밝히기 위해 (주)오OO기업을 대상으로 2015년부터 2021년까지 647개의 리뷰 데이터를 통해 텍스트 마이닝을 실시하여 토픽모델링 및 의미망 분석을 실시하였고, 특징적으로 나타나는 이슈 및 유형을 확인하였다. 분석 결과 대외이미지와 관련한 이슈에서 진정성 인식의 가장 큰 특징을 보이며, 진정성의 인식 평가 유형은 크게 수용과 거부로 나뉘고 이는 다시 5가지 유형으로 세분화된다. 본 연구의 함의는 조직에서 CSR 전략을 수립할 때 외부 및 내부를 모두 고려해야 하고 내부 구성원의 인식이 어떠한가에 대한 반응을 수집 및 반영하는 상호작용적 순환관계로 나아가야 한다는 것이다. 마지막으로 본 연구는 향후 이후 이러한 상호작용과 관련한 문제 극복 방안을 제시하고 있다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.

타액 연구의 최신 지견과 임상 응용 (Trends in Saliva Research and Biomedical Clinical Applications )

  • 박소영;이은경;신종현;정태성
    • 대한소아치과학회지
    • /
    • 제50권1호
    • /
    • pp.1-12
    • /
    • 2023
  • 타액선의 기능과 타액의 구성성분은 개체의 건강 상태를 반영하는 지표가 될 수 있다. 타액에서 바이러스와 미생물, 호르몬, 면역 및 대사산물 등을 검출하는 미량원소 분석기술이 발달함에 따라, 전신건강의 진단, 평가, 예방 분야에서 타액의 활용가능성이 높아지고 있다. 진단 검체로써 타액은 혈액에 비해 채취 방법이 비 침습적이어서 환자의 불편감이 적고 비 전문가에 의한 검체 수집이 가능할 뿐 아니라 채취과정 중 감염 위험성이 낮다는 점에서 장점이 있다. 이러한 이유로 스트레스, 마이크로바이옴, 유전학 및 후생유전학 분야의 연구에 있어 타액 내 단백질, 유전물질이나 각종 생체표지자 등을 활용하는 방법이 주목받고 있다. 또한 전신 건강에 대한 빅데이터 수집 연구와 관련하여 타액을 효율적으로 활용, 보관하기 위한 인체 자원 은행의 필요성이 강조되고 있으며, 조직공학과 접목하여 타액선 재생연구도 활발히 진행되고 있다. 검체 채취법이나 보관, 활용 방법의 표준화를 비롯하여 해결해야 할 과제가 남아있으므로, 본 리뷰에서 타액 및 타액선에 관한 최근의 연구 동향을 알아보고 미래 발전 방향에 대하여 검토해 보고자 하였다.

텍스트 마이닝을 이용한 인공지능 활용 신약 개발 연구 동향 분석 (Analysis of Research Trends in New Drug Development with Artificial Intelligence Using Text Mining)

  • 남재우;김영준
    • 생명과학회지
    • /
    • 제33권8호
    • /
    • pp.663-679
    • /
    • 2023
  • 본 리뷰 논문은 2010년부터 2022년까지의 인공지능을 활용한 신약개발 관련 연구동향을 분석하여 정리하였다. 이러한 분석을 통해 2,421개 연구의 초록을 코퍼스로 구성하고, 전처리를 거쳐 빈도가 높고 연결 중심성이 높은 단어를 추출하였다. 분석 결과 2010-201년과 2020-2022년 단어빈도 추이는 비슷한 것으로 구분되어 나타났다. 연구 방법으로는 2010년부터 2020년까지 머신 러닝을 활용한 연구가 많이 진행되었고, 2021년부터는 딥러닝을 활용한 연구가 증가하고 있다. 이러한 연구를 통해 이루어지고 있는 인공지능 활용연구 동향에 대해 분야별로 살펴보고 관련 연구의 장점, 문제점, 도전과제 등을 살펴보았다. 파악되어진 연구 동향은 2021년 이후로 약물의 재배치를 인공지능 활용 연구, 항암제 개발을 위한 컴퓨터 활용 연구, 임상시험에 인공지능 적용 연구 등과 같이 인공지능 적용 분야가 확대되고 있다는 점이다. 이러한 과정을 통해 향후 이루어질 것으로 예상되는 인공지능 활용 신약개발 연구의 전망에 대해 간략히 제시하였다. 위의 인공지능 기술 발전과 함께 바이오와 의료데이터의 신뢰성과 안전성이 확보되어진다면 인공지능 활용 신약개발의 방향이 개인 맞춤형 의료와 정밀의료 분야로 진행되어질 것으로 판단하기에 이에 대한 지속적인 노력이 필요하리라 본다.

공항 경제권 형성을 통한 허브 경쟁력 향상 방안에 대한 연구: 인천국제공항을 중심으로 (A Study on Ways to Improve Hub-Airport Competitiveness Through Forming Economy Zone: Focus on the Incheon International Airport)

  • 남승주;김준환;최솔샘;유영준;김진기
    • 경영정보학연구
    • /
    • 제24권2호
    • /
    • pp.21-40
    • /
    • 2022
  • 본 연구는 인천국제공항 중심 경제권 형성을 통한 허브 경쟁력 확보를 위해 향후 인천국제공항이 중점적으로 고려 및 개선해야 하는 요인을 도출하는 것을 목적으로 한다. 이를 위해 세계적 수준의 환승 공항을 이용한 승객이 작성한 온라인 리뷰를 대상으로 텍스트 분석을 실시하여, 승객이 중요하게 인식하는 환경요인을 도출하였다. 이후, 구체적인 인식 조사를 위해 도출된 환경 요인 중 15개의 세부평가 요인을 선행 연구에 기반하여 선정하였다. 해당 요인들은 전문가를 대상으로 중요도와 수행도를 확인하고자 설문조사 및 IPA 분석을 수행하였다. 분석 결과, 모든 요인에 있어, 중요도보다 수행도가 낮은 것으로 평가되었으며, 향후 인천국제공항이 중점적으로 개선해야 하는 상위 3개 요인으로 접근시설(편의성 및 다양성, 비용, 시간), 경제자유지역, 다양하고 우수한 쇼핑시설이 제시되었다. 본 연구는 텍스트 분석과 설문조사의 장점을 복합적으로 활용하여 승객의 인식을 이해했다는 점에서 의의가 있다. 본 연구 결과는 향후 허브 공항의 입지를 확고히 하기 위한 정책적, 전략적 방향성 수립에 활용될 수 있다.

완전성과 간결성을 고려한 텍스트 요약 품질의 자동 평가 기법 (Automatic Quality Evaluation with Completeness and Succinctness for Text Summarization)

  • 고은정;김남규
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.125-148
    • /
    • 2018
  • 다양한 스마트 기기 및 관련 서비스의 증가에 따라 텍스트 데이터가 폭발적으로 증가하고 있으며, 이로 인해 방대한 문서로부터 필요한 정보만을 추려내는 작업은 더욱 어려워졌다. 따라서 텍스트 데이터로부터 핵심 내용을 자동으로 요약하여 제공할 수 있는 텍스트 자동 요약 기술이 최근 더욱 주목을 받고 있다. 텍스트 요약 기술은 뉴스 요약 서비스, 개인정보 약관 요약 서비스 등을 통해 현업에서도 이미 활발하게 적용되고 있으며, 학계에서도 문서의 주요 요소를 선별하여 제공하는 추출(Extraction) 접근법과 문서의 요소를 발췌한 뒤 이를 조합하여 새로운 문장을 구성하는 생성(Abstraction) 접근법에 따라 많은 연구가 이루어지고 있다. 하지만 문서의 자동 요약 기술에 비해, 자동으로 요약된 문서의 품질을 평가하는 기술은 상대적으로 많은 진전을 이루지 못하였다. 요약문의 품질 평가를 다룬 기존의 대부분의 연구들은 사람이 수작업으로 요약문을 작성하여 이를 기준 문서(Reference Document)로 삼고, 자동 요약문과 기준 문서와의 유사도를 측정하는 방식으로 수행되었다. 하지만 이러한 방식은 기준 문서의 작성 과정에 막대한 시간과 비용이 소요될 뿐 아니라 요약자의 주관에 의해 평가 결과가 다르게 나타날 수 있다는 한계를 갖는다. 한편 이러한 한계를 극복하기 위한 연구도 일부 수행되었는데, 대표적으로 전문에 대해 차원 축소를 수행하고 이렇게 축소된 전문과 자동 요약문의 유사도를 측정하는 기법이 최근 고안된 바 있다. 이 방식은 원문에서 출현 빈도가 높은 어휘가 요약문에 많이 나타날수록 해당 요약문의 품질이 우수한 것으로 평가하게 된다. 하지만 요약이란 본질적으로 많은 내용을 줄여서 표현하면서도 내용의 누락을 최소화하는 것을 의미하므로, 단순히 빈도수에 기반한 "좋은 요약"이 항상 본질적 의미에서의 "좋은 요약"을 의미한다고 보는 것은 무리가 있다. 요약문 품질 평가의 이러한 기존 연구의 한계를 극복하기 위해, 본 연구에서는 요약의 본질에 기반한 자동 품질 평가 방안을 제안한다. 구체적으로 요약문의 문장 중 서로 중복되는 내용이 얼마나 적은지를 나타내는 요소로 간결성(Succinctness) 개념을 정의하고, 원문의 내용 중 요약문에 포함되지 않은 내용이 얼마나 적은지를 나타내는 요소로 완전성(Completeness)을 정의한다. 본 연구에서는 간결성과 완전성의 개념을 적용한 요약문 품질 자동 평가 방법론을 제안하고, 이를 TripAdvisor 사이트 호텔 리뷰의 요약 및 평가에 적용한 실험 결과를 소개한다.

고객 선호 변화를 고려한 토픽 모델링 기반 추천 시스템 (A Topic Modeling-based Recommender System Considering Changes in User Preferences)

  • 강소영;김재경;최일영;강창동
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.43-56
    • /
    • 2020
  • 추천 시스템은 사용자가 다양한 옵션 중에서 최선의 선택을 할 수 있도록 도와준다. 그러나 추천 시스템이 상업적으로 성공하기 위해서는 극복할 몇 개의 문제점이 존재한다. 첫째, 추천시스템의 투명성 부족 문제이다. 즉, 추천된 상품이 왜 추천되었는지 사용자들이 알 수 없다. 둘째, 추천시스템이 사용자 선호의 변화를 즉각적으로 반영할 수 없는 문제이다. 즉, 사용자의 상품에 대한 선호는 시간이 지남에 따라 변함에도 불구하고, 추천시스템이 사용자 선호를 반영하기 위해서는 다시 모델을 재구축해야 한다. 따라서 본연구에서는 이러한 문제를 해결하기 위해 토픽 모델링과 순차 연관 규칙을 이용한 추천 방법론을 제안하였다. 토픽 모델링은 사용자에게 아이템이 왜 추천되었는지 설명하는데 유용하며, 순차 연관 규칙은 변화하는 사용자의 선호를 파악하는데 유용하다. 본 연구에서 제안한 방법은 크게 토픽 모델링 및 사용자 프로파일 생성 등 토픽 모델링에 기반한 사용자 프로파일 생성 단계와 토픽에 사용자 선호 확인 및 순차 연관 규칙 발견 등 순차 연관 규칙에 기반한 추천 단계로 구분된다. 벤치마크 시스템으로 협업 필터링 기반 추천 시스템을 개발하고, 아마존의 리뷰 데이터 셋을 이용하여 제안한 방법론의 성능을 비교 평가하였다. 비교 분석 결과, 제안한 방법론이 협업 필터링 기반 추천시스템보다 뛰어난 성능을 보였다. 따라서 본 연구에서 제안하는 추천 방법을 통해 추천 시스템의 투명성을 확보할 수 있을 뿐만 아니라, 시간에 따라 변화하는 사용자의 선호를 반영할 수 있다. 그러나 본 연구는 토픽과 관련된 상품을 추천하기 때문에, 토픽에 포함된 상품의 수가 많을 경우 추천이 정교하지 못하는 한계점이 있다. 또한 토픽의 수가 적기 때문에 토픽에 대한 순차 연관 규칙이 너무 적은 문제점이 있다. 향후 연구에서 이러한 문제점을 해결한다면 좋은 연구가 될 것으로 판단된다.