• 제목/요약/키워드: 자료와 가능성

검색결과 4,779건 처리시간 0.03초

범주형 자료에서 경험적 베이지안 오분류 분석 (Empirical Bayesian Misclassification Analysis on Categorical Data)

  • 임한승;홍종선;서문섭
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.39-57
    • /
    • 2001
  • 범주형 자료에서 오분류는 자료를 수집하는 과정에서 발생될 수 있다. 오분류되어 있는 자료를 정확한 자료로 간주하여 분석한다면 추정결과에 편의가 발생하고 검정력이 약화되는 결과를 초래하게 되며, 정확하게 분류된 자료를 오분류하고 판단한다면 오분류의 수정을 위해 불필요한 비용과 시간을 낭비해야 할 것이다. 따라서 정확하게 분류된 표본인지 오분류된 표본인지를 판정하는 것은 자료를 분석하기 전에 이루어져야할 매우 중요한 과정이다. 본 논문은 I$\times$J 분할표로 주어지는 범주형 자료에서 두 변수 중 하나의 변수에서만 오분류가 발생되는 경우에 오분류 여부를 검정하기 위해서 오분류 가능성이 없는 변수에 대한 주변합은 고정시키고, 오분류 여부를 가능성이 있는 변수의 주변합을 Sebastiani와 Ramoni(1997)가 제안한 Bound와 외부정보로 표현되는 Collapse의 개념, 그리고 베이지안 방법을 확장하여 자료에 적합한 모형과 사전정보를 고려한 사전모수를 다양하게 설정하면서 재분류하는 연구를 하였다. 오분류에 대한 정보를 얻기 위해서 Tenenbein(1970)에 의해 연구된 이중추출법을 이용하여 오분류 검정을 위한 새로운 통계량을 제안하였으며, 제안된 오분류 검정통계량에 관한 분포를 다양한 모의실험을 통하여 연구하였다.

  • PDF

인구주택총조사 마이크로자료의 개인정보 노출제한방법 (A Method of Masking for 2005 Korean Census Microdata)

  • 정동명;정미옥
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.313-325
    • /
    • 2008
  • 통계이용자들의 마이크로자료 제공요구가 갈수록 증가하고 있으며 통계작성기관도 마이크로자료의 제공을 위해 노력을 기울이고 있는 실정이다. 그러나 마이크로자료에는 응답자의 개인정보가 많이 담겨 있으므로 자료를 그대로 제공할 경우 개인정보가 노출 될 가능성이 높기 때문에 자료제공시 적절한 방법으로 노출을 제한시켜 주어야만 한다. 본 논문에서는 마이크로자료 제공시 발생하는 응답자의 정보노출에 대한 개념과 이를 제한하는 방법 등을 소개하고, 2005년에 통계청에서 실시한 인구주택총조사의 2% 마이크로자료 제공을 위해 다양한 노출제한방법을 적용하여 자료파일을 작성하는 과정을 설명하였다. 즉, 10% 표본조사결과를 모집단으로 하고 계통추출한 표본을 대상으로 외부인이 식별할 가능성이 높은 12개 항목을 key 변수로 선정한 후, 각 변수의 조합별 유일성을 파악하고 노출위험을 계산하였다. 그 결과 2% 표본을 통한 정보의 축소는 물론 그룹화, 코딩 등을 포함한 일련의 방법들을 적용함으로써 인구주택총조사 마이크로자료의 개인정보 노출을 제한하는데 상당한 효과가 있음을 알 수 있었다.

자연어 생성 모델을 이용한 준지도 학습 기반 한국어 사실 확인 자료 구축 (Semi-Supervised Data Augmentation Method for Korean Fact Verification Using Generative Language Models)

  • 정재환;전동현;김선훈;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.105-111
    • /
    • 2021
  • 한국어 사실 확인 과제는 학습 자료의 부재로 인해 연구에 어려움을 겪고 있다. 본 논문은 수작업으로 구성된 학습 자료를 토대로 자연어 생성 모델을 이용하여 한국어 사실 확인 자료를 구축하는 방법을 제안한다. 본 연구는 임의의 근거를 기반으로 하는 주장을 생성하는 방법 (E2C)과 임의의 주장을 기반으로 근거를 생성하는 방법 (C2E)을 모두 실험해보았다. 이때 기존 학습 자료에 위 두 학습 자료를 각각 추가하여 학습한 사실 확인 분류기가 기존의 학습 자료나 영문 사실 확인 자료 FEVER를 국문으로 기계 번역한 학습 자료를 토대로 구성된 분류기보다 평가 자료에 대해 높은 성능을 기록하였다. 또한, C2E 방법의 경우 수작업으로 구성된 자료 없이 기존의 자연어 추론 과제 자료와 HyperCLOVA Few Shot 예제만으로도 높은 성능을 기록하여, 비지도 학습 방식으로 사실 확인 자료를 구축할 수 있는 가능성 역시 확인하였다.

  • PDF

일반 대중의 코로나19에 대한 불안, 지식, 감염 가능성, 감염예방 가능성, 감염예방행위 수행에 관한 연구 (A Study on Anxiety, Knowledge, Infection Possibility, Preventive Possibility and Preventive Behavior Level of COVID-19 in General Public)

  • 정애리;홍은주
    • 융합정보논문지
    • /
    • 제10권8호
    • /
    • pp.87-98
    • /
    • 2020
  • 본 연구는 코로나19 확산에 따른 대중의 불안, 지식, 감염 가능성, 감염예방 가능성, 감염예방행위 수행도 수준을 파악하기 위해 시도되었다. 2020년 4월 6일부터 4월 10일까지 20~50대 성인 208명을 대상으로 자료수집을 하였다. 대상자의 일반적 특성과 코로나19 관련 불안, 지식, 감염 가능성, 감염예방 가능성, 감염예방행위 수행도 수준을 설문조사하였고, 수집된 자료는 SPSS 23.0을 이용하여 기술통계, t-test, ANOVA, 상관관계 분석을 실시하였다. 본 연구결과에서 나타난 불안 점수는 성별, 연령, 결혼여부, 동거가족 유형에 따라 통계적으로 유의미한 차이가 나타났으며, 지식 점수는 연령, 결혼여부에 따라, 감염 가능성은 연령과 지역에 따라, 감염예방행위 수행도는 성별, 연령, 결혼여부, 동거가족 형태에 따라 통계적으로 유의한 차이가 나타났다. 하지만 감염예방 가능성의 경우 대상자 특성에 따른 차이는 없는 것으로 나타났다. 이상의 연구결과는 개인과 지역사회의 감염병 예방을 위한 적절한 보건 정책을 마련하는데 필요한 기초 자료로 사용될 수 있을 것이다. 추후 감염병 유행 시기별로 응답자의 반응을 비교하는 연구가 필요하며 지역 범위와 대상자 규모를 확대한 반복 연구를 제언한다.

IKONOS 고해상도 영상을 활용한 녹지자연도 판정 가능성 평가

  • 서기환;엄정섭
    • 대한지리학회:학술대회논문집
    • /
    • 대한지리학회 2002년도 추계학술대회 요약집
    • /
    • pp.119-122
    • /
    • 2002
  • 효율적인 자연환경보전을 위한 방법론상의 선결과제는 자연환경에 대한 신뢰할 수 있는 기초조사 자료를 확보하고 이를 기반으로 하여 효율적인 보전정책을 수립하는 것이 필요하다. 우리나라의 환경부 등 관련기관이나 미국, 영국, 독일 등 각 국의 환경관련기관에서 사용하고 있는 자연환경에 대한 기초 자료는 대부분 현장조사에 기반을 두고 있거나 항공사진에 의거하여 확보되어지고 있다.(중략)

  • PDF

작업환경을 위한 TLV의 근거 - PENTACHLORONAPHTHALENE

  • 김치년
    • 월간산업보건
    • /
    • 통권257호
    • /
    • pp.13-16
    • /
    • 2009
  • 펜타클로로나프탈렌(Pentachloronaphthalene)의 직업적 노출기준은 0.5 $mg/m^3$으로 권고하였으며 이 수준은 염화물 형태의 간 손상과 피부염의 가능성을 최소화하기 위한 것이다. 피부 흡수 경고는 동물실험에서 pentachloronaphthalene이 피부접촉 시 흡수가 용이하다는 자료를 근거로 권고하였다. 두 종류 이상의 염화나프탈렌에 노출되는 경우는 상가작용을 적용하여야 하며 감작제, 발암성, TLV-STEL에 대한 권고는 충분한 자료가 확보되지 않아 아직은 설정하지 않고 있다.

  • PDF

공간 통계 분석을 이용한 DEM 오차 패턴 연구

  • 안은자
    • 대한지리학회:학술대회논문집
    • /
    • 대한지리학회 2003년도 춘계학술대회
    • /
    • pp.207-210
    • /
    • 2003
  • 지리학적 정보는 지구의 표면이나 가까이에 나타나는 현상과 사상에 대한 정보로서 정의된다(Goodchild et al., 1999). 지리학에서, 이러한 지리학적 정보는 특정한 현상을 연구하기 위한 공간자료로 이용되는데, 이는 공간적 패턴을 통해 유형화된다. 이러한 공간자료는 현지답사를 통해 수집ㆍ분석되며, 관찰자의 주관적 판단, 기술적인 오류로 인해, 오차의 필연적 발생 가능성을 안고 있다(Maffini, 1989; Bolstad, 1990; Dunn, 1990; Keeler, 1991). (중략)

  • PDF

GIS와 인공신경망을 이용한 금-은 광물 부존적지 선정 및 검증 (Gold-Silver Mineral Potential Mapping and Verification Using GIS and Artificial Neural Network)

  • 오현주
    • 한국지리정보학회지
    • /
    • 제13권3호
    • /
    • pp.1-13
    • /
    • 2010
  • 본 연구에서는 지리정보시스템(GIS)과 인공신경망 기법을 이용하여 강원도 태백산광화대 지역의 금-은 광물부존 가능성도를 작성 및 검증하고자 한다. 금-은 광상과 관련된 요인으로는 지질, 단층, As, Cu, Mo, Ni, Pb, Zn 등의 지화학 자료를 선정하여 GIS 기반의 공간 데이터베이스로 구축하였다. 46개소의 금-은 광상은 훈련 및 검증 자료로 분류하여 광물부존 가능성 분석과 검증에 사용하였다. 인공신경망 분석에 있어서 광상 분포지역과 미 분포지역에 대한 훈련자료는 기존 광상의 위치와 우도비 방법으로 도출된 광물부존 가능지수의 하위 10%에 해당하는 지역으로 선정하였다. 금-은 광물부존 가능성도의 신뢰도를 검증하기 위해 광물부존 가능지수의 상위 5% 지역 내에서 암석시료를 채취한 후 Au, Ag, As, Cu, Pb, Zn 원소의 성분을 분석하였다. 그 결과 No. 4의 시료는 다른 시료들보다 각 원소별로 높은 함량을 보였다.

인터넷 자료를 활용한 브랜드가치 평가의 새로운 접근 (New Approaches for Evaluation of Brand Valuation Using Internet Data)

  • 변종석
    • 한국조사연구학회지:조사연구
    • /
    • 제4권1호
    • /
    • pp.49-71
    • /
    • 2003
  • 본 연구의 목적은 인터넷 자료를 활용하여 브랜드가치를 평가하는 새로운 접근방법으로 브랜드 파워를 산출해 봄으로써 인터넷상에서 수집된 자료의 활용 방안을 검토해 보는 것이다. 브랜드파워 평가에 필요한 자료로 인터넷 사이트의 브랜드주가 자료와 인터넷조사 자료를 이용하였다. 브랜드주가 자료와 실증시의 주가 자료와의 상관관계를 검토하여 인터넷 자료의 활용가능성을 확인하였고, 인터넷조사의 결과를 결합하여 상대적 개념으로 평가하는 브랜드가치 평가방법을 제안하였다.

  • PDF