• 제목/요약/키워드: 다항

검색결과 603건 처리시간 0.024초

k-모집단 동질성검정에서 피어슨검정의 오차성분 분석에 관한 연구 (Error cause analysis of Pearson test statistics for k-population homogeneity test)

  • 허순영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.815-824
    • /
    • 2013
  • 국가단위의 조사와 같은 대규모 표본조사에서는 표본의 대표성을 확보하기 위해 층화, 집락, 계통, 불균등확률추출 등을 종합적으로 사용하는 복합표본설계가 일반화되어 있다. 이러한 복합표본설계에 기초한 범주형 자료분석에서는 자료의 독립성과 다항분포를 가정하는 전통적인 피어슨검정이 왜곡된 검정결과를 가져올 수 있다. 본 연구는 복합표본설계에 의한 범주형조사자료의 k-모집단 동질성검정에서 설계기반 일치통계량인 Wald 검정통계량을 유도하고, 전통적인 피어슨검정통계량을 사용할 경우 발생할 수 있는 오차요인을 항목별로 분해하여, 분산의 편의에 의한 영향, 추정량의 편의에 의한 영향, 기타 분산의 편의와 추정량의 편의가 교락되어 미치는 영향으로 각각 분해하는 식을 도출하였다. 또한, 도출된 식의 각 항목이 피어슨 카이제곱검정통계량에 미치는 상대적 크기를 경험적으로 확인하기 위해 국민건강영양조사 제4기 2차년도 자료를 이용해 경험분석 하였다. 분석결과, 변수에 따른 차이는 있지만 대체로 분산의 편의가 미치는 영향이 추정량의 편의가 미치는 영향보다 크다는 것을 명확히 확인할 수 있었다.

빅데이터 기반 소비자 유형별 농식품 추천시스템 구축 사례 (Case Study of Big Data-Based Agri-food Recommendation System According to Types of Customers)

  • 문정훈;장익훈;최영찬;김진교;박진
    • 한국통신학회논문지
    • /
    • 제40권5호
    • /
    • pp.903-913
    • /
    • 2015
  • 농림수산식품교육문화정보원에서는 2015년 1월부터 공공데이터 포털 서비스를 시작하였으며 포털 내에 구축된 빅데이터 기반 농식품 추천 시스템을 이용한 맞춤소비정보를 제공하고 있다. 추천시스템의 특징은 첫째, SNS오피니언마이닝, 소비자패널의 모든 구매내역 정보, 기후데이터, 도매가격 데이터와 같은 빅데이터의 성격을 가진 농식품분야의 다양한 데이터들을 이용하기 때문에 데이터 양의 관점에서 추천의 정확도를 높일 수 있다. 둘째, 추천시스템 구축 초기에는 사용자 정보 기반 추천이 어려운 한계를 극복할 수 있는 방법으로 식생활 라이프스타일과 메가트렌드 요인을 이용한 소비자 세분화방법을 사용한다. 이는 사용자 개인정보가 없는 상황에서도 다양한 식품 선호를 반영할 수 있도록 하여 추천실패율을 낯춘다. 셋째, 디리슐레-다항분포를 이용하는 추천 알고리즘을 적용하여 다양한 상황적 요인들의 선호가 반영된 농식품 추천이 가능하도록 하였다. 이 외에도 추천 농식품에 대한 SNS 맛집정보와 버즈량, 관련 식재료를 판매하는 주변 소매점 위치 및 가격정보 등 다양한 정보를 제공하여 농식품 분야 정보에 관심을 높일 수 있도록 시스템을 구현하였다.

신교통수단 수혜자의 시장분할을 고려한 수단선택 모형 개발 (A Mode Choice Model with Market Segmentation of Beneficiary Group of New Transit Facility)

  • 김덕녕;최아름;황재민;김동규
    • 대한토목학회논문집
    • /
    • 제33권2호
    • /
    • pp.667-677
    • /
    • 2013
  • 신교통수단의 도입은 통행 대안 간의 수단분담률에 영향을 미친다. 그러나 수단분담률을 추정하는 데에 일반적으로 사용되는 다항로짓 모형은 통행자 선택의 다양성을 반영하기 어렵기 때문에 수단선택 특성을 정확하게 파악하는 데에 한계가 있다. 이러한 문제는 교통수단의 도입 효과를 과다 또는 과소추정하는 결과를 야기하며, 이는 심각한 사회적 손실을 초래할 수 있다. 본 연구는 선호의 동질성 문제를 극복할 수 있는 방법론을 모색하는 것을 목적으로 한다. 전체모집단을 직접수혜자와 간접수혜자로 구분하는 시장분할 구조를 적용하여 선호의 이질성을 반영할 수 있도록 한다. 제주도의 조사 자료를 활용하여 수단 선택 모형이 추정되며, 통계적 검정이 수행된다. 분석 결과, 신교통수단의 통행특성이 고급화됨에 따라 도심부에 거주하는 직접수혜자의 수단 전환율이 증가하는 것으로 확인되었다. 본 연구는 수단전환 패턴의 다양성을 반영함으로써 신교통수단 도입시 수요예측의 정확성을 제고하는 데에 기여할 것으로 사료된다.

정점 색칠 문제의 다항시간 알고리즘 (A Polynomial Time Algorithm for Vertex Coloring Problem)

  • 이상운;최명복
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권7호
    • /
    • pp.85-93
    • /
    • 2011
  • 본 논문은 지금까지 NP-완전인 난제로 알려진 정점 색칠 문제를 선형시간 복잡도로 해결한 알고리즘을 제안하였다. 제안된 알고리즘은 그래프 G=(V,E)의 최소 채색수 ${\chi}(G)$=k를 결정하기 위해 사전에 k값을 알지 못한다는 가정에 기반하고 있다. 단지 주어진 그래프를 독립집합 $\overline{C}$와 정점 피복 집합 C로 정확히 양분하여 $\overline{C}$에 색을 배정하는 방법을 적용하였다. 독립집합 $\overline{C}$의 원소는 ${\delta}(G)$인 정점 ${\upsilon}$가, C의 원소는 정점 ${\upsilon}$의 인접 정점들 u가배정된다. 축소된 그래프 C는 다시 $\overline{C}$와 C로 양분되며, 이 과정을 C의 간선이 없을 때까지 수행한다. 26개의 다양한 그래프를 대상으로 제안된 알고리즘을 적용한 결과 정점 ${\upsilon}$를 선택하는 횟수는 정점의 수 n보다 작은 값을 나타내었으며, ${\chi}(G)$=k를 찾는데 성공하였다.

노인의 우울유무에 따른 일상생활수행능력과 수면의 비교 (Comparison of the activities of daily living and sleep according to the presence depression in the elderly)

  • 정은숙;전미경
    • 디지털융복합연구
    • /
    • 제11권1호
    • /
    • pp.289-297
    • /
    • 2013
  • 본 연구의 대상은 D시, M시 각각의 일개 노인복지관을 이용하는 65세 이상의 노인 301명을 편의 표집 하여 구조화된 설문지에 대해 대상자와 일대일 면담을 통하여 모든 문항을 읽어주고 설문지를 작성하도록 하였다. 노인의 우울 여부를 파악하여 우울군과 정상군의 일반적 특성, 일상생활수행능력, 수면을 파악하고, 두 군 간의 차이 및 비교 위험도를 분석하였다. 자료의 분석은 공분산분석, 이변량 로지스틱회귀분석, 다항 로지스틱회귀분석을 이용하였으며, 연구의 결과는 다음과 같다. 우울군은 정상군에 비해 일상생활수행 능력의 수준이 저하되어 있었으며, 수면도 양호하지 않음을 나타냈고, 일상생활수행능력의 옷 입기, 대소변 조절에서 보다 많은 어려움을 호소하였으며, 도구적 일상생활수행 능력의 몸단장하기, 교통수단 이용하기, 물건사기에서 보다 많은 어려움을 호소하였다. 결론을 종합하면 노인 복지관을 이용하는 노인을 대상으로 건강증진 전략을 수립하고자 할 때 노인의 우울여부를 고려하여 일상생활수행능력의 향상과 수면의 만족도를 높일 수 있는 다양한 교육 및 신체활동프로그램의 개발이 요구되며, 우울 중재 프로그램의 개발 및 적용, 그 효과를 파악하는 확대 연구의 필요성을 제언한다.

데이터마이닝을 활용한 이직의도와 조직몰입의 결정요인에 대한 연구 (A Study of The Determinants of Turnover Intention and Organizational Commitment by Data Mining)

  • 최영준;심원술;백승현
    • 한국시뮬레이션학회논문지
    • /
    • 제23권1호
    • /
    • pp.21-31
    • /
    • 2014
  • 본 논문에서는 조직관련 변수들의 연구를 위해 이직의도와 조직몰입을 목표(종속)변수로서 데이터마이닝 시뮬레이션을 실시하여 접근 방법을 찾고 분석결과 도출을 목적으로 하였다. 데이터마이닝 분석방법 중 CART 앙상블 기법을 활용하였다. 자료는 한국직업능력개발원의 인적자본기업패널조사 1차~3차(2005~2009)데이터를 사용하였다. 조직몰입 변수는 다항목 측정 사항에 대해 신뢰성, 단일차원성 검토를 실행 후 합산척도 변수를 생성하여 분석하였다. 본 연구 결과는 다음과 같다. 첫째, 이직의도에 대한 주요 결정요인은 신뢰, 커뮤니케이션, 인재 중시 풍조 아이템으로 나타났다. 둘째, 조직몰입에 대한 주요 결정요인은 신뢰, 근속기간, 혁신, 커뮤니케이션 아이템으로 나타났다. 데이터마이닝 방법의 CART 앙상블 방법으로 Bagging과 Arcing 알고리즘을 적용한 결과 Arc-x4 방법이 매우 높은 결정계수를 나타낸 시나리오를 추출했다. 본 연구에서는 데이터마이닝 방법 중 하나인 CART 앙상블 시뮬레이션을 통해 최대치의 결정계수, 최소치의 오류를 산출한 시나리오 모델을 도출하고 실무적 시사점을 제시하였으며 한계점 및 향후 연구에 대해 논의되었다.

한우 혈청에서 호르몬 및 대사물질 농도들의 연령에 따른 변화에 관한 연구 (Change of Concentration of Hormones and Metabolic Materials in Serum by Age in Hanwoo)

  • 전기준;김종복;최재관;이창우;황정미;김형철;양부근;박춘근;나기준
    • 한국수정란이식학회지
    • /
    • 제18권3호
    • /
    • pp.215-225
    • /
    • 2003
  • 본 시험은 한우에서 연령에 따라 혈청성분들의 변화를 알아보기 위하여 한우 866두(거세 638, 비거세 228)에 대하여 혈청 농도를 분석하여 채혈시 일령을 독립 변량으로 하고 혈청 성분들을 종속변수로 하는 다항 회귀방정식으로 추정한 결과는 다음과 같다. 거세우나 비거세우 모두 같은 차수의 회귀방정식이 접합한 혈청 성분은 IGF- I (3차식) calium(1차식) 및 IP(1차식)이었고 거세우에서는 1차식이 적합하고 비거세우에서는 3차식이 적합한 혈청 성분은 testosterone와 creatinine었다. 반면에 HDLC는 거세우에서는 3차식이 적합하나 비거세우에서는 1차식이 적합한 것으로 나타났다. 그리고 거세우에서는 2차식이 적합한데 비거세우에서는 3차식이 적합한 혈청성분은 triglyceride 농도와 globulin농도 그리고 A/G비율 등이었고, 거세우에서는 3차식이 적합하고 비거세우에서는 2차식이 적합한 혈청성분은 BUN이었으며, 거세우에서는 2차식이 적합한데 비거세우에서는 1차식이 적합한 혈청성분은 TP와 albumin이었다. 한편 cortisol은 거세우나 비거세우에서 모두 3차식까지의 회귀방정식으로는 연령에 따른 변화를 설명하기가 적합하지 않았으며 glucose는 비거세우에서는 3차식 변화를 보이고 있으나 거세우에서는 3차식까지의 회귀방정식만으로는 연령에 따른 변화를 설명하기가 어려웠다. 가장 적합한 것으로 판단되는 혈청성분들의 회귀모형 중에서 비교적 R-SQUARE 값이 높은 것(R-SQUARE value>0.1)들은 거세우에서 ICF-I, albumin, creatinine, IP, HDLC 등이었으며, 비거세우에서 testosterone, IGF-I, TP, albumin, glucose, creatinine, IP, HDLC 등으로 나타났다. 따라서 IGF-I, albumin, creatinine, IP, HDLC 등은 거세우나 비거세우 모두에서 연령에 따라 비교적 큰 변화를 보이는 혈청 성분이라고 생각된다.

대형백화점의 신규출점에 따른 예상매출액 추정 (Prediction of Estimated Sales Amount through New Open of Department Store)

  • 박철주;고윤배;윤명길;김원겸
    • 유통과학연구
    • /
    • 제4권2호
    • /
    • pp.5-20
    • /
    • 2006
  • 소매업은 '입지산업'이라고 한다. 왜냐하면 소비자를 직접 판매대상으로 하는 소매업자에 있어서 입지는 점포의 경영성과를 좌우하는 소매믹스 중 가장 중요한 요인이기 때문이다. 소매업자의 경영성과는 일반적으로 매출액으로 나타낼 수 있다. 따라서 소매업자는 매출액을 올리기 위해서 고객 수를 늘릴 수 있는 방안에 집중하게 된다. 본 연구에서는 먼저, 점포선택에 관한 가장 기본적인 모델인 라일리의 소매인력모델, 콘버스 모델, 허프확률모델, 다항로짓모델을 검토하고자 한다. 다음에는, 기존의 이론모델을 이용하여 대형 백화점의 예상매출액을 추정하는 분석방법과 절차를 제시하고, 사례시설인 D광역시 L백화점의 출점에 따른 예상매출액을 추정하고자 한다. 마지막으로 본 연구의 문제점과 향후의 연구과제에 대해서 논의 하고자 한다. 본 연구는 선행연구들을 토대로 한국의 상권구조 특성을 감안하여 유통업 현장에서 통용될 수 있는 매출 변수들이 보완된다면 한국적 현실을 반영할 수 있는 수정모델의 제시가 가능한 것으로 분석되었다. 따라서 앞으로의 연구에서는 기존의 상권분석모델에 대한 비판적인 검토를 통하여 우리나라의 소매시장에 적합한 이론모델을 구축해야 할 것이다.

  • PDF

작업균형에 의한 시간 사용 비교 연구: 지역 사회 거주 노인과 시설 거주 노인을 기준으로 (Local Community and Nursing-home of the resident elderly in the Comparative Study of the Time Use for Occupational balance)

  • 박헌경;전병진;이재신;김수경
    • 대한지역사회작업치료학회지
    • /
    • 제4권2호
    • /
    • pp.41-51
    • /
    • 2014
  • 목적 : 지역사회 거주 노인과 시설 거주 노인의 일반적 특성과 생활시간 사용에 대한 비교를 위하여 두 그룹으로 나누어 작업균형을 알아보기 위하여 비교분석을 시행하였다. 연구방법 : 이 연구는 통계청에서 시행한 생활시간 조사 연구 2009년도 자료를 기반으로 하여 대전에서 거주하고 있는 65세 이상 노인 246명의 자료를 통계적으로 재분석하였다. 대전의 2곳 요양시설을 선정하여 그 곳에 거주하고 있는 65세 이상 노인 146명을 선정하여 일반적 특성과 생활시간 사용에 대한 자료를 수집하였다. 자료는 SPSS 12.0으로 분석하여 교차분석, 상관관계분석, 다항 로짓 회귀분석으로 분석하였다. 결과 : 지역사회 거주 노인과 시설 거주 노인의 각각의 생활시간을 분석하였을 때, 교차분석에서 유의한 결과를 나타내었고, 유의한 상관관계를 나타내었다. 또한 시설 거주 노인의 경우 낮은 활동 시간이 지역 사회 거주 노인과 비교하였을 때, 높은 수준을 나타내었다. 결론 : 이 연구 결과를 통하여 노인의 생활환경에 따른 생활시간의 사용이 시설 거주 노인과 지역사회 거주 노인을 비교하였을 때, 시설 거주 노인의 작업 불균형을 나타내고 있다는 것을 알 수 있었다.

  • PDF

통행목적별 수단별 통행시간가치도출 및 유의성 검정 (VOT Derivation for Different Trip Purposes, Travel Modes and Testing of Their Significance)

  • 김현;오세창;최기주
    • 대한교통학회지
    • /
    • 제17권1호
    • /
    • pp.113-129
    • /
    • 1999
  • 통행시간가치가 교통수단의 선택 및 교통계획의 평가에 있어서 중요한 역할을 함에도 불구하고 이를 정확히 판단하는 것은 쉬운 일이 아닌 것으로 되어왔다. 통상, 통행시간가치에 있어서 업무와 비업무통행으로만 구분하여 연구되어진 반면, 본 연구는 다항로짓모형을 적용하는데 있어 통행목적에 따른 모형 구성변수에 있어 통계적신뢰성 및 모형의 적합도, 수정우도비, 교통수단선택의 행태특성을 반영하여 적중율의 동일성이 검정하였고, 또한 통행 목적별 수단별 시간가치 값의 유의적인 차이가 있음을 검정하였다. 한편, 구체적으로 제시된 결과로는, 첫째 교통수단선택의 효용함수를 정산결과 모형 I (통근+통학)의 경우 선정된 11개 변수는 유의수준 5%이내에서 높은 설명력이 나타나, 신뢰구간 95%에서 모형을 구성하는 변수의 통계적 신뢰성이 있음을 검정하였고, 둘째, 모형별 통행시간가치 도출결과 모형 I (통근+통학)의 경우 승용차 8,198원/시, 버스 639원/시, 지하철 1,083원/시이며, 모형II(업무)는 승용차 14,074원/시, 버스 1,219원/시, 지하철 1,062원/시로 산정되었으며, 모형III(통근)의 경우 승용차10.947원/시, 버스 972원/시, 지하철 987원/시로 산정되었다. 모형의 적합도에 있어서는 모형II가 가장 큰 값을 나타냈으며, 다음은 모형III, 모형 I의 순으로 나타났다 셋째, 통행 목적별 각 모형 상호간 적중율차이에 대한 동일성은 유의수준 5%이내에서 인정되어 예측력에 따른 통행시간가치의 변화는 없을 것으로 판단되며, 또한 통행시간 가치값의 도출에 영향을 미치는 통행시간, 승용차비용, 버스요금 지하철요금 등의 매개변수가 유의수준 5%에서 검정결과 유의적인 차이가 인정된 만큼 통행목적 별 수단별 통행시간 가치값은 상호간에 유의적인 차이가 있음을 확인하였다. 본 연구 결과 향후 경제성 평가는 통행목적에 따른 수단별 통행시간가치가 적용될 수 있을 것으로 기대되며, 또한 수단선택모형의 매개변수 정산시에는 통행목적별 시간가치를 비교하여 모형의 타당성을 입증하는 요인으로 적용될 수 있을 것으로 기대된다.

  • PDF