• 제목/요약/키워드: Data interpretation, statistical

검색결과 174건 처리시간 0.035초

유전자군 분석의 방법론과 응용 (A Method for Gene Group Analysis and Its Application)

  • 이태원
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.269-277
    • /
    • 2012
  • 마이크로어레이 분석은 특이 발현하는 개별적인 유전자보다 유전자 온톨로지(Gene Ontology)와 같이 기능적 분류나 생물학적 경로(pathway)와 관련된 유전자군을 찾아내는 것이 그 해석의 용이성 때문에 최근 더욱 많은 연구가 진행되고 있다. 약물 처리에 의한 생물학적 반응을 연구할 때, 한 유전자군에 속하는 유전자들 각각의 특이 발현 여부의 유의성을 나타내는 $p$-value들을 취합하여 그 유전자군의 유의성을 결정하는 통계 검증 방법을 본 논문에서 소개하였다. 본 논문에 제시된 유전자군 분석(Gene group analysis) 방법은 Fisher's exact test나 permutation test와 같은 기존의 대표적인 방법들보다 더 정확하고 적용범위가 넓음을 실재 생물학 실험 자료의 분석을 통해 보였다. 제시된 유전자군 분석 방법은 SAS 프로그램으로 구현되었고 저자의 홈페이지(http://cafe.daum.net/go.analysis)에서 내려 받아 사용할 수 있다.

원자력발전 온배수 영향에 대한 해수질 환경조사 지침 연구 (A Study on Seawater Quality Criteria and Assessment of Thermal Discharge from Nuclear Power Plant)

  • 박용철;김성준;김은수;이희준;이효진;김동화
    • 한국해양학회지:바다
    • /
    • 제12권1호
    • /
    • pp.50-56
    • /
    • 2007
  • 원자력발전소의 온배수 배출에 따른 주변해역의 해양환경변화는 온배수의 수온상승에 의한 해수질의 생지화학적 변화가 상호 연관되어 나타나게 된다. 지금까지 우리나라에서 수행된 여러 원전 온배수 관련 해양환경 영향범위 산정 문제는 항상 객관적 논리와 정량화된 근거자료의 미비나 부재로 이해 당사자간의 소모적인 논란과 파행적 피해보상 진행으로 귀결되어온 바 있다. 이러한 문제는 해양환경 피해영향평가 조사가 용역조사기관에 따라 각각 달리 수행되어 동일하고 표준화된 지침에 의하여 객관성을 보장하지 못하였기 때문으로 초래한 현상으로 사료된다. 국내에서 2002년부터 2004년까지 수행된 17개 조사보고서를 검토한 결과 이에 대한 보다 근본적인 원인은 우선 해수질 조사항목에서부터 그 적정성과 유의성에 대한 검증이 충분치 못한 상황에서 용역조사기관 재량에 따라 결정 수행되었기 때문으로 생각된다. 더구나 결과해석에 있어서 온배수에 의한 인과관계를 정량적이거나 객관화된 피해근거를 규명하지 못하고 애매모호한 경우가 많았으며 경우에 따라 불명확하거나 비객관적인 해석으로 인하여 이해당사자간의 합리적인 합의를 도출할 수 없었기 때문으로 판단된다. 따라서 본 연구에서는 이러한 관행적 문제점을 개선하고 보다 명확한 피해영향평가를 도출하기위해 객관화되고 정량적인 온배수에 의한 해양환경 영향평가가 이루어질 수 있도록 모든 이해당사자와 전문가, 학계 그리고 용역수행기관이 합의할 수 있는 표준지침을 토의하고 제시하고자 하였다.

수량화 제3 방법의 축소 해 (Shrinkage Solution of Quantification Method III)

  • 허명회;이용구
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.331-338
    • /
    • 2006
  • 수량화 제3방법은 일본의 하야시(Hayashi)에 의해 창안된 교차표 분석 기법으로 사회조사 및 마케팅 조사 자료의 분석에서 매우 유용하다. 그러나 반응빈도가 작은 일부 범주들이 특이하게 큰 수량화 값을 갖는 경우가 있어 불안정한 과잉 해석으로 이어지기도 한다. 본 교신은 이 문제를 해결하고자 한 연구로서 수량화 제3방법을 새로 정식화하고 축소 해 (shrinkage solution)를 제안할 것이다. 그리고 실제 조사 자료에 새 방법론을 적용해 보고자 한다.

APPLICATION AND CROSS-VALIDATION OF SPATIAL LOGISTIC MULTIPLE REGRESSION FOR LANDSLIDE SUSCEPTIBILITY ANALYSIS

  • LEE SARO
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.302-305
    • /
    • 2004
  • The aim of this study is to apply and crossvalidate a spatial logistic multiple-regression model at Boun, Korea, using a Geographic Information System (GIS). Landslide locations in the Boun area were identified by interpretation of aerial photographs and field surveys. Maps of the topography, soil type, forest cover, geology, and land-use were constructed from a spatial database. The factors that influence landslide occurrence, such as slope, aspect, and curvature of topography, were calculated from the topographic database. Texture, material, drainage, and effective soil thickness were extracted from the soil database, and type, diameter, and density of forest were extracted from the forest database. Lithology was extracted from the geological database and land-use was classified from the Landsat TM image satellite image. Landslide susceptibility was analyzed using landslide-occurrence factors by logistic multiple-regression methods. For validation and cross-validation, the result of the analysis was applied both to the study area, Boun, and another area, Youngin, Korea. The validation and cross-validation results showed satisfactory agreement between the susceptibility map and the existing data with respect to landslide locations. The GIS was used to analyze the vast amount of data efficiently, and statistical programs were used to maintain specificity and accuracy.

  • PDF

Influence of e-HRM and Human Resources Service Quality on Employee Performance

  • NURLINA, N.;SITUMORANG, Jubair;AKOB, Muhammad;QUILIM, Cici Aryansi;ARFAH, Aryati
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제7권10호
    • /
    • pp.391-399
    • /
    • 2020
  • This study aims to analyze the relationship of e-HRM implementation to employee performance both directly and indirectly through the intervening of the Human Resource service Quality variable, both practically and theoretically. This study uses variance-based structural equation modeling (SEM) techniques with partial least square (PLS) statistical testing tools to test the direct relationship of e-HRM and the performance and relationship moderated by Human Resources service quality tested on 200 civil servants in five offices under the coordination of the Government of the South Sulawesi Province of Indonesia. The data collection model in this study uses an online survey. The data analysis stages through the explanatory concept consist of, first, the interpretation of the distribution of the average frequency of respondents' answers; second, outer-loading; third, determination of the validity and reliability; fourth, the coefficient of determination test and partial test; fifth, the GoF model; sixth, validity test; and seventh, hypothesis testing. This study explores four hypotheses in a comprehensive fashion; the results of this study show that all hypotheses have positive and significant effects both through direct and intervening relationships. Among the three direct relationships, the relationship of e-HRM variables on HR Service Quality is greatest and most dominant.

An Efficient DNA Sequence Compression using Small Sequence Pattern Matching

  • Murugan., A;Punitha., K
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.281-287
    • /
    • 2021
  • Bioinformatics is formed with a blend of biology and informatics technologies and it employs the statistical methods and approaches for attending the concerning issues in the domains of nutrition, medical research and towards reviewing the living environment. The ceaseless growth of DNA sequencing technologies has resulted in the production of voluminous genomic data especially the DNA sequences thus calling out for increased storage and bandwidth. As of now, the bioinformatics confronts the major hurdle of management, interpretation and accurately preserving of this hefty information. Compression tends to be a beacon of hope towards resolving the aforementioned issues. Keeping the storage efficiently, a methodology has been recommended which for attending the same. In addition, there is introduction of a competent algorithm that aids in exact matching of small pattern. The DNA representation sequence is then implemented subsequently for determining 2 bases to 6 bases matching with the remaining input sequence. This process involves transforming of DNA sequence into an ASCII symbols in the first level and compress by using LZ77 compression method in the second level and after that form the grid variables with size 3 to hold the 100 characters. In the third level of compression, the compressed output is in the grid variables. Hence, the proposed algorithm S_Pattern DNA gives an average better compression ratio of 93% when compared to the existing compression algorithms for the datasets from the UCI repository.

Determinants of the Effectiveness of Internal Shariah Audit: Evidence from Islamic Banks in Bangladesh

  • ISLAM, K.M. Anwarul;BHUIYAN, Abul Bashar
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제8권2호
    • /
    • pp.223-230
    • /
    • 2021
  • The concept of Shariah-based internal audit has received increasing attention from researchers in recent times especially since Islamic financial institutions have been developing in several Asian countries like Bangladesh. To avoid financial irregularities and to maintain Shariah-based financial transactions, an effective Shariah-based internal audit system is extremely important for Islamic financial institutions such as Islamic banks. Hence, the objective of this study is to determine the factors that influence the effectiveness of the Shariah-based audit system. Study data has been gathered from Shariah auditors, members of the Shariah board and audit committee of six private Islamic banks in Dhaka, Bangladesh. A total of 210 survey questionnaires were sent and finally 136 responses were retained, indicating a final sample size of n=136, with a survey feedback rate of 65%. The study adopted a quantitative measure and collected only primary data, followed by convenience sampling. SPSS has been used to run necessary statistical interpretation. Results reveal that auditor's work autonomy, level of competency, and work performance significantly impact the Shariah-based internal audit effectiveness. The study findings can be adopted as guidelines to improve the overall effectiveness of the Shariah-based internal audit system in Islamic financial institutions.

랜덤포레스트를 위한 상관예측변수 중요도 (Correlated variable importance for random forests)

  • 신승범;조형준
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.177-190
    • /
    • 2021
  • 랜덤포레스트는 여러 의사결정나무 모형들을 융합하여 안정성과 예측력을 높여주기 때문에 종종 사용되는 방법이다. 예측력을 증가시키는 반면 해석의 용이성을 희생하기 때문에 이를 보상하기 위해 변수의 중요도를 제공한다. 변수의 중요도는 랜덤포레스트를 구축할 때 변수가 얼마나 중요한 역할을 하는지를 알려 준다. 그러나 어떤 예측변수가 다른 예측변수들과 상관되어 있을 때 기존 알고리즘의 변수중요도는 왜곡될 수 있다. 상관된 예측변수들의 하향 편향은 예측변수의 중요도를 실제 중요도보다 낮게 측정하게 한다. 우리는 기존 알고리즘을 수정하여 상관 예측변수의 하향 편향을 회복하는 새로운 알고리즘을 제안한다. 제안된 알고리즘의 성능은 모의 자료에 의해 증명되고 실제 자료에 의해 설명된다.

확률적 비음수 행렬 인수분해를 사용한 통계적 음성검출기법 (Statistical Voice Activity Detection Using Probabilistic Non-Negative Matrix Factorization)

  • 김동국;신종원;권기수;김남수
    • 한국통신학회논문지
    • /
    • 제41권8호
    • /
    • pp.851-858
    • /
    • 2016
  • 본 논문은 비음수 행렬 인수분해(NMF)의 확률적 해석에 근거한 새로운 통계적 음성검출기법을 제안한다. NMF의 기저와 부호화 행렬들이 주어졌을 때, 데이터 행렬의 분포를 Poisson 분포로 가정한 로그 우도는 Kullback-Leibler 발산을 이용한 NMF의 목적 함수와 일치한다. 이러한 NMF의 확률모델에 근거하여 음성검출을 위해 DFT영역에서 잡음과 음성의 크기 스펙트럼을 Poisson 분포로 모델링하여 새로운 우도비 검출 규칙을 유도한다. 실험 결과를 통해 제안된 기법이 0-15dB 신호 대 잡음비의 시뮬레이션 환경에서 기존 Gaussian과 NMF을 사용한 기법보다 향상된 음성검출 결과를 보여준다.

뇌기능 연결성 모델링을 위한 통계적 방법 (Statistical methods for modelling functional neuro-connectivity)

  • 김성호;박창현
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1129-1145
    • /
    • 2016
  • 뇌기능 연결성 문제는 뇌의 신경역학적 현상과 밀접한 관련이 있다는 의미에서 뇌과학에서 주요 연구주제이다. 본 논문에서는 기능적 자기공명영상(fMRI)자료를 뇌활동에 대한 반응 자료의 주요 형태로써 선택하였는데, 이 fMRI자료는 높은 해상도 때문에 뇌과학 연구에서 선호되는 자료 형태이다. 뇌활동에 대한 생리학적 반응을 측정해서 자료로 사용한다는 전제하에서 뇌의 기능적 연결성을 분석하는 방법들을 고찰하였다. 여기서의 전제란 상태공간 및 측정 모형을 다룬다는것을 의미하는데, 여기서 상태공간 모형은 뇌신경역학을 표현한다고 가정한다. 뇌기능 영상자료의 분석은 무엇을 측정하였느냐에 따라서 분석방법과 그 해석이 조금씩 달라진다. 실제 fMRI자료를 고차원 자기회귀모형을 적용해서 분석한 결과를 논문에 포함하였는데, 이 결과를 통해서 서로 다른 도형문제를 푸는데 서로 다른 뇌신경 역학관계가 요구된다는 것을 엿볼 수 있었다.