• 제목/요약/키워드: 사용빈도

검색결과 4,809건 처리시간 0.037초

단어 중의성 해소를 위한 SVM 분류기 최적화에 관한 연구 (A Study on Optimization of Support Vector Machine Classifier for Word Sense Disambiguation)

  • 이용구
    • 정보관리연구
    • /
    • 제42권2호
    • /
    • pp.193-210
    • /
    • 2011
  • 이 연구는 단어 중의성 해소를 위해 SVM 분류기가 최적의 성능을 가져오는 문맥창의 크기와 다양한 가중치 방법을 파악하고자 하였다. 실험집단으로 한글 신문기사를 적용하였다. 문맥창의 크기로 지역 문맥은 좌우 3단어, 한 문장, 그리고 좌우 50바이트 크기를 사용하였으며, 전역문맥으로 신문기사 전체를 대상으로 하였다. 가중치 부여 기법으로는 단순빈도인 이진 단어빈도와 단순 단어빈도를, 정규화 빈도로 단순 또는 로그를 취한 단어빈도 ${\times}$ 역문헌빈도를 사용하였다. 실험 결과 문맥창의 크기는 좌우 50 바이트가 가장 좋은 성능을 보였으며, 가중치 부여 방법은 이진 단어빈도가 가장 좋은 성능을 보였다.

강우사상 이변량 빈도해석을 위한 Peaks Over Threshold (POT) 방법을 이용한 적정 확률표본 선택 연구 (Appropriate Sample Size for Bivariate Frequency Analysis of Rainfall Event using Peaks Over Threshold (POT))

  • 주경원;김한빈;안현준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.304-304
    • /
    • 2018
  • 이변량 빈도해석은 일반적으로 고정지속기간 강우량에 대해 빈도해석하는 단변량 빈도해석에 비해 지속기간을 확률변수로 이용하여 강우량과 동시에 확률변수로 사용할 수 있다는 장점이 있다. 하지만 확률분포형의 차원이 증가하기 때문에 기존 단변량 빈도해석에서 요구되던 표본크기보다 더 많은 표본이 필요하다. 우리나라 강우관측소의 경우 오래된 관측소의 경우에도 기록년수가 60년을 넘지 않아 연최대계열로 확률표본을 작성할 경우 이변량 빈도해석을 수행하기에 부족할 수 있다. 따라서 본 연구에서는 Peaks Over Threshold (POT) 방법을 이용하여 적정 확률표본을 선택하는 연구를 진행하였다. 서울 기상청 지점의 강우자료로부터 최소무강우시간을 이용하여 모든 강우사상을 추출하였으며 각 강우사상의 강우량과 지속기간이 확률변수로 사용되었다. 기존에 알려진 POT 방법들과 Anderson-Darling 적합도 검정을 이용한 절단값 산정방법등을 적용하여 확률표본 개수의 변화에 따른 주변분포형의 적합도 검정과 이변량 확률모형의 적합성을 살펴보았다.

  • PDF

2007 개정·2009 개정 중학교 과학 교과서 화학영역에 사용된 과학 글쓰기 문항의 비교 분석 (An Comparison Analysis of Science Writing Tasks in the Chemistry Domain of Middle School Science Textbooks Developed under the 2007 & the 2009 Revised National Curriculums (RNC))

  • 이규희;홍훈기
    • 대한화학회지
    • /
    • 제58권6호
    • /
    • pp.600-611
    • /
    • 2014
  • 이 연구에서는 2007개정 교육과정에 따른 중학교 과학 교과서 18권과 2009개정 교육과정에 따른 중학교 과학 교과서 18권의 화학 영역에 사용된 과학 글쓰기 문항을 추출하고, 사용 빈도를 조사하였다. 또한, 추출한 과학 글쓰기 문항을 인지적 과정, 글의 유형에 따라 분류하고, 과학 글쓰기 문항에 포함된 글로벌 이슈 내용을 분석하여 얻어진 결과를 비교하였다. 2007개정 교과서에 사용된 과학 글쓰기 문항은 총 183개로서 교과서 한 권당 10.17개, 10쪽 당 평균 1.32개의 과학 글쓰기 문항이 사용되었다. 한편, 2009개정 교과서에 사용된 과학 글쓰기 문항은 총 168개로서, 교과서 한 권당 9.33개, 10쪽 당 평균 1.23개의 과학 글쓰기 문항이 사용되어, 2007개정 교과서와 비교해 2009개정 교과서에 사용된 과학 글쓰기 문항의 한 권당 사용 빈도와 10쪽 당 평균 사용 빈도가 모두 감소한 것으로 나타났다. 또한, 두 교육과정에서 과학 글쓰기 문항 사용 빈도는 단원별, 출판사별로 차이를 보였으며, 과학 글쓰기 문항은 과학 교과서의 단원 마무리 단계에서 주로 사용되는 경향을 보였다. 인지적 과정에 따라 과학 글쓰기 문항을 분류한 결과, 두 교육과정에서 공통적으로 이해하기에 해당하는 문항의 사용 빈도가 가장 높았으며, 기억하기에 해당하는 문항의 사용 빈도는 가장 낮았다. 글의 유형에 따라 과학 글쓰기 문항을 분류한 결과, 정보를 전달하는 글쓰기가 가장 많이 사용되었으며, 이에 해당하는 인지적 과정 중 이해하기가 가장 높은 사용빈도를 보였다. 과학 글쓰기 문항에 포함된 글로벌 이슈 내용을 분석한 결과, 2007개정 교과서에서 21개(11.48%), 2009개정 교과서에서 33개(19.64%)가 글로벌 이슈 내용을 포함하고 있는 과학 글쓰기 문항으로 분석되어, 2009개정 교과서에서 글로벌 이슈 내용을 포함한 과학 글쓰기 문항의 사용 빈도가 증가한 것을 알 수 있었다. 또한, 2007 개정 및 2009 개정 교과서에서 공통적으로 환경 보전과 관련한 과학 글쓰기 문항의 사용 빈도가 가장 높았으며, 2009 개정 교과서에서 사용된 글로벌이슈 내용의 소재가 더욱 다양화된 것으로 분석되었다.

치수시설물 설계기준 개선을 위한 연초과확률 기반의 IDF곡선 산정 및 적용성 평가 (IDF curve Based Annual Exceedance Probability and Its application for Hydraulic Structure Design)

  • 탁우현;엄중현;서재승;김삼은;김형수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.191-191
    • /
    • 2021
  • 최근 이상기후 및 기후변화에 의한 영향으로, 집중호우 및 대형호우 사상이 빈번하게 발생하고 이로 인한 홍수피해가 급증하고 있다. 지난 2020년 한반도 전역에서 발생한 호우사상은 56일간 지속된 최장기간 강우로 기록되었고, 일부 유역에 대해서 500년 빈도의 강우로 기록되기도 하였다. 이는 2020년 기준 치수시설물 설계기준 중 최상위 기준인 200년 빈도를 상회하는 대규모 호우사상으로, 기후위기에 따른 기존 치수대책의 검토가 필요한 실정이다. 이에 본 연구에서는 기존 설계기준 산정을 위한 강우강도-지속기간-빈도 곡선(Intensity-Duration-Frequency curve, IDF curve) 작성 시 사용된 강우 빈도해석의 대안으로서 연초과확률을 이용한 IDF 곡선 산정을 제안하고자 한다. 기존 치수시설물 설계기준에서 활용되고 있는 강우 빈도해석의 경우 분포형의 종류에 따라서 극한사상에 대한 불확실성이 큰 문제를 가지고 있으며, 최상위 기준인 200년 빈도를 넘는 빈도에 대해서 산정된 값을 사용하기에는 어려움이 있다. 또한 통계학적 이론에 근거하여 산정되는 '빈도(Frequency)' 라는 개념의 의미는 발생가능성을 내포한 재현기간으로 명확한 반면, 관련 의사결정자 혹은 민간에서 받아들이는 의미는 발생주기 혹은 재발에 대한 보장기간 등으로 오해하는 경향이 있어, 혼란을 야기하고 있다. 따라서 설계기준 산정을 위한 IDF 곡선 작성시 빈도(Frequency)를 연강우량에 대한 초과확률인 연초과확률(Annual Exceedance Probability)에 근거하여 산정하여 보다 직관적인 설계기준을 제시하고자 한다. 또한 홍수피해 발생이력을 기준으로 대상지역을 선정하고, 기존 빈도(Frequency)에 근거한 IDF 곡선 및 설계기준과 연초과확률에 근거한 IDF 곡선 및 설계기준을 산정 및 비교하여 적용성을 평가하고, 효율적인 치수시설물의 설계기준을 제안하고자 한다.

  • PDF

공공도서관의 사용빈도별 서지 데이터 필드 분석 (Analysis of bibliographic data fields by frequency of use in public libraries)

  • 김주용;신판섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.245-246
    • /
    • 2021
  • 본 논문에서는 차세대 서지 기술 방법인 BIBFRAME의 적용성을 향상하기 위한 사전 연구로, 공공도서관의 서지 데이터 필드를 분석하여 사용빈도가 높은 주요 필드를 선정하고 각 필드별 태그의 의미를 제시한다. 주요 필드 선정은 실제 사용 중인 최신 서지 데이터를 대상으로 분석을 진행하며, 이를 통해 공공도서관의 다양한 KORMARC 서지 데이터 필드 중 BIBFRAME 변환을 위한 주요 데이터 필드를 추출한다.

  • PDF

이변량 지역빈도해석의 한국 극한강우에 대한 적용성 평가 (Assessment of the Bivariate Regional Frequency analysis for The Extreme Rainfalls of South Korea)

  • 신주영;안현준;정창삼;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.12-12
    • /
    • 2018
  • 수공구조물 설계의 기준을 정하기 위해서 수문자료의 빈도해석이 널리 사용되고 있다. 수문자표의 빈도해석 기법으로는 자료의 차원과 기법에 따라서 총 네 개로 구분할 수 있다. 그 네 개의 빈도해석은 다음과 같다 1) 단변량 수문자료와 지점별로 확률분포형 모형을 구축하는 단변량 지점빈도해석, 2) 다변량 수문자료와 지점별로 확률분포형을 구축하는 다변량 지점빈도해석, 3) 단변량 수문자료와 동일지점내의 확률분포모형을 구축하는 단변량 지역빈도해석, 4) 다변량 수문자료와 동일지점내의 확률분포모형을 구축하는 다변량 지역빈도해석. 현재는 다변량 지역빈도해석에 대한 연구사 수문분야에서 활발히 연구되고 있다. 현재 다변량 지역빈도해석에 대한 한국의 극한 강우 자료에 대한 연구가 진행되지 않았기 때문에, 본 연구에서는 이변량 극한강우자료에 대한 다변량 지역빈도해석의 적용성을 평가하였다.

  • PDF

해외 홍수량 자료에 대한 지역빈도해석 적용성 검토 (Application of Regional Frequency Analysis in Oversea's Flood Data)

  • 이영석;조한범
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.405-405
    • /
    • 2021
  • 지점빈도해석은 수문자료의 관측기간이 짧은 경우 확률수문량 산정의 신뢰도가 낮은 경향이 있으므로, 지점 내 충분한 수의 자료확보가 선행되어야 한다. 지역빈도해석은 지점 자료가 부족한 경우 또는 미계측 지점에서 확률수문량을 결정하기 위하여 제안된 방법으로서, 자료수가 부족한 경우 지역빈도해석을 사용하면 효율적이고 안정적으로 확률수문량을 산정할 수 있는 것으로 알려져 있다. 그간 국내 수문자료를 적용한 지역빈도해석에 대해 많은 검토가 이루어져 왔으나, 해외 수문자료에 대해서는 구하기 어려운 점 등의 이유로 상대적으로 검토가 부족했던 바, 본 검토에서는 해외 수문자료를 이용하여 지점빈도해석 및 지역빈도해석을 수행하여 결과를 비교하였다. 지역빈도해석의 기법으로는 지수홍수법 및 지역형상추적법을 적용하였으며, 적용한 지점의 L-변동계수, L-왜곡도계수의 차이에 따라 다른 결과가 나타났다. 일반적으로는 지역형상추적법이 지점빈도해석과 지수홍수법의 절충형으로, 확률수문량 산정결과도 지역형상추적법의 결과가 지점빈도해석과 지수홍수법의 사이에 위치할 것으로 예상하였으나, 어떤 경우에서는 그렇지 않은 결과를 도출하기도 하였다. 따라서, 지역빈도해석은 가급적 두 가지 이상의 방법을 적용한 뒤, 설계자가 자료의 특성에 따라 판단하여 적용해야 할 것으로 판단된다. 향후 국내에 비해 자료가 상대적으로 부족한 해외 수자원사업의 경우, 적은 자료수에서도 안정적인 결과를 산출하는 지역빈도해석의 적용이 필수적으로 판단되며, 해외 자료를 이용한 관련 연구가 지속적으로 이루어져야 할 것이다.

  • PDF

Copula 방법을 통한 강우 빈도 해석 (Rainfall Frequency Analysis Based on the Copula Method)

  • 주경원;신주영;김수영;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.376-380
    • /
    • 2011
  • 강우사상은 강우량, 지속기간, 강우강도 등의 특성으로 표현될 수 있으며 이런 인자들을 같이 고려할수록 그 현상을 보다 종합적으로 표현할 수 있다. 하지만 현재 일반적으로 이루어지는 일변량 빈도해석절차에서는 지속기간을 고정시켜놓고 각 지속시간에 따른 결과만을 도출해 낼 수 있기 때문에 지속기간에 대해 제약적이고 입력자료에 존재하지 않는 지속기간에 대한 결과를 얻기가 어렵다. Copula모델은 두 일변량 분포형을 다변량 분포형으로 연결하여 주는 모델이다. 따라서 강우량과 지속기간을 변수로 사용하면 Copula모델을 통한 이변량 강우빈도해석은 보편적으로 이루어지고 있는 일변량 지점빈도해석보다 지속기간에 대해 유연한 결과를 나타낼 수 있다. 즉, 강우와 지속기간이 동시에 변수로 사용되기 때문에 임의의 지속기간이나 강우에 대해서 확률강우량 및 확률지속기간을 얻을 수 있다. 본 연구에서는 서울지점을 대상으로 1961∼2009년 동안 발생한 강우사상 중 각 년도에서 최대강우량이 발생한 사상을 추출하여 입력자료로 사용하였다. Copula 모형은 Gumbel-Hougaard, Frank, Joe, Clayton, Galambos등 총 5개의 모델을 적용하였고 각 Copula의 매개변수는 준모수방법인 maximum pseudolikelihood estimator를 이용하여 추정하였다.

  • PDF

수문자료의 이변량 확률분포형 매개변수 추정 개선을 위한 Monte-Carlo 모의실험 (Monte-Carlo Simulation for Parameter Estimation of Bivariate Probability Distribution for Hydrological Data)

  • 주경원;김성훈;정영훈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.335-335
    • /
    • 2019
  • 최근 수문자료에 대한 다변량 빈도해석 연구가 활발히 이루어지고 있다. 하나의 자료를 확률변수로 사용하는 단변량 빈도해석에 비해 여러 수문자료를 조합하여 동시에 추정할 수 있는 다변량 빈도해석은 수문자료의 상관성을 고려하면서 확률분포형을 추정할 수 있다는 장점이 있다. 이에 다변량 확률분포형을 이용한 빈도해석 과정 중 정확한 매개변수 추정을 위한 연구도 최근 여러방면으로 이루어지고 있다. 본 연구에서는 다변량 확률분포형의 매개변수 추정방법 중 기존에 주로 사용되고 있는 의사최우도법(MPL, Maximum Pseudo-Likelihood method)의 성능을 개선하기 위해 기존의 방법과 본 연구에서 제안하는 매개변수 추정방법의 Monte-Carlo 모의실험을 수행하였다. 일반적으로 수문자료는 양(+)의 왜곡도계수를 갖기 때문에 GEV(Geveralized Extreme Value) 분포형을 모분포로 하여 각 방법의 정확성을 검토하였다. 모의실험을 수행한 결과, 기존의사최우도법에서 Weibull 식을 이용하여 순위통계량을 계산하는 방법보다 본 연구에서 제안한 왜곡도를 고려하는 순위통계량을 사용하는 것이 더 정확한 매개변수 추정결과를 보여주는 것으로 나타났다.

  • PDF

데스크탑 PC를 위한 적응형 메뉴의 사용성 비교 평가 (A Usability Evaluation of Adaptive Split, Adaptive Style, and Adaptable Menus for Desktop PCs)

  • 박정철;한성호;박용성;조영석
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.419-424
    • /
    • 2006
  • 본 연구는 데스크탑 PC 환경에서 사용될 수 있는 다양한 적응형 메뉴 인터페이스의 사용성을 평가한다. 선택 빈도에 따라 자동으로 변화하는 2가지 방식의 Adaptive menu와 사용자가 메뉴 내에서 원하는 항목의 위치를 직접 변경하는 Adaptable menu의 사용성을 일반적으로 많이 이용되는 Traditional menu와 비교하기 위해 사용자를 동원한 평가 실험을 수행하였다. Adaptive menu에는 선택 빈도가 높은 메뉴 항목이 메뉴의 상단으로 이동하는 Adaptive split menu와 자주 선택되는 항목이 굵은 글씨로 표현되는 Adaptive style menu가 포함된다. 각 방식의 적응형 메뉴가 자주 선택되는 메뉴 항목의 변화에 따라 얼마나 민감하게 영향을 받는지 비교하기 위해, 두 개의 각기 다른 선택 빈도 분포가 이용되었다. 각 실험 조건 별로 사용자가 메뉴 항목을 선택하는 데 걸린 시간과 오류 회수를 측정하였으며, 피실험자로 하여금 시인성, 효율성, 전반적 선호도 등의 주관적인 만족도를 평가하도록 하였다. 각각의 종속 변수들은 분산 분석(ANOVA), Chi-square test, Friedman test 등의 기법을 이용해 분석되었다. 분석 결과, Adaptable menu가 다른 방식의 메뉴들에 비해 수행도와 만족도 모두 높은 것으로 나타났으며, Adaptive split menu는 상대적으로 현실적인 조건 하에서 큰 효용을 갖지 못하는 것으로 나타났다. Adaptive style menu는 수행도 측면에서는 일반적인 메뉴와 큰 차이가 없었지만, 자주 선택되는 항목을 쉽게 파악할 수 있게 해 주고, 선택 빈도의 변화에도 민감하지 않기 때문에 사용자들에게 선호되는 것으로 나타났다. 본 연구의 결과는 데스크탑 PC의 적응형 메뉴 설계에 대한 이용될 수 있으며, 추후 휴대용 정보기기의 적응형 메뉴에 대한 사용성 연구의 기초 자료로도 활용될 수 있을 것으로 기대된다.

  • PDF