• Title/Summary/Keyword: 이용통계표준

Search Result 631, Processing Time 0.025 seconds

Detecting and classification ADRs using Named Entity Recognition on social media (개체명 인식을 이용한 소셜 미디어에서의 약물 부작용 표현 추출 및 분류)

  • Jeong, Hyeon-jeong;Kim, Hyon Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.443-446
    • /
    • 2021
  • 의약품에 대한 안전성 정보 수집과 관리는 온라인, 오프라인을 통해 약물 이상 사례를 보고받는 형태로 진행되고 있다. 하지만 소비자들의 자발적인 참여로 이루어지므로 실제 발생하는 약물 부작용보다 데이터가 현저히 적다는 단점이 존재한다. 본 논문에서는 약물 이상 데이터 희소성 문제를 해결 할 수 있도록 소셜 미디어에서 약물 부작용 표현을 찾을 수 있도록 하였다. 소셜 미디어의 경우에는 표준 약물 부작용 용어를 사용하기보다는 일반인들이 자연어로 표현한 경우가 많으므로 개체명 인식 기법을 이용해 부작용을 추출할 수 있는 모델을 개발하였다. 또한 추출된 부작용 표현을 표준용어로 분류할 수 있는 모델을 제시하였다. 실험 결과 제안한 두 가지 모델은 0.9 이상의 정확도를 얻을 수 있었으며, 일반 사용자들이 자연어로 표현한 약물 부작용 표현을 효과적으로 찾아내고 표준 부작용 용어로 매핑할 수 있음을 보여준다.

An Outstanding Issues fey a New Practical Model of Korean Library Statistics (관종별 한국도서관통계 실용안개발 현안 및 개발방향)

  • Ahn, In-Ja;Hoang, Gum-Sook;Oh, Se-Hoon;Chang, Hye-Young
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.41 no.1
    • /
    • pp.431-451
    • /
    • 2007
  • As a new practical model of Korean Library statistics, It suggests 6 parts, fifty-four items for 4 types of libraries. In comparison with last version, 'library use and users', 'electronic services' parts are increased which are occupied as more than hair of the whole statistical items. Budget parts are increased also. The new model which is developed based on the international standards like ISO2789 and NISO/ANSI Z39.7 is advised by professionals in the fields.

통계적 컬러영상처리를 이용한 사과의 색 선별 시스템 개발

  • Im, Dong-Hoon
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.143-148
    • /
    • 2003
  • 본 논문에서는 통계적 방법에 기초한 사과 선별시스템을 이용하여 사과의 색깔을 식별하고자 한다. 이를 위해 T-검정을 이용하여 에지를 검출하였고 검출된 에지로부터 체인코드를 이용하여 사과 영상의 경계선과 환상대 영역을 구하였다. 우리는 주어진 사과영상의 환상대 영역으로부터 R, G, B 채널상에서 히스토그램과 평균 명암값을 구하여 색깔 판정용 표준사과로부터 얻은 기준값들과 비교함으로서 사과의 색깔을 식별하였다.

  • PDF

Urban flood prediction through the linkage between the statistical characteristics of rainfall and the AI model (강우의 통계적 특성과 AI 모형의 연계를 통한 도시침수예측)

  • Lee, Yeonsu;Yoo, Jaehwan;Kim, Hyun-il;Kim, Byunghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.97-97
    • /
    • 2022
  • AI 모형을 적용한 도시지역 침수예측에 대한 연구는 꾸준히 수행되어 왔다. AI 모형을 이용해 도시침수예측을 하기 위해서는 모형에 강우자료를 학습시키게 되는데, 시계열 강우분포 자료를AI 모형의 학습자료로 사용하기에 자료의 양이 너무 많기 때문에 총 강우량만을 이용하여 도시침수예측을 수행한 바 있다(Kim et al., 2021). 하지만 총 강우량만을 AI 모형에 학습시킬 경우, 지속기간 동안 강우가 고르게 분포하는지 불규칙적으로 분포하는지에 대한 정보가 포함되지 않았기 때문에 침수예측력이 떨어질 수 있다. 따라서 본 연구에서는 시계열 강우자료의 통계치를 산정하여 AI 모형에 학습시킴으로써 강우분포특성을 고려한 침수예측을 통해 예측력을 높이고자 한다. 총 강우량만을 학습시킬 경우, 같은 지속시간에 같은 양의 강우가 내리더라도 고른 분포를 가진 강우에 의해서는 실제 침수는 작게 일어나므로 과대예측을, 전체 지속시간 중 특정 시간대에 편향된 분포를 가진 강우에 의해서는 실제 침수가 크게 일어나므로 과소예측을 하는 문제가 발생할 수 있다. 따라서 표준편차를 평균 강우량으로 나눈 값인 변동계수, 강우분포의 뾰족한 정도를 나타내는 첨도, 평균값에 대해 어느 방향으로 비대칭인지를 나타내는 왜도 값을 추가로 학습시킴으로써 시계열 강우자료 전체를 학습시키지 않고도 강우분포를 학습시키지 않았을 때 발생하는 과소·과대예측 문제를 해결할 수 있다. 또한 변동계수 대신 표준편차를 학습시키는 모형, 변동계수와 표준편차를 모두 학습시키지 않는 모형, 변동계수와 표준편차를 모두 학습시키는 모형과의 침수예측 결과 비교를 통해 표준편차와 변동계수 중 어떤 통계치를 학습시키는 것이 적합한지와 비슷한 통계치 자료를 모두 학습시켰을 때의 과적합 문제 등에 대한 결론를 얻을 수 있다.

  • PDF

A Decision-support System for Care Plan in Long-term Care Insurance (의사결정나무기법을 활용한 노인장기요양보험 표준급여모형 개발)

  • Han, Eun-Jeong;Lee, Jung-Suk;Kim, Dong-Geon;Kwon, Jinhee
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.5
    • /
    • pp.667-679
    • /
    • 2014
  • National Health Insurance Service(NHIS) provide care-plans for beneficiaries in the long-term care insurance(LTCI) systems that help them use LTC services appropriately. The care-plan includes recommendations for the most adequate type of care (gold standard) for beneficiaries. This study develops a decision-support system to determine the appropriate type of care plan. To develop a model, we used a data set that well-trained assessors in the NHIS investigated as a gold standard for beneficiaries: nursing home care, home-visit care, home-visit bathing, home-visit nursing, or day and night care. The decision-support system was established through a decision-tree model, because it may be easy to explain the algorithm of a decision-support system to working groups and policy makers. Our results might be useful in evidence-based care planning in an LTCI system and contribute to the efficient use of LTC services.

표준품질지수

  • 한근식
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.41-48
    • /
    • 2004
  • 2002년 10월 유럽통계협회는 품질지수개발을 위해 협회소속국가들이 연합하여 특별연구팀을 발족시켰다. 이 팀의 주목적은 유럽통계협회에서 생산되는 자료의 품질을 측정하기 위해 대표성이 있으며, 계산하기 쉽고, 이해하기 쉬운 지수를 개발하는 것이었다. 유럽 통계협회는 연구팀에서 개발한 지수를 이용하여 내부품질보고서를 작성하도록 결정하였다. 개발된 풀질지수들은 유럽 통계협회 소속 국가에 의해 생산된 통계에 적용하기 적합해야하며 유럽전체를 위해 Eurostat 이 보유하고 있는 통계에도 적합해야한다. 그러므로 지수들은 각 국이 합의한 용어, 공식, 변수, 도메인, 분석의 정도를 고려하여 개발되도록 하였다. 이러한 지수는 정기적으로 생산되도록 규정하고 있으며 이 규정이 지켜지기 위해서는 동일한 변수, 공식 통이 적용되어야함은 물론이고 시계열의 유지를 위해 관련된 메타데이터가 제공되어야한다. 서로 다른 조사결과로부터 관련된 통계량의 측정과 개념들간의 차이를 확인하기 위해서 메타데이터는 반드시 필요하며 품질보고서가 있는 경우 많은 도움이 릴 것이다. 본 연구에서는 동계생산자의 관점에서 본 각각의 품질 요소에 따라서 생산된 다양한 통계의 풀질을 평가하기 위해서 개발된 일련의 표준화된 품질지수를 제시할 것이다. 각 지수들의 정의와 가장 대표적인 지수산출을 제안하고 지수산출을 위해 필요한 메타데이터를 선명한 것이다.

  • PDF

대학별고사를 위한 문항분석, 표준점수, 검사동등화

  • 성태제
    • Communications for Statistical Applications and Methods
    • /
    • v.1 no.1
    • /
    • pp.206-214
    • /
    • 1994
  • 본 논문은 1994학년도 부터 부활된 대학별고사 실시에 따른 문항분석, 표준 점수제 그리고 검사동등화의 문제점을 지적하기 위하여 교육측정이론의 기본 개념을 소개하는데 있다. 대학별고사의 타당성과 신뢰성을 보장받기 위하여는 양질의 문항제작이 우선하여야하며, 이를 위하여 문항분석은 종전에 사용하던 고전검사이론 보다는 문항반응이론을 이용하는 것이 바람직하다. 문항반응이론에 의한 문항분석은 피험자 집단의 특성에 의하여 문항특성이 달리 분석되지 않는 특징을 지니고 있기 때문이다. 문항이 논술형일 경우 채점자간 신뢰도와 채점자 내 신뢰도를 간과하여서는 안될 것이다. 다양한 선택과목을 채택하는 대학별 고사에서 입학 사정을 위하여 원점수를 사용하거나, 표준점수 혹은 검사동등화 방법을 이용하고 있으나 이는 교육측정이론에 위배된다. 다른 과목에 대한 인가의 능력을 상대비교 할 수 없으며, 표준점수와 검사동등화는 동일 능력에 대한 상대비교를 위한 방법이다. 특히 검사동등화는 동일 특성, 공정성, 모교집단 불변성, 대칭성을 전제한다. 표준점수제에 의하여 수험생들의 다른 능력을 상대 비교하는 방법은 다른 능력이 점수로 표현되기 때문에 가능하나 그 점수가 무엇을 의미하는 가를 분석할 때는 교육평가의 기본 철학에도 위배된다.

  • PDF

A Study on the Acquisition of Usage Statistics based on SUSHI Project (SUSHI 기반 학술정보 이용통계 수집 모델 연구)

  • Kim, Sun-Tae;Lim, seok-Jong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.35-39
    • /
    • 2007
  • Recently Usage statistics are widely available from online content providers. However. the statistics are not yet available in a consistent data container and the administrative cost of individual provider-by-provider downloads is high. The Standardized Usage Statistics Harvesting Initiative (SUSHI) is developing an automated request and response protocol for moving Project COUNTER (Counting Online Usage of Networked Electronic Resources) Code of Practice usage statistics from providers to library electronic repositories. SUSHI will help libraries make better decisions by reducing the administrative overhead of using Project COUNTER statistics. Publishers in the recording and exchange of usage statistics for electronic resources, initially journals and databases. By following COUNTER's Code of Practice, vendors can provide library customers with Excel or CSV (comma delimited) files of usage data using COUNTER's standardized formats and data elements. The result is a consistent, credible, and compatible set of usage data from multiple content providers. On this study, We propose the acquisition model of usage data based on SUSHI for KESLI that is overseas electronic journal consortium in korea.

  • PDF

A Study on the Estimation of Standard Deviation of Least Absolute Deviation Estimators of Regression Coefficients (회귀계수의 최소절대편차추정량의 표준편차 추정법)

  • 이기훈;정성석
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.463-473
    • /
    • 2001
  • 선형모형의 회귀계수의 L$_1$-추정량의 점근분포는 오차항의 중앙값에 종속되어있는데, 이 값은 잔차의 순서통계량의 함수로 추정될 수 있다. 본 논문에서는 오차항 중앙값의 추정량을 유도하는 몇 가지 방법을 소개하고 몬테칼로 실험을 통하여 가장 바람직한 추정량의 형태를 제안하였다. 또한 제안한 추정량을 이용하면 검정문제에서도 좋은 결과를 얻을 수 있음을 보였다.

  • PDF

Automatic Generation of Standard Classification Code (표준 통계 분류 코드 자동 생성)

  • Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.05a
    • /
    • pp.388-390
    • /
    • 2006
  • 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용하는 한국어 표준 산업/직업 코드 자동분류 시스템을 제안한다. 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다.

  • PDF