• 제목/요약/키워드: Data & Knowledge Engineering

검색결과 1,311건 처리시간 0.028초

국가 과학기술 표준분류 체계 기반 연구보고서 문서의 자동 분류 연구 (Research on Text Classification of Research Reports using Korea National Science and Technology Standards Classification Codes)

  • 최종윤;한혁;정유철
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.169-177
    • /
    • 2020
  • 과학기술 분야의 연구·개발 결과는 연구보고서 형태로 국가과학기술정보서비스(NTIS)에 제출된다. 각 연구보고서는 국가과학기술 표준 분류체계 (K-NSCC)에 따른 분류코드를 가지고 있는데, 보고서 작성자가 제출 시에 수동으로 입력하게끔 되어있다. 하지만 2000여 개가 넘는 세분류를 가지고 있기에, 분류체계에 대한 정확한 이해가 없이는 부정확한 분류코드를 선택하기 십상이다. 새로이 수집되는 연구보고서의 양과 다양성을 고려해 볼 때, 이들을 기계적으로 보다 정확하게 분류할 수 있다면 보고서 제출자의 수고를 덜어줄 수 있을 뿐만 아니라, 다른 부가 가치적인 분석 서비스들과의 연계가 수월할 것이다. 하지만, 국내에서 과학기술표준 분류체계에 기반을 둔 문서 자동 분류 연구 사례는 거의 없으며 공개된 학습데이터도 전무하다. 본 연구는 KISTI가 보유하고 있는 최근 5년간 (2013년~2017년) NTIS 연구보고서 메타정보를 활용한 최초의 시도로써, 방대한 과학기술표준 분류체계를 기반으로 하는 국내 연구보고서들을 대상으로 높은 성능을 보이는 문서 자동 분류기법을 도출하는 연구를 진행하였다. 이를 위해, 과학기술 표준분류 체계에서 과학기술 분야의 연구보고서를 분류하기에 적합한 중분류 210여 개를 선별하였으며, 연구보고서 메타 데이터의 특성을 고려한 전처리를 진행하였다. 특히, 가장 영향력 있는 필드인 과제명(제목)과 키워드만을 이용한 TK_CNN 기반의 딥러닝 기법을 제안한다. 제안 모델은 텍스트 분류에서 좋은 성능을 보이고 있는 기계학습법들 (예, Linear SVC, CNN, GRU등)과 비교하였으며, Top-3 F1점수 기준으로 1~7%에 이르는 성능 우위를 확인하였다.

로그 및 지수형 결함 발생률에 따른 소프트웨어 신뢰성 모형에 관한 신뢰도 성능분석 연구 (The Study for Performance Analysis of Software Reliability Model using Fault Detection Rate based on Logarithmic and Exponential Type)

  • 김희철;신현철
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권3호
    • /
    • pp.306-311
    • /
    • 2016
  • 소프트웨어 개발과정에서 소프트웨어 신뢰성은 매우 중요한 이슈이다. 소프트웨어 고장분석을 위한 유한고장 비동질적인 포아송과정에서 고장발생률이 상수이거나, 단조 증가 또는 단조 감소하는 패턴을 가질 수 있다. 본 연구에서는 소프트웨어 제품 테스팅 과정에서 관측고장시간에 근거한 로그 및 지수형 결함 발생률을 고려한 소프트웨어 신뢰성 모형에 대하여 연구 하였다. 신뢰성 분야에서 많이 사용되는 Goel-Okumoto모형을 이용한 새로운 로그 및 지수형 결함 확률을 반영한 문제를 제시하였다. 수명분포는 유한고장 비동질적인 포아송과정을 이용하고 모수추정법은 최우 추정법을 이용 하였다. 따라서 본 논문에서는 로그 및 지수형 결함발생률을 고려한 소프트웨어 모형분석을 위하여 소프트웨어 고장 시간간격 자료를 적용하여 비교 분석하였다. 본 연구에서 제안된 방법은 로그 및 지수형 결함발생률을 고려한모형도 신뢰성 측면에서 효율적이기 때문에 (결정계수가 80% 이상) 이 분야에서 기존 모형의 하나의 대안으로 사용할 수 있음을 확인 할 수 있었다. 이 연구를 통하여 소프트웨어 개발자들은 다양한 수명분포를 고려함으로서 소프트웨어 고장형태에 대한 사전지식을 파악하는데 도움을 줄 수 있으리라 사료 된다.

Bulk tank milk의 품질평가를 위한 퍼지기반 추론 (Fuzzy reasoning for assessing bulk tank milk quality)

  • 김태운;정대유
    • 지능정보연구
    • /
    • 제10권3호
    • /
    • pp.39-57
    • /
    • 2004
  • 우유생산 농가에서는 그들 젖소의 우유를 저장하는 탱크 (bulk tank milk: BTM)로부터 채취된 샘플로부터 분석된 우유에 대한 품질관련 항목들, 즉 체세포 수 (somatic cell count: SCC), 표준 plate count (standard plate count: SPC), 사전 incubation count (preliminary incubation count: PIC) 등에 관한 정보를 정기적으로 제공 받는다. 이러한 정보는 일정기간 쌓이게 되면 우유의 품질을 유지하고 목장을 관리할 수 있는 중요한 지식 베이스가 될 수 있다. 그러나 우유 품질이나 목장의 관리상태를 평가하는 기준은 모호하고 퍼지한 용어로 많이 표현되고 있다. 즉 우유 품질을 최상급, 상급, 중간, 불량으로 표시하거나 목장의 관리상태를 아주 양호, 양호, 미흡 등으로 표시한다. 이러한 서술방식은 퍼지이론에서의 모호한 상태를 표현하는 기준과 많이 부합되고 있다. 본 연구의 목적은 BTM으로부터 추출한 샘플로부터 미생물학적 분석을 통해서 나온 결과를 이용해서 BTM의 품질과 목장의 관리상태에 대하여 추론하는 것을 목표로 하고 있다. 따라서 퍼지추론엔진에 기초하여 퍼지로직 기반의 추론방법을 개발하고 실제 데이터를 이용해서 평가하였다. 입력 데이터로는 Bulk Tank SCC, SPC, PIC, laboratory pasteurization count (LPC), non agalactiae Streptococci, Streptococci like organisms, Staphylococcus aureus등이다. 이러한 입력자료에 근거하여 BTM의 품질상태를 아주 양호, 양호, cooling문제, 청결문제, 환경적 mastitis, 환경적/청결 복합문제로 분류하고, 낙농가로부터 채취한 실제 데이터를 이용하여 추론하였다. 본 퍼지 추론 결과는 낙농생산자, 컨설턴트, 수의사 등 관련 종사자들에게 의사결정을 위한 참고자료로서 활용이 가능하다.

  • PDF

다시기 Sentinel-2A 영상을 활용한 산불피해 변화탐지 및 NBR 오분류 픽셀 탐지 (Detection of Forest Fire and NBR Mis-classified Pixel Using Multi-temporal Sentinel-2A Images)

  • 윤형진;정종철
    • 대한원격탐사학회지
    • /
    • 제35권6_2호
    • /
    • pp.1107-1115
    • /
    • 2019
  • 산불 피해와 관련하여 위성영상을 활용한 분석은 넓은 면적을 빠르게 분석하는 장점이 있다. 본 연구에서는 2019년 4월 4일 속초에서 발생한 산불 피해에 따른 산림의 변화 탐지를 위해 7장의 Sentinel-2A영상을 활용하였다. 산불피해지역 분류 과정은 NBR(normalized burn ratio) 값의 전후 시기 차이를 나타낸 dNBR(difference normalized burn ratio)을 통해 산불피해 정도를 7가지 단계로 분류하였다. 분류과정에서 본 연구는 식생의 재성장지수가 높은 3지역을 선정하여 해당 지역에 대한 세밀한 공간 분석을 실시하였다. dNBR 분석 결과는 활엽수림보다 침엽수림의 식생 재성장 분류가 큰 폭으로 나타났으나, NDVI를 통한 결과에서 가장 낮은 평균값을 보여주었다. 이는 침엽수림의 dNBR 오차범위로 나타난다. 시계열 결과로는 4월 20일과 5월 3일 사이를 기준으로 산불피해 면적이 큰 폭으로 감소하였다. 이는 경과한 시기의 활엽수림에서 하층 식생의 발달 및 식생 증가에 따른 피해 완화로 예를 들 수 있다. 본 연구 결과는 발생하는 산불 피해에 대하여 산림 분류 별 면적 변화를 통해 변화 탐지를 실시하였으며, NDVI와 dNBR 비교를 통해 침엽수림이 가장 높은 분류 오차가 발생한다는 결론을 도출하였다. 따라서 dNBR을 통한 영상분류과정에서 현장조사를 동반한 정밀한 국내 산불피해 등급표를 개선해야 할 필요성을 제시하였다.

Balancing Water Supply Reliability, Flood Hazard Mitigation and Environmental Resilience in Large River Systems

  • Goodwin, Peter
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.1-1
    • /
    • 2016
  • Many of the world's large ecosystems are severely stressed due to population growth, water quality and quantity problems, vulnerability to flood and drought, and the loss of native species and cultural resources. Consequences of climate change further increase uncertainties about the future. These major societal challenges must be addressed through innovations in governance, policy, and ways of implementing management strategies. Science and engineering play a critical role in helping define possible alternative futures that could be achieved and the possible consequences to economic development, quality of life, and sustainability of ecosystem services. Science has advanced rapidly during the past decade with the emergence of science communities coalescing around 'Grand Challenges' and the maturation of how these communities function has resulted in large interdisciplinary research networks. An example is the River Experiment Center of KICT that engages researchers from throughout Korea and the world. This trend has been complemented by major advances in sensor technologies and data synthesis to accelerate knowledge discovery. These factors combine to allow scientific debate to occur in a more open and transparent manner. The availability of information and improved communication of scientific and engineering issues is raising the level of dialogue at the science-policy interface. However, severe challenges persist since scientific discovery does not occur on the same timeframe as management actions, policy decisions or at the pace sometimes expected by elected officials. Common challenges include the need to make decisions in the face of considerable uncertainty, ensuring research results are actionable and preventing science being used by special interests to delay or obsfucate decisions. These challenges are explored in the context of examples from the United States, including the California Bay-Delta system. California transfers water from the wetter northern part of the state to the drier southern part of the state through the Central Valley Project since 1940 and this was supplemented by the State Water Project in 1973. The scale of these activities is remarkable: approximately two thirds of the population of Californians rely on water from the Delta, these waters also irrigate up to 45% of the fruits & vegetables produced in the US, and about 80% of California's commercial fishery species live in or migrate through the Bay-Delta. This Delta region is a global hotspot for biodiversity that provides habitat for over 700 species, but is also a hotspot for the loss of biodiversity with more than 25 species currently listed by the Endangered Species Act. Understanding the decline of the fragile ecosystem of the Bay-Delta system and the potential consequences to economic growth if water transfers are reduced for the environment, the California State Legislature passed landmark legislation in 2009 (CA Water Code SS 85054) that established "Coequal goals of providing a more reliable water supply for California and protecting, restoring, and enhancing the Delta ecosystem". The legislation also stated that "The coequal goals shall be achieved in a manner that protects and enhances the unique cultural, recreational, natural resource, and agricultural values of the Delta as an evolving place." The challenges of integrating policy, management and scientific research will be described through this and other international examples.

  • PDF

계획된 행동 이론을 적용한 화재안전교육이 요양보호사 교육생들의 화재안전행동에 미치는 효과 (Effect of Fire Safety Education Based on the Theory of Planned Behavior on the Fire Safety Behavior of Care Worker Trainees)

  • 변도화
    • 한국화재소방학회논문지
    • /
    • 제33권1호
    • /
    • pp.147-155
    • /
    • 2019
  • 본 연구는 요양보호사 교육생들을 대상으로 화재안전교육의 효과를 규명하기 위한 유사실험연구로 비동등성 대조군 전후시차설계(Non-equivalent control group no-synchronized design)이다. 연구대상자는 S요양보호사 교육원의 교육생으로 실험군 28명, 대조군 29명으로 총 57명 이었다. 실험처치기간은 2018년 5월 21일부터 6월 14일까지 주 1회씩 총 4회로 구성하여 화재안전교육을 실시하였다. 자료분석은 ${\chi}^2-test$, t-test로 분석하였다. 연구결과 화재안전교육은 요양보호사 교육생들의 화재안전에 대한 지식, 화재안전에 대한 태도, 화재안전에 대한 지각된 행동통제, 화재안전 행동의도, 화재안전 행동을 증진시키는데 효과적인 교육으로 일상생활에서 화재안전행동실천에 유용하게 활용될 수 있을 것이라 기대된다. 반면 화재안전에 대한 주관적 규범은 유의한 차이가 없는 것으로 나타나 화재안전에 대한 주관적 규범의 효과를 검증하는 후속연구를 제언한다.

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.

지구과학 논문의 언어 특성 이해: 레지스터 분석 (Understanding of the Linguistic Features of Earth Science Treatises: Register Analysis Approach)

  • 맹승호;신명환;차현정;함석진;신현정;김찬종
    • 한국지구과학회지
    • /
    • 제31권7호
    • /
    • pp.785-797
    • /
    • 2010
  • 이 연구에서는 과학 논문 레지스터를 분석하여 지구과학 논문의 언어 특성을 탐색하였다. 연구 자료로 지질과학, 대기과학, 해양과학의 한국어 논문 1편씩을 선정하였다. 지구과학 논문 레지스터의 특징은 다음과 같다. 첫째, 주제부와 설명부 간의 의미적, 지시적 연결이 체계적으로 이루어지고 있으며, 이를 통해 텍스트가 제시하려는 메시지와 요점이 통일적으로 응집력 있게 제시되었다. 둘째, 각 텍스트의 장르 요소에 따라 연역적 추론 또는 귀추적 추론 관계 및 인과 관계를 나타내는 술어들이 사용되었으며, 논리적 관계는 접속어구보다는 술어의 유형을 통해 표현되었다. 셋째, 대부분의 논문 텍스트에서 가능성을 나타내는 인식적 술어를 사용하여 과학자들의 해석과 설명 및 주장을 간접적으로 표현하는 약한 상호관계를 형성하였다. 연구 결과를 근거로 학생들이 과학 학습 과정에서 과학 텍스트에 대한 문해 능력을 높이고, 과학자들의 지식 구성 방식을 이해하기 위해서는 과학 글에서 각 문장을 구성하는 주제부와 설명부의 연결 관계를 파악하고, 술어의 유형에 따라 논리적 관계를 조사하는 과학 언어 풀어내기 활동이 과학 교육과정에 포함되어야 함을 논의하였다.

중소형 의료 환경에서 U-헬스케어 서비스 향상을 위한 전문가 시스템 기반 IT/의료 융합 솔루션 (An IT/Medical Converged Solution based on the Expert System for Enhancing U-Healthcare Services in Middle-sized Medical Environment)

  • 류동우;강경진;조민수
    • 한국산학기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.1318-1324
    • /
    • 2010
  • 최근들어, U-헬스케어는 진료에 있어 인력 및 시간 등 많은 비용을 절감할 수 있는 연구로 주목받고 있다. 그러나, 센싱, 측정 등 헬스케어에 대한 기반 기술들은 충분히 연구된 반면, IT 기술이 의료 기술과 접목된 IT/의료 융합 기술은 아직 초기 단계에 있다. 이에 본 논문에서는 이미 검증된 기술들과 전문가 시스템을 기반으로 개인 병원이나 가정 등의 중소형 의료 환경에 적용 가능한 U-헬스 케어 솔루션으로서의 헬스케어 시스템을 제안한다. 그 동안 IT 분야의 눈부신 발전으로 네트워크 및 데이터베이스 등 타 분야에 융합 가능한 IT 요소 기술들이 충분히 발전해 있고, 헬스케어의 경우 시간보다는 임무 수행이 중요한(Mission-Critical) 환경이므로, 새로운 기술 개발도 중요하지만 이미 검증된 기술들을 활용하는 것이 바람직하다. 제안된 솔루션은 전문가 시스템을 기반으로 체지방, 혈압, 그리고 혈당 등의 측정된 데이터를 이용해 자동화된 의료 서비스를 제공한다. 또한 의사와 간호사, 관계자등에게 편리한 진료 환경을 제공한다. 또한, 필요시 전문 지식이 없는 사람들도 자가 진단이 가능하므로 향 후 다양한 방면에서 의료 서비스 비용 절감이 기대된다. 특히, 각 장비들이 표준화된 블루투스 기술을 통해 통신하므로, 다양한 의료기기로 확장 가능한 솔루션이다. 이로부터, 우리는 전문가 시스템을 통한 비용 절감에 의해 U-헬스케어의 자가 측정 및 진단 서비스가 향상되었다고 말할 수 있다.

통합유사도 함수의 이용과 시간정보를 고려한 협업필터링 기반의 추천시스템 (New Collaborative Filtering Based on Similarity Integration and Temporal Information)

  • 최근호;김건우;유동희;서용무
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.147-168
    • /
    • 2011
  • 상품 및 서비스에 대한 개인화된 추천 서비스가 중요해짐에 따라, 많은 연구자들은 추천시스템 개발을 위한 다양한 지식과 기법들을 제공해왔다. 이러한 기법들 중에서 협업 필터링(Collaborative Fitering) 기법은 여러 분야에서 널리 사용되고 있으며, 그 유용성이 입증되었다. 하지만, 추천시스템의 성능을 더욱 높이기 위해서 현재의 협업 필터링 기법은 다음과 같은 점들을 고려해야 한다. 첫째, 대부분의 추천시스템과 관련한 연구에서 특정 고객과 성향이 유사한 다른 고객들을 찾기 위해 사용되는 유사도 함수들(Similarity Functions)은 대부분 특정한 관점에 초점을 두고 있기 때문에 다양한 관점에서 성향이 유사한 다른 고객들을 찾는데 한계를 가진다. 따라서, 특정 관점에 치우치지 않는 통합된 유사도 함수를 사용해야 할 필요가 있다. 둘째, 고객들의 성향은 시간이 지남에 따라 변화하기 때문에, 이를 추천결과에 반영하기 위해서는 시간에 따른 고객들의 구매 성향의 변화를 고려해야 한다. 본 연구는 여러 실험들을 통해 다음의 가설을 검정하는 것을 목적으로 하였다-다양한 관점이 동시에 반영된 통합 유사도 함수의 이용과 시간정보를 이용한 사용자의 구매 성향의 변화를 반영할 경우 추천의 정확도가 향상될 것이다. 다양한 실험을 통해, 본 연구에서 제시한 추천시스템은 전통적인 협업 필터링 기반의 추천시스템들에 비해 일반적으로 상당히 높은 정확도를 보였으며 이를 통해, 본 연구에서 제시한 가설이 채택될 수 있음을 확인하였다.