• 제목/요약/키워드: Pre-processing Process

검색결과 483건 처리시간 0.038초

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용 (Research on ITB Contract Terms Classification Model for Risk Management in EPC Projects: Deep Learning-Based PLM Ensemble Techniques)

  • 이현상;이원석;조보근;이희준;오상진;유상우;남마루;이현식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권11호
    • /
    • pp.471-480
    • /
    • 2023
  • 국내 건설수주 규모는 2013년 91.3조원에서 2021년 총 212조원으로 특히 민간부문에서 크게 성장하였다. 국내외 시장 규모가 성장하면서, EPC(Engineering, Procurement, Construction) 프로젝트의 규모와 복잡성이 더욱 증가되고, 이에 프로젝트 관리 및 ITB(Invitation to Bid) 문서의 위험 관리가 중요한 이슈가 되고 있다. EPC 프로젝트 발주 이후 입찰 절차에서 실제 건설 회사에게 부여되는 대응 시간은 한정적일 뿐만 아니라, 인력 및 비용의 문제로 ITB 문서 계약 조항의 모든 리스크를 검토하는데 매우 어려움이 있다. 기존 연구에서는 이와 같은 문제를 해결하고자 EPC 계약 문서의 위험 조항을 범주화하고, 이를 AI 기반으로 탐지하려는 시도가 있었으나, 이는 레이블링 데이터 활용의 한계와 클래스 불균형과 같은 데이터 측면의 문제로 실무에서 활용할 수 있는 수준의 지원 시스템으로 활용하기 어려운 상황이다. 따라서 본 연구는 기존 연구와 같이 위험 조항 자체를 정의하고 분류하는 것이 아니라, FIDIC Yellow 2017(국제 컨설팅엔지니어링 연맹 표준 계약 조건) 기준 계약 조항을 세부적으로 분류할 수 있는 AI 모델을 개발하고자 한다. 프로젝트의 규모, 유형에 따라서 세부적으로 검토해야 하는 계약 조항이 다를 수 있기 때문에 이와 같은 다중 텍스트 분류 기능이 필요하다. 본 연구는 다중 텍스트 분류 모델의 성능 고도화를 위해서 최근 텍스트 데이터의 컨텍스트를 효율적으로 학습할 수 있는 ELECTRA PLM(Pre-trained Language Model)을 사전학습 단계부터 개발하고, 해당 모델의 성능을 검증하기 위해서 총 4단계 실험을 진행했다. 실험 결과, 자체 개발한 ITB-ELECTRA 모델 및 Legal-BERT의 앙상블 버전이 57개 계약 조항 분류에서 가중 평균 F1-Score 기준 76%로 가장 우수한 성능을 달성했다.

흑삼 열수 추출물의 항산화 효과를 통한 염산/에탄올로 유발된 위염 억제 작용 (Inhibitory Activities of Water Extracts of Black Ginseng on HCl/Ethanol-Induced Acute Gastritis through Anti-Oxidant Effect)

  • 김민영;권오준;노정숙;노성수
    • 한국식품영양과학회지
    • /
    • 제45권9호
    • /
    • pp.1249-1256
    • /
    • 2016
  • 백삼을 9회 증숙 및 건조 과정 후 제조한 흑삼의 항산화 효과급성위염 유발 모델에서 점막 보호 효과를 확인하기 위하여 증숙 횟수별 추출한 시료를 통해 실험을 진행하였다. 백삼과 흑삼의 증숙 횟수에 따른 추출물의 성분을 분석한 결과 백삼과 비교하여 흑삼 추출물에서 모두 유효성분의 양이 증가하는 것을 확인하였고, 특히 9회 반복 과정을 거친 BG군에서 가장 높은 성분 함량을 보였다. 또한, 항산화능을 확인하기 위하여 실시된 DPPH, ABTS free radical 소거 활성에서도 BG군의 억제율이 가장 높게 나타났으며, 총페놀과 총플라보노이드의 함량도 가장 높게 나타났다. 이러한 결과를 토대로 백삼과 9번 증숙 과정을 거친 흑삼을 HCl/에탄올로 유도한 급성위염 마우스에 투여한 결과 BG군에서 위 점막의 손상은 대조군과 비교하여 유의한 감소를 보였으며, 또한 백삼과 비교하여 9회 증숙한 흑삼에서 유의한 감소를 보였다. 혈액에서 측정한 활성산소종의 수치에서도 대조군과 비교하여 9회 증숙 흑삼에서 유의한 감소를 보였고, 백삼과 비교하여 뛰어난 항산화 효과를 나타내었다. 산화적 스트레스의 증가로 발생한 사이토카인의 발현을 확인한 결과에서도 COX-2, TNF-${alpha}$와 IL-6의 경우 대조군보다 유의한 감소를 보였고, 백삼과 비교하여도 유의한 감소를 보였다. 그러므로 9회 증숙한 흑삼에서는 백삼과 비교하여 유효성분 함량의 증가가 발생하여 뛰어난 항산화력을 보이고, 이에 따라 염증성 사이토카인의 발현을 억제시키므로 9회 증숙한 흑삼은 항산화 효과에 따른 급성위염 유발모델에서 점막 보호 효과가 있다고 생각한다.

MORPHEUS: 확장성이 있는 비교 쇼핑 에이전트 (MORPHEUS: A More Scalable Comparison-Shopping Agent)

  • 양재영;김태형;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권2호
    • /
    • pp.179-191
    • /
    • 2001
  • 비교 쇼핑은 웹 상에 존재하는 웹 상점으로부터 구매를 원하는 상품에 대해 저렴한 가격을 찾아주는 일종의 판매자 중개 방법이다. 보다 쉽게 확장 가능한 비교 쇼핑 시스템을 생성하기 위해서 에이전트는 각각의 준 구조화된 상점으로부터 필요한 정보만을 추출할 수 있는 wrapper를 자동으로 생성해낼 수 있어야 한다. 웹 문서를 작성하기 위한 HTML은 포함하고 잇는 정보의 의미가 아닌 브라우저를 통한 정보의 표현에 대해서만 정의하고 있다. 또한 각 웹 상점들은 사용자의 다양한 상품 검색 요구를 수용하기 위해 다양한 상품 검색 방법과 검색 결과의 출력 형태를 가진다. 따라서 자동으로 필요한 정보만을 추출하는 wrapper의 생성은 어려운 작업이다. wrapper의 귀납적인 생성은 이러한 이질적인 환경을 극복하기 위한 기술이다. 그러나 Shopbot과 같은 기존의 확장 가능한 비교 쇼핑 에에전트는 원하는 상품 정도를 추출하기 위해 강한 바이어스에 의존한다. 따라서 Shopbot은 바이어스를 따르지 않는 많은 웹 상점으로부터 wrapper를 생성할 수 없다. 본 논문에서는 강한 바이어스를 사용하지 않고 wrapper를 생성해 낼 수 있는 비교 쇼핑 에이전트 시스템인 모피우스를 제안한다. 모피우스는 간단하면서도 견고한 학습 알고리즘을 바탕으로 wrapper를 생성한다. 제안하는 학습 알고리즘의 핵심은 상품 검색 결과를 논리적 라인으로 나누고 여기서 나타나는 상품 설명 단위의 패턴으로 wrapper를 생성하는 것이다. 모피우스 대부분의 웹 상점에 대한 wrapper를 정확하게 생성해 낸다. 또한 학습하려는 검색 결과에 노이즈가 존재하는 경우에도 wrapper를 정확하게 추출할 수 있다. 모피우스는 헤더나 광고와 같은 불필요한 정보들을 제거하는 별도의 단계를 거치지 않으므로 wrapper를 빠르게 생성한다. 궁극적으로 모피우스는 새로운 웹 상점을 사용자가 자유롭게 추가, 삭제할 수 있는 환경을 제공한다.

  • PDF

유역오염원 수질거동해석을 위한 GIS기반 정보시스템 개발 (Development of Information System based on GIS for Analyzing Basin-Wide Pollutant Washoff)

  • 박대희;하성룡
    • 한국지리정보학회지
    • /
    • 제9권4호
    • /
    • pp.34-44
    • /
    • 2006
  • 환경모델링 기법은 비선형 오염유출현상을 구조화하여 배출특성 규명 및 정책대안의 영향예측 도구로서 활용도가 증가하고 있다. 반면 복잡한 입력 매개변수의 구성은 모형운영에 있어 비정량적 수치의 적용가능성을 내포하고 있다. 이러한 한계성을 극복하기 위해 최근 들어 GIS와 정보기술의 연계를 통한 자료관리 및 모형 매개변수 산출을 위한 연구들이 활발히 진행 중에 있다. 이에 본 연구의 목적은 NGIS사업을 통해 축척된 지형공간 자료와 GIS의 공간분석기능을 연계하여 유역 오염유출모형인 HSPF의 운영정보 생성을 지원하는 정보시스템을 개발하는데 있다. 주 연구내용은 시스템 분석 및 설계, 기초 데이터 수집과 DB 구축, 지형 매개변수 산정을 위한 GIS-HSPF의 통합 인터페이스 구축이다. 개발된 KBASIN-HSPF는 EPA에 의해 개발된 BASIN의 유역분할, 하천망생성, 지형특성계수 산정 기능과 함께 우리나라의 지형 오염원 기상정보의 저장구조를 고려한 데이터 모델링, Thiessen망에 준한 강우자료 보정 그리고 HSPF 모형운영정보 생성 및 전환기능을 포함하고 있다. KBASIN-HSPF는 기존의 오염유출모델링을 위해 자료준비부터 정보연계, 모형운영까지 분산된 환경에서 수행되었던 것을 통합환경하에서 진행함으로써 정보의 질적보장과 정보전환의 표준화방안을 제시하는 정보분석시스템이다.

  • PDF

드론과 이미지 분석기법을 활용한 구조물 외관점검 기술 연구 (Study on Structure Visual Inspection Technology using Drones and Image Analysis Techniques)

  • 김종우;정영우;임홍철
    • 한국건축시공학회지
    • /
    • 제17권6호
    • /
    • pp.545-557
    • /
    • 2017
  • 이 연구는 사회 기반 구조물의 노후화에 대한 안전점검 기술분야에서 구조물 외관점검 기술의 효율적 대안에 관한 연구이다. 기존 육안점검 및 조사를 대신하여 산업용 드론과 딥 러닝기반의 이미지 분석 기법을 접목함으로써 막대한 인력과 시간소요 및 비용을 절감하고 높은 구역 및 돔 구조물의 접근 한계를 극복하고자 하였다. 구조물의 0.3mm 이상의 균열 손상을 검지할 수 있는 고 해상도 카메라와 라이다 센서, 임베디드 이미지 프로세서 모듈로 구성된 탑재체를 제작하여 산업용 드론에 탑재하였다. 이를 현장 시험에 적용하여 자동비행항법을 통해 시편의 손상 이미지를 촬영하였다. 또한 균열경을 이용하여 기존 육안 점검 방법으로 백태, 박리박락과 같은 면적형 손상과 선형 손상인 균열의 폭과 길이를 측정하여 최종 이미지 분석 검출 결과와 비교하고자 하였다. 촬영된 이미지 중 80장의 샘플을 골라 이미지 분석 기법을 적용하여 사전처리작업(pre-processing)-분리작업(segmentation)-특징점 추출작업(feature extraction)-분류 작업(Classification)-지도학습작업(supervised learning) 등의 과정을 거쳐 손상을 분리하고, 이를 딥러닝 기반 플랫폼으로 지도학습하여 분석 파라미터를 추출하였다. 지도학습을 수행하지 않은 임의의 이미지 샘플 60장을 신규로 추가하여 추출된 파라미터를 기반으로 이미지 분석을 수행한 결과, 손상 검출율의 90.5%로 나타났다.

The Usefulness of Selected Physicochemical Indices, Cell Membrane Integrity and Sperm Chromatin Structure in Assessments of Boar Semen Sensitivity

  • Wysokinska, A.;Kondracki, S.;Iwanina, M.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제28권12호
    • /
    • pp.1713-1720
    • /
    • 2015
  • The present work describes experiments undertaken to evaluate the usefulness of selected physicochemical indices of semen, cell membrane integrity and sperm chromatin structure for the assessment of boar semen sensitivity to processes connected with pre-insemination procedures. The experiments were carried out on 30 boars: including 15 regarded as providers of sensitive semen and 15 regarded as providers of semen that is little sensitive to laboratory processing. The selection of boars for both groups was based on sperm morphology analyses, assuming secondary morphological change incidence in spermatozoa as the criterion. Two ejaculates were manually collected from each boar at an interval of 3 to 4 months. The following analyses were carried out for each ejaculate: sperm motility assessment, sperm pH measurement, sperm morphology assessment, sperm chromatin structure evaluation and cell membrane integrity assessment. The analyses were performed three times. Semen storage did not cause an increase in the incidence of secondary morphological changes in the group of boars considered to provide sperm of low sensitivity. On the other hand, with continued storage there was a marked increase in the incidence of spermatozoa with secondary morphological changes in the group of boars regarded as producing more sensitive semen. Ejaculates of group I boars evaluated directly after collection had an approximately 6% smaller share of spermatozoa with undamaged cell membranes than the ejaculates of boars in group II ($p{\leq}0.05$). In the process of time the percentage of spermatozoa with undamaged cell membranes decreased. The sperm of group I boars was characterised with a lower sperm motility than the semen of group II boars. After 1 hour of storing diluted semen, the sperm motility of boars producing highly sensitive semen was already 4% lower ($p{\leq}0.05$), and after 24 hours of storage it was 6.33% lower than that of the boars that produced semen with a low sensitivity. Factors that confirm the accuracy of insemination male selection can include a low rate of sperm motility decrease during the storage of diluted semen, low and contained incidence of secondary morphological changes in spermatozoa during semen storage and a high frequency of spermatozoa with undamaged cell membranes.

점진적 특징 가중치 기법을 이용한 나이브 베이즈 문서분류기의 성능 개선 (Improving Naïve Bayes Text Classifiers with Incremental Feature Weighting)

  • 김한준;장재영
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.457-464
    • /
    • 2008
  • 실제 운용 환경에서 자동문서분류시스템의 성공을 위해서 충분하지 못한 학습문서의 문제와 특징 공간들에 대한 사전지식이 없는 상황을 해결하는 것이 관건이다. 이런 맥락에서 많은 자동문서분류 시스템의 구축을 위해 나이브 베이즈 문서분류 알고리즘을 사용한다. 이는 기존 학습된 분류모델과 특징 공간을 점진적으로 갱신함으로써 분류모델을 향상시키는 것이 매우 용이하기 때문이다. 본 논문에서는 특징 가중치를 이용하여 문서분류기의 성능을 향상시키는 기법을 제안한다. 기본 아이디어는 문서분류 모델의 인자로서 특징들의 분포뿐만 아니라 각 특징들의 중요도를 반영하는 것이다. 속성 선택을 미리 수행하여 학습모델을 만드는 것이 아니라, 속성 중요도를 나이브 베이즈 학습 모델에 포함시킴으로써 보다 정확한 모델을 생성할 수 있다. 또한 동적 환경에서 점진적인 특징 가중치 부여를 위해 기존의 특징 갱신 기법을 확장한 알고리즘도 제안한다. 본 논문에서 제안된 기법을 평가하기 위해서 Reuters-21578과 20Newsgroup 문서집합 이용한 실험을 실시하여, 제안된 기법이 전통적인 나이브 베이즈 분류기의 성능을 크게 향상시킴을 증명한다.

제한된 자원을 갖는 장치에서 효과적인 얼굴 인증 방법 (An Effective Face Authentication Method for Resource - Constrained Devices)

  • 이경희;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1233-1245
    • /
    • 2004
  • 사용자를 인증하는데 생체인식(biometrics)을 사용하는 것은 보안성과 편리성에서 우수함에도 불구하고, 생체 정보를 사용하는 전형적인 인증 알고리즘은 스마트카드(smart cards)와 같은 자원이 한정된 장치에서는 실행되지 못할 수도 있다. 따라서, 제한된 자원을 갖는 장치에서 생체인식 과정이 수행되기 위해서는 적은 메모리와 처리 능력을 요구하는 가벼운 인증 알고리즘의 개발이 필요하다. 또한 생물학적 특징들 중에서 얼굴에 의한 인증은 인간에게 보다 친숙하고 얼굴 영상 획득이 비강제성을 띤다는 점에서 사용하기 가장 편리한 생체인식 기술이다. 본 논문에서는 생체인식 기술 연구의 일환으로 새로운 얼굴 인중 알고리즘을 제안한다. 이 얼굴 인증 알고리즘은 두 가지 면에서 새로운 특성을 갖는다. 그 하나는 유전자 알고리즘(GA: Genetic Algorithms) 에 의해 추출된 특징 집합(feature set)을 입력벡터로 사용하는 Support Vector Machines(SVM)을 얼굴인증에 이용함으로써 메모리 요구량을 감소시킨다는 것이다. 다른 하나는, 필요에 따라 특징 집합의 크기 조절에 대한 시스템 파라미터를 조절함으로써, 인식률은 다소 감소하더라도 인증 과정에 필요한 메모리양을 더욱 더 감소시킬 수 있다는 것이다. 이러한 특성은 메모리양이 한정된 장치에서 얼굴 인중 알고리즘을 수행할 수 있게 하는 데 상당히 효과적이다. 다양한 변화가 있는 얼굴 데이터베이스들에 대하여 실험한 결과, GA에 의해 선택된 식별력이 우수한 특징들을 SVM의 입력벡터로 사용하는 제안한 얼굴 인증 알고리즘이, GA에 의한 특징 선택 과정이 없는 알고리즘보다 정확성과 메모리 요구량에서 우수한 성능을 보임을 알 수 있다. 또한 시스템 파라미터의 변경 실험에 의해 선택될 특징의 개수가 조절될 수 있음을 보인다.

계량정보분석시스템 KnowledgeMatrix 개발 (Development of an Informetric Analysis System KnowledgeMatrix)

  • 이방래;여운동;이준영;이창환;권오진;문영호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.167-171
    • /
    • 2007
  • 데이터베이스로부터 지식을 발견하고 이를 연구기획자, 정책의사결정자들이 활용하는 움직임이 전세계적으로 활발해지고 있다. 이러한 연구분야 중 대표적인 것이 계량정보학이고 이 분야를 지원하기 위해서 주로 선진국을 중심으로 분석시스템이 개발되고 있다. 그러나 외국의 분석시스템은 실제 수요자의 요구를 충분히 반영하지 못하고 있고, 고가이면서 한글이 지원되지 않아 국내 연구기획자가 사용하기에 어려운 점이 있다. 따라서 한국과학기술정보연구원에서는 이러한 단점을 극복하기 위해서 계량정보분석시스템 KnowledgeMatrix를 개발하였다. KnowledgeMatrix는 논문 및 특허의 서지정보를 분석하여 지식을 발견하기 위한 목적으로 설계된 독립형(stand-alone) 시스템이다. KnowledgeMatrix의 주요구성을 살펴보면 행렬 생성, 클러스터링, 시각화, 데이터 전처리로 요약된다. 본 논문에서 소개하고 있는 KnowledgeMatrix는 외국의 대표적인 정보분석시스템과 비교했을 때 다양한 기능을 제공하고 있고 특히 영문데이터 처리 이외에 한글데이터 처리가 가능하다는 장점을 갖고 있다.

  • PDF

Wheel tread defect detection for high-speed trains using FBG-based online monitoring techniques

  • Liu, Xiao-Zhou;Ni, Yi-Qing
    • Smart Structures and Systems
    • /
    • 제21권5호
    • /
    • pp.687-694
    • /
    • 2018
  • The problem of wheel tread defects has become a major challenge for the health management of high-speed rail as a wheel defect with small radius deviation may suffice to give rise to severe damage on both the train bogie components and the track structure when a train runs at high speeds. It is thus highly desirable to detect the defects soon after their occurrences and then conduct wheel turning for the defective wheelsets. Online wheel condition monitoring using wheel impact load detector (WILD) can be an effective solution, since it can assess the wheel condition and detect potential defects during train passage. This study aims to develop an FBG-based track-side wheel condition monitoring method for the detection of wheel tread defects. The track-side sensing system uses two FBG strain gauge arrays mounted on the rail foot, measuring the dynamic strains of the paired rails excited by passing wheelsets. Each FBG array has a length of about 3 m, slightly longer than the wheel circumference to ensure a full coverage for the detection of any potential defect on the tread. A defect detection algorithm is developed for using the online-monitored rail responses to identify the potential wheel tread defects. This algorithm consists of three steps: 1) strain data pre-processing by using a data smoothing technique to remove the trends; 2) diagnosis of novel responses by outlier analysis for the normalized data; and 3) local defect identification by a refined analysis on the novel responses extracted in Step 2. To verify the proposed method, a field test was conducted using a test train incorporating defective wheels. The train ran at different speeds on an instrumented track with the purpose of wheel condition monitoring. By using the proposed method to process the monitoring data, all the defects were identified and the results agreed well with those from the static inspection of the wheelsets in the depot. A comparison is also drawn for the detection accuracy under different running speeds of the test train, and the results show that the proposed method can achieve a satisfactory accuracy in wheel defect detection when the train runs at a speed higher than 30 kph. Some minor defects with a depth of 0.05 mm~0.06 mm are also successfully detected.