• 제목/요약/키워드: 데이터 선별

검색결과 576건 처리시간 0.028초

동해안 너울성 파도 예측을 위한 머신러닝 모델 연구 (A Study of Machine Learning Model for Prediction of Swelling Waves Occurrence on East Sea)

  • 강동훈;오세종
    • 한국정보기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.11-17
    • /
    • 2019
  • 최근 들어 동해안에서 너울성 파도에 의한 손실이 빈번히 발생하고 있다. 너울성 파도는 다양한 요인들이 결합되어 발생하기 때문에 예측이 어렵다. 본 연구에서는 머신러닝 기술에 기초하여 동해안에서 너울성 파도의 발생을 예측하는 모델을 제안하였다. 모델 개발을 위해 포항 신항의 하역중단 데이터 및 신항 부근의 기압, 풍속, 풍향, 수온 등의 기상자료를 수집하였다. 수집한 데이터로부터 너울발생에 중요한 영향을 미치는 변수들을 선별하였으며, 모델 개발을 위해 다양한 머신러닝 예측 알고리즘들을 테스트 하였다. 그 결과 조위, 수온, 기압이 너울 발생 예측을 위한 주요 변수로 확인이 되었고, Random Forest 모델이 가장 우수한 성능을 보였으며. 모델의 예측 정확도는 88.6%이다.

망막 영상 분석을 위한 두 갈래 분류기 (Two-Branch Classifier for Retinal Imaging Analysis)

  • 오영택;박현진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.614-616
    • /
    • 2021
  • 세계는 안구 질병 치료, 시력 회복 서비스, 훈련된 안과 전문의의 부족 등 안과 측면에서 어려움에 직면해 있다. 안구 병리를 조기에 발견하고 진단하면 시각 장애를 예방할 수 있다. 하지만 기존의 망막 영상 공개 데이터 세트는 임상에서 발견되는 다양한 질병으로 구성되어 있지 않기 때문에 다양한 안구 질환을 분류하는 방법을 개발하기가 어렵다. 본 연구는 2021 ISBI challenge에서 공개된 데이터 세트인 Retinal Fundus Multi-disease Image Dataset (RFMiD) 을 이용하여 안구 질환을 분류하는 방법을 제안한다. 본 연구의 목표는 망막 이미지를 정상, 비정상 범주로 선별하기 위한 강력하고 일반화 가능한 모델을 개발하는 것이다. 제안된 모델의 성능은 수신자 조작 특성 곡선 아래 면적 점수로 비공개 테스트 데이터 세트에 대해 0.9782의 값을 보여준다.

  • PDF

한방 8체질과 신체 정보를 활용한 맞춤 음식과 식단 추천 데이터베이스 시스템 설계 및 구현 (Design and Implementation of the Database System for Personalized Food and Diet Recommendation Based on 8-Oriental Body Constitution and Physical Information)

  • 이정훈;이상덕;정예원;이유정;문유진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.187-188
    • /
    • 2020
  • 본 논문에서는 한방 8체질 및 신체정보 관련 데이터셋을 바탕으로 개인 맞춤 식품 및 식단을 추천하는 데이터베이스의 설계·구축을 수행한다. 또한 이 시스템을 이용하여 추천된 식품(식단)과 희망하는 지역을 입력했을 때 선별된 음식점 정보를 제공한다. 데이터베이스 생성 프로세스와 수집한 데이터를 통해 데이터베이스 설계, 데이터 수집, 생산 및 처리 예제, 데이터베이스 활용 등에 대해 다양한 방법을 제공한다. 일상생활에서 데이터베이스 시스템을 활용함으로써, 이 시스템은 한의원 또는 전문채널을 통해 알 수 있었던 맞춤 식단 정보를 대중에 공개되어 정보 진입장벽을 낮추고 편의성을 도모한다. 이로써 오늘날 고령 사회에 진입한 대한민국에서 국민들이 건강한 식생활을 지원하여 궁극적으로 국민 건강 증진에 기여한다.

  • PDF

국내 대학기관 재난안전분야 학과 소속 저자의 학술지 논문 분석 (Analysis of Author's Journal Papers belonging to Departments in the field of Disaster and Safety at Domestic Universities)

  • 김병규;류범종;심형섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.169-172
    • /
    • 2022
  • 재난안전 분야의 기술개발 동향을 파악하고 지적 관계를 분석하기 위한 연구에서 신뢰성과 최신성을 겸비한 학술정보를 활용하는 것은 매우 유용하다. 기존의 논문 기반 계량정보분석 연구에서는 관련 분야의 학술지와 키워드를 중심으로 분석 대상 논문을 선별하여 연구재료로 사용하였다. 본 논문에서는 재난안전 분야의 보다 세부적인 연구 특성 파악을 위해 국내 대학기관의 방재 및 안전공학 학과에 소속된 저자들의 논문 정보를 대상으로 기관식별, 학과유형 분류, 재난안전유형 분류. 표준산업분류를 매핑하고 주요 측면별로 분석 연구를 수행하였다. 분석 결과, 재난안전 분야 연구에서 저자소속 기관의 유형 및 지역적 분포, 공저 학과 유형의 구성, 재난안전유형 및 표준산업분류의 현황과 핵심 키워드가 자세히 파악되었다. 연구 결과는 향후 지능형 위기경보 체계 구축을 위한 재난유형별 주요 기관 및 전문가 식별과 추천에 활용이 기대된다.

  • PDF

WordNet기반 주석확장을 이용한 이미지 검색 (Image Retrieval using Annotation Expansion based on WordNet)

  • 황광수;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.165-168
    • /
    • 2007
  • 이미지 데이터를 의미적으로 검색하기 위한 가장 중요한 요소는 이미지의 정보를 표현하고 있는 주석이라고 할 수 있다. 이미지의 주석은 관리자가 사용자 입장에서 검색이 가능한 이미지를 표현할 수 있는 키워드를 선별하여 데이터화한 것이다. 그러다보니 이미지내 의미를 모두 표현하기위해 주석에 수는 증가되고, 증가된 주석은 각각에 이미지에서 차지하고 있는 의미량을 고려하지않고 동일한 크기를 가지게 된다. 이러한 경우 실제적으로 검색하였을 때 의미량에 상관없이 질의어와 주석이 일치한 모든 이미지를 검색하므로 사용자가 검색 결과에서 의미량이 큰 이미지를 다시 재검색하거나 주석입력자와 사용자와 어휘 표현에 차이 때문에 검색에 재검색해야한다. 따라서 본 논문에서는 의미량을 이용하여 효율적인 이미지 검색을 하기 위해 각 키워드 간에 의미적인 관계를 어휘 온톨로지인 WordNet을 이용하여 유사도 측정을 하고, 측정한 데이터를 이용하여 전체 이미지 의미량에서 해당 키워드가 갖는 의미량을 측정한다. 의미량은 이미지 검색시 질의어가 이미지에서 차지하고 있는 비율을 비교하여 가장 높은 의미량을 갖는 이미지를 우선 검색하고 의미량이 가장 큰 키워드를 대표키워드로 추출하여 WordNet상에서 동일한 의미를 갖는 계층에 단어들로 주석을 확장한다.

전진선택법에 의해 선택된 부분 상관관계의 유전자들을 이용한 암 분류 (Classifying Cancer Using Partially Correlated Genes Selected by Forward Selection Method)

  • 유시호;조성배
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.83-92
    • /
    • 2004
  • 유전 발현 데이터는 생명체의 특정 조직에서 채취한 샘플을 마이크로어레이상에서 측정한 것으로, 유전자들의 발현 정도가 수치로 나타난 데이터이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현 정도는 차이를 보이기 때문에 유전 발현 데이터를 통하여 암을 분류할 수 있다. 그러나 분류에 모든 유전자가 관여하지는 않으므로 효율적인 암의 분류를 위해서는 관련성 있는 소수의 유전자만을 선별해내는 작업인 특징선택 방법이 필요하다. 본 논문에서는 회귀분석의 변수선택방법중 하나인 전진 선택법(forward selection method)을 사용하여 유전자들을 선하고 분류하는 방법을 제안한다. 이 방법은 선택되는 유전자들의 중복된 정보를 최소화시켜 암의 분류에 있어 보다 효과적인 유전자 선택을 한다. 실험데이터는 대장암 데이터(Colon cancer dataset)를 사용하였고, 분류기는 k-최근접 이웃(KNN)을 사용하였다. 이 방법과 상관계수를 이용한 특징 선택방법인 피어슨 상관계수와 스피어맨 상관계수방법과 비교해본 결과 전진 선택법에 의한 특징선택 방법이 암의 분류에 있어서 더 효과적인 유전자 선택을 한다는 사실을 확인하였다. 실험결과 90.3%의 높은 인식률을 보였다. 추가적으로 림프종 데이터에 대한 실험을 하였고, 그 결과 전진 선택법의 유용성을 확인할 수 있었다.

eCRM을 위한 데이터마이닝 에지전트의 개발 (The Development of the Data Mining Agent for eCRM)

  • 손달호;홍덕훈
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.236-244
    • /
    • 2006
  • 전자상거래의 성장에 따라 고객의 특성을 파악하고 고객의 기호에 맞는 정보를 제공하여 구매력에 영향을 주고 동시에 웹사이트 운영자의 정보선별과 관련된 의사결정을 지원하는 시스템도구들이 개발되고 있다. 그러나 이런 시스템도구들은 웹운영기업에 경제적 부담을 주고 컴포넌트화 되어 있지 않아서 원하는 데이터를 수집하기보다는 수집된 데이터에 기업들의 요구정보를 맞춰야 하는 어려움이 있다. 이러한 점을 감안하여 본 연구는 기업의 필요정보에 대한 맞춤형 웹에이전트 시스템의 설계로 도구기반 로그분석을 대신할 수 있는 시스템개발을 연구목적으로 설정하였다. 본 연구에서 개발된 웹에이전트는 설계언어로 Java와 ASP를 이용하였으며 데이터 저장방식은 쿠키를 이용하는 방식으로 구현되었고 장기적 보존 데이터를 위해서 My-SQL의 데이터베이스와 연동될 수 있도록 개발되었다. 본 연구에서 개발된 시스템은 데이터마이닝개념을 이용하여 도구에 분석데이터를 전달시키기보다는 적극적으로 웹사이트의 컴포넌트형 에이전트로 데이터를 가공하도록 하였고 따라서 고객 개인화 인터페이스 설계 뿐 아니라 의사결정과 전문가 시스템의 성격을 지닌 정보제공방식을 마련할 수 있다는 점에서 기여도가 있다고 본다.

  • PDF

연속간행물 기사 DB의 서지데이터요소 표준화 연구 (A Study on Standards for Bibliographic Data Elements of the Articles in Serials)

  • 한종엽
    • 한국문헌정보학회지
    • /
    • 제34권3호
    • /
    • pp.109-132
    • /
    • 2000
  • 본 연구의 목적은 연속간행물 기사 DB 구축을 위한 서지데이터요소의 표준화방안을 제시하고자 하는 것이다. 국내외의 대표적인 서지DB(10개기관)의 데이터요소를 대비 분석한 바 각각의 기술항목의 명칭이 다른 점이 많고, 기술항목의 기술순서와 기술의 상세도에 있어서도 상당히 상이하다. 그리하여 ISO 690의 서지기술요소를 분석하여 이를 데이터베이스에 적용할 수 있는지의 여부를 면밀히 분석한 결과, 이는 서지 DB의 데이터요소에 있어서도 기본적인 모델이 될 수 있음을 확인하였다. 따라서 본 연구에서는 ISO 690의 서지기술을 위한 10가지 요소를 기본적인 골격으로 하고, 국내외의 대표적인 서지DB의 연속간행물 기사에 대한 데이터요소를 비교 분석한 결과를 바탕으로 기타의 필요 적절한 데이터요소 7가지를 선별해서 추가하고 이들 17가지 요소들을 합리적으로 정렬하여 바람직한 표준안을 도출하였다.

  • PDF

디지털 증거 선별 조사의 효율성을 위한 Digital Evidence Container 설계 및 구현 (A New Design and Implementation of Digital Evidence Container for Triage and Effective Investigation)

  • 임경수;이창훈;이상진
    • 전자공학회논문지CI
    • /
    • 제49권4호
    • /
    • pp.31-41
    • /
    • 2012
  • 최근 국내외 수사 기관은 초동 수사 시 현장에 컴퓨터가 있을 경우, 사이버 범죄 수사가 아닌 경우에도 시스템을 압수 또는 확보하는 것이 필수적인 단계로 자리 잡고 있다. 이렇게 확보한 시스템으로부터 용의자의 범죄 사실 입증을 위한 정황 증거를 확보하여 수사에 활용되고 있다. 하지만 사이버 범죄가 아닌 일반 범죄 사건에서 확보한 시스템에서 디스크 이미지를 확보한 후, 면밀히 조사하는 것은 시간이 많이 소요되며 신속한 사건 대응이 필요한 납치, 살인사건과 같은 범죄 유형에는 더욱 어려움이 따른다. 또한 기업 수사에서도 대용량 데이터베이스나 파일 서버 조사에서 나아가 클라우드 환경에서는 디스크 단위의 복제는 불가능하므로 선별 수집한 디지털 증거를 분석에 이용해야 한다. 하지만 다양한 종류의 디지털 증거를 선별 수집하더라도 이를 저장 및 보관하기 위한 표준화된 데이터 포맷이 존재하지 않아 법정에서 증거력을 증명하기 어려운 것이 현실이다. 따라서 본 논문에서는 선별 수집된 다양한 디지털 증거를 보관하기 위한 새로운 증거 보관 포맷을 제시한다. 본문에서 제시하는 디지털 증거 포맷은 다양한 디지털 증거 자료에 활용할 수 있도록 범용성과 확장성에 중심을 두었으며, 일반적인 XML 기술과 압축 파일 포맷을 이용하여 기존 시스템에 적용하기 쉽도록 설계하여 기존 연구들보다 활용하기 쉬운 장점이 있다.

Chrysin과 emodin에 의한 대장암 세포 항 성장 활성 및 세포사멸 (Anti-proliferative Effects and Apoptosis Induced by Chrysin or Emodin in Human Colorectal HCT116 Cells)

  • 류승민;김용현;이은주;정정욱;김종식
    • 생명과학회지
    • /
    • 제31권10호
    • /
    • pp.929-936
    • /
    • 2021
  • 본 연구에서는 시판하는 천연물 library (Selleckchem, L1400)로부터 암세포 항 성장 활성을 보여주는 천연물을 선별하였다. 즉, 인간 대장암 세포주인 HCT116에 50 μM의 각 천연물을 처리한 후 세포 생존율을 측정하였다. 1차 선별과정을 통하여 5종의 천연물(chrysin, diosmetin, emodin, piperlongumine, tanshinone I)을 선별하였다. 5종의 천연물에 의한 NAG-1 단백질의 발현을 확인한 결과 chrysin과 emodin에 의해서 발현이 현저하게 증가하였다. 또한, chrysin과 emodin은 농도의존적으로 세포 생존율을 감소시켰으며, chrysin과 emodin은 항암 단백질인 NAG-1의 발현을 농도 및 시간 의존적으로 증가시켰다. 게다가, chrysin과 emodin 처리에 의해 증가된 PARP cleavage가 NAG-1 siRNA transfection에 의해서 감소됨을 확인함으로써, chrysin과 emodin에 의한 세포사멸과 NAG-1의 발현 증가가 직접적인 관련이 있음을 증명하였다. 따라서, 본 연구결과는 암세포 항 성장 활성을 보여주는 천연물 선별에 대한 기초 데이터를 제공해 주며, chrysin과 emodin에 의한 암세포 항 성장 활성 및 세포사멸의 기전을 이해하는 데 도움을 줄 것으로 판단된다.