• 제목/요약/키워드: 데이터 선별

검색결과 583건 처리시간 0.035초

벤처확인유형을 중심으로 한 벤처기업의 성장 분석 (An Analysis of Venture Firms' Growth in Korea: Focusing on the Differences between 'Venture Certification Types')

  • 김기완
    • KDI Journal of Economic Policy
    • /
    • 제35권1호
    • /
    • pp.63-101
    • /
    • 2013
  • 우리나라의 '벤처기업'은 법적 용어로서 벤처캐피털 투자기업('벤처투자기업')뿐만 아니라 연구개발기업과 정책자금 지원기업('기술평가 보증 대출 기업')들을 포괄한다는 특징을 지닌다. 본 논문은 벤처확인유형에 따른 우리나라 벤처기업의 성장에서의 차이를 분석하였다. 실증분석을 위해서 중소기업청의 1998~2010년 벤처확인기업 명단을 '한국기업데이터'(KED) 재무 데이터와 연계하여 사용하였다. 실증분석 결과, 벤처투자기업은 기업공개 확률이나 최초 벤처확인 이후 3년 및 5년이 경과한 시점에서의 매출 고용 성장률 모두에서 기술평가 보증 대출 기업에 비해 우수한 것으로 나타났으며, 2003년 이후 신규 인증된 연구개발기업 역시 기술평가 보증 대출 기업에 비해 우수한 성장성을 보이고 있다. 이 결과는 '벤처기업'이라는 단일한 명칭에도 불구하고 이들 기업군은 상이한 속성을 지닌 기업들로 구성되어 있으며, 기업 성장 면에서 정책적 선별이 시장에 의한 선별에 상응하는 효과를 도출하지 못하고 있다는 점을 시사하고 있다. 이를 감안할 때 벤처지원정책은 벤처확인유형별로 상이한 기업군의 지원수요를 적극적으로 고려할 필요가 있으며, 명목상의 벤처기업 수 증가보다는 벤처캐피털 시장의 활성화에 정책의 초점을 맞추는 것이 바람직하다.

  • PDF

차세대염기서열분석 데이터 기반으로 선별한 전복(Haliotis discus hannai) 유래 신규 펩타이드의 항암 효과 (Anticancer Effect of Novel Peptide from Abalone (Haliotis discus hannai) based on Next Generation Sequencing Data)

  • 문현혜;황보전;비라판 칼파감;사티시쿠마 나타라잔;정호용;박준형
    • 한국해양생명과학회지
    • /
    • 제7권1호
    • /
    • pp.15-20
    • /
    • 2022
  • 본 연구는 우리나라 해안에서 널리 서식 중인 해양 자원 중 하나인 전복(Haliotis discus hannai)의 차세대염기서열분석 데이터 기반으로 선별한 신규 펩타이드의 항암 활성을 평가한 연구이다. 펩타이드의 항암 활성은 교모세포종 세포주인 SNU-489에서 농도 의존적으로 처리 시간에 비례하여 증가하였으며, 200 µM로 48시간 처리하였을 때 암 세포 사멸율이 67%로 가장 높게 나타났다. 반면 정상 세포인 HaCaT에서 가장 높은 세포 사멸율은 18%로 농도 의존적이었으나 처리 시간과는 무관하였다. 또한 신규 펩타이드의 항암 메커니즘 과정을 밝히기 위해 세포자멸괴사(Necroptosis) 관련 유전자의 발현 변화를 qRT-PCR 방법을 통해 검증하였다. RIPK3는 신규 펩타이드 처리군에서 200 µM 처리 시 9배 이상 발현 증가, MLKL는 100 µM 처리군에서 대조군 대비 2배 이상 유의미하게 발현이 증가되었다. 이러한 결과로 미루어 볼 때, 전복 유래 신규 펩타이드는 암 세포 특이적으로 세포 독성을 가지며, 세포자멸괴사 메커니즘을 통해 암세포 사멸을 일으키는 것으로 추측되므로 신규 펩타이드가 추후 교모세포종 치료제의 후보 물질로 활용될 수 있을 것으로 사료된다.

차원축소를 활용한 해외제조업체 대상 사전점검 예측 모형에 관한 연구 (Preliminary Inspection Prediction Model to select the on-Site Inspected Foreign Food Facility using Multiple Correspondence Analysis)

  • 박혜진;최재석;조상구
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.121-142
    • /
    • 2023
  • 수입식품의 수입 건수와 수입 중량이 꾸준히 증가함에 따라 식품안전사고 방지를 위한 수입식품의 안전관리가 더욱 중요해지고 있다. 식품의약품안전처는 통관단계의 수입검사와 더불어 통관 전 단계인 해외제조업소에 대한 현지실사를 시행하고 있지만 시간과 비용이 많이 소요되고 한정된 자원 등의 제약으로 데이터 기반의 수입식품 안전관리 방안이 필요한 실정이다. 본 연구에서는 현지실사 전 부적합이 예상되는 업체를 사전에 선별하는 기계학습 예측 모형을 마련하여 현지실사의 효율성을 높이고자 하였다. 이를 위해 통합식품안전정보망에 수집된 총 303,272건의 해외제조가공업소 기본정보와 2019년도부터 2022년 4월까지의 현지실사 점검정보 데이터 1,689건을 수집하였다. 해외제조가공업소의 데이터 전처리 후 해외 제조업소_코드를 활용하여 현지실사 대상 데이터만 추출하였고, 총 1,689건의 데이터와 103개의 변수로 구성되었다. 103개의 변수를 테일유(Theil-U) 지표를 기준으로 '0'인 변수들을 제거하였고, 다중대응분석(Multiple Correspondence Analysis)을 적용해 축소 후 최종적으로 49개의 특성변수를 도출하였다. 서로 다른 8개의 모델을 생성하고, 모델 학습 과정에서는 5겹 교차검증으로 과적합을 방지하고, 하이퍼파라미터를 조정하여 비교 평가하였다. 현지실사 대상업체 선별의 연구목적은 부적합 업체를 부적합이라고 판정하는 확률인 검측률(recall)을 최대화하는 것이다. 머신러닝의 다양한 알고리즘을 적용한 결과 Recall_macro, AUROC, Average PR, F1-score, 균형정확도(Balanced Accuracy)가 가장 높은 랜덤포레스트(Random Forest)모델이 가장 우수한 모형으로 평가되었다. 마지막으로 모델에 의해서 평가된 개별 인스턴스의 부적합 업체 선정 근거를 제시하기 위해 SHAP(Shapley Additive exPlanations)을 적용하고 현지실사 업체 선정 시스템에의 적용 가능성을 제시하였다. 본 연구결과를 바탕으로 데이터에 기반한 과학적 위험관리 모델을 통해 수입식품 관리체계의 구축으로 인력·예산 등 한정된 자원의 효율적 운영방안 마련에 기여하길 기대한다.

사용자의 국가 R&D 정보 이용 접근성 향상을 위한 큐레이션 서비스 : 이슈로 보는 R&D 사례를 중심으로 (Curation Service to Improve User's Access to National R & D Information : Focusing on Issues R&D Service)

  • 유은지;최광남;황유나
    • 한국콘텐츠학회논문지
    • /
    • 제20권9호
    • /
    • pp.1-10
    • /
    • 2020
  • 국가 R&D 데이터는 기초과학 연구부터 산업화 부분까지 전 분야에 대한 정보를 포괄하고 있지만 전문적인 용어로 표현되며 이로 인해 대중의 이용에는 어려움이 있다. 이에 NTIS 는 국가 R&D 데이터를 이용한 데이터 큐레이션 서비스를 개발하여 국가적인 현안과 사회적 이슈에 대해 국가 R&D 정보를 선별하여 제공하고 있다. 이에 본 연구에서는 NTIS 의 데이터 큐레이션 서비스인 이슈로 보는 R&D 서비스 분석을 통해 국가 R&D 정보를 이용한 데이터 큐레이션 서비스 구축 방안을 제안하고자 하며 이 서비스가 국가 R&D 정보에 대한 사용자의 접근성 향상에 미친 영항도 분석하였다. 이슈로 보는 R&D 서비스는 뉴스기사에서 추출한 이슈와 관련된 국가 R&D 과제, 성과, 주요 연구기관 등을 매핑하여 정리, 제공한다. 패키징에 이용된 데이터는 모두 오픈되어 있고 관련 자료는 보고서 형식으로 정리돠어 PDF 파일로 제공된다. 또한 해당 프로세스를 자동화 하여 관리자 뿐 만 아니라 NTIS 이용자라면 누구나 개인적인 이슈패키징을 가능하게 하였다. 이 밖에 Special Issue 코너를 개설하며 주요 현안에 대한 사용자의 접근,이용 편의성을 높였고 코너 개설 이후 접속자의 페이지뷰가 증가한 것으로 나타났다.

무기체계의 신뢰성 향상을 위한 고장발생기간 중심의 대응분석 연구 (The research of Correspondence Analysis centered on the Failure Period to improve the reliability of Weapon Systems)

  • 송봉근;김근형;김용국;박승환;백준걸
    • 한국산학기술학회논문지
    • /
    • 제17권10호
    • /
    • pp.289-299
    • /
    • 2016
  • 무기체계는 효율적인 전투준비태세를 갖추기 위해 개발단계의 신뢰성을 중요시하고 있다. 이미 제조업을 중심으로 다양한 분야에서 데이터 분석을 활용한 신뢰성 향상이 이루어지고 있다. 하지만 무기체계 개발단계는 보안의 중요성, 데이터의 부족 등으로 데이터 분석이 어려운 실정이다. 따라서 장기적인 무기체계 품질향상을 위해 전력화 이후의 장비 정보가 수집된 후속군수지원 데이터 분석을 수행하였다. 본 연구의 제안하는 방법론은 후속군수지원 데이터를 통해 목적변수인 고장발생기간을 중심으로 상관성 패턴을 파악하는 것이며, 절차는 다음과 같다. 첫 번째, 신뢰성에 영향을 미치는 주요 변수를 선택하고 고장발생기간을 중심으로 변수 간 상관성을 파악하였다. 두 번째, 범주형 데이터 특성을 갖는 데이터로부터 상관성 패턴을 파악하기 위해 대응분석 기법을 적용하여 분석을 수행하였다. 세 번째, 기여도와 표현력이 높은 범주들을 추출하고 시각화를 통해서 고장발생기간과 가장 관련이 높은 변수를 찾았다. 그리고 고장발생기간이 짧은 변수의 패턴을 선별하고 빈도분석을 통해서 신뢰성 저하 요인들을 파악하였다. 따라서 본 연구는 신무기 개발 시 신뢰성 저하 요인을 제거하여 군의 전투준비태세 강화에 도움이 될 것으로 기대한다.

암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법 (A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis)

  • 최종환;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.397-402
    • /
    • 2019
  • 암 환자에게 적절한 치료계획을 제공하기 위해 암의 진행양상 또는 환자의 생존 기간 등에 해당하는 환자의 예후를 정확히 예측하는 것은 생물정보학 분야에서 다루는 중요한 도전 과제 중 하나이다. 많은 연구에서 암 환자의 유전자 발현량 데이터를 이용하여 환자의 예후를 예측하는 기계학습 모델들이 많이 제안되어 오고 있다. 유전자 발현량 데이터는 약 17,000개의 유전자에 대한 수치값을 갖는 고차원의 수치형 자료이기에, 기존의 연구들은 특징 선택 또는 차원 축소 전략을 이용하여 예측 모델의 성능 향상을 도모하였다. 그러나 이러한 접근법은 특징 선택과 예측 모델의 훈련이 분리되어 있어서, 기계학습 모델은 선별된 유전자들이 생물학적으로 어떤 관계가 있는지 알기가 어렵다. 본 연구에서는 유전자 발현량 데이터를 이미지 형태로 변환하여 예후 예측이 효과적으로 특징 선택 및 예후 예측을 수행할 수 있는 기법을 제안한다. 유전자들 사이의 생물학적 상호작용 관계를 유전자 발현량 데이터에 통합하기 위해 Node2Vec을 활용하였으며, 2차원 이미지로 표현된 발현량 데이터를 효과적으로 학습할 수 있도록 합성곱 신경망 모델을 사용하였다. 제안하는 모델의 성능은 이중 교차검증을 통해 평가되었고, 유전자 발현량 데이터를 그대로 이용하는 기계학습모델보다 우월한 예후 예측 정확도를 가지는 것이 확인되었다. Node2Vec을 이용한 유전자 발현량의 새로운 이미지 표현법은 특징 선택으로 인한 정보의 손실이 없어 예측 모델의 성능을 높일 수 있으며, 이러한 접근법이 개인 맞춤형 의학의 발전에 이바지할 것으로 기대한다.

사물인터넷 환경에서 상황인식 개선을 위한 다중센서의 이벤트 데이터 가중치 부여 방안 (A Novel Weighting Method of Multi-sensor Event Data for the Advanced Context Awareness in the Internet of Things Environment)

  • 유정봉;서동혁
    • 한국전자통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.515-520
    • /
    • 2022
  • 다중 센서를 활용하는 상황인식에 있어서 각각의 센서가 감지하여 보내온 센서 데이터를 활용할 때, 센서 별로 가중치를 달리하여야 할 필요가 있다. 같은 상황에 대하여 같은 종류의 센서를 구성하였더라도 다른 부차적인 요인 때문에 가중치 부여를 달리하여야 하는 경우가 있다. 실제 세계의 이벤트에 가중치 부여를 하지 않을 수 없으며, 다중 센서를 활용하는 상황인식 시스템에서 활용할 수 있는 가중치 부여 방안은 필요하다고 할 수 있다. 본 연구에서는 시간이 경과하면서 센서들이 계속 감지 활동을 하는 가운데 호스트로 보고하는 각 센서에 대한 가중치 부여 방안을 제안한다. 대부분의 사물인터넷 환경에서 센서는 감지 활동을 지속적으로 이어나가며, 감지한 값이 사전에 정해 둔 범위 이상의 변화양상을 보일 때, 호스트로 보고하는 것을 기본으로 한다. 이러한 것을 일종의 데이터 스트림 환경이라고 할 수 있다. 데이터 스트림 환경에서 다중 센서로부터의 감지 데이터를 대상으로 하는 가중치 부여 방안에 대하여 제안하였으며, 새로운 가중치 부여 방안은 스트림 상에서 상황 변화를 주도적으로 나타내는 데이터를 선별하여 가중치를 부여하는 것으로 하였다.

크라우드소싱 드론 영상의 기하학적 품질 자동 검증 (Automatic Validation of the Geometric Quality of Crowdsourcing Drone Imagery)

  • 이동호;최경아
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.577-587
    • /
    • 2023
  • 크라우드소싱(crowdsourcing) 공간 데이터 활용 연구가 활발히 진행되고 있으나 데이터 품질의 불확실성으로 인한 문제점이 제기되고 있다. 특히 드론 영상 데이터셋에 품질이 낮은 데이터가 포함될 경우, 출력되는 공간 정보의 품질이 저하될 수 있다. 이를 위해 본 연구에서는 크라우드소싱된 영상의 기하학적 품질을 자동으로 검증하는 방법론을 제안하였다. 주요 품질 요소로는 영상의 공간해상도, 해상도 변화량, 매칭점 재투영 오차, 번들 조정 결과 등을 입력변수로 활용하였다. 공간 정보 생성에 적합한 영상을 분류하기 위해 학습 및 검증 데이터를 구축하고, radial basis function (RBF) 기반의 support vector machine (SVM) 모델로 학습을 진행하였다. 학습된 SVM 모델의 분류 정확도는 99.1%를 기록하였다. 품질 검증 모델 효과를 확인하기 위해 학습 및 검증에 사용하지 않은 드론 영상에 대하여 해당 모델을 적용하기 전후의 영상 데이터셋으로 각각 정사영상을 생성하고 비교하였다. 그 결과 모델 적용을 통하여 정사영상에 포함될 수 있는 다양한 왜곡을 줄이고 객체 식별력을 증대시키는 것을 확인하였다. 제안된 품질 검증 방법론은 다양한 품질의 크라우드소싱 데이터를 입력으로 받아 양질의 정보만을 자동 선별하게 함으로써 공간정보 생성에서의 활용 가능성을 증대시킬 것으로 기대한다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

한국인 선천성 갑상선기능저하증에 대한 신생아선별검사의 14년간의 후향적 연구; 발생빈도와 유효성 (Evaluation of the Congenital Hypothyroidism for Newborn Screening Program in Korea: A 14-year Retrospective Cohort Study)

  • 윤혜란;안선현;이향자
    • 대한유전성대사질환학회지
    • /
    • 제19권1호
    • /
    • pp.1-11
    • /
    • 2019
  • 목적: 선천성 갑상선기능저하증(Congenital hypothyroidism, CH)은 전세계적으로 출생아 3,000-4,000명 당 1명의 빈도로 발생하는 신생아기에 가장 흔한 내분비질환이다. 본 연구는 1991년부터 2004년까지 남한의 선천성 갑상선기능저하증 발생률의 빈도 및 현재까지 적용되어온 광범위한 신생아 선별검사의 검사방법과 결과를 재평가하기 위해 수행되었다. 방법: 서울 지역에 위치하지만 전국적인 지사를 운영하고 있는 검사기관 서울의과학 연구소(SCL)에서는 서울 외 6개 광역시(부산, 인천, 대구, 대전, 광주, 울산)와 9개도(경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주)로 한국을 15개 지역으로 분류하였다. 15개 지역으로부터 신생아의 채혈지를 수집하여 서울본원에서 수집하여, TSH 및 유리 T4를 ELISA 검사법으로 신생아선별검사를 수행하였다. SCL 데이터 및 복지부에 보고된 전국적인 양성자수를 검토하였다. 선천성갑상선기능저하증에 대한 신생아선별 검사법의 cut-off 치는 신생아 갑상선자극호르몬(TSH) 측정을 위해서는 20 mIU/L를 유리 T4의 검사를 위해서는 0.8 ng/dL 이하를 사용하였다. TSH 및 유리 T4 ELISA 분석에 기초한 선천성 갑상선기능저하증에 대해 1차 선별검사에서 선천성 갑상선기능저하증 양성은 신생아 671,805명 중 신생아 159명에서 발견되었으며, 이의 발병빈도는 4,225명 중 1명으로 추정되었다 결과: TSH 분석에서 cut-off 20 mIU/ L를 사용했을 때 민감도, 특이도 및 양성 측도(PPV)는 각각 100.0%, 99.7% 및 10.8%였다. 유리 T4 분석을 위해 0.8 ng/dL cut-off를 사용했을 때 민감도, 특이도 및 양성 예측도는 각각 100.0%, 98.5% 및 3.9%였다. 결론: NBS를 통해 얻은 CH의 발병빈도는 2004년 이전에 해외의 여러 국가에서 보고 된 발병빈도와 비교할 만큼 유사하였다.

  • PDF