• Title/Summary/Keyword: 분류 기술

Search Result 6,557, Processing Time 0.04 seconds

A Review of the Methodology for Sophisticated Data Classification (정교한 데이터 분류를 위한 방법론의 고찰)

  • Kim, Seung Jae;Kim, Sung Hwan
    • Journal of Integrative Natural Science
    • /
    • v.14 no.1
    • /
    • pp.27-34
    • /
    • 2021
  • 전 세계적으로 인공지능(AI)을 구현하려는 움직임이 많아지고 있다. AI구현에서는 많은 양의 데이터, 목적에 맞는 데이터의 분류 등 데이터의 중요성을 뺄 수 없다. 이러한 데이터를 생성하고 가공하는 기술에는 사물인터넷(IOT)과 빅데이터(Big-data) 분석이 있으며 4차 산업을 이끌어 가는 원동력이라 할 수 있다. 또한 이러한 기술은 국가와 개인 차원에서 많이 활용되고 있으며, 특히나 특정분야에 집결되는 데이터를 기준으로 빅데이터 분석에 활용함으로써 새로운 모델을 발견하고, 그 모델로 새로운 값을 추론하고 예측함으로써 미래비전을 제시하려는 시도가 많아지고 있는 추세이다. 데이터 분석을 통한 결론은 데이터가 가지고 있는 정보의 정확성에 따라 많은 변화를 가져올 수 있으며, 그 변화에 따라 잘못된 결과를 발생시킬 수도 있다. 이렇듯 데이터의 분석은 데이터가 가지는 정보 또는 분석 목적에 맞는 데이터 분류가 매우 중요하다는 것을 알 수 있다. 또한 빅데이터 분석결과 통계량의 신뢰성과 정교함을 얻기 위해서는 각 변수의 의미와 변수들 간의 상관관계, 다중공선성 등을 고려하여 분석해야 한다. 즉, 빅데이터 분석에 앞서 분석목적에 맞도록 데이터의 분류가 잘 이루어지도록 해야 한다. 이에 본 고찰에서는 AI기술을 구현하는 머신러닝(machine learning, ML) 기법에 속하는 분류분석(classification analysis, CA) 중 의사결정트리(decision tree, DT)기법, 랜덤포레스트(random forest, RF)기법, 선형분류분석(linear discriminant analysis, LDA), 이차선형분류분석(quadratic discriminant analysis, QDA)을 이용하여 데이터를 분류한 후 데이터의 분류정도를 평가함으로써 데이터의 분류 분석률 향상을 위한 방안을 모색하려 한다.

Analysis of Soil Microbes in Continuous Cropping Fields of Gastrodia elata (천마 연작지의 토양 미생물상 분석)

  • Chang Su Kim;Eun Suk Lee;Hyun Soo Jung;Jung Hyun Yoo;So Ra Choi;Young Eun Song;Sang Young Seo;Min Sil Ahn
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2023.04a
    • /
    • pp.36-36
    • /
    • 2023
  • 천마(天麻, Gastrodia elata Blume)는 난초과(蘭草科, Orchidaceae)에 속하는 식물로 잎과 뿌리가 없어 탄소동화능력이 없으며, 뽕나무버섯균과 공생하는 기생식물이다. 천마는 노지 재배에 따른 안정생산 문제가 지속적으로 발생하고 있다. 혹한, 폭우 등 기상환경에 따른 연차간 수량성 차가 673~1,175kg/10a로 크고, 연작에 따른 수량성이 연작 1회 시 29%, 연작 2회 시 68%가 감소하는 경향을 보이고 있다. 따라서, 본 연구는 천마의 연작에 따른 토양내 미생물상의 변화를 분석하기 위해 수행하였다. 본 실험은 초작지, 연작 1회지, 연작 2회지 및 자생지의 각각 3곳에 대한 토양을 Metagenome 분석법을 활용하여 미생물상을 분석하였다. metagenome 분석 결과, 초작지 3곳의 시료를 이용하여 확보한 총 read는 699,221개였으며, 이 중에서 Eukaryota로 분류되지 않은 read는 1,377개(0.2%), no hit, not assign된 read는 10,510개 (1.5%), Bacteria로 분류된 read는 342,916개(49.0%), Eukaryota로 분류된 read는 총 344,418개(49.3%)였다. 그리고 천마의 생육에 영향을 주는 Fusarium 속과 종은 3곳 포장에서 고르게 분포하고 있으며, 총 11,242 read로 전체의 3.3%를 차지하였다. 연작 1회지 3곳의 시료를 이용하여 확보한 총 read는 655,097개였으며, 이 중에서 Eukaryota로 분류되지 않은 read는 1,694개(0.3%), no hit, not assign된 read는 18,985개(2.9%), Bacteria로 분류된 read는 312,201개(47.7%), Eukaryota로 분류된 read는 총 322,217개 (49.2%)였다. 그리고 천마의 생육에 영향을 주는 Fusarium 속과 종은 3곳 포장에서 고르게 분포하고 있으며, 총 11,597 read로 전체의 3.6%를 차지하였다. 연작 2회지 3곳의 시료를 이용하여 확보한 총 read는 651,624개였으며, 이 중에서 Eukaryota로 분류되지 않은 read는 1,753개(0.3%), no hit, not assign된 read는 7,995개(1.2%), Bacteria로 분류된 read는 307,178개(47.1%), Eukaryota로 분류된 read는 총 334,698개(51.4%)였다. 그리고 천마의 생육에 영향을 주는 Fusarium 속과 종은 총 43,877 read로 전체의 13.1%를 차지하였다. 자생지 3곳의 시료를 이용하여 확보한 총 read는 731,719개였으며, 이 중에서 Eukaryota로 분류되지 않은 read는 2,828개(0.4%), no hit, not assign된 read는 585개(0.1%), Bacteria로 분류된 read는 356,690개(48.7%), Eukaryota로 분류된 read는 총 371,616개(50.8%)였다. 그리고 천마의 생육에 영향을 주는 Fusarium 속과 종은 MJH01 자생지에서만 전체의 0.2%(총 660 read)로 극히 일부가 분리되었다. 따라서, 천마의 생육에 영향을 미치는 Fusarium 속과 종은 초작지 3.3%, 연작 1회지 3.6%, 연작 2회지 13.1%, 자생지 0.2%로 나타났으며, 연작 2회 시 급격히 증가하는 것으로 판단되었다.

  • PDF

토양복원기술의 선진 동향과 시사점

  • 천정용
    • Environmental engineer
    • /
    • s.174
    • /
    • pp.22-26
    • /
    • 2001
  • (1) 토양오염의 특성과 현황 - 토양오염은 지하에서 일어나는 오염문제이므로 눈으로 직접 확인하기가 어려울 뿐만 아니라 한번 오염되면 복원을 위해서 많은 시간과 경제적 노력이 필요함 - 우리나라에서는 폐광지대 그리고 공업단지 내 유류 저장시설 주변 토양이 중금속과 유기화합물로 심각하게 오염되어 있는 것으로 나타남 (2) 오염토양 정화기술의 분류와 주요기술 - 오염토양 정화기술은 크게 비원위치 기술과 원위치 기술로 분류되며 각각 물리적, 화학적, 생물학적

  • PDF

어류 mitochondrial DNA의 분자계통학적 이용과 국내에서의 분류학적 적용 현황

  • 김영자;김일찬;이세영;이완옥;이재성
    • Proceedings of the Korean Society of Fisheries Technology Conference
    • /
    • 2003.05a
    • /
    • pp.41-41
    • /
    • 2003
  • 기존의 계통분류는 비교해부학적 및 비교발생학적 방법에 의해 소수의 특징적인 기준형질만을 가지고 상위분류군간의 분류범주를 정하고, 종을 배정하였기 때문에 상당한 인위성이 개입되었고, 이렇게 주관적으로 정리하다 보면 종종 한개의 분류군에 대하여 서로 불일치하는 경우도 있다. 따라서 상위분류군들은 분류군을 구성하는 많은 구성원들이 나타내고 있는 형질의 집합체로서, 다양한 형질에 의해서 다루어져야 한다. (중략)

  • PDF

Automatic Generation of Standard Classification Code (표준 통계 분류 코드 자동 생성)

  • Lim, Heui-Seok
    • Proceedings of the KAIS Fall Conference
    • /
    • 2006.05a
    • /
    • pp.388-390
    • /
    • 2006
  • 본 논문은 수동 코드 분류 규칙과 예제기반의 자동 학습을 이용하는 한국어 표준 산업/직업 코드 자동분류 시스템을 제안한다. 제안된 시스템은 산업과 직업에 대하여 설명하는 자연어를 입력받아 해당 산업/직업 분류 코드를 생성하는 시스템으로 수작업으로 구축된 규칙을 적용한 후 규칙이 적용되지 않는 레코드는 예제 기반의 학습을 이용한 자동 분류 시스템에 의해서 해당 코드를 할당한다.

  • PDF

A Study on Word Semantic Categories for Natural Language Question Type Classification and Answer Extraction (자연어 질의 유형판별과 응답 추출을 위한 어휘 의미체계에 관한 연구)

  • Yoon Sung-Hee
    • Proceedings of the KAIS Fall Conference
    • /
    • 2004.11a
    • /
    • pp.141-144
    • /
    • 2004
  • 질의응답 시스템이 정보검색 시스템과 다른 중요한 점은 질의 처리 과정이며, 자연어 질의 문장에서 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 것이다. 본 논문에서는 질의 주-형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의 문장에서 의문사에 해당하는 어휘들을 추출하고 주변에 나타나는 명사들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법을 제안한다. 의문사가 생략된 경우의 처리 방법과 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

The Technology of the Audio Feature Extraction for Classifying Contents (콘덴츠 분류를 위한 오디오 신호 특징 추출 기술)

  • Lim, J.D.;Han, S.W.;Choi, B.C.;Chung, B.H.
    • Electronics and Telecommunications Trends
    • /
    • v.24 no.6
    • /
    • pp.121-132
    • /
    • 2009
  • 음성을 비롯하여 음악, 음향 등을 포함하는 오디오 신호는 멀티미디어 콘텐츠를 구성하는 매우 중요한 미디어 타입이며, 미디어 기록 매체와 네트워크의 발전으로 인한 데이터 양의 급격한 증대는 수동적 관리의 어려움을 유발하게 되고, 이로 인해 오디오 신호를 자동으로 구분하는 기술은 매우 중요한 기술로 인식되고 있다. 다양한 오디오 신호를 분류하기 위한 오디오 신호의 특징을 추출하는 기술은 많은 연구들을 통해 발전하여 왔으며, 본 논문은 오디오 콘텐츠 자동 분류에서 높은 성능을 갖는 오디오 신호 특징 추출에 대해서 분석한다. 그리고 특징 분류기 중에서 안정적인 성능을 가지는 SVM을 사용한 오디오 신호 분류 방법을 알아본다.

Experimental studies of 1.0T/D Entrained Flow Coal Gasifier (1.0T/D 가압 분류층 석탄 가스화기 운전 특성)

  • Ra, Howon;Hong, Jaichang;Choi, Youngchan
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2010.06a
    • /
    • pp.115.1-115.1
    • /
    • 2010
  • 석탄 가스화기술은 기존의 연소 방식에서 발생하는 공해 물질은 줄이면서 발생되어지는 합성가스를 이용하여 직접 사용하거나, IGCC나 CTL 공정등에서 원료로서 사용할 수 있다는 장점을 가지고 있어 석탄의 환경친화적인 이용을 위하여 오래전에 개발된 기술임에도 불구하고 최근 각광받고 있는 기술이다. 분류층 가스화기는 미분화된 석탄을 고온에서 가스화하는 방식으로 용량의 대형화가 가능하여 석탄가스화복합발전(IGCC)용으로 이용되고 있다. 석탄슬러리를 원료로 사용하는 습식 분류층 가스화기는 기술적으로 상당히 안정적이어서 가장 많이 보급되어진 가스화기 형태이다. 본 연구에서는 1.0T/D급 습식 분류상 가스화 장치의 가압 운전 특성 및 가스화 특성, 운전 조건을 파악하기 위하여 실험을 실시하였다. 실험에 사용된 반응기는 운전 압력 30bar로 설계되었으며, Fuel의 공급량은 50~70kg/hr로 공급하였으며, $O_2$/fuel Ratio를 0.7~1.1까지 변경하여 Fuel 주입량에 따른 내부온도 분포와 $O_2$/Fuel 비율에 따른 합성가스의 조성, 탄소 전환율, 냉가스효율 변화 특성을 알아보았다.

  • PDF

An Adaptive Flow Classifier for IP/ATM Hybrid System (IP/ATM 하이브리드 시스템에 대한 적응형 플로우 분류기)

  • Jo, Dae-U;Lee, Seon-U;Byeon, Tae-Yeong;Han, Gi-Jun;Jang, Seong-Sik;Jeong, Yeon-Kwae
    • Journal of KIISE:Information Networking
    • /
    • v.28 no.1
    • /
    • pp.173-181
    • /
    • 2001
  • 최근 인터넷 사용자의 증가와 서비스의 다양화 그리고 이에 따른 고속 인터넷 엑세스 기술의 도입으로 인터넷 트래픽의 급격한 증가를 초래하고 있다. 이러한 이유로 인터넷 패킷 전달에 2계층 스위칭 기술과 3계층 라우팅 기술을 접목한 IP/ATM Hybrid system이 등장하게 되었다. 이러한 시스템에서의 중요한 자원은 2계층 스위칭 기술을 사용하기 위한 유한한 VCI/VPI 공간이다. 이 VCI/VPI 공간을 효과적으로 관리하기 위한 방안으로 많은 방안들이 제시되고 있다. 특히 흐름 기반의 IP/ATM Hybrid system에서의 흐름 분류기를 사용함으로서 VCI/CPI 공간을 관리하고 있다. 본 논문에서 주장하는 적응형X/Y 분류기가 유한한 VCI/VPI 공간을 효율적으로 관리하기 위한 방안임을 제시하고 이에 대하여 실험을 통하여 성능 평가를 실시하였다 특히 동일한 VCI/VPI 공간에서 X/Y분류기와의 비교실험에서 적응형 X/Y 분류기의 성능이 높은 스위칭 율로 나타나고 있다. 즉 적응형 X/Y 분류기가 X/Y분류기에 비하여 효율적으로 VCI/VPI를 관리함을 보이고 있다

  • PDF

A Method of Classification of Overseas Direct Purchase Product Groups Based on Transfer Learning (언어모델 전이학습 기반 해외 직접 구매 상품군 분류)

  • Kyo-Joong Oh;Ho-Jin Choi;Wonseok Cha;Ilgu Kim;Chankyun Woo
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.571-575
    • /
    • 2022
  • 본 논문에서는 통계청에서 매월 작성되는 온라인쇼핑동향조사를 위해, 언어모델 전이학습 기반 분류모델 학습 방법론을 이용하여, 관세청 제공 전자상거래 수입 목록통관 자료를 처리하기 위해서 해외 직접 구매 상품군 분류 모델을 구축한다. 최근에 텍스트 분류 태스크에서 많이 이용되는 BERT 기반의 언어모델을 이용하며 기존의 색인어 정보 분석 과정이나 사례사전 구축 등의 중간 단계 없이 해외 직접 판매 및 구매 상품군을 94%라는 높은 예측 정확도로 분류가 가능해짐을 알 수 있다.

  • PDF