• 제목/요약/키워드: tree-based classification

검색결과 494건 처리시간 0.025초

데이터마이닝을 이용한 표준정책 수요 중소기업의 프로파일링 연구: R&D 동기와 사업화 지원 정책을 중심으로 (An Empirical Study of Profiling Model for the SMEs with High Demand for Standards Using Data Mining)

  • 전승표;정재웅;최산
    • 기술혁신학회지
    • /
    • 제19권3호
    • /
    • pp.511-544
    • /
    • 2016
  • 표준은 호환성 증진, 품질확보 및 안정성 증진, 정보제공 등의 긍정적인 기능과 함께 기술혁신을 유발하는 것으로 알려져 있다. 표준의 순기능이 어떤 특정 기업 집단의 기술혁신 활동이나 사업화에 영향을 주는지 밝히는 것은 표준관련 정책을 수요 집단에 맞춰 적절하게 기획하고 집행하는 것을 가능하게 한다. 따라서 본 연구는 표준 정책 수립과 집행에서 증거기반 정책이라는 측면에서 기여하고자 중소기업 중에서 연구개발 동기가 표준 대응인 기업과 기술사업화를 위해서 표준제도 도입이 필요한 기업을 프로파일링하여, 이런 특정 기업을 판별할 수 있는 예측모형을 개발하고자 한다. 이를 위해, 본 연구는 의사결정나무 분석을 통해 표준 대응을 위해 연구개발을 하는 중소기업과 기술사업화를 위해 표준 규격이나 기술인증 정책을 필요로 하는 중소기업의 특징을 데이터마이닝을 통해 프로파일링 했다. 또한 판별분석을 활용하여 프로파일링된 두 가지 조건의 기업군을 몇 가지 변수로 판별할 수 있는 예측모형을 제시하였으며 판별식의 활용 가능성도 통계적으로 확인했다. 연구결과에 따르면 표준 및 규제 대응을 위해 연구개발을 수행하는 기업은 R&D기획 소요기간, 표준산업분류, 종업원 수, 기술의 신규성 등의 변수에서 차이가 있는 것으로 나타났다. 기술사업화를 위한 표준정책지원 수요기업의 프로파일링 결과에 따르면 표준산업분류, 주거래처, 연구개발 소요기간, 시험검사 능력 등의 변수에서 차이가 있었다. 본 연구에서 프로파일링 결과와 판별분석을 통해 제시한 모형은 향후 표준관련 정책을 기획하거나 집행할 때 표준지원을 필요로 하는 기업에 대한 객관적인 정보를 제공하여 표준관련 사업 성공률을 제고하는데 기여할 것으로 기대된다.

ITS 염기서열에 의한 한국산 쑥속(Artemisia L.)의 계통분류학적 연구 (A phylogenetic analysis of Korean Artemisia L. based on ITS sequences)

  • 이정훈;박충범;박춘근;문성기
    • 한국자원식물학회지
    • /
    • 제23권4호
    • /
    • pp.293-302
    • /
    • 2010
  • 한국산 쑥속 분류군의 계통분류학적 연구를 위해 Nuclear ribosome DNA의 ITS 염기서열 분석을 실시하였다. 정렬된 염기의 총 길이는 635~643 bp이며, ITS1과 ITS2 부위의 길이는 각각 251~255 bp와 217~222 bp로 나타났다. 염기서열 변이를 보이는 site는 95개로 확인되었다. 그 중 ITS1이 35개, ITS2가 26개로 총 72개의 site가 계통학적으로 유효한 것으로 나타남으로써 ITS1이 ITS2보다 종 분화의 변이가 다양하게 발생하는 것으로 확인되었다. ITS 염기서열을 기초한 계통학적 분석은 쑥속 내에 5개의 Clade를 형성하였다. 그 결과 자방이 퇴화된 분류군들(사철쑥, 제비쑥, 섬쑥, 갯제비쑥)이 하나의 분계조(Clade 1)를 형성함으로써 아속 수준(Subgen. Dracunculus)으로 취급되는 결과를 뒷받침 하였다. 애기비쑥과 큰비쑥은 거의 동일한 유전적 정보를 보였으며(Boostrap 99%), 한국산 참쑥의 학명은 재고 되어야할 것으로 사료된다. 또한, 강화약쑥(A. sp.)은 황해쑥과 매우 가까운 상동성을 보였다(Boostrap 89%). 따라서, 형태적 형질의 변이가 다소 연속적인 쑥속은 DNA 염기서열에 기초한 분자계통학적 연구가 유용한 방법으로 판단되며, 본 ITS 연구결과는 한국산 쑥속의 계통분류를 이해하는데 유용한 형질로 기여할 것으로 기대된다.

미토콘드리아 DNA의 제한효소 분석법에 의한 영지의 계통분류 (Phylogeny of Ganoderma Based on the Restriction Enzyme Analysis of Mitochondrial DNA)

  • 홍순규;정학성
    • 미생물학회지
    • /
    • 제32권4호
    • /
    • pp.245-251
    • /
    • 1994
  • 영지속(Ganoderma)에 속하는 7종 10균주에 대하여 미토콘드리아 DNA의 제한효소 분절양상 비교를 통한 계통분석을 수행하였다. 여러 가지 제한효소들 중 생산된 절편이 충분한 정보를 가지고 있으면서 서로 구별할 수 있는 6가지의 제한효소를 분석에 이용하였다. 절편양상을 설 비교하여 전체 절편중 공통된 절편의 개수를 구하고 이로부터 염기위치당 염기치환율을 구하였으며, 이를 균주간의 진화거리로 계산하여 PHYLIP package의 Neighbor-joining 방법에 이한 계통도를 얻고 그 결과를 고찰하였다. 특이한점은 G. lucidum의 3균주와 G. lobatum 이 유연관계가 많이 있다는 점이다. 이러한 결과는 G. lucidum과 G. lobatum은 종의 다양성으로 인하여 과거부터 복합종으로 취급되어 왔으며 고전적인 영지속의 분류에 문제점이 많이 있음을 시사해 주고 있다. 따라서 영지속의 분류가 진화경로에 바탕을 둔 자연분류가 되기 위해서는 형태분류 뿐만 아니라 배양 분류와 분자생물학적이 sqnstjr등 다양한 기준에 의해서 재고되어야 할 것으로 판단된다.

  • PDF

무인항공기를 이용한 소나무재선충병 선단지 예찰 기법: 세종특별자치시를 중심으로 (Use of Unmanned Aerial Vehicle for Forecasting Pine Wood Nematode in Boundary Area: A Case Study of Sejong Metropolitan Autonomous City)

  • 김명준;방홍석;이준우
    • 한국산림과학회지
    • /
    • 제106권1호
    • /
    • pp.100-109
    • /
    • 2017
  • 본 연구는 세종특별자치시 소나무재선충병(PWN) 피해지의 선단지에 대해서 무인항공기를 이용하여 효율적인 예찰 및 방제사업 지원을 실시하기 위해 수행되었다. 선단지를 중심으로 2016년 2월 15일부터 약 2주간 6개 구역 총 2,284 ha의 면적에 대해 무인항공 촬영을 실시하여 GSD (Ground Sample Distance) 12 cm의 고품질 정사영상 6매를 제작하였다. 정사영상을 바탕으로 1차 피해 의심목 분류를 실시한 결과 총 423본이 분류되었다. 그러나 촬영시기의 계절적 특성, 임상의 다양성 등의 문제로 인해 적중률이 낮아짐에 따라 1차 분류 결과와 스냅사진, 비행정보 등을 활용하여 2차 재분류를 실시하였으며, 이를 통해 피해 의심목 423본 중 231본을 추출하였다. 추출된 231본에 대해 대상지별 주제도를 제작하고 GNSS 등을 이용하여 현장조사를 실시하였으며, 그 결과 총 23본의 피해 의심목을 추출하였다. 현장조사를 통해 추출된 23본에 대해 시료를 채취하여 관련기관에 검증을 의뢰한 결과 23본 모두 소나무재선충병에 감염된 것으로 나타났다. 소나무재선충병 피해목의 분포 특성을 분석한 결과 활엽수림 14본, 침엽수림 4본, 소나무림 3본, 리기다소나무림 2본 등 다양한 임상에서 피해목이 검출된 것으로 나타났다. 무인항공기를 활용하여 항공촬영에서부터 현장조사까지의 과정에 대해 효율성 분석을 실시한 결과 2.3인의 인력으로 6일에 걸쳐 수행한 것으로 분석되었다.

기계학습과 GPT3를 시용한 조작된 리뷰의 탐지 (The Detection of Online Manipulated Reviews Using Machine Learning and GPT-3)

  • 체르냐예바 올가;홍태호
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.347-364
    • /
    • 2022
  • 고객의 구매 의사결정에 영향을 주는 온라인 리뷰의 부적절한 조작을 통해 이익을 얻고자 하는 기업 또는 온라인 판매자들 때문에, 리뷰의 신뢰성은 온라인 거래에서 매우 중요한 이슈가 되었다. 온라인 쇼핑몰 등에서 온라인 리뷰에 대한 소비자들의 의존도가 높아짐에 따라 많은 연구들이 조작된 리뷰를 탐지하는 방법에 개발하고자 하였다. 기존의 연구들은 온라인 리뷰를 기반으로 정상 리뷰와 조작된 리뷰를 대상으로 기계학습으로 이용함으로써 조작된 리뷰를 탐지하는 모형을 제시하였다. 기계학습은 데이터를 이용하여 이진분류 문제에서 탁월한 성능을 보여왔으나, 학습에 충분한 데이터를 확보할 수 있는 환경에서만 이러한 성능을 기대할 수 있었다. 조작된 리뷰는 학습용으로 사용할 수 있는 데이터가 충분하지 못하며, 이는 기계학습이 충분한 학습을 할 수 없다는 치명적 약점으로 내포하게 된다. 본 연구에서는 기계학습이 불균형 데이터 셋으로 인한 학습의 저하를 방지할 수 있는 방안으로 부족한 조작된 리뷰를 인공지능을 이용하여 생성하고 이를 기반으로 균형된 데이터 셋에서 기계학습을 학습하여 조작된 리뷰를 탐지하는 방안을 제시하였다. 파인 튜닝된 GPT-3는 초거대 인공지능으로 온라인 플랫폼의 리뷰를 생성하여 데이터 불균형 문제를 해결하는 오버샘플링 접근방법으로 사용되었다. GPT-3로 생성한 온라인 리뷰는 기존 리뷰를 기반으로 인공지능이 작성한 리뷰로써, 본 연구에서 사용된 로짓, 의사결정나무, 인공신경망의 성능을 개선시키는 것을 SMOTE와 단순 오버샘플링과 비교하여 실증분석을 통해서 확인하였다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

<동궐도(東闕圖)>의 러버쉬팅변환을 통한 창덕궁 돈화문 지역의 입체적 식생 경관 추정 (Estimation of the Three-dimensional Vegetation Landscape of the Donhwamun Gate Area in Changdeokgung Palace through the Rubber Sheeting Transformation of )

  • 이재용
    • 헤리티지:역사와 과학
    • /
    • 제51권2호
    • /
    • pp.138-153
    • /
    • 2018
  • 본 연구는 조선 후기에 제작된 <동궐도(東闕圖)>의 분석을 통해 창덕궁 돈화문 지역의 식생 경관을 입체적으로 규명하고자 하였으며 연구의 결과는 다음과 같다. 첫째, <동궐도>에 묘사된 수목은 17세기에 중국으로부터 유입된 수목 표현 입문서인 "개자원화전(芥子園畵傳)"을 토대로 유형의 구분이 가능하였다. 분류 결과에 따라 <동궐도>의 돈화문 지역에 표현된 수목은 10종 50주로 확인되었다. 둘째, <동궐도>의 입면 제작 축척을 이용하여 그림에 묘사된 수목의 실제 크기를 산정할 수 있었다. 산출된 수목의 수고는 최소 4.37m에서 최대 22.37m로 다양하게 나타났다. <동궐도> 제작 이전부터 창덕궁에 생육하고 있는 것으로 확인된 노거수와의 비교를 통해 그림에 묘사된 수목들이 과도하지 않게 현실감 있는 크기로 제작된 것이 확인되었다. 셋째, <동궐도>의 러버쉬팅변환(Rubber Sheeting Transformation)을 통해 현재 수치지형도에 <동궐도>의 식재 평면도 제작이 가능하였다. 특히, 변환 지역의 세분화와 통제점 추가를 통해 제작된 평면도의 정밀도를 향상시킬 수 있었다. 작성된 <동궐도>의 식재 평면도를 통해서 수목의 위치와 밀도의 변화를 파악할 수 있었다. 마지막으로 <동궐도>에서 취득된 수목의 형상 정보와 식재 평면도를 이용하여 3차원 식생 모델의 제작이 가능하였다. 3차원 모델은 실제 사람의 눈높이에서 조망축, 스카이라인, 주변으로의 개방과 차폐 정도 등 현황과의 입체적 경관 비교를 가능하게 함으로써 당시의 조망 특성을 검토하는데 유용하였다. 본 연구는 기존에 논의되어 온 <동궐도>의 사실적 표현을 입증하고 이에 근거하여 기록화에 묘사된 동궐의 식생 경관의 원형을 규명하기 위한 가능성을 제시하였다는 점에서 의의가 있다.

피라미드 상호연결망의 기반 그래프로서의 2n-정방형 메쉬 그래프의 간선 특성 (Edge Property of 2n-square Meshes as a Base Graphs of Pyramid Interconnection Networks)

  • 장정환
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.582-591
    • /
    • 2009
  • 피라미드 그래프는 정방형 메쉬와 트리 구조를 기반으로 하는 상호연결망 토폴로지이다. 본 논문에서는 피라미드 그래프의 각 계층을 구성하고 있는 기반 그래프로서의 정방형 메쉬 그래프의 간선들을 두개의 서로 다른 그룹으로 분류하는 전략을 채택한다. 메쉬 내의 간선 집합은 해당 간선의 양 끝 정점들에 인접된 부모 정점들이 상위 계층 내에서 서로 이웃하는 관계인지 아니면 공유하는 관계인지에 따라서 각각 NPC-간선과 SPC-간선이라는 이름으로 불리는 두 개의 서로 다른 부분집합으로 나누어질 수 있다. 아울러 원래 그래프에서의 SPC-간선들을 압축된 결과 그래프에서는 압축된 슈퍼-정점 내부로 숨김으로써 NPC-간선들에만 초점을 맞출 수 있도록 하기 위해 압축 그래프의 개념을 소개한다. 본 논문에서는 $2^n\times2^n$ 2-차원 정방형 메쉬 내에서 헤밀톤 사이클 구성 시 포함할 수 있는 NPC-간선 개수의 하한 및 상한이 각각 $2^{2n-2}$$3*(2^{2n-2}-2^{n-1})$임을 분석한다. 이 결과를 피라미드 그래프로 확장시킴으로써 n-차원 피라미드 내에서 헤밀톤 사이클에 포함가능한 NPC-간선의 최대 개수가 $4^{n-1}-3*2^{n-1}$-2n+7 임을 증명한다.

개선된 피라미드 네트워크에서 토러스 부그래프의 사이클 확장성 (Cycle Extendability of Torus Sub-Graphs in the Enhanced Pyramid Network)

  • 장정환
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1183-1193
    • /
    • 2010
  • 피라미드 그래프는 병렬처리 분야에서 정방형 메쉬와 트리 구조를 기반으로 하는 상호연결망 위상으로 잘 알려져 있다. 개선된 피라미드 그래프는 이러한 피라미드 그래프보다 성능을 향상시키기 위해 메쉬를 토러스로 대체시킨 구조를 말한다. 본 논문에서는 개선된 피라미드 그래프의 각 계층을 형성하고 있는 기반 부-그래프로서의 정방형 토러스 그래프의 간선들을 두 개의 서로 다른 그룹으로 분류하는 전략을 채택한다. 토러스 그래프 내의 간선 집합은 해당 간선의 양 끝 정점들에 인접된 부모 정점들이 상위 계층에서 서로 인접하는지 아니면 공유하는 관계 인지에 따라 각각 NPC-간선과 SPC-간선이라 불리는 두 개의 서로 다른 부분집합으로 나누어 고려한다. 아울러 원래 그래프에서의 SPC-간선들을 압축된 결과 그래프에서는 압축된 슈퍼-정점 내부로 은닉시킴으로써 NPC-간선들에 대해서만 초점을 맞추도록 하기 위해 압축 그래프의 개념을 소개한다. 본 연구에서는 $2^n{\times}2^n$ 2-차원 정방형 토러스 내에서 헤밀톤 사이클 구성 시 포함할 수 있는 NPC-간선 개수의 하한 및 상한이 각각 $2^{2n-2}$$3{\cdot}2^{2n-2}$임을 분석한다. 이 결과를 개선된 피라미드 그래프로 확장시킴으로써 개선된 n-차원 피라미드 그래프 내에서 헤밀톤 사이클에 포함할 수 있는 NPC-간선의 최대 개수는 $4^{n-1}$-2n+1 개임을 증명한다.