• 제목/요약/키워드: 식별기술

검색결과 2,087건 처리시간 0.026초

사용자 리뷰의 평가기준 별 이슈 식별 방법론: 호텔 리뷰 사이트를 중심으로 (Methodology for Identifying Issues of User Reviews from the Perspective of Evaluation Criteria: Focus on a Hotel Information Site)

  • 변성호;이동훈;김남규
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.23-43
    • /
    • 2016
  • 최근 IT기술의 발전에 따라 많은 사람들이 자신들의 여가활동에 대한 경험을 공유하고 있으며, 역으로 다른 사람들의 여가활동에 대한 경험을 참고하여 더 나은 여가활동을 누릴 수 있는 기회를 얻게 되었다. 이러한 현상은 영화, 숙박, 음식, 여행 등 여가활동 전반에 걸쳐 나타나고 있으며, 그 중심에는 여가활동에 대한 정보를 요약하여 제공하는 수많은 사이트가 있다. 대부분의 여가활동 정보 사이트는 각 상품에 대한 평균 평점뿐만 아니라 상세 리뷰를 제공함으로써, 해당 상품을 구매하고자 하는 잠재고객의 의사결정을 지원하고 있다. 하지만 기존 대부분의 사이트는 한 단계의 평가기준에 따라 평점과 리뷰를 제공하기 때문에, 각 평가기준을 구성하는 세부요소에 대한 특징과 평가기준 별 주요 이슈를 파악하기 위해서는 상당히 많은 수의 리뷰를 직접 읽어야 한다는 불편이 따른다. 즉 사용자는 자신이 중요한 것으로 생각하는 평가기준에 대한 조건을 파악하기 위해, 많은 수의 리뷰를 하나하나 읽어보는 과정에서 많은 시간과 노력을 소비하게 된다. 예를 들어 호텔의 접근성, 객실, 서비스, 음식 등 한 단계의 평가기준만을 사용하여 평점과 리뷰를 제공하는 사이트의 경우, 접근성 중 특히 지하철역과의 거리, 객실 중 특히 욕실의 상태를 살펴보고자 하는 사용자에게 필요한 정보를 충분히 제공하지 못하게 된다. 따라서 본 연구에서는 기존 여가활동 정보 사이트의 한계, 즉 평가기준별로 입력된 리뷰를 신뢰하기 어렵다는 점과 평가기준을 구성하고 있는 세부 내용을 파악하기 어렵다는 점을 극복하기 위한 방안을 제시하고자 한다. 본 연구에서 제안하는 방법론은 사용자가 별도의 구분 없이 입력한 리뷰를 그 내용에 따라 평가기준별로 자동 분류하고, 각 평가 기준 별 주요 이슈를 요약하여 제공한다. 제안 방법론은 최근 텍스트 분석에 활발하게 사용되고 있는 토픽 모델링(Topic Modeling)에 기반을 두고 있으며, 각 리뷰를 하나의 문서 단위로 사용하는 것이 아니라 리뷰를 문장 단위로 끊어 개별 리뷰 유닛(Review Unit)으로 분해한 뒤, 평가기준별로 리뷰 유닛을 재구성하여 분석한다는 측면에서 기존의 토픽 모델링 기반 연구와 큰 차이가 있다고 할 수 있다. 본 논문에서는 제안 방법론을 실제 호텔 정보 사이트에서 수집한 423건의 리뷰 문서에 적용하여 6가지 평가기준에 대해 총 4,860건의 리뷰 유닛을 재구성하고, 이에 대한 분석 결과를 소개함으로써 제안 방법론의 유용성을 간접적으로 보인다.

다중가우시안혼합모델을 이용한 소동물 심근경색 PET 영상의 정량적 평가 기술 (Quantitative Assessment Technology of Small Animal Myocardial Infarction PET Image Using Gaussian Mixture Model)

  • 우상근;이용진;이원호;김민환;박지애;김진수;김종국;강주현;지영훈;최창운;임상무;김경민
    • 한국의학물리학회지:의학물리
    • /
    • 제22권1호
    • /
    • pp.42-51
    • /
    • 2011
  • 전통적으로 심근 생존능을 식별하고 심근 관류를 정확히 평가하기 위한 도구로 핵의학영상이 이용되고 있으나 경색영역을 정의하기에는 어려움이 있다. 이에 본 연구에서는 극성지도의 분포를 분석하여 특성에 맞는 적응적 임계값을 이용하여 심근경색 모델을 정량적으로 평가하고자 하였다. 쥐 심근경색 모델은 왼쪽 관상동맥을 결찰시켜 제작하였다. 소동물PET 영상은 37 MBq $^{18}F$-FDG를 쥐의 꼬리정맥에 주사한 후 60분 섭취 후 Siemens Inveon SPECT/PET 스캐너를 이용하여 20분 동안 ECG 신호와 함께 획득하였고, OSEM 2D 알고리즘을 이용하여 재구성하였다. PET 영상의 심근 극성지도는 Siemens QGS 소프트웨어에 적합한 형식으로 변환 후 자동으로 심근 벽을 설정하여 작성하였다. 심근경색영역의 기준데이터는 TTC 염색으로 설정하였으며 전체 좌심실대비 염색된 영역의 백분율로 획득하였다. 최적의 임계값 설정을 위해 절대치 설정 방법, Otsu 알고리즘, 다중가우시안혼합모델(Multi Gaussian mixture model, MGMM)을 이용하여 평가하였다. 절대치 설정 방법은 10~90%까지 10%단위로 미리 정의 된 임계값을 이용하였고, Otsu 알고리즘은 영상 내에서 두 군집의 분산을 최대로 하는 임계값으로 설정하였다. MGMM 방법은 영상의 화소 강도를 분석하여 여러 개의 가우시안 분포함수(MGMM2, $\cdots$ MGMM4)로 반복 수행하여 최적의 가우시안 분포를 구하여 적응적 임계값을 설정하였다. 극성지도 평가지표는 각각의 알고리즘에서 측정된 임계값을 이용하여 이진화하고 전체 극성지도와 경색영역의 백분율로 획득한 후, TTC 염색으로 획득된 기준데이터와의 차이를 비교하였다. 그 차이는 절대치 방법의 20%에서 $7.04{\pm}3.44%$, 30%에서 $3.87{\pm}2.09%$, 40%에서 $2.15{\pm}2.07%$이었다. Otsu 방법은 $3.56{\pm}4.16%$이었으며 MGMM 방법은 $2.29{\pm}1.94%$이었다. 소동물 PET 극성지도에서는 30% 임계값이 조직학적 데이터와 비교하여 가장 작은 차이를 보였다. 그러나 TTC 염색으로 측정한 크기가 10% 이하에서는 MGMM 방법이 절대치 방법보다 작은 차이를 보였다(MGMM: 0.006%, 절대치방법: 0.59%). 이 연구에서는 심근경색 모델 평가를 위하여 생체영상 극성지도에서 다중가우시안혼합모델을 이용하여 평가하고자 하였다. MGMM은 사용자의 선택 없이도 자동적으로 영상 특성을 고려하여 적응적 임계값을 찾아주는 방법으로 극성지도에서 심근경색을 평가하는데 도움이 될 것으로 기대된다.

부정 탐지를 위한 이상치 분석 활용방안 연구 : 농수산 상장예외품목 거래를 대상으로 (A Study on the Application of Outlier Analysis for Fraud Detection: Focused on Transactions of Auction Exception Agricultural Products)

  • 김동성;김기태;김종우;박성기
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.93-108
    • /
    • 2014
  • 기업 의사 결정 지원을 위하여 거래 데이터를 다양한 관점에서 분석하고 활용하려는 노력과 관심들이 증가하고 있다. 이러한 노력들은 고객 관리나 마케팅에만 국한되는 것이 아니라 부정행위에 대한 감시와 탐지를 목적으로도 다양한 분석 방안들이 연구되고 있다. 부정행위는 기술의 발전을 악용하여 다양한 형태로 진화하고 있으며, 이에 따라 목적에 맞는 부정탐지 방안 연구와 적용을 통하여 탐지 효용의 극대화를 위한 노력의 필요성이 증가하고 있다. 이러한 연구 동향의 일환으로 본 연구에서는 대용량 거래 데이터가 저장 관리되고 있는 국내 최대 농수산물 유통 시장의 2008년부터 2010년까지 상장예외품목의 거래 가격을 분석하여 부정 탐지 규칙을 도출하였으며, 전문가 검증을 통하여 도출 된 규칙의 신뢰성을 확보하였다. 본 연구의 주요 부정거래 분석 방안으로는 정상적인 데이터들은 발생 확률이 높은 반면에 특이한 데이터들의 발생 확률은 낮다고 가정하는 통계적 접근을 통한 이상치 식별 방안을 활용하였다. 이에 따라 부정거래 분석 별로 정의 된 Z-Score 값보다 클 경우 부정거래 탐지 대상이 된다. 다만 상장예외품목 거래의 경우 취급 가능한 중도매인의 수가 제한되어 있으며, 일반적인 상장품목의 거래보다 거래량이 적기 때문에 소수의 이상치가 품목의 평균에 미치는 영향이 크다. 그 예로 다른 소수의 중도매인들이 해당 품목을 정상적인 가격에 거래하였더라도, 특정한 중도매인 한 명이 지나치게 비정상적인 가격에 거래할 경우 모든 거래들이 부정거래로 탐지 될 가능성도 있다. 이러한 문제를 해결하기 위하여 기존의 Z-Score의 개념을 활용하여 수정된 Z-Score(Self-Eliminated Z-Score)를 사용하였다. 또한 부정 유형별 탐지 규칙 관리와 활용을 위한 시스템 프로토타입(prototype) 개발을 수행하였다. 이를 통하여 실제 부정거래 탐지 업무에 적용할 수 있는 효과적인 방안을 제시하였고, 농수산 유통시장의 공정성 및 투명성 확보를 위한 관리 감독의 기능 강화가 가능할 것이다.

공공 서비스 수출 플랫폼을 위한 온톨로지 모형 (An Ontology Model for Public Service Export Platform)

  • 이광원;박세권;류승완;신동천
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.149-161
    • /
    • 2014
  • 공공 서비스의 수출의 경우 수출 절차와 대상 선정에 따른 다양한 문제가 발생하며, 공공 서비스 수출 플랫폼은 이러한 문제점들을 해결하기 위하여 사용자 중심의 유연하고, 개방형 구조의 디지털 생태계를 조성할 수 있도록 구현되어야 한다. 또한 공공서비스의 수출은 다수의 이해당사자가 참여하고 여러 단계의 과정을 거쳐야 하므로 사용자의 이해 종류와 탐색 컨설팅 협상 계약 등 수출 프로세스 단계별로 맞춤형 플랫폼 서비스 제공이 필수적이다. 이를 위해서 플랫폼 구조는 도메인과 정보의 정의 및 공유는 물론 지식화를 지원할 수 있어야 한다. 본 논문에서는 공공서비스 수출을 지원하는 플랫폼을 위한 온톨로지 모형을 제안한다. 서비스 플랫폼의 핵심 엔진은 시뮬레이터 모듈이며 시뮬레이터 모듈에서는 온톨로지를 사용하여 수출 비즈니스의 여러 컨텍스트들을 파악하고 정의하여 다른 모듈들과 공유하게 된다. 온톨로지는 공유 어휘를 통하여 개념들과 그들 간의 관계를 표현할 수 있으므로 특정 영역에서 구조적인 틀을 개발하기 위한 메타 정보를 구성하는 효과적인 도구로 잘 알려져 있다. 공공서비스 수출 플랫폼을 위한 온톨로지는 서비스, 요구사항, 환경, 기업, 국가 등 5가지 카테고리로 구성되며 각각의 온톨로지는 요구분석과 사례 분석을 통하여 용어를 추출하고 온톨로지의 식별과 개념적 특성을 반영하는 구조로 설계한다. 서비스 온톨로지는 목적효과, 요구조건, 활동, 서비스 분류 등으로 구성되며, 요구사항 온톨로지는 비즈니스, 기술, 제약으로 구성 된다. 환경 온톨로지는 사용자, 요구조건, 활동으로, 기업 온톨로지는 활동, 조직, 전략, 마케팅, 시간으로 구성되며, 국가 온톨로지는 경제, 사회기반시설, 법, 제도, 관습, 인프라, 인구, 위치, 국가전략 등으로 구성된다. 수출 대상 서비스와 국가의 우선순위 리스트가 생성되면 갭(gap) 분석과 매칭 알고리즘 등의 시뮬레이터를 통하여 수출기업과 수출지원 프로그램과의 시스템적 연계가 이루어진다. 제안하는 온톨로지 모형 기반의 공공서비스 수출지원 플랫폼이 구현되면 이해당사자 모두에게 도움이 되며 특히 정보 인프라와 수출경험이 부족한 중소기업에게 상대적으로 더 큰 도움이 될 것이다. 또한 개방형 디지털 생태계를 통하여 이해당사자들이 정보교환, 협업, 신사업 기획 등의 기회를 만들 수 있을 것으로 기대한다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

국방 온톨로지를 통한 지능형 의사결정지원시스템 구축 및 활용 - 공군 군수상황관리체계 적용 사례 (Construction and Application of Intelligent Decision Support System through Defense Ontology - Application example of Air Force Logistics Situation Management System)

  • 조원기;김학진
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.77-97
    • /
    • 2019
  • 제 4차 산업혁명의 초연결 환경에서 발생하는 많은 양의 데이터는 제 4차 산업혁명을 기존의 생산 환경과 구분지어 주는 주요한 요소이다. 이러한 환경은 데이터를 필요로 하는 동시에 데이터를 생산하는 양면적인 특징을 가진다. 때문에 앞으로의 정보 시스템은 기존의 정보시스템보다 양적인 측면에서 더 많은 데이터를 처리해야 하며, 질적인 측면에서는 많은 데이터 중 사용자의 목적에 부합하는 목표 데이터만을 추출하는 능력이 요구된다. 작은 규모의 정보 시스템에서는 사람이 그 시스템을 정확히 이해하고 필요한 정보를 획득하는 것이 가능하지만, 시스템에 대해 정확한 이해가 어려워진 다양하고 복잡한 시스템에서는 원하는 정보를 획득하는 것이 점점 더 어려워진다. 이러한 문제는 데이터를 사람뿐 아니라 컴퓨터가 이해할 수 있는 온톨로지로 표현하여 다양한 정보처리가 가능하도록 하는 시맨틱 웹(Semantic Web) 구축이 해결책이 될 수 있다. 군에서도 현재 대부분의 업무가 정보 시스템을 통해 이루어지고 있는데, 정보의 입력이나 가공 등 단순처리 중심으로 구축된 기존 시스템이 점점 더 많은 양의 데이터를 포함하게 되면서 시스템을 쉽게 활용하기 위한 노력이 필요한 상황이다. 본 연구에서는 온톨로지를 통한 지능형 의사결정지원시스템의 예로 온톨로지 기반 군수상황관리체계를 제안하고자 한다. 온톨로지 기반 군수상황관리체계는 기존의 군수정보체계의 복잡한 정보를 직관적으로 보여주기 위해 구축된 군수상황관리체계를 온톨로지를 통해 구축하였으며, 성과기반군수지원 계약관리, 부품사전 등의 유용한 기능을 추가 식별하여 온톨로지에 포함하였다. 또한 구축된 온톨로지가 의사결정지원에 활용할 수 있는지를 확인하기 위해 시맨틱 웹 기술을 통해 기본적인 질의응답은 물론 추론 및 함수를 통한 분석기능을 구현하였다.

초위성체 마커를 활용한 가축다양성정보시스템(DAD-IS) 등재 재래닭 집단의 유전적 다양성 분석 (Genetic Diversity of Korean Native Chicken Populations in DAD-IS Database Using 25 Microsatellite Markers)

  • 노희종;김관우;이진욱;전다연;김승창;고응규;문성실;이현정;이준헌;오동엽;변재현;조창연
    • 한국가금학회지
    • /
    • 제46권2호
    • /
    • pp.65-75
    • /
    • 2019
  • 본 연구는 세계식량농업기구(FAO) 가축다양성정보시스템(DAD-IS)에 등재되어 있는 우리나라 재래닭 집단의 유전적 다양성 및 외래품종과의 차별성을 분석하기 위해 25개의 초위성체(MS) 마커를 이용하여 총 18개 집단 548수의 유전자형을 분석하였고, 이를 토대로 기대($H_{\exp}$) 및 관측이형접합도($H_{obs}$), 다형정보지수(PIC), 유전거리, 유전적 균일도 등을 계산하였다. 마커별 다형성 분석 결과, 총 195개의 대립유전자가 나타났으며, $H_{\exp}$와 PIC의 경우 MCW0145에서 각각 0.646, 0.569로 가장 높았으며, $H_{obs}$의 경우 ADL0278에서 0.773으로 가장 높은 수치를 보이고 있었던 반면, MCW0078에서는 $H_{\exp}$, $H_{obs}$, PIC가 각각 0.263, 0.291, 0.217로 가장 낮은 것을 확인할 수 있었다. 집단간 다양성 분석 결과로는 MNA, $H_{\exp}$, $H_{obs}$, PIC 모두 황갈색재래종(KNY) 집단(각각 4.60, 0.627, 0.643, 0.563)에서 가장 높게, 횡성약닭(HYD) 집단(각각 1.84, 0.297, 0.286, 0.236)에서 가장 낮게 나타났다. 대립유전자형의 빈도를 바탕으로 계산된 18개 품종간의 DA 유전거리 분석 결과, 횡성약닭(HYD)와 화이트레그혼F(LGF) 집단 사이에서 0.675로 가장 먼 유전거리를 형성하고 있었으며, 같은 품종인 로드아일랜드레드 두 집단(RRC, RRD) 사이에서 0.027로 가장 가까운 유전거리를 보였다. 한편, 같은 품종임에도 불구하고, 코니시 두 집단(COS, COH)사이에서는 0.313의 비교적 먼 유전거리를 나타내고 있었다. 집단의 실제 구조를 확인하기 위한 집단별 균일도 분석 결과, K=15에서 최적의 K값(${\Delta}K:66.22$)을 얻을 수 있었으며, 18개의 집단 중 14개의 집단에서 90% 이상의 높은 유전적 균일도를 나타내며 독립적인 군락을 형성하고 있었다. 또한, 황갈색재래종(KNY), 현인흑계(HIC), 연산오계(KNO) 집단에서도 각각 88.9%, 83.9%, 76.3%로 독립적인 군락을 형성하고 있는 것을 확인할 수 있었다. 반면, 제주재래닭(JJC)의 경우 독립적인 군락을 형성하지 못하고, 황갈색재래종(KNY) 집단이 속해 있는 2번 군락에서 가장 높은 44.3%의 균일도를 보이고 있었으며, 3번 군락(17.7%)과 8번 군락(19.1%)에도 일부 포함되어 있는 것으로 보아 집단 조성 과정에 있어 타집단과의 교잡이 일어났을 것으로 추정되며, 독립적인 집단으로 구분하는 것이 어렵기 때문에 추후 개체식별을 통한 지속적인 계획교배를 실시하여 유전적 고정화 작업이 이루어질 필요성이 있을 것으로 판단된다. 이상의 결과로 DAD-IS에 등재되어 있는 우리나라 재래닭 집단이 외래 토착종 집단과 확연하게 구분이 되며, 각 재래닭 집단간에도 비교적 뚜렷하게 구분되는 것을 확인함으로써, 고유 종자로서의 과학적인 근거를 확보할 수 있었으며, 추후 재래닭 유전자원에 대한 국가 수준의 관리 및 평가를 통해 다양한 육종 소재로 이용할 수 있는 기초자료로써 활용될 수 있을 것으로 보인다.