Search | Korea Science

A Comparative Study on Feature Selection and Classification Methods Using Closed Frequent Patterns Mining (닫힌 빈발 패턴을 기반으로 한 특징 선택과 분류방법 비교)

Zhang, Lei;Jin, Cheng Hao;Ryu, Keun Ho
- Annual Conference of KIPS
- /
- 2010.11a
- /
- pp.148-151
- /
- 2010
분류 기법은 데이터 마이닝 기술 중 가장 잘 알려진 방법으로서, Decision tree, SVM(Support Vector Machine), ANN(Artificial Neural Network) 등 기법을 포함한다. 분류 기법은 이미 알려진 상호 배반적인 몇 개 그룹에 속하는 다변량 관측치로부터 각각의 그룹이 어떤 특징을 가지고 있는지 분류 모델을 만들고, 소속 그룹이 알려지지 않은 새로운 관측치가 어떤 그룹에 분류될 것인가를 결정하는 분석 방법이다. 분류기법을 수행할 때에 기본적으로 특징 공간이 잘 표현되어 있다고 가정한다. 그러나 실제 응용에서는 단일 특징으로 구성된 특징공간이 분명하지 않기 때문에 분류를 잘 수행하지 못하는 문제점이 있다. 본 논문에서는 이 문제에 대한 해결방안으로써 많은 정보를 포함하면서 빈발패턴에 대한 정보의 순실이 없는 닫힌 빈발패턴 기반 분류에 대한 연구를 진행하였다. 본 실험에서는 ${\chi}^2$(Chi-square)과 정보이득(Information Gain) 속성 선택 척도를 사용하여 의미있는 특징 선택을 수행하였다. 그 결과, 이 연구에서 제시한 척도를 사용하여 특징 선택을 수행한 경우, C4.5, SVM 과 같은 분류기법보다 더 향상된 분류 성능을 보였다.
https://doi.org/10.3745/PKIPS.y2010m11a.148 인용 PDF

Constructing Korean Dialogue Natural Inference Dataset through Pseudo Labeling (Pseudo Labeling을 통한 한국어 대화 추론 데이터셋 구축)

Young-Jun Lee;Chae-Gyun Lim;Yunsu Choi;Ji-Hui Lm;Ho-Jin Choi
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.205-209
- /
- 2022
페르소나 대화 시스템이 상대방의 개인화된 정보에 일관된 응답을 생성하는 것은 상당히 중요하며, 이를 해결하기 위해 최근에 많은 연구들이 활발히 이루어지고 있다. 그 중, PersonaChat 데이터셋에 대해 수반/중립/모순 관계를 라벨링한 DialoguNLI 데이터셋이 제안되었으며, 일관성 측정, 페르소나 속성 추론 태스크 등 여러 분야에 활용되고 있다. 그러나, 공개적으로 이용가능한 한국어로 된 대화 추론 데이터셋은 없다. 본 연구에서는 한국어로 번역된 페르소나 대화 데이터셋과 한국어 자연어 추론 데이터셋에 학습된 모델을 이용하여 한국어 대화 추론 데이터셋(KorDialogueNLI)를 구축한다. 또한, 사전학습된 언어모델을 학습하여 한국어 대화 추론 모델 베이스라인도 구축한다. 실험을 통해 정확도 및 F1 점수 평가 지표에서 KLUE-RoBERTa 모델을 미세조정(fine-tuning)시킨 모델이 가장 높은 성능을 달성하였다. 코드 및 데이터셋은 https://github.com/passing2961/KorDialogueNLI에 공개한다.
PDF

SRR(Social Relation Rank) and TS_SRR(Topic Sensitive_Social Relation Rank) Algorithm; toward Social Search (소셜 관계 랭크 및 토픽기반_소셜 관계 랭크 알고리즘; 소셜 검색을 향해)

Park, GunWoo;Jung, JeaHak;Lee, SangHoon
- Annual Conference of KIPS
- /
- 2009.04a
- /
- pp.364-368
- /
- 2009
"소셜 네트워크(Social Network)와 검색(Search)의 만남"은 현재 인터넷 상에서 매우 의미 있는 두 영역의 결합이다. 이와 같은 두 영역의 결합을 통해 소셜 네트워크 내에서 친구들의 생각이나 관심사 및 활동을 검색하고 공유함으로써 검색의 효율성과 적합성을 높이기 위한 연구들이 활발히 수행되고 있다. 본 논문에서는 일반적인 소셜 관계 랭크(SRR : Social Relation Rank) 및 토픽이 반영된 소셜 관계 랭크(TS_SRR : Topic Sensitive_Social Relation Rank) 알고리즘을 제안한다. SRR은 소셜 네트워크 내에 존재하는 웹 사용자들의 내재적인 특성 및 검색 성향 등에 대한 관련성(또는 유사정도)을 수치로 산정한 '소셜 관계 지수(SRV : Social Relation Value)'에 랭킹(Ranking)을 부여한 것을 의미한다. 제안하는 알고리즘의 검색 적용 가능성을 검증하기 위해 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜네트워크를 구성 한다. 둘째, 웹 사용자들의 속성에 내재된 정보를 이용하여 토픽별 SRV를 산정한 후 랭킹을 부여하고, 토픽별 변화되는 랭킹에 따라 소셜 네트워크를 재구성 한다. 마지막으로 (TS_)SRR과 웹 사용자들의 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 (TS_)SRR이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 결론적으로 (TS_)SRR 알고리즘을 기반으로 관심분야에 연관성이 높은, 즉 상위에 랭크 된 웹 사용자들을 검색하여 검색 패턴을 공유 또는 상속받는 다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성과 신뢰성 향상에 기여 할 수 있다.
https://doi.org/10.3745/PKIPS.y2009m04a.364 인용 PDF

A Study on Novelty Detection of GPS Data Using Human Mobility and OCSVM(One-class SVM) (OCSVM(One-class SVM)과 인간의 이동을 이용한 GPS 데이터의 이상 현상 검출에 관한연구)

Kim, Woo-Joong;Song, Ha-Yoon
- Annual Conference of KIPS
- /
- 2011.04a
- /
- pp.1060-1063
- /
- 2011
인간은 목적지를 향하여 가는 방법의 선택에 있어서 가고자 하는 목적, 목적지, 출발 시간 등에 영향을 받는다. 그러나 이러한 매개변수들과 더불어 중요하게 고려되는 것은 바로 인간의 습관이다. 다시 말해 인간이 목적지로 가는 방법을 선택하는데 습관이라는 매개변수와 밀접한 영향이 있다는 것이다. 이를 미루어 볼 때, 인간의 이동은 습관으로 인해 대부분 특정한 범주 안에서 이동을 할 것이라는 추측할 수 있다. 나아가, 사람들이 흔히 들고 다니는 GPS장치에서 측정된 데이터가 추측한 속성으로 인해 범주를 벗어나는 이상현상을 검출하는 것으로 확장을 할 수 있다. 즉, GPS장치에서 측정된 데이터는 개인별로 클래스화(Classification)가 가능함을 추론할 수 있다. 본 논문에서는 실제 사람이 이동한 좌표를 바탕으로 시간당 변화량을 계산하여 좌표에 사상시켰다. 그리고, 단일 클래스 서포트 백터 머신(OCSVM)을 가지고 클래스화 했으며, OCSVM의 커널 함수 내의 변수인에 따라 클래스의 크기 혹은 클래스 내부의 밀도에 영향을 받음을 알 수 있었으며, 그 둘 사이에는 적절한 교환(Tradeoff)이 발생하였다는 결론이 나왔다.
https://doi.org/10.3745/PKIPS.y2011m04a.1060 인용 PDF

A Location Correction Scheme based on the RFID Tag for Ubiquitous Warehouse Managements (u-창고관리를 위한 RFID 테그 기반의 위치 보정 기법)

Roh, Kwi-Yong;Song, Jin-Kook;Jung, Chang-Ryul
- Journal of the Korea Society of Computer and Information
- /
- v.14 no.2
- /
- pp.149-155
- /
- 2009
The frequency is widely used to measure the distance. In the warehouse, however, the frequency is apt to be interrupted by various unmade stuffs and cannot be easily applied to that kind of environment. This study will suggest the method to localize a worker in the warehouse exactly with calculating the time difference of arrival from the base position to a node or between each node and with 3-points pin pointer. This study will propose the localizing method using RFID tag and analyze the result using the suggested method. Also, the efficiency of suggested method will be increased with the simulation based on the information from the RFID tag.
https://doi.org/10.9708/jksci.2009.14.2.149 인용 PDF

Accurate dam inflow predictions using SWLSTM (정확한 댐유입량 예측을 위한 SWLSTM 개발)

Kim, Jongho;Tran, Trung Duc
- Proceedings of the Korea Water Resources Association Conference
- /
- 2021.06a
- /
- pp.292-292
- /
- 2021
최근 데이터 과학의 획기적인 발전으로 딥러닝(Deep Learning) 알고리즘이 개발되어 다양한 분야에 널리 적용되고 있다. 본 연구에서는 인공신경망 중 하나인 LSTM(Long-Short Term Memory) 네트워크를 기반으로 정확한 댐유입량 예측을 수행하는 SWLSTM 모델을 제안하였다. SWLSM은 모델의 정확도를 개선하기 위해 세 가지 주요 아이디어를 채택하였다. (1) 통계적 속성 (PACF) 및 교차 상관 함수(CCF)를 사용하여 적절한 입력 변수와 시퀀스 길이를 결정하였다. (2) 선택된 입력 예측 변수 시계열을 웨이블릿 변환(WT)을 사용하여 하위 시계열로 분해한다. (3) k-folds cross validation 및 random search 기법을 사용하여 LSTM의 하이퍼 매개변수들을 효율적으로 최적화하고 검증한다. 제안된 SWLSTM의 효과는 한강 유역 5개 댐의 시단위/일단위/월단위 유입량을 예측하고 과거 자료와 비교함으로써 검증하였다. 모델의 정확도는 다양한 평가 메트릭(R2, NSE, MAE, PE)이 사용하였으며, SWLSTM은 모든 경우에서 LSTM 모델을 능가하였다. (평가 지표는 약 30 ~ 80 % 더 나은 성능을 보여줌). 본 연구의 결과로부터, 올바른 입력 변수와 시퀀스 길이의 선택이 모델 학습의 효율성을 높이고 노이즈를 줄이는 데 효과적임을 확인하였다. WT는 홍수 첨두와 같은 극단적인 값을 예측하는 데 도움이 된다. k-folds cross validation 및 random search 기법을 사용하면 모델의 하이퍼 매개변수를 효율적으로 설정할 수 있다. 본 연구로부터 댐 유입량을 정확하게 예측한다면 정책 입안자와 운영자가 저수지 운영, 계획 및 관리에 도움이 될 것이다.
PDF

Nearest Neighbor-based Pre-processing Scheme for Advanced Skyline Query (최근접 이웃 탐색 기반의 향상된 스카이라인 질의를 위한 전처리 기법)

Kim, Ji-Hyun;Lee, SangMin;Jeon, Hyeongjun;Jin, ChangGyun;Kim, JiYunm;Kwon, Jin youngm;Kim, Jongwanm;Oh, Dukshinm
- Annual Conference of KIPS
- /
- 2020.05a
- /
- pp.420-423
- /
- 2020
스카이라인 질의는 객체의 속성을 기준으로 사용자의 선호에 적합한 대상을 탐색하는 기법이다. 기존 스카이라인 질의는 일괄처리 방식으로 탐색 결과를 반환하지만 대화형 앱이나 모바일 환경과 같이 잦은 위치이동 발생 시 일괄처리 방식으로 스카이라인 질의 결과를 신속하게 받기 어렵다. 최근접 이웃(Nearest Neighbor) 알고리즘은 사용자와 상호 작용이 필요한 대화형 앱에서 실시간으로 선호 객체를 탐색하여 사용자에게 전달함으로써 객체의 반환 속도를 향상시켰다. 그러나 최근접 이웃 알고리즘은 객체 탐색 과정에서 반복적인 비교 연산을 수행하여 불필요한 탐색 시간이 소요된다. 본 논문은 대화형 앱에서 신속한 스카이라인 결과를 산출하고자 연산 대상 객체의 범위를 축소함으로써 최근접 이웃 스카이라인 질의 알고리즘의 성능을 향상시킨 전처리 기법을 제안한다. 데이터 객체는 최대 40,000 개의 실험에서 제안 기법은 최근접 이웃 알고리즘보다 50% 빠른 성능을 나타내어 본 연구의 가용성이 증명되었다.
https://doi.org/10.3745/PKIPS.y2020m05a.420 인용 PDF

Estimation of spatial soil moisture using Sentinel-1 SAR images and ANN considering antecedent precipitation (선행강우를 고려한 Sentinel-1 SAR 위성영상과 ANN을 활용한 공간 토양수분 산정)

Chung, Jeehun;Lee, Yonggwan;Son, Moobeen;Han, Daeyoung;Kim, Seongjoon
- Proceedings of the Korea Water Resources Association Conference
- /
- 2021.06a
- /
- pp.117-117
- /
- 2021
본 연구에서는 Sentinel-1A/B C-band SAR(Synthetic Aperture Radar) 위성영상을 기반으로 인공신경망(Artificial Neural Network, ANN) 모형을 활용해 금강 유역 상류 40×50 km² 면적에 대한 토양수분을 산정하였다. 10 m 공간 해상도의 Sentinel-1A/B SAR 영상은 8일 간격으로 2015년부터 2019년까지 5년 동안 구축하였고, SNAP(SentiNel Application Platform)을 통해 기하 보정, 방사 보정 및 잡음(Noise) 보정을 수행하고 VV 및 VH 편파 후방산란계수로 변환하였다. ANN 모형 검증자료로 TDR(Time Domain Reflectometry)로 측정된 9개 지점의 실측 토양수분 자료를 구축하였으며, 수문학적 개념인 선행강우를 고려하기 위해 동지점에 대한 강수량 자료를 구축하였다. ANN은 각 지점에 해당하는 토양 속성별로 모델링하고, 전체 기간 및 계절별로 나누어 모의하였으며, 전체 자료의 60%와 40%를 각각 훈련 및 테스트 데이터로 사용하였다. 산정된 토양수분은 상관계수(Correlation Coefficient, R)와 평균제곱근오차(Root Mean Square Error, RMSE)를 활용하여 검증을 수행할 예정이다.
PDF

A Causal Model of Perceived Service Quality, Consumer Attitude, and Intention to Repatronize (지각된 서비스 품질, 소비자 태도, 재이용 의도 사이의 인과관계 모형)

이인구;김종배;이문규
- Asia Marketing Journal
- /
- v.2 no.3
- /
- pp.44-63
- /
- 2000
경영관리의 초점이 생산중심에서 마케팅중심 그리고 서비스중심으로 급격히 변화하면서 서비스 경쟁이 중요한 생존무기가 되고 있다. 차별화의 수단으로 서비스의 중요성이 강조되면서 여러 가지 서비스 속성 중에서 서비스 품질에 관한 연구가 활발히 진행되어 왔다. 그러나 서비스 품질을 구성하는 차원을 밝히려는 연구는 많았던데 비해 서비스 품질이 소비자의 태도와 재이용 의도에 어떠한 영향을 미치는가에 관한 연구는 거의 이루어지지 않았다. 본 연구에서는 지각된 서비스 품질을 구성하는 여러 차원들이 소비자의 태도에 어떠한 영향을 주며, 태도는 소비자의 재이용 의도에 어떠한 영향을 주는가를 알아보았다. 자료는 소매점 이용자를 대상으로 수집되었으며 소매점 서비스에 관한 인과관계 모형을 통하여 분석되었다. 연구 결과 기능적 품질에 속하는 신뢰성 차원과 기술적 품질에 속하는 유형설비 차원이 소비자의 태도에 긍정적인 영향을 미치는 것으로 나타났다. 기술적 품질로 볼 수 있는 가격(비용) 차원은 예상대로 부정적인 영향을 주는 것으로 나타났다. 반면에 기능적 품질에 속하는 감정배려는 통계적으로 유의적인 영향을 미치지 못하는 것으로 나타났다. 한편 서비스 품질을 통해 형성된 소비자 태도는 소매점 재이용 의도에 긍정적인 영향을 미치는 것으로 나타났다. 본 연구는 추가적으로 소매점을 특성에 따라 몇 개의 범주로 분류하고 인과관계 모형의 영향 관계가 어떻게 달라지는가를 분석하였다. 분석결과 대형 할인소매점, 백화점, 주거지역 인근의 소매점들에서 상당한 차이를 발견하였다. 즉, 태도와 재이용 의도 사이의 긍정적인 영향관계는 소매점 유형에 관계없이 나타났으나 태도에 영향을 주는 서비스 품질 차원은 매우 다르게 나타났다. 이는 차별화 지표로 서비스 품질을 사용할 경우에 서비스 관리자들이 어떠한 전략을 선택해야 하는가에 관하여 시사하는 바가 크다. 아울러 동일범주의 서비스 산업이더라도, 서비스의 특성에 따라 서비스 품질을 구성하는 중요한 차원을 규명하기 위한 추가 연구의 필요성을 제기한다.
PDF

Defect Severity-based Dimension Reduction Model using PCA (PCA를 적용한 결함 심각도 기반 차원 축소 모델)

Kwon, Ki Tae;Lee, Na-Young
- Journal of Software Assessment and Valuation
- /
- v.15 no.1
- /
- pp.79-86
- /
- 2019
Software dimension reduction identifies the commonality of elements and extracts important feature elements. So it reduces complexity by simplify and solves multi-collinearity problems. And it reduces redundancy by performing redundancy and noise detection. In this study, we proposed defect severity-based dimension reduction model. Proposed model is applied defect severity-based NASA dataset. And it is verified the number of dimensions in the column that affect the severity of the defect. Then it is compares and analyzes the dimensions of the data before and after reduction. In this study experiment result, the number of dimensions of PC4's dataset is 2 to 3. It was possible to reduce the dimension.
https://doi.org/10.29056/jsav.2019.06.09 인용

Search Result 1,573, Processing Time 0.037 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)