Search | Korea Science

Loss-adjusted Regularization based on Prediction for Improving Robustness in Less Reliable FAQ Datasets (신뢰성이 부족한 FAQ 데이터셋에서의 강건성 개선을 위한 모델의 예측 강도 기반 손실 조정 정규화)

Park, Yewon;Yang, Dongil;Kim, Soofeel;Lee, Kangwook
- Annual Conference on Human and Language Technology
- /
- 2019.10a
- /
- pp.18-22
- /
- 2019
FAQ 분류는 자주 묻는 질문을 범주화하고 사용자 질의에 대해 가장 유사한 클래스를 추론하는 방식으로 진행된다. FAQ 데이터셋은 클래스가 다수 존재하기 때문에 클래스 간 포함 및 연관 관계가 존재하고 특정 데이터가 서로 다른 클래스에 동시에 속할 수 있다는 특징이 있다. 그러나 최근 FAQ 분류는 다중 클래스 분류 방법론을 적용하는 데 그쳤고 FAQ 데이터셋의 특징을 모델에 반영하는 연구는 미미했다. 현 분류 방법론은 이러한 FAQ 데이터셋의 특징을 고려하지 못하기 때문에 정답으로 해석될 수 있는 예측도 오답으로 여기는 경우가 발생한다. 본 논문에서는 신뢰성이 부족한 FAQ 데이터셋에서도 분류를 잘 하기 위해 손실 함수를 조정하는 정규화 기법을 소개한다. 이 정규화 기법은 클래스 간 포함 및 연관 관계를 반영할 수 있도록 오답을 예측한 경우에도 예측 강도에 비례하여 손실을 줄인다. 이는 오답을 높은 확률로 예측할수록 데이터의 신뢰성이 낮을 가능성이 크다고 판단하여 학습을 강하게 하지 않게 하기 위함이다. 실험을 위해서는 다중 클래스 분류에서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 비교 실험을 위한 정규화 방법으로는 통상적으로 사용되는 라벨 스무딩을 채택했다. 실험 결과, 본 연구에서 제안한 방법은 기존 방법보다 성능이 개선되고 보다 안정적으로 학습이 된다는 것을 확인했으며, 데이터의 신뢰성이 부족한 상황에서 효과적으로 분류를 수행함을 알 수 있었다.
PDF

An Efficient Mode Decision Method for Fast Intra Prediction of SVC (SVC에서 빠른 인트라 예측을 위한 효율적인 모드 결정 방법)

Cho, Mi-Sook;Kang, Jin-Mi;Chung, Ki-Dong
- Journal of KIISE:Computing Practices and Letters
- /
- v.15 no.4
- /
- pp.280-283
- /
- 2009
To improve coding performance of scalable video coding which is an emerging video coding standard as an extension of H.264/AVC, SVC uses not only intra prediction and inter prediction but inter-layer prediction. This causes a problem that computational complexity is increased. In this paper, we propose an efficient intra prediction mode decision method in spatial enhancement layer to reduce the computational complexity. The proposed method selects Inra_BL mode using RD cost of Intra_BL in advance. After that, intra mode is decided by only comparing DC modes. Experimental results show that the proposed method reduces 59% of the computation complexity of intra prediction coding, while the degradation in video quality is negligible.
PDF KSCI

Prediction model of plasma deposition process using genetic algorithm and generalized regression neural network (유전자 알고리즘과 일반화된 회귀신경망을 이용한 플라즈마 증착공정 예측모델)

Lee, Duk-Woo;Kim, Byung-Whan
- Proceedings of the Korean Institute of Electrical and Electronic Material Engineers Conference
- /
- 2004.07b
- /
- pp.1117-1120
- /
- 2004
경제적인 공정분석과 최적화를 위해서는 컴퓨터를 이용한 플라즈마 예측모델이 요구되고 있다. 본 연구에서는 일반화된 회귀 신경망 (GRNN)을 이용하여 플라즈마 증착공정 모델을 개발한다. GRNN의 예측성능은 패턴층 뉴런의 가우시안 함수를 구성하는 학습인자, 즉 spread에 의존한다. 종래의 모델에서는 모든 가우시안 함수의 spread가 동일한 값에서 최적화되었으며, 이로 인해 모델의 예측성능을 향상시키는 데에는 한계가 있었다. 본 연구에서는 유전자 알고리즘 (GA)를 이용하여 다변수 spread를 최적화하는 기법을 개발하였으며, 그 성능을 PECVD 공정에 의해 증착된 SiN 박막의 증착률에 적용하여 평가하였다. $2^{6-1}$ 부분인자 실험계획법에 의해 수집된 데이터를 이용하여 신경망을 학습하였고, 모델적합성 점검을 위해 별도의 12번의 실험을 수행하였다. 가우시안 함수의 spread는 0.2에서 2.0까지 0.2간격으로 증가시켰으며, 최적화한 GA-GRNN모델의 예측성능은 6.6 ${\AA}/min$이었다. 이는 종래의 방식으로 최적화한 모델의 예측성능 (13.5 ${\AA}/min$)과 비교하여 50.7% 향상된 예측성능이며, 이러한 향상은 제안한 GA-GRNN 모델이 플라즈마 공정 모델의 예측성능을 증진하는데 매우 효과적임을 보여준다.
PDF

An Efficient Scheme for Motion Estimation Using Multi-reference Frames in H.264/AVC (H.264에서 다중참조 프레임을 이용한 효율적인 움직임 예측)

Kim Sung-Eun;Han Jong-Ki
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.31 no.9C
- /
- pp.859-868
- /
- 2006
H.264에서 다중참조 프레임을 사용한 움직임 예측 방법은 단일 참조프레임을 이용한 움직임 예측보다 더 많은 시간적 중복성을 제거하여 부호화 효율을 높이거나 채널에러에 강인하게 부호화하기 위해 사용된다. 하지만 다중 참조 프레임을 이용하여 움직임 예측을 하는 것은 단일의 참조 프레임을 이용하는 것보다 많은 계산량을 요구하기 때문에 비디오 인코더의 복잡도를 증가시키게 된다. 본 논문에서는 다중참조 프레임을 사용한 움직임 예측을 화질 열화 없이 적은 복잡도로서 가능하게 하는 알고리즘을 제안한다. 움직임 예측 절차의 복잡도를 줄이기 위해, 제안한 알고리즘에서는 연속되는 프레임 사이에 구성된 움직임 벡터맵을 이용하여 움직임벡터를 추정한다. 제안한 방식은 추정된 움직임벡터를 작은 탐색영역에서 보정하는 방식을 적용하기 때문에 기존의 방식들에 비해 적은 복잡도가 요구된다. 제안된 방법으로 추정된 움직임벡터는 각 참조프레임들에 대해 최적의 움직임 벡터를 효과적으로 추적하기 때문에 부호화 된 영상의 화질은 전 탐색영역 움직임 예측 알고리즘을 이용한 결과와 매우 비슷하다. 제안된 방식은 세가지 단계로 구성된다. (a) 연속되는 두 개의 프레임 사이에 벡터맵을 구성한다. (b) 벡터맵에 있는 요소벡터를 이용하여 시간적 움직임 벡터를 구성한다. (c) 마지막으로, 임시 움직임 벡터를 좁은 탐색영역에서 보정한다. 컴퓨터 실험을 통해 제안된 방식의 효율성을 입증하였다. 제안된 방식과 기존의 방식들과의 비교를 위해 H.264 부호화기에서 움직임 예측 모듈에 의해 소비된 CPU 시간을 측정하였다. 컴퓨터 실험을 통해 알 수 있듯이 제안된 방식에 의해 부호화된 영상의 화질은 기존 방식과 을 통해 얻은 영상화질과 거의 같으면서 알고리즘 복잡도는 크게 줄어드는 것을 볼 수 있다.
PDF KSCI

Prosodic-Boundary Prediction for Korean Text-to-Speech System (한국어 TTS 시스템을 위한 운율구 경계 예측)

Chun Jin-wook;Kim Han Woo;Kim Dong gun;Lee Yanghee
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.77-82
- /
- 2002
운율은 음성의 초분절적인 면에 연관하는 음성의 한 성으로서 통상적으로 화자는 음성을 달하는 과정에서 청자의 이해를 돕기 위해 운율을 사용하게 된다. 본 논문은 이러한 운율을 이루는 성분 중의 하나인 운율구의 위치 예측에 대한 성능을 향상시키는 것에 그 목적을 둔다. 한국어 운율 정보에 대한 표기 방법 중의 하나인 K-ToBI를 기반으로 하여, 운율구의 경계와 그에 대한 레벨을 Break Indices 정보로서 나타내었고, 통계학 분야에서 제안된 Support Vector Machine(SVM)을 이용하여 시스템의 예측률 향상을 꾀하였다. 기존의 방법에서 사용된 트리 기반 모델을 이용하여 한국어 운율에 가장 많은 영향을 끼치는 언어 정보들을 추출하였고 이를 실험에 적용하였다. 기존의 트리 모델과 SVM 모델에 대한 예측률을 비교한 결과, 경계 유무 정보 예측과 4단계의 레벨을 가지는 경계 정보의 예측에서 모두 본 방법이 보다 높은 예측률을 보여 주어 본 연구에서 제시한 접근법이 운율구의 경계 정보를 예측하는 데에 있어 더욱 효과적인 접근법임을 실험적으로 입증하였다.
PDF

Prediction of Number of Movie Audience Using Feature Minimization and Data Selection (특징 최소화와 데이터 선별을 활용한 영화 관객수 예측)

Yang, Youngbo;Yu, Heonchang
- Proceedings of the Korea Information Processing Society Conference
- /
- 2019.05a
- /
- pp.443-446
- /
- 2019
빅데이터 분석을 위해 많이 사용하고 있는 기계학습 알고리즘들 중 딥러닝 알고리즘이 많이 활용되고 있으며 분류와 예측에 높은 정확도를 나타내고 있다. 딥러닝 알고리즘의 적용에 따른 많은 장단점들이 있지만, 단점은 분석에 사용되는 특징들이 너무 많다는 것과 분석 모델을 만드는데 사용되는 알고리즘도 여러 가지를 적용하다 보니 분석 시간이 오래 걸린다는 것이다. 이런 단점들은 업무를 파악하면 특징을 최소화할 수 있고 필요로 하는 정보만 선별해서 대표적인 딥러닝 알고리즘 하나에 분석을 하게 되면 분석 시간을 단축시킬 수 있다. 이 실험은 [1], [2]에서 연구한 영화 관객수 예측 모델을 4개의 특징으로 최소화하고 선별된 데이터를 인공신경망 알고리즘 하나로 예측 모델을 생성하였을 때 유의미한 정보를 도출해 낼 수 있는지를 알아보기 위한 것이다. 실험결과는 최종 관객수를 1명 단위까지 정확하게 예측하지는 못했지만 비슷한 수준의 관객수 정보를 예측하였다. 학문적인 접근으로 보았을 때 예측 정확도가 높지 않으면 사용이 불가능한 모델이라고 판단할 수 있지만, 기업 입장으로 접근해 보았을 때 예측 정보가 [1]. [2] 연구 결과에 비해 부족한 수준은 아니다. 총 소요된 시간은 기획 3일, 데이터 수집 및 모델 개발 5일, 분석 시간 10분으로 개발 시간 단축, 업무 효율성 향상, 비용 절감을 기대할 수 있다.
https://doi.org/10.3745/PKIPS.y2019m05a.443 인용 PDF

The Usability Evaluation of Menu Interfaces using ACT-R : Focusing on Performance Prediction (ACT-R 모델을 이용한 메뉴 인터페이스의 사용성 평가 : 수행도 예측을 중심으로)

Jo, Seong-Sik;Cha, Yeon-Joo;Myung, Ro-Hae
- 한국HCI학회:학술대회논문집
- /
- 2009.02a
- /
- pp.1064-1068
- /
- 2009
인지모델(Cognitive Model)에 의한 사용성 평가는 실제 실험에 의한 방법에 비해 시간, 노력, 비용을 절감할 수 있다. 여러 인지모델 중 ACT-R(Adaptive Control of Thought Rational)은 인간의 모든 인지과정을 상세하게 묘사할 수 있어 다른 모델보다 정확히 인간의 과제 수행을 정량적으로 예측할 수 있다. 그러나 ACT-R 모델을 수립하기 위해서는 인간의 지각, 주의, 기억 인출 등의 처리 과정과 행동 선택 및 수행에 필요한 과제 수행 규칙을 매우 상세하게 분석 및 기술해야 하기 때문에, GUI(Graphic User Interface) 환경에서 운용되는 메뉴 인터페이스와 같이 다양한 시각적 정보의 처리가 요구되는 과제에 대한 모델을 수립하는데는 많은 시간과 노력이 요구된다. 이에 본 연구에서는 GUI 환경에서 전문가 수준의 과제 수행을 예측할 수 있는 간략화한 ACT-R 모델 수립 방안을 제안하고, 이를 이용하여 상용 통계 분석 소프트웨어의 과제 수행도를 예측하였다. 그 결과 실제 실험을 통한 측정 결과와 간략화한 ACT-R 모델의 예측 결과가 잘 일치하였으며 본 연구에서 제시한 간략화한 ACTR 모델이 메뉴 인터페이스의 사용성 평가에 효율적으로 적용될 수 있음을 확인하였다.
PDF

Prognostic Modeling of Metabolic Syndrome Using Bayesian Networks (베이지안 네트워크를 이용한 대사증후군의 예측 모델링)

Park Han-Saem;Cho Sung-Bae;Lee Hong Kyu
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.07b
- /
- pp.292-294
- /
- 2005
대사증후군은 당뇨병, 고혈압, 복부 비만, 고지혈증 등의 질병이 한 개인에게 동시에 발현하는 것을 말한다. 미국에서는 $25\%$ 이상의 성인이 대사성 증후군인 것으로 알려져 있으며, 경제 여건의 향상 및 식생활 습관의 변화와 함께 최근 우리나라에서도 심각한 문제가 되고 있다. 한편 불확실성의 처리를 위해 많이 사용되고 있는 베이지안 네트워크는 사람이 분석 가능한 확률 기반의 모델로 최근 의학 분야에서 지식 발견, 데이터 마이닝을 위한 도구로 유용하게 사용되고 있다. 본 논문에 서 는 대사증후군을 예측하는 문제를 다루며, 베이지안 네트워크와 의학 지식을 이용한 대사증후군의 예측 모델을 제안한다. 제안하는 모델을 통해 1993년의 데이터를 가지고 1995년의 상태를 예측하는 분류 실험을 수행하였으며, 실험 결과 다층 신경망, k-최근접 이웃 등의 분류기 보다 높은 $81.5\%$의 예측율을 보였다.
PDF

A Hybrid Value Predictor Using Static Classification (정적 분류를 이용한 혼합형 결과간 예측기)

박홍준;고광현;조영일
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10c
- /
- pp.865-867
- /
- 2001
데이터 종속성을 제거하기 위해서 명령어의 결과값을 예상하는 여러 결과값 예측기의 장점을 이용하여 놓은 성능을 얻을 수 있는 새로운 혼합형 예측 메커니즘을 제안한다. 제안된 혼합형 결과값 예측기는 예상 테이블을 모험적으로 갱신할 수 있기 때문에 부적절한(Stale) 데이터로 인해 잘못 예상되는 명령어의 수를 효과적으로 감소시킨다. 또한 정적 분류 정보를 사용하여 명령의 반입시 적절한 예측기에 할당함으로써 예상 정확도를 더욱 향상시키며, 하드웨어 비용을 효율적으로 감소시키도록 하였다. 5개의 SPECint 95 벤치마크 프로그램에 대해 SimpleScalar/PISA 3.0 툴셋을 사용하여 실험하였다. 16-이슈 폭에서 모험적 갱신을 사용한 평균 예상 정확도는 73%의 실험 결과가 나왔으며, 정적 분류 정보를 사용하였을 경우 예상 정확도가 88%로 증가된 결과를 얻었다.
PDF

Assessing Box Office Performance Using Movie Scripts Text Mining (영화 스크립트 텍스트 마이닝을 통한 흥행성과 예측)

Ha, Hyunsoo;Hwang, Byeong-Yeon
- Proceedings of the Korea Information Processing Society Conference
- /
- 2016.10a
- /
- pp.556-558
- /
- 2016
영화 흥행 실패의 리스크를 줄이기 위해 객관적인 흥행 예측 지표가 요구된다. 본 논문에서는 영화 스크립트의 텍스트를 분석하여 흥행성과를 예측하는 기법을 제안한다. 객관적인 흥행 예측 지표는 누적 관객 수와 누적 매출액으로 설정하였다. 실험은 2010년 1월 1일부터 2016년 8월까지 개봉한 영화중에서 누적 관객 수와 누적 매출액을 기준으로 상위 50위까지의 영화 스크립트를 분석하여 진행했다. 실험을 통해 영화 제작에 앞서 스크립트 분석만을 활용한 영화 흥행성과 예측이 가능함을 보였다.
https://doi.org/10.3745/PKIPS.y2016m10a.556 인용 PDF

Search Result 8,146, Processing Time 0.036 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)