• 제목/요약/키워드: Algorithm performance

검색결과 18,207건 처리시간 0.064초

효율적인 양식 모니터링을 향하여: YOLOv7 및 SORT를 사용한 실시간 물고기 감지 및 추적을 위한 지상 기반 카메라 구현 (Towards Efficient Aquaculture Monitoring: Ground-Based Camera Implementation for Real-Time Fish Detection and Tracking with YOLOv7 and SORT)

  • 노태경;하상현;김기환;강영진;정석찬
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.73-82
    • /
    • 2023
  • 현재 수산업 종사자의 78%를 차지하고 있는 인력 고령화에 따른 노동력 부족 문제를 해결하기 위해 객체 검출 및 추적 알고리즘을 주요 내용으로 하는 스마트 양식 기술에 대한 연구가 활발히 진행되고 있다. 이러한 기술들은 어류의 크기 분석, 행동 패턴 예측 등의 작업이 가능하여 실시간 모니터링 및 자동화 시스템의 구축이 용이할 것으로 기대된다. 본 연구에서는 양식 시설 외부에 설치된 카메라로부터 수집된 영상 데이터를 기반으로 어류 검출 및 추적 알고리즘을 활용하였다. 수중 조건, 암모니아, pH 농도에 따른 카메라 부식 문제로 인한 높은 유지보수 비용 문제를 극복하는 것을 목표로 하였다. 어류 객체 검출을 위해 YOLOv7 모델을 활용한 실시간 모니터링 시스템의 성능을 분석하였고, 어류의 움직임을 추적하기 위해 SORT 알고리즘을 활용하였다. YOLOv7 훈련 결과 PR Curve 기반의 Recall과 Precision 값의 상충 관계를 밝혀내 조명에 의한 물줄기와 그림자의 오검출을 최소화하였음을 알 수 있다. 어류 추적을 위해 우리는 재식별화를 통해 효과적인 추적을 확인하였다. 이러한 연구 결과는 스마트 양식 산업의 운영 효율성을 높이고 양식 시설의 어류 관리 개선을 용이하게 할 것으로 기대된다.

기계학습을 활용한 XRD 광물 조성 예측 모델 개발 (Development of Prediction Model for XRD Mineral Composition Using Machine Learning)

  • 박선영;이경북;최지영;박주영
    • 광물과 암석
    • /
    • 제37권2호
    • /
    • pp.23-34
    • /
    • 2024
  • 퇴적물 내에서 가스 하이드레이트(gas hydrate, GH) 부존 가능성을 파악하기 위해서는 획득된 코어 시료의 광물 조성을 아는 것이 필수적이다. GH 탐사를 진행하며 채취된 울릉분지 코어 시료에서 각 시료 별 488개의 X선 회절 분석(X-ray diffraction, XRD)을 활용하여 광물 조성 값을 확보하였다. 488개의 학습 자료를 기반으로 입력값을 3100개의 XRD 피크 세기로 출력값을 12개의 광물 조성으로 기계학습을 수행하였다. 488개의 데이터를 307개의 학습자료, 132개의 검증자료, 49개의 테스트 자료로 나누어 학습을 수행하였고 랜덤 포레스트(random forest, RF) 알고리즘을 활용하여 결과를 획득하였다. 학습 결과 전문가가 예측한 광물 조성과 기계학습을 통해 예측한 값의 차이인 평균 절대 오차(mean absolute error, MAE)가 1.35%로 확인되었다. 개발된 모델 성능의 개선을 위해 주성분분석(principal component analysis, PCA)을 활용하여 XRD 피크의 핵심 특징을 추출하여 입력자료의 차원을 줄여 추가적으로 기계학습을 수행한 결과 MAE 값이 최대 1.23%까지 감소하는 것을 볼 수 있었고 시간적인 측면에서 학습 효율도 향상된 것을 확인할 수 있었다.

오버레이 멀티캐스팅에서 트리의 스위칭을 고려한 빠른 멤버 가입 방안에 관한 연구 (Fast Join Mechanism that considers the switching of the tree in Overlay Multicast)

  • 조성연;노경택;박명순
    • 정보처리학회논문지C
    • /
    • 제10C권5호
    • /
    • pp.625-634
    • /
    • 2003
  • 인터넷 멀티캐스팅 기술은 지난 10여년간의 기술 발전에도 불구하고 아직 본격적인 서비스 보급이 이루어지지 못하고 있다. 주된 이유는 멀티캐스트 라우팅에서의 트래픽 제어, 글로벌 인터넷에서의 멀티캐스트 주소 할당, 멀티캐스트 신뢰전송 기법 등의 문제가 아직 해결되지 않았기 때문이다. 최근 인터넷 방송, 실시간 증권정보 서비스 등의 멀티캐스트 응용 서비스에 대한 요구가 급격히 증가함에 따라, 새로운 인터넷 멀티캐스팅 기술로써 오버레이 멀티캐스팅이 개발되고 있다 본 논문은 오버레이 멀티캐스팅 기술을 살펴보고, 새로운 멤버가 그룹에 가입하는데 걸리는 시간을 단축하는 방안을 제안한다. 기존의 방식은 잠재적인 부모 노드를 발견하기 위해서 한번에 트리의 한 레벨씩을 검색해 내려갔으며, 이로 인하여 긴 가입 지연 시간이 야기되었다. 또한, 트리의 매 레벨에서 자신과 가까운 노드를 잠재적인 부모 노드로 지적함으로써, 최적의 부모 노드를 선택하려고 노력하였지만 실제로 노드의 제한 차수로 인하여 자신과 가장 가까운 잠재적인 부모 노드를 선택하지 못하였으며, 이로 인해 트리의 효율성이 떨어졌다. 본 논문에서는 이러한 가입 지연 시간을 감소시키고, 생성된 트리의 효율성을 높이기 위해서, 트리의 두 레벨씩 검색하는 방안을 제안한다. 이 방식은 가입 요청 메시지를 자신의 자식 노드에게 전달하는 방식으로, 평상시에 트리 유지를 위한 추가적인 오버헤드 없이, 가입 요청이 왔을 때 검색 메시지의 수를 증가시켜서, 빠르게 가입을 완료한다. 또한, 더 많은 노드를 검색함으로써 좀 더 효율적인 트리를 생성하게 도와준다. 제안하늘 방안의 성능을 평가하기 위해서, 그룹의 멤버 수와 제한 차수를 기준으로 검색 시간 및 검색한 노드의 수 그리고 트리 스위칭 횟수를 측정하였다. 시뮬레이션 결과에서 제안한 기법이 기존의 방식에 비해서 가입 지연 시간을 단축시켰으며, 좀 더 효율적인 트리를 생성하는 것을 볼 수 있었다.본 연구결과 이소플라본은 전립선암 환자의 혈중 지질 패턴과 항산화체계를 개선시키는 효과를 보였다. 따라서 이소플라본이 지질대사에 미치는 영향과 항산화작용기전에 대한 보다 심층적인 연구가 이루어져야 할 것이며, 보다 많은 전립선암 환자를 대상으로 이소플라본 섭취에 따른 장기적인 임상실험연구가 이루어져 이소플라본이 전립선암 환자의 삶의 질을 향상시킬 수 있는지에 대한 다각적인 검토가 필요하다고 본다. 중 참가성 , 흥미성, 지속성, 대인관계 4개의 측정항목에서 높은 증가율을 보여 치료효과가 큰 것으로 판단된다. 원예 치료 실시 후의 자체설문지 평가결과 원예 활동을 통해서 달라진 점은 개인적으로 가족, 이웃 간의 긍정적인 변화를 이끌어내고 있다는 것을 발견할 수 있었고 다양한 원예프로그램이 인상깊었다고 하였으며 다음진행에 추가적으로 야외에서 진행할 프로그램에 대한 욕구가 표출되었다. 이것을 통해 개인적 치료경험과 가족, 이웃 간의 지지망 형성이 중요하며 긍정적인 영향을 주었다는 것을 볼 수 있었다. 또한 다양한 원예치료프로그램의 적용과 야외 활동을 조화롭게 적용한다면 성공적인 프로그램 진행에 도움을 될 것으로 판단된다. 이상의 결과를 종합하면 정신지체장애인에게 원예치료 프로그램을 실시한 이후에 원예에 대한 관심이 높고 자아존중 감이 향상되었으며 원예치료 프로그램에 대한 높은 만족도를 보였고 원예치료에 대한 참가성, 흥미성, 지속성, 대인관계성에서 높은 증가율을 보여 치료프로그램의 개입이 유의미한 효과가 있는 것으로 나타났다. 이러한 결과들 볼 때 의도적인 원예치료활동을 통해서 심신의 치료를 경험하$\infty$I 자존감이 향상되며 회원 상호관계를 통한 사회부적응문제를 치료하여 사회성이 향상될 것이라는 목표에 대한 높은 달성정도를 볼 수 있다. 또한 지속적이고 흥미를 유발하는 원예치 료 프로그램을 적용한다면 심리적, 신체적, 정서적 치료효과가 높은 향상을 보이고 자신감과

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

잠재 토픽 기반의 제품 평판 마이닝 (Latent topics-based product reputation mining)

  • 박상민;온병원
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.39-70
    • /
    • 2017
  • 최근 여론조사 분야에서 데이터에 기반을 둔 분석 기법이 널리 활용되고 있다. 기업에서는 최근 출시된 제품에 대한 선호도를 조사하기 위해 기존의 설문조사나 전문가의 의견을 단순 취합하는 것이 아니라, 온라인상에 존재하는 다양한 종류의 데이터를 수집하고 분석하여 제품에 대한 대중의 기호를 정확히 파악할 수 있는 방안을 필요로 한다. 기존의 주요 방안에서는 먼저 해당 분야에 대한 감성사전을 구축한다. 전문가들은 수집된 텍스트 문서들로부터 빈도가 높은 단어들을 정리하여 긍정, 부정, 중립을 판단한다. 특정 제품의 선호를 판별하기 위해, 제품에 대한 사용 후기 글을 수집하여 문장을 추출하고, 감성사전을 이용하여 문장들의 긍정, 부정, 중립을 판단하여 최종적으로 긍정과 부정인 문장의 개수를 통해 제품에 대한 선호도를 측정한다. 그리고 제품에 대한 긍 부정 내용을 자동으로 요약하여 제공한다. 이것은 문장들의 감성점수를 산출하여, 긍정과 부정점수가 높은 문장들을 추출한다. 본 연구에서는 일반 대중이 생산한 문서 속에 숨겨져 있는 토픽을 추출하여 주어진 제품의 선호도를 조사하고, 토픽의 긍 부정 내용을 요약하여 보여주는 제품 평판 마이닝 알고리즘을 제안한다. 기존 방식과 다르게, 토픽을 활용하여 쉽고 빠르게 감성사전을 구축할 수 있으며 추출된 토픽을 정제하여 제품의 선호도와 요약 결과의 정확도를 높인다. 실험을 통해, K5, SM5, 아반떼 등의 국내에서 생산된 자동차의 수많은 후기 글들을 수집하였고, 실험 자동차의 긍 부정 비율, 긍 부정 내용 요약, 통계 검정을 실시하여 제안방안의 효용성을 입증하였다.

기술가치 평가를 위한 기술사업화 기간 및 비용 추정체계 개발 (Development of Systematic Process for Estimating Commercialization Duration and Cost of R&D Performance)

  • 전승표;최대헌;박현우;서봉군;박도형
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.139-160
    • /
    • 2017
  • 기술사업화는 기업의 연구개발 과정 및 결과물을 시장에 효과적으로 연계하여 경제 가치를 창출하는 것을 의미한다. 거시적인 관점에서 보면 기술사업화는 국가수준의 R&D 효과성을 강화할 수 있으며, 관련된 산업의 발전을 촉진할 수 있다. 또한, 미시적인 관점에서 보면 기업이나 개인들은 기술사업화를 통해서 경쟁우위를 확보하고, 유지할 수 있다. 특정 기술이 사업화까지 이르기 위해서는 기술 기획, 기술의 연구와 개발, 상용화 즉 시장 진출까지의 크게 세 단계를 거치는 게 일반적이며, 이런 일련의 과정은 많은 시간과 비용을 수반한다. 따라서 연구개발 착수에서 상용화까지 소요되는 기술사업화 기간과 비용은 기업 입장에서는 시장 진출 전략을 결정하는 데 중요한 의사결정 정보가 되며, 기술 투자자에게는 기술가치를 합리적으로 평가하는데 더욱 중요한 정보가 된다. 이렇게 중요한 기술사업화 소요 기간과 비용을 과학적으로 추정하는 것은 매우 중요하지만 현재까지 이런 두 가지 정보에 대한 연구는 매우 부족한 실정이며, 널리 알려진 방법론도 부재한 상황이다. 본 연구의 목적은 기술사업화 기간과 비용을 추정하는 체계를 설계하고 이를 실제 기업데이터를 활용하여 개발하는 것이다. 구체적으로 특정 기술의 기술 자체의 요인, 기술개발 주체의 역량, 외부 환경 요인의 세 관점에서 어떤 요인들이 기술사업화 기간 및 비용에 영향을 주는지 도출하고, 해당 요인들의 수준에 따라 기술사업화 기간 및 비용을 제시하는 모형을 개발하고자 한다. 본 연구의 결과는 기술을 개발하는 주체와 기술을 투자하는 주체 모두에게 유용하게 활용될 것으로 기대된다.

ART2 기반 RBF 네트워크와 얼굴 인증을 이용한 주민등록증 인식 (Recognition of Resident Registration Card using ART2-based RBF Network and face Verification)

  • 김광백;김영주
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.1-15
    • /
    • 2006
  • 우리나라의 주민등록증은 주소지, 주민등록번호, 얼굴사진, 지문 등 개인의 다양한 정보를 가진다. 현재의 플라스틱형 주민등록증은 위조 및 변조가 쉽고 그 수법이 날로 전문화 되어가고 있다. 따라서 육안으로 위조 및 변조 사실을 쉽게 확인하기가 어려워 사회적으로 문제를 일으키고 있다. 이에 본 논문에서는 개선된 ART2 기반 RBF 네트워크에 이용한 주민등록번호 인식과 얼굴 인증을 통한 주민등록증 자동 인식 방법을 제안한다. 제안된 방법은 주민등록증 영상으로부터 주민등록번호와 발행일을 추출하기 위하여 주민등록증 영상에 소벨 마스킹와 미디언 필터링을 적용한 후에 수평 스미어링을 적용하여 주민등록번호와 발행일 영역을 추출한다. 그리고 원영상에 대해 고주파 필터링을 적용하여 영상 전체를 이진화하고, 이진화된 영상에 CDM 마스크를 적용하여 주민등록번호와 발행일 코드를 복원한 다음, 검출된 각 영역에 대해 4-방향 윤곽선 추적 알고리즘을 적용하여 개별 문자를 추출한다. 추출된 주민등록번호 등의 개별 문자를 인식하기 위해 개선된 ART2 기반 RBF 네트워크를 제안하고 인식에 적용한다. 제안된 ART2 기반 RBF 네트워크는 학습 성능을 개선하기 위하여 중간층과 출력층의 학습에 퍼지 제어 기법을 적용하여 학습률을 동적으로 조정한다. 얼굴 인증은 템플릿 매칭 알고리즘을 이용하여 얼굴 템플릿 데이터베이스를 구축하고 주민등록증에서 추출된 얼굴 영역과의 유사도를 측정하여 주민등록증 얼굴 영역의 위조여부를 판별한다. 제안된 주민등록증 인식 방법의 성능을 평가하기 위해 원본 주민등록증 영상에 대해 얼굴 영역 위조, 노이즈추가, 대비 증감, 밝기 증감 그리고 영상 흐리기 등의 변형된 영상들을 생성하여 실험한 결과, 제안된 방법이 주민등록번호 인식 및 얼굴 인증에 있어서 우수한 성능이 있음을 확인하였다

  • PDF

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용 (A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps)

  • 전병국;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.