• 제목/요약/키워드: Pattern-Recognition

검색결과 2,473건 처리시간 0.024초

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

온라인 서비스 품질이 고객만족 및 충성의도에 미치는 영향 -항공권 예약.발권 웹사이트를 중심으로- (The Effects of Online Service Quality on Consumer Satisfaction and Loyalty Intention -About Booking and Issuing Air Tickets on Website-)

  • 박종기;고도은;이승창
    • 한국유통학회지:유통연구
    • /
    • 제15권3호
    • /
    • pp.71-110
    • /
    • 2010
  • 본 연구에서는 항공권 예약 발권 웹사이트의 서비스 품질을 측정 뿐만 아니라 서비스 회복도 측정하고자 하였다. 또한 서비스 품질과 서비스 회복이 고객만족 및 충성의도에 미치는 영향관계를 실증하고자 하였다. 온라인 서비스 품질과 온라인 서비스 회복의 측정을 위해 Parasuraman, Zeithaml, & Malhotra(2005)가 개발한 E-S-QUAL과 E-RecS-QUAL을 사용했으며, 했다. E-S-QUAL은 온라인 서비스 품질을 측정하는 도구로써, 효율성, 시스템 이용가능성, 이행성, 프라이버시의 4개 차원 22개 항목으로 구성된다. E-RecS-QUAL은 온라인 서비스 회복을 측정하는 도구로써, 반응, 보상, 접촉의 3개 차원 11개 항목으로 구성된다. 실증분석을 위한 설문조사는 항공사나 여행사의 웹사이트를 통해 국내 외 항공권을 구입해 본 경험이 있는 소비자를 대상으로 실시하였는데, 총 400부가 회수되었고, 이 중 342부를 최종분석에 사용하였다. 실증분석을 위해 AMOS 7.0과 SPSS 15.0을 사용하였다. 먼저, SPSS 15.0을 사용하여, 요인점수를 이용한 회귀분석으로 가설검증을 한 결과, <가설 I-1, 2, 3, 4, II-1, 2, 3, III-1, IV-1>이 전부 채택되었다. 온라인 서비스 품질과 온라인 서비스 회복의 각 차원은 모두 전반적인 서비스 품질에 유의한 영향을 보였고, 전반적인 서비스 품질은 고객만족에 유의한 영향을 미쳤다. 마지막으로 고객만족 역시 충성의도에 유의한 영향을 미치는 것으로 확인되었다. 한편 AMOS 7.0을 사용하여 모형 분석을 하였는데, 모형의 적합도는 가설검증을 하기에 합당한 수치가 나왔다. 이를 토대로 가설검증을 한 결과, <가설 I-1, 3, II-1, 3, III-1, IV-1>은 채택되었고, <가설 I-2, 4, II-2>는 기각되었다. 이 결과는 Parasuraman et al.(2005)이 주장한 것처럼 E-S-QUAL을 나타내는 데는 요인점수를 이용한 회귀분석이 더 적합하다는 것을 보여주는 것이라고 판단된다. 이를 토대로 본 연구의 시사점을 정리하였다.

  • PDF