• 제목/요약/키워드: 온라인 실험

검색결과 905건 처리시간 0.038초

크라우드소싱 기반 문장재구성 방법을 통한 의견 스팸 데이터셋 구축 및 평가 (A Crowdsourcing-Based Paraphrased Opinion Spam Dataset and Its Implication on Detection Performance)

  • 이성운;김성순;박동현;강재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.338-343
    • /
    • 2016
  • 웹이 정보 교환의 주된 수단으로 사용되면서, 온라인 리뷰의 중요도가 증가하는 동시에 사용자의 올바른 의사결정을 저해하는 의견 스팸 이슈가 부각되고 있으며, 관련 연구가 활발하게 진행되고 있다. 하지만 분석 및 학습에 필요한 기준 데이터셋의 부족함과 한계점들은 관련 연구의 발전을 더디게 하고 있다. 본 논문에서는 사실 리뷰를 모사한 새로운 형태의 Paraphrased Opinion Spam(POS) 데이터셋을 소개한다. 우리는 실제 스패머들이 스팸을 작성할 때 실제 리뷰를 참고한다는 경향에 착안하여, 실제 리뷰어들이 작성한 리뷰를 의역하는 과정을 통하여 본문에 포함되어 있는 사실 정보와 경험을 담은 스팸 데이터 셋을 생성하였다. 실험 결과, 새롭게 생성된 POS 데이터셋이 언어학적으로 실제 리뷰들과 유사하여 스팸 분류 모델을 이용하여 분류 시 기존의 데이터셋들보다 더 분류하기 힘들다는 것을 발견했다. 또한 데이터의 학습량에 따라서 스팸 리뷰의 분류 정확도가 비례적으로 증가하는 것을 확인함으로써, 데이터의 양이 스팸 분류 모델 성능에 중요한 요소로 작용한다는 것을 확인할 수 있었다.

상품평의 언어적 분석을 통한 상품 평가 요약 시스템 (Product Evaluation Summarization Through Linguistic Analysis of Product Reviews)

  • 이우철;이현아;이공주
    • 정보처리학회논문지B
    • /
    • 제17B권1호
    • /
    • pp.93-98
    • /
    • 2010
  • 본 논문에서는 폭발적으로 증가하고 있는 상품평을 효과적으로 활용하기 위해 언어적 분석을 통하여 상품 평가를 요약하는 시스템을 제안한다. 시스템에서는 스커트 상품 분류의 경우 '디자인'과 '재질'과 같이, 상품을 평가하는 기준이 되는 항목에 대한 상품평의 부정과 긍정의 극성 여부를 판별하여 그래프 형태로 요약하여 제시한다. 본 논문에서는 작은 시드 어휘와 문맥에 기반한 자동 확장 방법을 사용하여 평가 항목 별 평가 어휘 극성 사전을 구축하여 평가 항목에 대한 상품평의 극성을 판정한다. 제안한 방식은 여러 온라인 쇼핑몰의 실제 상품평에 대한 실험에서 극성 사전 추출에서 평균 69.8%의 정확율과 문장별 극성 식별에서 평균 81.8%의 정확율을 보였다.

HBIC와 BIC_Anti 기준을 이용한 HMM 구조의 최적화 (HMM Topology Optimization using HBIC and BIC_Anti Criteria)

  • 박미나;하진영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.867-875
    • /
    • 2003
  • 본 논문에서는 연속 밀도 HMM 구조의 최적화 문제를 다룬다. HMM 구조의 최적화를 위해 여러 연구가 있었는데, 그 중에서도 잘 알려진 BIC(Bayesian Information Citerion)등과 같이 이미 제안된 모델 선택 기준은 동질의 파라미터를 갖는 데이타에 대해 통계적으로 잘 행동하는 모델을 가정하고 있어서 연속 밀도 HMM 등과 같이 복잡한 파라미터를 갖는 구조에는 적합하지 않고, 파라미터 수를 줄이는데는 어느 정도 효과가 있었으나 인식률 향상에 있어서는 한계를 보였다. 이에 본 논문에서는 HMM의 파라미터 유형에 따라 별도의 확률 밀도를 추정하여 사전 모델 확률(a priori model probability)로 사용하는 모델 선택 기준인 HBIC(HMM-oriented BIC)를 제안했다. 또한 HMM의 변별력을 높이기 위해 변별력 특성을 갖는 안티확률을 BIC와 결합한 새로운 모델 선택 기준인 BIC_Anti를 제안했다. 제안한 모델 선택 기준의 유용성을 검증하기 위해 온라인 필기 데이타를 대상으로 실험하여 기존의 연구와 비교하였다. 그 결과 제안한 HBIC와 BIC_Anti 모델 선택 기준을 사용하는 것이 BIC를 사용하는 것보다 더 적은 파라미터 수로도 향상된 인식률을 얻을 수 있음을 확인했다.

서명 검증을 위한 특정 기반의 FE-SONN (Feature Extraction based FE-SONN for Signature Verification)

  • 구건서
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.93-102
    • /
    • 2005
  • 본 논문은 퍼지 c-means 알고리즘의 퍼지 멤버십 등식을 신경망과 융합한 서명의 특징정보를 기반으로 하는 자율적인 자기조직화 신경망 모델 이용하여 서명 검증하는 방법을 제안하였다. 기존 온라인 서명인식 방법인 함수적 접근법과 매개변수적 접근법의 한계점을 개선하기 위해 자율적 클러스터 특징정보에 의해 서명 패턴 분류 접근법을 제안했다. 본 논문의 중요한 요소는 서명의 특징 정보를 36개의 전역적 특징 정보 정의와 12개의 지역적 특징 정보를 정의하였고, 이를 기반으로 FE-SONN에 학습하여 서명의 진위여부를 검증하는 검증시스템 구현에 있다. 총 713개의 서명을 가지고 실험하였으며, 원본 서명 155개와 시험용으로 위조 서명 180개와 본인이 작성한 진본 서명 378개를 테스트한 결과 97.67$\%$이상의 검증률을 얻을 수 있었다. 그러나 눈으로 식별이 불가능한 정교한 위조서명은 검증 시스템에서도 진위여부 판단에 어려움이 있다.

  • PDF

진화 연산 알고리즘과 퍼지 논리를 이용한 고속 열처리 공정기의 제어기 설계 (Design of Controller for Rapid Thermal Process Using Evolutionary Computation Algorithm and Fuzzy Logic)

  • 황민웅;도현민;최진영
    • 한국지능시스템학회논문지
    • /
    • 제8권6호
    • /
    • pp.37-47
    • /
    • 1998
  • 본 논문은 진화 연산 알고리즘과 퍼지 로직을 이용하여 고속 열처리 공정기의 웨이퍼 온도를 제어하는 제어기 설계 방법을 제안한다. 전체 제어기는 기준 온도의 정상 상태의 추종을 위한 앞먹임 정적 제어기, 과도 상태의 추종을 위한 앞먹임 동적 제어기, 그리고 온라인 상에서 모델링 오차나 외란을 극복하기 위한 되먹임 오차 제어기로 구성된다. 앞먹임 제어기들은 퍼지 로직을 이용하여 모든 동작점에서 제어 입력을 구해주는 전역적 비선형 제어기로 구성된다. 각 제어기들의 제어 파라미터는 진화 연산 알고리즘을 이용하여 추정되므로 수학적 모델식을 모르는 경우에도 제어기를 설계할 수 있는 장점이 있다. 끝으로 모의 실험을 통하여 제어기의 성능을 검증한다.

  • PDF

SVM을 이용한 웨이블릿 기반 프로파일 분류에 관한 연구 (A Wavelet-based Profile Classification using Support Vector Machine)

  • 김성준
    • 한국지능시스템학회논문지
    • /
    • 제18권5호
    • /
    • pp.718-723
    • /
    • 2008
  • 베어링은 각종 설비에서 활용되는 중요한 기계요소 중 하나이다. 설비고장의 상당수는 베어링의 결함이나 파손에 기인하고 있다. 따라서 베어링에 대한 온라인모니터링기술은 설비의 정지를 예방하고 손실을 줄이는 데 필수적이다. 본 논문은 진동 신호를 이용하여 베어링의 상태를 예측하기 위한 온라인모니터링에 대해 연구한다. 프로파일로 주어지는 진동신호는 이산 웨이블릿 변환을 통해 분석되고, 분해수준별 웨이블릿 계수로부터 얻은 통계적 특징 중 유의한 것을 선별하고자 분산분석 (ANOVA)을 이용한다. 선별된 특징벡터는 Support Vector Machine (SVM)의 입력이 되는 데, 본 논문에서는 다중클래스 분류문제를 다루기 위한 계층적 SVM 트리를 제안한다. 수치실험 결과, 제안된 방법은 베어링의 결함을 분류하는 데 우수한 성능을 갖는 것으로 나타났다.

비교 쇼핑 사이트들에 대한 효율적인 메타검색 기법 (An Efficient Meta-Search Scheme for Comparison Shopping Sites)

  • 조강의;조성제
    • 경영정보학연구
    • /
    • 제5권1호
    • /
    • pp.97-111
    • /
    • 2003
  • 인터넷 기반의 전자상거래가 확산되면서, 에이전트 기술을 사용한 비교 쇼핑 사이트들이 등장하여 쇼핑이 점차 편해지고 있다. 하지만, 이들 비교 쇼핑 사이트들이 동일 상품에 대해 서로 다른 가격을 보여줄 때도 있고, 또 어떤 사이트는 특정 상품에 대한 정보를 전혀 보여주지 못할 때가 많기 때문에, 여전히 대부분의 소비자들은 최적의 가격을 검색하기 위해 많은 시간을 소비하고 있다. 또한, 책이나 CD 등의 상품에 대한 가격 검색에서는 온라인 실시간 검색이 요구되므로 시스템 부하를 유발시켜 응답시간이 길어지게 된다. 이러한 문제를 해결하기 위해, 본 논문에서는 지역 데이터베이스와 메모리 캐시를 갖는 메타-비교 쇼핑 시스템을 설계하고 구현하였다. 제안된 시스템은 여러 소프트웨어 에이전트를 이용하여 기존 비교 쇼핑 사이트들에 대해 메타 검색을 수행함으로써, 인기검색 상품들에 대한 가격 정보를 수집하여 유지한다. 실험을 통해 제안 시스템이 효율적인 메타-비교 쇼핑 엔진으로 응답 시간의 지연을 줄여 주며 오버헤드도 적게 유발시킨다는 것을 보였다.

주문형 비디오 서버를 위한 실측 기반 적응형 확률 승인 제어 기법 (Measurement-Based Adaptive Statistical Admission Control Scheme for Video-On-Demand Servers)

  • 김인환;김정원;이승원;정기동
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3794-3803
    • /
    • 2000
  • 주문형 비디오 서버(Video-on-Demand server)에서 멀티미디어 데이터를 효과적으로 서비스 하기 위해 사용되는 승인제어는 시스템의 정확한 여유 자원 상태의 파악을 통해서 이루어져야 한다. 여러 자원 중에서도 디스크 자원은 요구에 대한 응답 시간이 디스크 외적인 요소에 의해 불규칙적이며 요구량 또한 편차카 크므로 적응성 있는 승인 제어가 필요하다. 기존의 승인 제어 기법에서는 이론적인 수치를 통해 승인 여부를 판단하였고, 실측에 기반할 지라도 서비스 상황에 따른 대처가 미흡했다. 본 논문에서 제안하는 실측 기반 적응형 확률 승인 제어 기법은 실제 서비스 환경에서 오프라인(Off-line) 처리 과정과 온라인(On-line) 처리 과정의 두 단계를 실시한다. 이를 통해 시스템의 자원 상황을 정확히 파악할 수 있고 상황에 따라 적응성 있게 승인 여부를 결정할 수 있다. 따라서 최대한의 자원 활용과 QoS(Quality of Service)를 동시에 보장할 수 있다. 모의 실험에서는 실측을 통해 얻어진 성능의 정확성과 요구 대역폭에 따른 적응성 있는 제어를 보임으로써 비디오 서버가 QoS를 보장하면서 최대한의 자원 활용이 가능함을 보였다.

  • PDF

스마트폰의 교육용 어플리케이션 동향분석 및 발전방향 연구 (The Analysis of Trends in Smart Phone Applications for Education and Suggestions for Improved Educational Use)

  • 정수정;임걸;고유정;심현애;김경연
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권2호
    • /
    • pp.203-216
    • /
    • 2010
  • 본 연구는 현재 공급되고 있는 교육용 어플리케이션에 다양한 기준을 적용하여 분석하고, 온라인 또는 원격교육의 특성이 어떻게 적용될 수 있는지에 대한 가능성을 모색하였다. 이를 위해 총 85개의 교육용 어플리케이션을 선정하였고, 콘텐츠 유형, 상호작용 유형, 콘텐츠 유형과 상호작용 유형의 조합을 준거로 분석하였다. 분석결과 콘텐츠 유형에서 반복연습형 및 도구형 등 빈도는 높은 반면, 모의실험과 문제해결형의 빈도는 낮았다. 상호작용에 있어서는 학습자와 콘텐츠 간 상호작용 유형이 대부분을 차지하였는데, 따라서 원활한 학습자간 의사소통의 확장이 이루어지는데 한계가 있었다. 따라서 SNS(Social Network Service) 어플리케이션 등의 특징을 적용하여 학습의 상호작용성을 촉진시키기 위한 목적으로 교육용 어플리케이션이 개발될 필요성이 있음이 발견되었다. 아울러 본 연구 결과를 바탕으로 스마트폰의 교육적 활용에 관한 몇 가지 제언을 하였다.

능동적 학습을 위한 군집화 기반의 다양한 복수 문의 예제 선정 방법 (Cluster-Based Selection of Diverse Query Examples for Active Learning)

  • 강재호;류광렬;권혁철
    • 지능정보연구
    • /
    • 제11권1호
    • /
    • pp.169-189
    • /
    • 2005
  • 능동적 학습은 훈련 예제의 수가 제한적일 때 효율적으로 분류기를 생성할 수 있는 학습 방법이다. 이 방법에서는 분류하기 모호한 예제에 카테고리를 부여하기 위한 문의 과정과 이렇게 얻어진 예제들을 추가해 가면서 분류기를 재생성 하는 과정을 반복적으로 수행한다. 특히 온라인 환경에서는 반복적으로 예제에 카테고리를 부여해야 하는 사용자의 부담을 줄이기 위해 문의 예제의 총 수뿐만이 아니라 문의 횟수 또한 최소화하여야 한다. 예제 수와 문의 횟수를 줄이면서도 좋은 분류기를 생성하기 위해서는 매 문의 시 사용자에게 다양하면서도 대표성이 높은 복수의 모호한 예제들을 선정하여 제시하는 것이 좋다. 본 논문에서는 다양하면서, 대표적이며, 또한 모호성이 높아 능동적 학습에 효과적인 복수의 문의 예제를 선별하기 위하여 군집화 기법을 활용하는 방안을 제안한다. 문서 분류 문제를 대상으로 본 제안 방안을 실험한 결과 모호성만을 기준으로 복수의 문의 예제를 선정하는 방법보다 우수한 분류기를 생성할 수 있음을 확인하였다.

  • PDF