• Title/Summary/Keyword: 상황기반 유사도

Search Result 368, Processing Time 0.034 seconds

Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity (대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용)

  • Jung-Won Lee;Il Im
    • Journal of Intelligence and Information Systems
    • /
    • v.29 no.3
    • /
    • pp.267-286
    • /
    • 2023
  • The conversational agents such as AI speakers utilize voice conversation for human-computer interaction. Voice recognition errors often occur in conversational situations. Recognition errors in user utterance records can be categorized into two types. The first type is misrecognition errors, where the agent fails to recognize the user's speech entirely. The second type is misinterpretation errors, where the user's speech is recognized and services are provided, but the interpretation differs from the user's intention. Among these, misinterpretation errors require separate error detection as they are recorded as successful service interactions. In this study, various text separation methods were applied to detect misinterpretation. For each of these text separation methods, the similarity of consecutive speech pairs using word embedding and document embedding techniques, which convert words and documents into vectors. This approach goes beyond simple word-based similarity calculation to explore a new method for detecting misinterpretation errors. The research method involved utilizing real user utterance records to train and develop a detection model by applying patterns of misinterpretation error causes. The results revealed that the most significant analysis result was obtained through initial consonant extraction for detecting misinterpretation errors caused by the use of unregistered neologisms. Through comparison with other separation methods, different error types could be observed. This study has two main implications. First, for misinterpretation errors that are difficult to detect due to lack of recognition, the study proposed diverse text separation methods and found a novel method that improved performance remarkably. Second, if this is applied to conversational agents or voice recognition services requiring neologism detection, patterns of errors occurring from the voice recognition stage can be specified. The study proposed and verified that even if not categorized as errors, services can be provided according to user-desired results.

Recommending System of Products on e-shopping malls based on CBR and RBR (사례기반추론과 규칙기반추론을 이용한 e-쇼핑몰의 상품추천 시스템)

  • Lee, Gun-Ho;Lee, Dong-Hun
    • The KIPS Transactions:PartD
    • /
    • v.11D no.5
    • /
    • pp.1189-1196
    • /
    • 2004
  • It is a major concern of e-shopping mall managers to satisfy a variety of customer's desire by recommending a proper product to the perspective purchaser. Customer information like customer's fondness, age, gender, etc. in shopping has not been used effectively for the customers or the suppliers. Conventionally, e-shopping mall managers have recommended specific items of products to their customers without considering thoroughly in a customer point of view. This study introduces the ways of a choosing and recommending of products using case-based reasoning and rule-based reasoning for customer themselves or others. A similarity measure between one member's idiosyncrasy and the other members' is developed based on the rule base and the case base. The case base is improved for the system intelligence by recognizing and learning the changes of customer's desire and shopping trend.

RTE: Routing Tree Estimation Scheme for Reliable Multicast (RTE: 신뢰적 멀티캐스트를 위한 라우팅 트리 추정 기법)

  • 윤원용;이동만
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.439-441
    • /
    • 1999
  • 트리 기반 신뢰적 멀티캐스트에서 효율적이고 확장성 있는 손실 복구를 하기 위한 RTE(Routing Tree Estimation) 기법을 제안한다. 에러 비트맵(error bitmap) 정보를 통하여 멀티캐스트 라우팅 트리와 유사한 논리적 트리(logical tree)를 구성함으로써 멀티캐스트 라우팅 트리에서 상위에 위치하는 수신자들이 재전송을 요청한 수신자의 신뢰성을 책임지도록 보장한다. 논리적 트리는 세션 멤버쉽이나 멀티캐스트 경로의 변화에 따라 적응적으로 재구성되는데 이는 멀티캐스트 세션 진행동안 논리적 트리와 멀티캐스트 라우팅 트리 사이에 불일치를 최소화함으로써 멤버십과 경로가 변하는 상황에서도 implosion과 exposure를 감소시키는 장점을 지닌다. 제안한 기법과 정적 트리기반의 신뢰적 멀티캐스트 프로토콜의 시뮬레이션 결과는 세션의 크기가 커짐에 따라 제안한 적응형 트리 기반의 복구방식의 효율성을 입증한다.

  • PDF

An Input Domain-Based Software Reliability Growth Model (입력 영역에 기초한 소프트웨어 신뢰성 성장 모델)

  • Park, Joong-Yang;Seo, Dong-Woo;Kim, Young-Soon
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.11
    • /
    • pp.3384-3393
    • /
    • 2000
  • 소프트웨어를 테스팅하는 동안 얻어지는 고장 데이터를 분석하여 소프트웨어의 신뢰성이 성장하는 과정을 평가하기 위해 여러 가지 소프트웨어 신뢰성 성장 모델들이 개발되었다. 그러나 이들 신뢰성 성장 모델들은 소프트웨어 개발과 사용환경에 관한 여러 가지 가정에 기반하고 있기 때문에, 이 가정이 적합하지 않은 상황이나 결함이 드물게 발생되는 소프트웨어에 대해서는 적절하지 않다. 입력영역에 기초한 소프트웨어 신뢰성 모델은 일반적으로 이러한 가정을 요구하지 않는데 디버깅 전의 소프트웨어와 디버깅 후의 소프트웨어를 별개의 것으로 다루어 많은 테스트 입력을 요하는 단점이 있다. 본 논문에서는 이러한 가정이 요구되지 않고 디버깅 전과 후의 소프트웨어를 동시에 테스트하는 방법에 기반을 둔 입력 영역 기반 소프트웨어 성장모델을 제안하고 그 통계적 특성을 조사한다. 이 모델은 모든 데이터를 다 활용하기 때문에 기존 입력영역 소프트웨어 신뢰성 모델에 비해 적은 테스트 입력을 필요로 할 것으로 기대된다. 그리고 소프트웨어의 유지보수 단계에 적용하기 위해 개발된 유사한 방법들과 비교한다.

  • PDF

Words Recommendation Algorithm for Similarity Connection based on Data Transmutability (데이터 변형성 기반 유사성 연결을 위한 단어 추천 알고리즘)

  • Kim, Boon-Hee
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.8 no.11
    • /
    • pp.1719-1724
    • /
    • 2013
  • Big data which requires a different approach from existing data processing methods, is unstructured data with a variety of features. The features mean the volume of data, the rate of change of the data, the data with a variety of features. Tweets of twitter in only Korea are more than 5 millions per day. So much cheaper data storage and analysis system due to the increasing demand for information, the value of research is increasing. In this paper, the technology required by the deformation characteristics of the data elements as a technology priority-based word-based recommendation algorithm is proposed.

A design of metadata based search method in Homeserver (홈서버 환경에서 메타데이터 기반의 검색 설계)

  • Kim Jae-Won;Kim Jinhyung;Choi O-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.199-201
    • /
    • 2005
  • 유비쿼터스 환경의 시발점인 홈 네트워크 기술은 홈서버를 중심의 댁내 모든 가전기기들을 하나의 네트워크로 연결함으로써 사용자가 언제 어디에서 단말 기기를 이용하여 댁내의 상황을 모니터링하고 모든 기기들을 제어할 수 있게 해주는 기술이다. 홈 네트워크의 핵심인 홈서버는 다양한 가전기기로부터 다량의 멀티미디어 콘텐츠를 저장하며, 다른 홈서버 또는 모바일 단말을 이용하여 검색과 공유가 가능하다. 그러나, 홈서버와 각 모바일 단말이 가지는 콘텐츠에 대한 메타데이터는 일관성을 가지지 않기 때문에 콘텐츠 검색이 용이하지 않고, 사용자가 직접 메타데이터 간의 유사성을 파악해야하는 문제점이 있다. 또한 메타 데이터간의 이질성으로 인해 이종 기기들 간의 콘텐츠의 검색, 공유 또한 힘들다. 따라서 홈서버들 간의 일관적인 데이터 입력과 공유를 위하여 멀티미디어 콘텐츠에 일반적으로 적용되는 Mepg-7 기반의 메타데이터 레지스트리 설계를 제시한다. 또한 이질적인 메타데이터를 지니는 홈서버-모바일 단말 간의 콘텐츠 공유를 위하여 워드넷 기반의 온톨로지 설계를 본 논문에서 제시한다.

  • PDF

Stress Affect Detection At Wearable Devices Via Clustered Federated Learning Based On Number of Samples Mahalanobis Distance (웨어러블 기기에서 데이터수 기반 마하라노비스 군집화 연합학습을 통한 스트레스 및 감정탐지)

  • Tae-Hwan Yoon;Bong-Jun Choi
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.764-767
    • /
    • 2024
  • 웨어러블 디바이스에서는 사용자의 다양한 메타데이터를 수집할 수 있다. 그러나 이런 개인정보를 함유하고 있는 데이터를 수집하는 것은 사용자에게 개인정보침해 위협을 야기한다. 때문에 본 논문에서는 개인정보보호를 통한 웨어러블 디바이스 데이터활용방안으로 연합학습을 채택하였다. 다만 기존 연합학습에서도 해결해야할 문제점들이 있다. 우리는 그중에서도 데이터이질성(Data Heterogeneity) 문제해결을 위해 군집화(Clustering) 방법을 활용하였다. 또한 기존의 코사인유사도 기반 군집화에서 파라미터중요도가 반영되지 않는다는 문제점을 해결하고자 데이터수 기반 마하라노비스거리(Number of Samples Mahalanobis Distance) 군집화 방법을 제시하였다. 이를 통해 WESAD(Werable Stress Affect Detection)데이터에서 피실험자의 데이터 이질성이 존재하는 상황에서 기존 연합학습보다 학습 안정성 측면에서 좋음을 보여주었다.

A Study on Fuzzy-Based Peer Relationship Analysis Technique Using Tendency Distance (경향거리를 이용한 퍼지이론 기반 교우관계분석 기법 연구)

  • Jeong, In-Joon;Jun, Woo-Chun
    • 한국정보교육학회:학술대회논문집
    • /
    • 2006.01a
    • /
    • pp.179-184
    • /
    • 2006
  • 초등학교 학급에서의 아동 상호간의 관계 파악은 아동 그룹이나 짝을 지어주고 교우관계를 분석하는데 매우 유용하다. 그러나 인간관계의 감정을 단순한 수치로 나타내기에는 아동 상호간의 복잡한 감정을 제대로 분석하기 힘들기 때문에, 본 논문에서는 퍼지 (Fuzzy) 이론을 기초로 하여 분석하고자 한다. 본 논문에서는 퍼지이론의 해밍거리(Hamming Distance)와 $\alpha$-수준집합을 적용하고 경향성을 계산할 수 있는 새로운 기법인 경향거리(Tendency Distance)를 제안하고 분석하는 기법을 연구하였다. 본 논문에서 제안하는 분석 방법의 특징은 첫째, 인간관계의 애매하고 모호한 점을 상대적 비교가 가능하게 함으로써 정확한 분석을 가능하게 하고, 둘째, 퍼지 이론의 적용을 통하여 해밍거리에 의한 유사도 분석에서 할 수 없었던 경향성의 분석을 가능하도록 하였으며, 셋째, 교육현장에서 발생할 수 있는 애매한 상황과 아동간의 교우 관계 등 수치적인 파악이 불가능한 부분을 분석이 가능한 데이터로 만들 수 있는 기법을 마련하였다는 데 의의를 둘 수 있다.

  • PDF

GAN 기반 은닉 적대적 패치 생성 기법에 관한 연구

  • Kim, Yongsu;Kang, Hyoeun;Kim, Howon
    • Review of KIISC
    • /
    • v.30 no.5
    • /
    • pp.71-77
    • /
    • 2020
  • 딥러닝 기술은 이미지 분류 문제에 뛰어난 성능을 보여주지만, 공격자가 입력 데이터를 조작하여 의도적으로 오작동을 일으키는 적대적 공격(adversarial attack)에 취약하다. 최근 이미지에 직접 스티커를 부착하는 형태로 딥러닝 모델의 오작동을 일으키는 적대적 패치(adversarial patch)에 관한 연구가 활발히 진행되고 있다. 하지만 기존의 적대적 패치는 대부분 눈에 잘 띄기 때문에 실제 공격을 받은 상황에서 쉽게 식별하여 대응할 수 있다는 단점이 있다. 본 연구에서는 GAN(Generative Adversarial Networks)을 이용하여 식별하기 어려운 적대적 패치를 생성하는 기법을 제안한다. 실험을 통해 제안하는 방법으로 생성한 적대적 패치를 이미지에 부착하여 기존 이미지와의 구조적 유사도를 확인하고 이미지 분류모델에 대한 공격 성능을 분석한다.

An Internet of Things (IoT) Service Clustering Method based on K-means Algorithm (K-means 기반 사물인터넷 서비스 분류 기법)

  • Yang, Chanwoo;Jo, Jeonghoon;Lee, Daewon
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.1326-1328
    • /
    • 2017
  • 4차 산업 혁명을 맞이하여 다양한 사물 인터넷(IoT) 서비스가 폭발적으로 등장하고 있다. 현재의 IoT 서비스는 독립 서비스로 제공되는 상황이지만 향후 IoT 서비스는 기존 IoT 서비스의 활용과 결합을 목표로 개발되고 있다. IoT 서비스 간 결합 시 발생할 수 모듈의 중복성 문제를 해결하고 새로운 IoT 서비스의 이식성을 높이기 위해 본 연구에서는 K-means 알고리즘을 활용하여 IoT 서비스 간 유사도를 고려한 IoT 서비스 분류 알고리즘을 제안한다. 실험 및 분석을 통하여 K=8,9인 경우 37개의 상용 IoT 서비스가 효율적이고 적합하게 클러스터됨을 증명하였다.