• 제목/요약/키워드: new topic detection

검색결과 37건 처리시간 0.026초

대화시스템 미지원 도메인 검출에 관한 조사 (Survey on Out-Of-Domain Detection for Dialog Systems)

  • 정영섭;김영민
    • 융합정보논문지
    • /
    • 제9권9호
    • /
    • pp.1-12
    • /
    • 2019
  • 대화시스템은 인간과 컴퓨터 사이의 새로운 의사소통 수단으로 떠오르고 있다. 대화시스템은 인간의 음성을 입력으로 취하여, 적절한 음성 답변 또는 서비스를 제공하게 된다. 아마존 에코, 네이버 웨이브 등과 같은 대화시스템 제품들이 등장하고 있음에도 불구하고, 이 대화시스템들은 공통적으로 미지원 도메인을 제대로 처리하지 못한다는 문제점을 안고 있다. 이와 관련한 몇몇 연구들이 있었지만, 이 문제를 풀기 위한 더욱 많은 연구가 진행될 필요가 있다. 이 논문에서는, 미지원 도메인 검출과 관련한 기존 연구들에 대하여 3가지 관점, 즉 데이터, 자질, 방법에 대한 관점으로 요약한 정보를 제공한다. 데이터셋이 부족하다는 점으로 인해 타 연구분야에 비해 적은 연구가 수행되어왔으므로, 앞으로 가장 시급한 연구 주제는 대화시스템의 미지원 도메인 검출을 위한 공개용 데이터셋을 구축하고 배포하는 것이다.

토픽의 조합으로 이벤트 흐름을 예측하기 위한 시각적 분석 시스템 (Visual Analytics using Topic Composition for Predicting Event Flow)

  • 연한별;김석연;장윤
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권12호
    • /
    • pp.768-773
    • /
    • 2015
  • 사회적 혼란을 야기하는 이벤트는 발생 직후 어떻게 대응하느냐에 따라 소요되는 비용의 편차가 크다. 이에 따라 비정상적인 이벤트를 탐지하고 의미를 파악하는 연구가 많이 진행되고 있다. 또한 예측 분석에 관한 연구도 많이 수행되고 있다. 그러나 대부분의 연구는 이벤트의 전체적인 미래 경향에 대한 수치 결과를 예측할 뿐, 이벤트가 내포하는 의미에 대한 예측 연구는 미비하다. 이에 따라 본 논문에서는 비정상적인 이벤트가 내포하는 토픽의 조합을 통해 미래에 어떠한 일이 발생할 수 있는지에 대한 시각적 예측 분석 방법을 제안한다. 제안하는 방법은 먼저 트윗에서 실시간으로 비정상 이벤트를 탐지한다. 그 다음 과거 유사한 사례를 탐색한 다음 이벤트와 관련된 토픽들을 추출한다. 마지막으로 사용자는 의미 있는 토픽의 조합을 통해 미래에 어떠한 일이 발생할 수 있을지 분석할 수 있다. 실험은 두 가지 상황에 대한 예측 분석을 수행하였으며, 실험 결과 본 논문에서 제안한 방법의 타당성을 입증하였다.

Cloud-Type Classification by Two-Layered Fuzzy Logic

  • Kim, Kwang Baek
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권1호
    • /
    • pp.67-72
    • /
    • 2013
  • Cloud detection and analysis from satellite images has been a topic of research in many atmospheric and environmental studies; however, it still is a challenging task for many reasons. In this paper, we propose a new method for cloud-type classification using fuzzy logic. Knowing that visible-light images of clouds contain thickness related information, while infrared images haves height-related information, we propose a two-layered fuzzy logic based on the input source to provide us with a relatively clear-cut threshold in classification. Traditional noise-removal methods that use reflection/release characteristics of infrared images often produce false positive cloud areas, such as fog thereby it negatively affecting the classification accuracy. In this study, we used the color information from source images to extract the region of interest while avoiding false positives. The structure of fuzzy inference was also changed, because we utilized three types of source images: visible-light, infrared, and near-infrared images. When a cloud appears in both the visible-light image and the infrared image, the fuzzy membership function has a different form. Therefore we designed two sets of fuzzy inference rules and related classification rules. In our experiment, the proposed method was verified to be efficient and more accurate than the previous fuzzy logic attempt that used infrared image features.

Exploratory Study: A Modification Training Method of Attentional Bias Toward Safety

  • Gao, Jingqi;Wu, Xiang;Luo, Xiaowei;Zhang, Ao
    • Safety and Health at Work
    • /
    • 제12권3호
    • /
    • pp.346-350
    • /
    • 2021
  • Background: The high sensitivity of individuals toward safety information in production activities, that is, attentional bias toward safety (ABS), can positively predict safe behaviors. It has become a hot topic in current organizational safety behavior research. However, there is no literature on its modification method. Methods: Based on the modified dot-probe task, we designed a modification training method of ABS. The training method required subjects to respond to the location of detection points that presented after safety stimulus and neutral stimulus pictures. Subjects' attentional bias values of safety and neutral pictures were measured during the experiment. Twenty-one students were selected and divided into a control group and training group to gain comparable results. Results: A novel training method was developed in this study to promote the efficacy of safety stimulus by activating ABS of the subjects. Moreover, repeated trainings and preacquired relative knowledge can enhance this effect. Conclusion: This study develops an experimental approach to evaluate the effectiveness of safety education and safety training, and also provides a new research idea for accident prevention.

A multisource image fusion method for multimodal pig-body feature detection

  • Zhong, Zhen;Wang, Minjuan;Gao, Wanlin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권11호
    • /
    • pp.4395-4412
    • /
    • 2020
  • The multisource image fusion has become an active topic in the last few years owing to its higher segmentation rate. To enhance the accuracy of multimodal pig-body feature segmentation, a multisource image fusion method was employed. Nevertheless, the conventional multisource image fusion methods can not extract superior contrast and abundant details of fused image. To superior segment shape feature and detect temperature feature, a new multisource image fusion method was presented and entitled as NSST-GF-IPCNN. Firstly, the multisource images were resolved into a range of multiscale and multidirectional subbands by Nonsubsampled Shearlet Transform (NSST). Then, to superior describe fine-scale texture and edge information, even-symmetrical Gabor filter and Improved Pulse Coupled Neural Network (IPCNN) were used to fuse low and high-frequency subbands, respectively. Next, the fused coefficients were reconstructed into a fusion image using inverse NSST. Finally, the shape feature was extracted using automatic threshold algorithm and optimized using morphological operation. Nevertheless, the highest temperature of pig-body was gained in view of segmentation results. Experiments revealed that the presented fusion algorithm was able to realize 2.102-4.066% higher average accuracy rate than the traditional algorithms and also enhanced efficiency.

Classifying Social Media Users' Stance: Exploring Diverse Feature Sets Using Machine Learning Algorithms

  • Kashif Ayyub;Muhammad Wasif Nisar;Ehsan Ullah Munir;Muhammad Ramzan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.79-88
    • /
    • 2024
  • The use of the social media has become part of our daily life activities. The social web channels provide the content generation facility to its users who can share their views, opinions and experiences towards certain topics. The researchers are using the social media content for various research areas. Sentiment analysis, one of the most active research areas in last decade, is the process to extract reviews, opinions and sentiments of people. Sentiment analysis is applied in diverse sub-areas such as subjectivity analysis, polarity detection, and emotion detection. Stance classification has emerged as a new and interesting research area as it aims to determine whether the content writer is in favor, against or neutral towards the target topic or issue. Stance classification is significant as it has many research applications like rumor stance classifications, stance classification towards public forums, claim stance classification, neural attention stance classification, online debate stance classification, dialogic properties stance classification etc. This research study explores different feature sets such as lexical, sentiment-specific, dialog-based which have been extracted using the standard datasets in the relevant area. Supervised learning approaches of generative algorithms such as Naïve Bayes and discriminative machine learning algorithms such as Support Vector Machine, Naïve Bayes, Decision Tree and k-Nearest Neighbor have been applied and then ensemble-based algorithms like Random Forest and AdaBoost have been applied. The empirical based results have been evaluated using the standard performance measures of Accuracy, Precision, Recall, and F-measures.

Epidemiology Characteristics and Trends of Incidence and Morphology of Stomach Cancer in Iran

  • Almasi, Zeinab;Rafiemanesh, Hosein;Salehiniya, Hamid
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권7호
    • /
    • pp.2757-2761
    • /
    • 2015
  • Background: Stomach cancer is the fourth most common cancer and the second leading cause of cancer-related death through the world. It is predicted that the number of new cancer cases will be more than 15 million cases by 2020. Regarding the lack of studies on this topic in the country, we have thoroughly examined the patho-epidemiology of stomach cancer in Iran. Materials and Methods: In this cross- sectional study data were collected retrospectively reviewing all new stomach cancer patients in Cancer Registry Center report of health deputy for Iran during a 6-year period (2003-2008). The study also examined the morphology of common stomach cancers. Trends in incidence and morphology underwent joinpoint regression analysis. Results: During the six-year period, a total of 35,171 cases of stomach cancer were registered. Average age standardized rate for females and males were equal to 7.1 and 15.1 per 100,000 persons, respectively. Most common histological type was adenocarcinoma, NOS with 21,980 cases (62.50%). The annual percentage change (APC) in age-standardized incidence rate (per 100,000) was increase in both females and males at 11.1 (CI: 4.3 to 18.3) and 9.2 (CI: 5.2 to 13.4), respectively. Conclusions: According to our results, the incidence of gastric cancer is increasing in Iran, so further epidemiological studies into the etiology and early detection are essential.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

재보간의 특성을 이용한 디지털 이미지의 합성 영역 및 필터링 영역 검출 (Detection of Forged Regions and Filtering Regions of Digital Images Using the Characteristics of Re-interpolation)

  • 황민구;하동환
    • 한국멀티미디어학회논문지
    • /
    • 제15권2호
    • /
    • pp.179-194
    • /
    • 2012
  • 디지털 합성 이미지는 이미지가 담고 있는 진정성을 왜곡하기 때문에 사회적인 문제가 되고 있다. 이러한 디지털 합성 이미지들은 인터넷, 잡지 또는 정치적 광고를 위한 이미지들에서 흔히 볼 수 있다. 이러한 왜곡된 매체들은 이미지가 담고 있는 정보에 대한 신뢰도를 떨어트릴 수 있다. 본 논문에서는 이와 같이 대중에게 전달되는 정보의 혼란을 예방하기 위한 연구로써 디지털 합성 이미지를 판독하는데 목적이 있다. 대부분의 합성 이미지들은 이미지 크기 조절 및 회전을 이용하는 방법을 사용하기 때문에 합성 영역에 보간 (Interpolation)이 적용되게 된다. 본 논문은 보간의 흔적을 검출하는 연구로써 이미 보간이 적용된 영역과 그렇지 않은 영역에 재보간을 적용하여 두 영영간의 주파수 패턴을 검출하는 실험을 하였다. 이를 통해 합성에 사용된 보간 흔적을 검출하였으며 이미지 리터칭에 사용된 필터링 영역도 검출할 수 있었다.