• 제목/요약/키워드: Topic Extraction

검색결과 124건 처리시간 0.03초

An Evaluation of Applying Knowledge Base to Academic Information Service

  • Lee, Seok-Hyoung;Kim, Hwan-Min;Choe, Ho-Seop
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제3권1호
    • /
    • pp.81-95
    • /
    • 2013
  • Through a series of precise text handling processes, including automatic extraction of information from documents with knowledge from various fields, recognition of entity names, detection of core topics, analysis of the relations between the extracted information and topics, and automatic inference of new knowledge, the most efficient knowledge base of the relevant field is created, and plans to apply these to the information knowledge management and service are the core requirements necessary for intellectualization of information. In this paper, the knowledge base, which is a necessary core resource and comprehensive technology for intellectualization of science and technology information, is described and the usability of academic information services using it is evaluated. The knowledge base proposed in this article is an amalgamation of information expression and knowledge storage, composed of identifying code systems from terms to documents, by integrating terminologies, word intelligent networks, topic networks, classification systems, and authority data.

어휘의 동시 발생 빈도와 분포를 이용한 다중 주제 회의록 요약 (Multi-Topic Meeting Summarization using Lexical Co-occurrence Frequency and Distribution)

  • 이병수;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
    • /
    • pp.13-16
    • /
    • 2015
  • 본 논문에서는 어휘의 동시 발생 (co-occurrence) 빈도와 분포를 이용한 회의록 요약방법을 제안한다. 회의록은 일반 문서와 달리 문서에 여러 세부적인 주제들이 나타나며, 잘못된 형식의 문장, 불필요한 잡담들을 포함하고 있기 때문에 이러한 특징들이 문서요약 과정에서 고려되어야 한다. 기존의 일반적인 문서요약 방법은 하나의 주제를 기반으로 문서 전체에서 가장 중요한 문장으로 요약하기 때문에 다중 주제 회의록 요약에는 적합하지 않다. 제안한 방법은 먼저 어휘의 동시 발생 (co-occurrence) 빈도를 이용하여 회의록 분할 (segmentation) 과정을 수행한다. 다음으로 주제의 구분에 따라 분할된 각 영역 (block)의 중요 단어 집합 생성, 중요 문장 추출 과정을 통해 회의록의 중요 문장들을 선별한다. 마지막으로 추출된 중요 문장들의 위치, 종속 관계를 고려하여 최종적으로 회의록을 요약한다. AMI meeting corpus를 대상으로 실험한 결과, 제안한 방법이 baseline 요약 방법들보다 요약 비율에 따른 평가 및 요약문의 세부 주제별 평가에서 우수한 요약 성능을 보임을 확인하였다.

  • PDF

Automatic Payload Signature Update System for the Classification of Dynamically Changing Internet Applications

  • Shim, Kyu-Seok;Goo, Young-Hoon;Lee, Dongcheul;Kim, Myung-Sup
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1284-1297
    • /
    • 2019
  • The network environment is presently becoming very increased. Accordingly, the study of traffic classification for network management is becoming difficult. Automatic signature extraction system is a hot topic in the field of traffic classification research. However, existing automatic payload signature generation systems suffer problems such as semi-automatic system, generating of disposable signatures, generating of false-positive signatures and signatures are not kept up to date. Therefore, we provide a fully automatic signature update system that automatically performs all the processes, such as traffic collection, signature generation, signature management and signature verification. The step of traffic collection automatically collects ground-truth traffic through the traffic measurement agent (TMA) and traffic management server (TMS). The step of signature management removes unnecessary signatures. The step of signature generation generates new signatures. Finally, the step of signature verification removes the false-positive signatures. The proposed system can solve the problems of existing systems. The result of this system to a campus network showed that, in the case of four applications, high recall values and low false-positive rates can be maintained.

Determining plasma boundary in Alvand-U tokamak

  • Yahya Sadeghi
    • Nuclear Engineering and Technology
    • /
    • 제55권9호
    • /
    • pp.3485-3492
    • /
    • 2023
  • One of the major topic of tokamak research is the determination of the magnetic profile due to magnetic coil fields and plasma current by mean of data from magnetic probes. The most practical approach is to use the current filament method, which models the plasma column with multiple current carrying filaments and the total current of these filaments is equal to the plasma current. Determining the plasma boundary in Alvand-U tokamak is the main purpose of this paper. In order to determine the magnetic field profile and plasma boundary, information concerning the magnetic coils, their position, and current is required in the computing code. Then, the plasma shape is determined and finally the plasma boundary is extracted by the code. In the conducted research, we discuss how to determine the plasma boundary and the performance of the computing code for extraction of the plasma boundary. The developed algorithm shows to be effective by running it in the regular pc machine with characteristics of Intel (R) core (TM) i3-10100 CPU @3.60 GHz and 8.00 GB of RAM. Finally, we present results of a test run for computing code using a typical experimental pulse.

Depth tracking of occluded ships based on SIFT feature matching

  • Yadong Liu;Yuesheng Liu;Ziyang Zhong;Yang Chen;Jinfeng Xia;Yunjie Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권4호
    • /
    • pp.1066-1079
    • /
    • 2023
  • Multi-target tracking based on the detector is a very hot and important research topic in target tracking. It mainly includes two closely related processes, namely target detection and target tracking. Where target detection is responsible for detecting the exact position of the target, while target tracking monitors the temporal and spatial changes of the target. With the improvement of the detector, the tracking performance has reached a new level. The problem that always exists in the research of target tracking is the problem that occurs again after the target is occluded during tracking. Based on this question, this paper proposes a DeepSORT model based on SIFT features to improve ship tracking. Unlike previous feature extraction networks, SIFT algorithm does not require the characteristics of pre-training learning objectives and can be used in ship tracking quickly. At the same time, we improve and test the matching method of our model to find a balance between tracking accuracy and tracking speed. Experiments show that the model can get more ideal results.

Prisma Statement: The Strategic Advantages and Disadvantages of Foreign Direct Investments (FDI)

  • Phouthakannha NANTHARATH
    • 산경연구논집
    • /
    • 제14권10호
    • /
    • pp.1-9
    • /
    • 2023
  • Purpose: In an increasingly globalized world, foreign direct investment (FDI) plays an essential role in the economic improvement of countries. This study aims to delve into the topic of overseas direct investment (FDI) and offer a complete analysis of its strategic advantages and disadvantages. By thoroughly examining the present literature, this study aims to discover and explore the diverse advantages and drawbacks. Research design, data and methodology: The information analysis system systematically and rigorously examined the selected studies. The evaluation will follow a thematic technique in which conventional subject matters and styles associated with FDI's strategic benefits and downsides can be recognized and synthesized. Data extraction contained relevant facts from the chosen research, along with the study objectives. Results: This study provides the findings of the, which explores the strategic advantages and disadvantages of foreign direct investments (FDI) primarily based on the evaluation of previous research. A comprehensive review of the identified benefits and drawbacks highlights their implications for businesses engaged in FDI. Conclusions: In sum, the findings offer valuable insights for practitioners, guiding their decision-making methods in the international commercial enterprise landscape. Organizations can function for fulfillment and sustainable development in the global marketplace by leveraging the advantages and effectively managing demanding situations.

How Chinese Online Media Users Respond to Carbon Neutrality: A Quantitative Textual Analysis of Comments on Bilibili, a Chinese Video Sharing Platform

  • Zha Yiru
    • Asian Journal for Public Opinion Research
    • /
    • 제11권2호
    • /
    • pp.145-162
    • /
    • 2023
  • This research investigates how users of Bilibili, a video sharing website based in China have responded to carbon neutrality. By conducting quantitative textual analyses on 3,311 comments on Bilibili using LDA topic extraction and content statistics, this research discovers that: (1) Bilibili users have assigned more weight to geopolitical topics (56.3%) than energy (22.0%) and environmental topics (21.7%). (2) When assessing carbon neutrality, Bilibili users considered geopolitical (53.8%) and energy factors (15.8%) more heavily than factors related to the class (9.2%), economy (8.9%), environment (8.7%), and definition (3.6%). (3) More Bilibili users had negative (64.6%) attitudes towards carbon neutrality, with only a small portion of them expressing positive (26.8%) and neutral (8.6%) attitudes. (4) Negative attitudes towards carbon neutrality were mainly driven by geopolitical concerns about the West's approach to China, other countries' free-riding on China's efforts and the West's manipulation of rules, doubts about the feasibility of energy transition and suspicion of capitalists exploiting consumers through this concept. This research highlights the geopolitical concerns behind the environmental attitudes of Chinese people, deepening our understanding to psychological constructs and crisis sensitivity of Chinese people towards environmental issues.

LC-MS/MS를 이용한 콘돔에 함유된 니트로사민류 농도 분석 (Analysis of Nitrosamines Concentration in Condom by using LC-MS/MS)

  • 박나연;김성민;정웅;고영림
    • 대한화학회지
    • /
    • 제62권3호
    • /
    • pp.181-186
    • /
    • 2018
  • 니트로사민류는 이차아민과 아질산이 니트로소화 반응을 통해 생성되는 화합물이며, 고무의 가공시 가황과정을 거치면서 생성되는 것으로 밝혀졌다. 최근 고무제품 중에서 니트로사민류가 검출되면서 큰 이슈가 되고 있다. 콘돔은 인체에 삽입되는 일회용 의료기기로써 피부 및 점막에 직접 접촉하므로 안전성이 매우 중요하다. 이에 본 연구에서는 ISO 29941 방법을 준용하여 콘돔 중 니트로사민류의 분석법을 개발하였다. 콘돔 시료를 증류수에 넣어 용출시키고, 용출액에서 분석대상 물질을 추출하기 위해 디클로로메탄으로 액체-액체 추출을 실시하였으며, 농축 후 LC-MS/MS에서 정량분석하였다. 분석법의 정확도는 85.8~108.7%, 정밀도는 11.5% 이하, 검출한계는 0.11(NDPA, NDBA) ~ 0.48(NPYR) ng/mL이었다. 31건의 콘돔시료 중에서 증류수 용출에 의해 검출된 물질은 NDBA 2건이었고, 인공타액(pH 4.5) 용출로 검출된 물질은 NDMA 1건, NDEA 4건, NDBA 26건이었다. 니트로사민류의 총량은 모든 시료에서 $500{\mu}g/kg$을 초과하지 않았다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.