• 제목/요약/키워드: Topic Generation

검색결과 162건 처리시간 0.03초

Classifying Social Media Users' Stance: Exploring Diverse Feature Sets Using Machine Learning Algorithms

  • Kashif Ayyub;Muhammad Wasif Nisar;Ehsan Ullah Munir;Muhammad Ramzan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.79-88
    • /
    • 2024
  • The use of the social media has become part of our daily life activities. The social web channels provide the content generation facility to its users who can share their views, opinions and experiences towards certain topics. The researchers are using the social media content for various research areas. Sentiment analysis, one of the most active research areas in last decade, is the process to extract reviews, opinions and sentiments of people. Sentiment analysis is applied in diverse sub-areas such as subjectivity analysis, polarity detection, and emotion detection. Stance classification has emerged as a new and interesting research area as it aims to determine whether the content writer is in favor, against or neutral towards the target topic or issue. Stance classification is significant as it has many research applications like rumor stance classifications, stance classification towards public forums, claim stance classification, neural attention stance classification, online debate stance classification, dialogic properties stance classification etc. This research study explores different feature sets such as lexical, sentiment-specific, dialog-based which have been extracted using the standard datasets in the relevant area. Supervised learning approaches of generative algorithms such as Naïve Bayes and discriminative machine learning algorithms such as Support Vector Machine, Naïve Bayes, Decision Tree and k-Nearest Neighbor have been applied and then ensemble-based algorithms like Random Forest and AdaBoost have been applied. The empirical based results have been evaluated using the standard performance measures of Accuracy, Precision, Recall, and F-measures.

Management of aerosol generation during upper gastrointestinal endoscopy

  • Chawisa Nampoolsuksan;Vitoon Chinswangwatanakul;Asada Methasate;Jirawat Swangsri;Atthaphorn Trakarnsanga;Chainarong Phalanusitthepha;Thammawat Parakonthun;Voraboot Taweerutchana;Nicha Srisuworanan;Tharathorn Suwatthanarak;Thikhamporn Tawantanakorn;Thawatchai Akaraviputh
    • Clinical Endoscopy
    • /
    • 제55권5호
    • /
    • pp.588-593
    • /
    • 2022
  • In the highly contagious coronavirus disease 2019 pandemic, aerosol-generating procedures (AGPs) are associated with high-risk of transmission. Upper gastrointestinal endoscopy is a procedure with the potential to cause dissemination of bodily fluids. At present, there is no consensus that endoscopy is defined as an AGP. This review discusses the current evidence on this topic with additional management. Prevailing publications on coronavirus related to upper gastrointestinal endoscopy and aerosolization from the PubMed and Scopus databases were searched and reviewed. Comparative quantitative analyses showed a significant elevation of particle numbers, implying that aerosols were generated by upper gastrointestinal endoscopy. The associated source events have also been reported. To reduce the dispersion, certain protective measures have been developed. Endoscopic unit protocols are recommended for the concerned personnel. Therefore, upper gastrointestinal endoscopy should be classified as an AGP. Proper practices should be adopted by healthcare workers and patients.

적대적 생성 신경망 기반 비공기압 타이어 디자인 시스템 (Non-pneumatic Tire Design System based on Generative Adversarial Networks)

  • 성주용;이현준;이성철
    • Journal of Platform Technology
    • /
    • 제11권6호
    • /
    • pp.34-46
    • /
    • 2023
  • 자동차 타이어의 휠과 트레드 사이에 탄성중합체 또는 다각형의 스포크를 채우는 방식으로 제작하는 비공기압 타이어는 자동차 관련 학계 및 항공우주 업계의 중요한 연구 주제가 되고 있다. 본 연구에서는 생성형 적대 신경망을 기반으로 비공기압 타이어 디자인을 생성하는 시스템 개발했다. 특히 비공기압 타이어의 종류와 사용 환경, 제작 방식, 공기압 타이어와의 차이점 그리고 스포크 디자인에 따른 하중 전달의 변화 등 디자인에 영향을 미칠만한 변수들에 대한 조사를 실시했다. 이 연구는 OpenCV를 통해 다양한 스포크 형태의 이미지를 만들고, projected GANs에 학습시켜 비공기압 타이어 디자인에 사용될 스포크를 생성했다. 디자인된 비공기압 타이어는 사용 가능 및 불가능으로 레이블링하고, 이를 Vision Transformer 이미지 분류 AI 모델에 학습시켜 분류하도록 하였다. 최종적으로 분류 모델의 평가를 통해 0에 가까운 loss의 수렴, 99%의 정확도를 확인했다. 차후 도형 및 스포크 이미지와 알고리즘을 이용한 디자인이 아닌, 완전 자동화 시스템의 개발과 더 나아가 3D의 물리적 해석 없이 사용 가능한 디자인을 생성하는 것을 목표로 한다.

  • PDF

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.

TERRAPOWER, LLC TRAVELING WAVE REACTOR DEVELOPMENT PROGRAM OVERVIEW

  • Hejzlar, Pavel;Petroski, Robert;Cheatham, Jesse;Touran, Nick;Cohen, Michael;Truong, Bao;Latta, Ryan;Werner, Mark;Burke, Tom;Tandy, Jay;Garrett, Mike;Johnson, Brian;Ellis, Tyler;Mcwhirter, Jon;Odedra, Ash;Schweiger, Pat;Adkisson, Doug;Gilleland, John
    • Nuclear Engineering and Technology
    • /
    • 제45권6호
    • /
    • pp.731-744
    • /
    • 2013
  • Energy security is a topic of high importance to many countries throughout the world. Countries with access to vast energy supplies enjoy all of the economic and political benefits that come with controlling a highly sought after commodity. Given the desire to diversify away from fossil fuels due to rising environmental and economic concerns, there are limited technology options available for baseload electricity generation. Further complicating this issue is the desire for energy sources to be sustainable and globally scalable in addition to being economic and environmentally benign. Nuclear energy in its current form meets many but not all of these attributes. In order to address these limitations, TerraPower, LLC has developed the Traveling Wave Reactor (TWR) which is a near-term deployable and truly sustainable energy solution that is globally scalable for the indefinite future. The fast neutron spectrum allows up to a ~30-fold gain in fuel utilization efficiency when compared to conventional light water reactors utilizing enriched fuel. When compared to other fast reactors, TWRs represent the lowest cost alternative to enjoy the energy security benefits of an advanced nuclear fuel cycle without the associated proliferation concerns of chemical reprocessing. On a country level, this represents a significant savings in the energy generation infrastructure for several reasons 1) no reprocessing plants need to be built, 2) a reduced number of enrichment plants need to be built, 3) reduced waste production results in a lower repository capacity requirement and reduced waste transportation costs and 4) less uranium ore needs to be mined or purchased since natural or depleted uranium can be used directly as fuel. With advanced technological development and added cost, TWRs are also capable of reusing both their own used fuel and used fuel from LWRs, thereby eliminating the need for enrichment in the longer term and reducing the overall societal waste burden. This paper describes the origins and current status of the TWR development program at TerraPower, LLC. Some of the areas covered include the key TWR design challenges and brief descriptions of TWR-Prototype (TWR-P) reactor. Selected information on the TWR-P core designs are also provided in the areas of neutronic, thermal hydraulic and fuel performance. The TWR-P plant design is also described in such areas as; system design descriptions, mechanical design, and safety performance.

로트카 생명표에서 연구 집단의 초기연령 설정에 따른 내적자연증가율 추정방법에 대한 고찰 (A Short Review for the Estimation Method of Intrinsic Rate of Natural Increase According to the Setting of Initial Age for the Study Cohort in the Lotka Life Table)

  • 김동순
    • 한국응용곤충학회지
    • /
    • 제61권4호
    • /
    • pp.549-554
    • /
    • 2022
  • 곤충생태 분야에서 생명표와 관련된 연구는 곤충연구자들에게 많은 관심을 받는 주제중 하나이다. 보통 두 가지 방법으로 생명표 통계량중 내적자연증가율을 추정하고 있는데, 첫 번째 하나는 순증가율(R0)에 자연로그를 취하고 평균세대기간(T)으로 나누어 근사치를 계산하는 방법이다(세대기간-기반 추정법). 다른 하나는 로트카-볼테라 개체군 생장 방정식에서 유도하여 최대우도법으로 정확한 내적자연증가율을 추정하는 방법이다(로트카-오일러식-기반 추정법). 후자의 경우 대상 집단의 초기 연령등급을 "0" 또는 "1"로 설정함에 따라 추정값에 차이가 발생하여 적용에 혼란이 제기되었다. 본 고찰에서는 생명표 통계량 계산과정의 역사를 간단히 정리하고, 로트카-오일러식-기반 추정법에서 최초 연령등급을 1로 설정한 경우 $\sum\limits_{x=1}^{w}e^{-rx}l_xm_x=1$의 형식, 반면 최초 연령등급을 0으로 설정한 경우 $\sum\limits_{x=0}^{w}e^{-r(x+1)}l_xm_x=1$의 형식을 적용해야 함을 재확인하였다.

The Trend of Cigarette Design and Tobacco Flavor System Development

  • Wu, Jimmy Z.
    • 한국연초학회지
    • /
    • 제24권1호
    • /
    • pp.67-73
    • /
    • 2002
  • In light of addressing consumer health concern, coping with anti-tobacco movement, and promoting new product, tobacco industry is actively pursuing to make a new generation of cigarettes with low tar and nicotine deliveries, and less harmful substances. Low tar and low nicotine cigarettes increases their market shares dramatically world wide, especially in KT&G, multinational tobacco companies, EU countries, even in China regulated by CNTC to set up yearly target to lower tar and nicotine deliveries. On the other hand, to design a new cigarette with reduced harmful substances begins to gain speed. The "modified Hoffmann list" publishes thirty plus substances in tobacco leaf and main smoke stream, which is the prime suspect causing health problems. Various ways and means are developed to reduce such components including new tobacco breeds, new curing method, tobacco leaf treatment before processing, selected filtration system, innovated casing system to reduce free radicals, as well as some non conventional cigarette products. In TSRC held this year, the main topic is related to reduce tobacco specific nitrosamines in tobacco leaf. The new generation of cigarette is in the horizon. It still needs a lot help to produce commercial products with satisfied taste and aroma characters. The flavor industry is not regulated by many governments demanding which ingredients might or might not be for tobacco use. However, most of the cigarette companies self impose a list of ingredients to guide flavor suppliers to design flavors. Unfortunately, the number of ingredients in those lists is getting shorter every year. It is understandable that the health is not the only reason. Some cigarette companies are playing safe to protect the company from potential lawsuit, while others are just copying from their competitors. Moreover, it is obvious that it needs more assistance from casings and flavors to design new generation of cigarettes with missing certain flavor components in tobacco leaf and main smoke stream. These flavor components are either non-existed or at lower level at new form of cured tobacco leaf or filtered in the main smoke stream along with reduced harmful substances. The use of carbon filters and other selected filtration system poses another tough task for flavor system design. Specific flavor components are missing from the smoke analysis data, which brings a notion of "carbon taste" and "dryness" of mouth feel. It is ever more demanded by cigarette industry to flavor suppliers to produce flavors as body enhancer, tobacco notes, salivating agents, harshness reducer, and various of aromatic notes provided they are safe to use. Another trend is that water based flavor or flavor with reduced ethanol as solvent is gaining popularity. It is preferred by some cigarette companies that the flavor is compounded with all natural ingredients or all ingredients should he GMO free. The new generation of cigarettes demands many ways of new thinking process. It is also vital for tobacco industry. It reflects the real needs for the consumers that the cigarette product should be safe to use as well as bearing the taste and aroma characters smokers always enjoyed. An effective tobacco flavor system is definitely a part of the equation. The global trend of tobacco industry is like trends of any other industries lead by consumer needs, benefited with new technology availability, affected by the global economy, and subjected for various rules and regulations. Anti-tobacco organizations and media exceptionally scrutinize cigarette, as a legal commercial product. Cigarette is probably the most studied commercial product for its composition, structure, deliveries, effects, as well as its new developmental trend. Therefore, any new trend of cigarette development would be within these boundaries. This paper is trying to point out what it would be like for tobacco industry in the next few yews and what concerns the tobacco industry. It focuses mostly on the efforts to produce safer cigarettes. It is such a vital task for the tobacco industry and its affiliate industries such as cigarette papers, filters, flavors, and other materials. The facts and knowledge presented in this paper might be well known for the public. Some of the comments and predictions are very much personal opinion for a further discussion.

기술 성숙도 및 의존도의 네트워크 분석을 통한 유망 융합 기술 발굴 방법론 (Discovering Promising Convergence Technologies Using Network Analysis of Maturity and Dependency of Technology)

  • 최호창;곽기영;김남규
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.101-124
    • /
    • 2018
  • 최근 다양한 분야에서 새로운 기술이 출현하고 있으며, 이들 대부분은 기존 기술들의 융합(Convergence)을 통해 형성되고 있다. 또한 가까운 미래에 출현하게 될 유망한 융합 기술을 예측함으로써 변화하는 기술 지형에 선제적으로 대응하기 위한 수요가 꾸준히 증가하고 있으며, 이러한 수요에 부응하여 많은 기관과 연구자들은 미래 유망 융합 기술 예측을 위한 분석을 수행하고 있다. 하지만 이와 관련한 기존의 많은 연구들은 (i) 고정된 기술 분류 기준을 분석에 사용함으로써 기술 분야의 동적 변화를 반영하지 못했다는 점, (ii) 예측 모형 수립 과정에서 주로 범용성 네트워크 지표를 사용함으로써 기술의 융합이라는 목적에 부합하는 고유 특성을 활용하지 못했다는 점, 그리고 (iii) 유망 분야 예측 모형의 정확성 평가를 위한 객관적 방법을 제시하지 못했다는 점 등에서 한계를 갖고 있다. 이에 본 연구에서는 (i) 토픽 모델링을 통해 기존의 고정된 분류 기준이 아닌 실제 기술시장의 동적 변화에 따른 새로운 기술군을 도출하고, (ii) 기술 성숙도 및 기술군 간 의존 관계에 따라 각 기술군의 융합적 특성을 반영하는 잠재 성장 중심성(Potential Growth Centrality) 지표를 산출하였으며, (iii) 잠재 성장 중심성에 근거하여 예측한 유망 기술의 성숙도 증가량을 시기별로 측정하여 예측 모형의 정확도를 평가하는 방안을 제시한다. 이와 더불어 제안 방법론의 성능 및 실무 적용 가능성의 평가를 위해 특허 문서 13, 477건에 대한 실험을 수행하였으며, 실험 결과 제안한 잠재 성장 중심성에 따른 예측 모형이 단순히 현재 활용되는 영향도 기반의 예측 모형에 비해 최대 약 2.88배 높은 예측 정확도를 보임을 확인하였다.

개선된 배깅 앙상블을 활용한 기업부도예측 (Bankruptcy prediction using an improved bagging ensemble)

  • 민성환
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.121-139
    • /
    • 2014
  • 기업의 부도 예측은 재무 및 회계 분야에서 매우 중요한 연구 주제이다. 기업의 부도로 인해 발생하는 비용이 매우 크기 때문에 부도 예측의 정확성은 금융기관으로서는 매우 중요한 일이다. 최근에는 여러 개의 모형을 결합하는 앙상블 모형을 부도 예측에 적용해 보려는 연구가 큰 관심을 끌고 있다. 앙상블 모형은 개별 모형보다 더 좋은 성과를 내기 위해 여러 개의 분류기를 결합하는 것이다. 이와 같은 앙상블 분류기는 분류기의 일반화 성능을 개선하는 데 매우 유용한 것으로 알려져 있다. 본 논문은 부도 예측 모형의 성과 개선에 관한 연구이다. 이를 위해 사례 선택(Instance Selection)을 활용한 배깅(Bagging) 모형을 제안하였다. 사례 선택은 원 데이터에서 가장 대표성 있고 관련성 높은 데이터를 선택하고 예측 모형에 악영향을 줄 수 있는 불필요한 데이터를 제거하는 것으로 이를 통해 예측 성과 개선도 기대할 수 있다. 배깅은 학습데이터에 변화를 줌으로써 기저 분류기들을 다양화시키는 앙상블 기법으로 단순하면서도 성과가 매우 좋은 것으로 알려져 있다. 사례 선택과 배깅은 각각 모형의 성과를 개선시킬 수 있는 잠재력이 있지만 이들 두 기법의 결합에 관한 연구는 아직까지 없는 것이 현실이다. 본 연구에서는 부도 예측 모형의 성과를 개선하기 위해 사례 선택과 배깅을 연결하는 새로운 모형을 제안하였다. 최적의 사례 선택을 위해 유전자 알고리즘이 사용되었으며, 이를 통해 최적의 사례 선택 조합을 찾고 이 결과를 배깅 앙상블 모형에 전달하여 새로운 형태의 배깅 앙상블 모형을 구성하게 된다. 본 연구에서 제안한 새로운 앙상블 모형의 성과를 검증하기 위해 ROC 커브, AUC, 예측정확도 등과 같은 성과지표를 사용해 다양한 모형과 비교 분석해 보았다. 실제 기업데이터를 사용해 실험한 결과 본 논문에서 제안한 새로운 형태의 모형이 가장 좋은 성과를 보임을 알 수 있었다.

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.