• 제목/요약/키워드: textual analysis

검색결과 203건 처리시간 0.035초

Sentiment Analysis of Product Reviews to Identify Deceptive Rating Information in Social Media: A SentiDeceptive Approach

  • Marwat, M. Irfan;Khan, Javed Ali;Alshehri, Dr. Mohammad Dahman;Ali, Muhammad Asghar;Hizbullah;Ali, Haider;Assam, Muhammad
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.830-860
    • /
    • 2022
  • [Introduction] Nowadays, many companies are shifting their businesses online due to the growing trend among customers to buy and shop online, as people prefer online purchasing products. [Problem] Users share a vast amount of information about products, making it difficult and challenging for the end-users to make certain decisions. [Motivation] Therefore, we need a mechanism to automatically analyze end-user opinions, thoughts, or feelings in the social media platform about the products that might be useful for the customers to make or change their decisions about buying or purchasing specific products. [Proposed Solution] For this purpose, we proposed an automated SentiDecpective approach, which classifies end-user reviews into negative, positive, and neutral sentiments and identifies deceptive crowd-users rating information in the social media platform to help the user in decision-making. [Methodology] For this purpose, we first collected 11781 end-users comments from the Amazon store and Flipkart web application covering distant products, such as watches, mobile, shoes, clothes, and perfumes. Next, we develop a coding guideline used as a base for the comments annotation process. We then applied the content analysis approach and existing VADER library to annotate the end-user comments in the data set with the identified codes, which results in a labelled data set used as an input to the machine learning classifiers. Finally, we applied the sentiment analysis approach to identify the end-users opinions and overcome the deceptive rating information in the social media platforms by first preprocessing the input data to remove the irrelevant (stop words, special characters, etc.) data from the dataset, employing two standard resampling approaches to balance the data set, i-e, oversampling, and under-sampling, extract different features (TF-IDF and BOW) from the textual data in the data set and then train & test the machine learning algorithms by applying a standard cross-validation approach (KFold and Shuffle Split). [Results/Outcomes] Furthermore, to support our research study, we developed an automated tool that automatically analyzes each customer feedback and displays the collective sentiments of customers about a specific product with the help of a graph, which helps customers to make certain decisions. In a nutshell, our proposed sentiments approach produces good results when identifying the customer sentiments from the online user feedbacks, i-e, obtained an average 94.01% precision, 93.69% recall, and 93.81% F-measure value for classifying positive sentiments.

"나꼼수현상"이 그려내는 문화정치의 명암: 권력-대항적인 정치시사콘텐츠의 함의를 맥락화하기 (A Critical Analysis of and Its Implications)

  • 이기형;이영주;황경아;채지연;천혜영;권숙영
    • 한국언론정보학보
    • /
    • 제58권
    • /
    • pp.74-105
    • /
    • 2012
  • 팟캐스트 프로그램 <나는 꼼수다>가 한국사회에 제기한 물음과 도전은 여러 가지 측면에서 충분히 주목할 만하다. 기존의 미디어양식과는 매우 차별화된 방식으로 <나는 꼼수다>는 정치사회적인 쟁점들을 개입적으로 조명했으며, 이 과정에서 기성의 언론이나 담론생산자들과는 매우 차별화되고 대안적인 접근과 더불어, 구성상의 새로움을 발현한 바 있다. 직설적이고 도발적인 발화와 강한 풍자성, 그리고 이른바 팩트와 가설 사이를 오가며 던지는 추정과 정치권력에 대한 비판과 희화로 특징을 들 수 있는 <나는 꼼수다>라는 신생 커뮤니케이션 양식의 부상과 위력은, 수용자대중과 전문가 집단 그리고 정치인들에게 매우 강한 인상을 남겼다. 특히 제도언론이 충분히 역할과 소임을 수행하고 있지 못한 국면에서, 또한 정치권력의 언론장과 공공영역에 대한 압박과 통제가 작동하고 있는 환경 속에서, <나는 꼼수다>는 기성의 언론과는 매우 차별화된 방식으로 정치사회적인 이슈들을 다루었으며, 이러한 대항적인 역할은 다수의 수용자들의 관심과 지지를 끌어내기도 했다. 한편 이 프로그램이 발휘하는 "정치적인 편향성"을 숨기지 않고 강하게 드러내는 관점의 표출 그리고 거칠고 파격적인 어법은 상당한 수준의 논쟁과 논란을 생성하기도 했다. 이 연구는 텍스트분석과 기사분석, 그리고 서면 인터뷰의 방식을 혼용함으로써, <나는 꼼수다>의 정치사회적인 기능과 담화의 매개체로서의 역할, 그리고 이 프로그램의 성취와 한계에 대하여 성찰적인 방식으로 조명하고자 시도했다.

  • PDF

장르와 레지스터 분석에서 나타난 중학생의 지구과학 주제 글쓰기의 언어적 특징 (Linguistic Characteristics of Middle School Students' Writing on Earth Science Themes Through Analysis of Its Genre and Register)

  • 차현정;김찬종;맹승호
    • 한국지구과학회지
    • /
    • 제32권1호
    • /
    • pp.84-98
    • /
    • 2011
  • 이 연구에서는 장르 분석 및 레지스터 분석을 통해 중학생들의 지구과학 주제 글쓰기의 언어적 특징을 분석하였다. 연구 자료는 7, 9학년 학생들을 대상으로 '지구 온난화'와 '암석의 분류' 주제 글쓰기를 실시하여 얻은 학생들의 글쓰기를 대상으로 하였다. 연구 결과는 다음과 같다. 첫째, 학생들은 장르별 글쓰기에 익숙하지 않았으며 특히 논설장르 글쓰기에 많은 어려움을 보였다. 둘째, 내용과 논리관계의 특징으로 정의나 분류와 같이 한 부분을 다른 부분과 관련시키는 관계적 술어보다는 행동 및 하는 것을 의미하는 현상적 술어와 부가적 논리 관계가 많이 나타났다. 셋째, 상호관계적 표현의 특징으로 글 속에서 글의 주체, 글쓴이의 감정, 주관적 의견들이 많이 드러났으며, 학생들은 자신의 생각에 대해서 확신을 가지지 못하고 불확실성을 드러내었다. 넷째, 텍스트 구성의 특징으로 대부분의 학생들이 부가 접속사를 통해 단편적인 정보들을 나열하였으며, 체계적이며 논리적인 글을 쓰는데 익숙하지 않았다. 연구 결과를 바탕으로 과학적 소양의 함양을 목표로 하는 과학 학습에서 과학 글쓰기가 강조되어야 하며 국가 교육과정차원에서 체계적인 계획뿐만 아니라 과학 글쓰기에 대한 교사들의 인식이 향상되어야 함을 논의하였다.

텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석 (Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm)

  • 선현석;임창원;이영섭
    • 응용통계연구
    • /
    • 제30권4호
    • /
    • pp.603-613
    • /
    • 2017
  • 최근 들어 많은 사람들이 자신의 관심사를 SNS에 게시하거나 인터넷과 컴퓨터의 기술 발달로 디지털 형태의 문서저장이 가능하게 됨으로써 생성되는 텍스트 자료의 양이 폭발적으로 증가하게 되었다. 이에 따라 수많은 문서 자료로부터 가치 있는 정보를 창출하기 위한 기술의 요구 또한 증가하고 있다. 그러나 대부분 비정형 형태로 구성되어 있는 텍스트 기반의 자료는 기존의 통계 분석이나 데이터 마이닝 기법을 적용하기에 부적합하기 때문에 텍스트 마이닝 기법이 사용되고 있다. 본 연구에서는 비정형 자료 분석 기법 중 하나인 텍스트 마이닝 기법으로 기상청 기상연감 자료를 분석하였다. 먼저 전처리 과정을 통하여 용어사전을 구축하고, 용어-문서 행렬을 생성하였다. 그리고 이것을 사용하여 연도별 용어 빈도수를 계산하고, 자주 나타나는 단어들에 대하여 상대도수의 변화를 관찰하였다. 또한 회귀 분석 기법을 사용하여 증가추세와 감소추세를 보이는 용어들을 파악하였다. 이러한 분석으로 기상청 기상연감 문서에서의 트렌드를 파악하고, 이를 통해 이슈가 되었던 기상 관련 소식과 기상현황, 그리고 기상청이 중점으로 하고 있는 업무 현황의 트렌드를 파악하였다. 본 연구를 통해 기상업무 분석 및 효율화에 도움을 주고 기상정책에 반영할 수 있는 유용한 정보를 이끌어내고자 하였다.

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.

Public Sentiment Analysis and Topic Modeling Regarding COVID-19's Three Waves of Total Lockdown: A Case Study on Movement Control Order in Malaysia

  • Alamoodi, A.H.;Baker, Mohammed Rashad;Albahri, O.S.;Zaidan, B.B.;Zaidan, A.A.;Wong, Wing-Kwong;Garfan, Salem;Albahri, A.S.;Alonso, Miguel A.;Jasim, Ali Najm;Baqer, M.J.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권7호
    • /
    • pp.2169-2190
    • /
    • 2022
  • The COVID-19 pandemic has affected many aspects of human life. The pandemic not only caused millions of fatalities and problems but also changed public sentiment and behavior. Owing to the magnitude of this pandemic, governments worldwide adopted full lockdown measures that attracted much discussion on social media platforms. To investigate the effects of these lockdown measures, this study performed sentiment analysis and latent Dirichlet allocation topic modeling on textual data from Twitter published during the three lockdown waves in Malaysia between 2020 and 2021. Three lockdown measures were identified, the related data for the first two weeks of each lockdown were collected and analysed to understand the public sentiment. The changes between these lockdowns were identified, and the latent topics were highlighted. Most of the public sentiment focused on the first lockdown as reflected in the large number of latent topics generated during this period. The overall sentiment for each lockdown was mostly positive, followed by neutral and then negative. Topic modelling results identified staying at home, quarantine and lockdown as the main aspects of discussion for the first lockdown, whilst importance of health measures and government efforts were the main aspects for the second and third lockdowns. Governments may utilise these findings to understand public sentiment and to formulate precautionary measures that can assure the safety of their citizens and tend to their most pressing problems. These results also highlight the importance of positive messaging during difficult times, establishing digital interventions and formulating new policies to improve the reaction of the public to emergency situations.

웹툰에서 재현하는 입시문제 : <공부하기 좋은 날>, <입시명문사립 정글고등학교>를 중심으로 (Analysis of the Problem of College Entrance System in Webtoon : in , )

  • 서정행
    • 만화애니메이션 연구
    • /
    • 통권37호
    • /
    • pp.335-360
    • /
    • 2014
  • 웹툰은 PC와 인터넷의 폭발적인 보급을 통해 새로이 대두된 콘텐츠로서 더 이상 출판만화의 연장 혹은 대안으로 볼 수 없는 독자적인 문화 콘텐츠 영역을 구축하게 되었다. 본 연구는 웹툰이 지니는 사회적 기능에 대하여 조명해보고자 한다. 웹툰은 출판만화의 특징인 표현의 자율성을 그대로 이어받아, 소외되거나 배척되던 것에 대해 신랄하고 자유롭게 표현해내는 역할을 지속하고 있다. 뿐만 아니라 상호작용적인 특징을 지닌 콘텐츠가 다양하게 발전하면서 작가와 독자의 교류가 활발하게 이루어져, 웹툰은 주류미디어에서 축소되거나 정화되고 미화되어 드러난 사회문제를 있는 그대로 명확하고 구체적으로 보여주는 기능을 떠안게 되었다. 본고에서는 현재 국내에서 가장 크게 이슈화 되는 사회문제 중 하나인 입시문제를 다루는 네이버 웹툰 <공부하기 좋은날>과 <입시명문사립 정글고등학교>를 통해 웹툰의 사회적 기능에 대하여 분석한다. 두 웹툰은 입시 스트레스, 학교라는 권력에 대항할 수 없는 학생의 무력감, 선생님이나 부모, 친구 등 주변인들과의 갈등에 대한 에피소드가 주를 이루고 있다. 그리고 입시와 관련된 기존 영화나 드라마에서처럼 극적이거나 추상적, 혹은 비현실적이거나 미화된 결말을 보여주지 않고, 현실적이고 열린 결말을 제시하고 있다. 두 웹툰의 분석을 통해 본 연구는 (1) 현실을 여과없이 투영하고 주류 미디어에서 축소되고 미화되어 드러난 사회문제를 있는 그대로 직설적으로 보여주는 웹툰의 특성을 밝히고. (2) 이를 바탕으로 기존 매체에 비하여 생산자와 수용자간의 직접적이고 즉각적인 소통이 가능하고, 여러 세대를 아우르는 사회적 담론의 장을 형성하는 새로운 소통의 콘텐츠로서 웹툰의 역할을 분석하는 것을 목적으로 한다. (3) 아울러 두 웹툰에서 사회문제인 입시문제를 어떻게 재현해나가는지 웹툰의 표현기술적 측면과 스토리텔링의 측면에서 살펴본다. 위와 같은 연구를 통해, 본고에서는 사회문화적 소통매체로서의 특성을 지닌 웹툰에서 재현하는 사회문제와 그 해결에 대한 제안점은 독자와 작가가 직접적인 소통과 교류가 일어나는 가운데 만들어진 것으로서 개인의 것이 아닌 사회적 담론의 결정체로 인정되어야 하고, 웹툰의 사회적 기능에 대한 가치가 새롭게 평가되어야 한다고 주장한다.

애니메이션(센과 치히로의 행방불명)에 대한 기호학적분석 (An Semiotic analysis on Spirited Away)

  • 이윤희
    • 방송과미디어
    • /
    • 제10권1호
    • /
    • pp.99-112
    • /
    • 2005
  • 영상기호학을 이끌었던 선구자인 메츠는 영화를 일종의 언어로서, 여러 약호들이 상호작용하는 의미화작용의 영역으로 보았다. 그는 영화를 상호 양립할 수 있는 영화적 약호들과 상호 대체적인 하위 약호들의 조합으로 보았으며, 영화의 텍스트는 작용하고 있는 약호들의 목록이 아니라 끊임없는 재구조화와 전치의 작업이라고 간주했다. 본 논문에서는 메츠의 기호학적 입장을 받아들여, 미야자키 하야오의 애니메이션 (센과 치히로의 행방불명)에서 중요하게 나타나는 약호의 흐름을 고찰했다. 전반적으로 (센과...)라는 애니메이션에서는 조명의 약호, 색상의 약호, 움직임의 약호, 작가 주의적 약호들이 특별히 의미 있게 다루어지고 있다. 특히 이 애니메이션 전체에서 강한 상징적 의미를 가지는 다리 신들 중 첫 번째를 골라, 각각의 샷에서 어떠한 하위 약호들이 서로 대립하며 구사되는지를 살펴보았다. 첫 번째 다리 신은 크게 목욕탕(즉, 유바바) 대 치히로(와 하쿠)라는 구도로 이루어져 있다. 목욕탕은 단순한 건물로서가 아니라 아직 등장하지 않은 유바바의 대리인이자 치히로의 대립점으로 기능한다. 각각의 샷에서 프레이밍, 시선, 앵글, 움직임의 약호 내의 모든 하위 약호들은 치히로와 목욕탕의 대조를 극대화시키는 방향으로 구사되고 있으며, 가장 눈에 띄는 약호는 움직임이다. (센과 치히로의 행방불명)에서 각각의 약호 내의 하위 약호들은 끊임없이 경쟁하고 교환되며 캐릭터들 간의 대조를 극대화하고 내러티브를 발전시키는 방향으로 구사되고 있음을 볼 수 있다. 영화는 복수약호적 매체로서 유사언어의 실천이라는 메츠의 말처럼, 이러한 약호와 하위 약호들의 조합과 전치는 언어와 다르지만 유사한 방식으로 관객과 커뮤니케이션하고 있는 것이다.

핀란드 초등 과학 교과서의 소재중심 통합단원 분석 (Analysis of Characteristics of Material-Centered Integrated Unit in Finland Elementary Science Textbook)

  • 채희인;노석구;이소영
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제35권1호
    • /
    • pp.26-38
    • /
    • 2016
  • The purpose of this study was to grasp the characteristics of composition regarding the material-centered integrated unit of environmental and natural studies, a science subject in Finland, to investigate a need for applying the material-centered integrated unit to the science curriculum of Korea. For the purpose, the study made an analysis on contents, inquiry activities, and visual materials (the most important in the elementary science curriculum and textbook composition), and it brought following results: First, as a result of analyzing the area of contents, the bicycle material-centered integrated unit comprised a large proportion of 44 pages (25.3%) of the whole 174 pages from the environmental and natural studies textbook for the third grade. The contents included such various concepts as traffic rules, safety, environmental protection and pollution, recycling and separate collection, tubes and triangular structures, wedges and screws, leverage, wheels, axles, gears, elasticity (spring), friction, and so on. Second, as a result of analyzing contents related to the thinking ability of inquiry activities, "expecting or confirming expectations" and "application" are included in every lesson, and one lesson is composed in such a way that students can study on bicycles as a practical material for their daily life and they can improve various thinking abilities. Third, as a result of analyzing the circumstances of inquiry activities, daily circumstances made up eight lessons (80.0%) and technical and social circumstances made up two lessons (20.0%) by focusing on bicycles, a material related to students' daily life. Fourth, as a result of analyzing visual materials, the percentage of pictures and photos was high at 53.4% and 45.2% respectively. As a result of analyzing the role of visual materials, the percentage of the illustrative role and explanatory-complementary role was high at 52.1% and 47.9% respectively. Lastly, as a result of analyzing from the epistemological view to interpret the relation between visual materials and students and the position of visual materials, the visual textbook materials were provided toward a way that students can decrease their feeling of epistemological separation in the three fields of ideational metafunction, interpersonal metafunction, and textual metafunction.

랭보의 「야만」의 난해성 : '자기텍스트성'과 '의미' (Abstruseness of Rimbaud's Barbare : Autotextuality and Meaning)

  • 신옥근
    • 비교문화연구
    • /
    • 제43권
    • /
    • pp.327-354
    • /
    • 2016
  • 랭보의 산문시집 "일뤼미나시용"의 "야만"은 형식이나 주제, 비유 등이 난해한 시로 유명하다. 본고는 작품의 난해성을 연구하기 위해 먼저 문법적 구조를 분석하였고, 그런 다음 시의 의미를 살펴보기 위해 저자의 다른 작품과 비교하는 자기텍스트성을 분석하였다. 자기텍스트성은 스티브 머피가 제시한 랭보 산문시 해석의 방법론으로서 저자의 작품과 맺는 내적 상호텍스트성을 말한다. "야만"의 경우 일반적 상호텍스트성의 연구가 없는 것은 아니지만 시의 의미를 크게 규명하지 못한다고 본다. "야만"의 난해성은 무의미 시의 예로 간주되기도 한다. 하지만 시 구조 분석과 자기텍스트성을 통해 볼 때, "야만"은 무의미가 아니라 의미를 구축하고 있다. 이 시는 일반적 운문시나 산문시와 달리 전체가 명사 구문의 비유로만 이루어져 있다. "야만"은 랭보 고유의 문맥에서 파괴, 화합, 재생의 순수한 힘을 의미한다. "야만"은 보들레르의 "이 세상 끝 어디라도"에 대한 랭보 식 답으로, 북극의 불카누스의 화산에 도달하는 영원한 여성의 목소리로 대변되는 현장이라 할 수 있다. "야만"의 읽기는 "일뤼미나시용"의 난해성을 읽어내는 하나의 방법론이 될 수 있다. 본고에서 우리는 "야만"의 언어적 지표의 분석과 자기텍스트성, 그리고 시가 침묵하고 있는 희열과 고독의 이해가 하나의 접근법이 될 수 있음을 분석하였다. 이러한 접근법을 통해 우리는 "일뤼미나시용"의 파편을 개개의 방식으로 연결하고 조합해서 파편들의 스토리를, 모험을 재구성할 수 있으리라 본다.