• 제목/요약/키워드: Word correlation analysis

검색결과 133건 처리시간 0.022초

웹 스크래핑과 텍스트마이닝을 이용한 공공 및 민간공사의 사고유형 분석 (A Study on the Analysis of Accident Types in Public and Private Construction Using Web Scraping and Text Mining)

  • 윤영근;오태근
    • 문화기술의 융합
    • /
    • 제8권5호
    • /
    • pp.729-734
    • /
    • 2022
  • 건설업의 사고원인 파악을 위해 사고사례를 이용한 다양한 연구가 진행되고 있지만, 공공 및 민간공사의 차이점에 대한 연구는 미미한 실정이다. 본 연구에서는 발주 유형별 사고원인 분석을 위해 웹 스크래핑과 텍스트 마이닝 기술을 적용하였다. 수집된 10,000건 이상의 정형 및 비정형 데이터에 대한 통계분석과 워드클라우드 분석을 통해 공공 및 민간공사의 사고유형과 사고원인에 대한 차이가 확인되었다. 또한, 주요 사고원인들의 상관관계를 파악함으로써 향후 안전관리 대책 수립에 기여할 수 있다.

팀동일시 수준에 따른 여성 스포츠팬의 동기요인이 재관람의도 및 구전의도에 미치는 영향 (Effect of Female Fans' Sport Consumption Motivation on Intention to Re-attend and Word of Mouth Intention According to Level of Team Identification)

  • 이용재
    • 한국콘텐츠학회논문지
    • /
    • 제7권10호
    • /
    • pp.262-273
    • /
    • 2007
  • 본 연구의 목적은 여성 스포츠팬을 스포츠 마케팅의 세그먼트로 인정하고 마케팅을 펼치기 위한 초기과제로, 여성 스포츠팬의 스포츠 관람동기요인을 규명하고 동기요인 중 동일시수준에 따라 재관람의도와 구전의도에 영향을 주는 요인을 밝히는 것에 있다. 이러한 목적을 달성하기 위해 여성 스포츠팬을 대상으로 포커스그룹인터뷰를 실시한 후, 경기장을 찾은 여성관람객을 대상으로 표집이 이루어졌으며, 총 248명의 설문지를 분석에 사용하였다. 자료처리는 기술통계분석, 상관분석, 신뢰도분석, 확인적 요인분석, 회귀분석 등을 이용하였으며 본 연구에서 도출된 결과는 다음과 같다. 첫째, 여성 스포츠팬의 관람동기요인은 9개의 요인으로 나타났으며, 그 중 기술, 성취감, 드라마, 그리고 일상탈출요인이 여성 스포츠팬의 재관람의도에 긍정적인 영향을 미친다. 둘째, 여성 스포츠팬의 관람동기 요인 중 구전의도에 긍정적 영향을 미치는 요인은 선수기술, 성취감, 그리고 사회성요인이다. 셋째, 여성스포츠 팬의 관람동기요인 중 재관람의도에 영향을 미치는 요인은 동일시수준에 따라 차이가 있었다. 넷째, 여성 스포츠 팬의 관람동기요인 중 구전의도에 영향을 미치는 요인은 동일시수준에 따라 차이가 있었다.

MF-DCCA ANALYSIS OF INVESTOR SENTIMENT AND FINANCIAL MARKET BASED ON NLP ALGORITHM

  • RUI ZHANG;CAIRANG JIA;JIAN WANG
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제28권3호
    • /
    • pp.71-87
    • /
    • 2024
  • In this paper, we adopt the MF-DCCA (Multifractal Detrended Cross-Correlation Analysis) method to study the nonlinear correlation between the returns of financial stock markets and investors' sentiment index (SI). The return series of Shanghai Securities Composite Index (SSEC) of China, Shenzhen Securities Component Index (SZI) of China, Nikkei 225 Index (N225) of Japan, and Standard & Poor's 500 Index (S&P500) of the United States are adopted. Firstly, we preliminarily analyze the correlation between SSEC and SI through the Pearson correlation coefficient. In addition, by MF-DCCA, we observe a power-law correlation between investors' sentiment index and SSEC stock market returns, with a significant multifractal correlation. Besides, SI series and SSEC return series have positive persistence. We compare the differences in multifractal cross-correlation between SI and stock return sequences in different markets. We found that the values of SZI-SI in terms of cross-correlation persistence and cross-correlation strength are relatively close to those of SSEC-SI, while the Hxy(2), ∆Hxy, and ∆αxy of N225-SI and S&P500 are much smaller than those of SSEC-SI and SZI-SI. This reason is related to the fact that the investors' sentiment index originated from the Shanghai Composite Index Tieba. The SI is obtained through natural language processing method. Finally, we study the rolling of Hxy(2) and ∆αxy. Results indicate that the macroeconomic environment may cause fluctuations in two sequences of Hxy(2) and ∆αxy.

발화 속도와 말차례 교체 빈도에 따른 운율 단위 변화에 관한 연구 (A study on the change of prosodic units by speech rate and frequency of turn-taking)

  • 원유권
    • 말소리와 음성과학
    • /
    • 제14권2호
    • /
    • pp.29-38
    • /
    • 2022
  • 이 연구는 국립국어원 일상 대화 음성 코퍼스(2020)에서 나타나는 발화를 분석하여 발화 속도 및 말차례 교체 빈도가 운율 단위 변화에 어떤 영향을 끼치는지 밝히는 것을 목적으로 하였다. 분석 결과, 발화 속도가 증가할수록 억양구, 어절 빈도, 발화 길이가 증가하는 양의 상관관계를 보였으나 상관관계가 낮았고, 회귀모형의 적합도는 3%-11%로 설명력이 약했다. 말차례 교체 빈도에 따른 평균 발화 속도는 유의미한 차이가 있었고, 말차례 교체 빈도가 증가할수록 발화 속도는 감소하였다. 또한 말차례 교체 빈도가 증가할수록 억양구 및 어절 빈도와 발화 길이는 감소하였으며 높은 음의 상관관계가 있는 것으로 나타났다. 회귀 모형의 적합도는 27%-32%로 계산되었다. 말차례 교체 빈도가 발화 속도와 운율 단위를 변화시키는 요인으로 작용했을 수 있다. 이는 대화체에서 나타나는 비유창성, 말차례 교체 특성, 화자 간 활발한 상호작용 등이 영향을 미쳤을 것이라 추측된다.

후기 한국어-영어 이중언어화자의 자소-음소 변환 규칙에 따른 영어 규칙성 효과 (Grapheme-to-Phoneme Conversion Regularity Effects among Late Korean-English Bilinguals)

  • 김다희;백연지;류재희;남기춘
    • 인지과학
    • /
    • 제26권3호
    • /
    • pp.323-355
    • /
    • 2015
  • 후기 한국어-영어 이중언어화자의 자소-음소 변환규칙(grapheme to phoneme conversion rule, GPC 규칙)에 따른 영어 규칙성 효과(regularity effect)가 단어수준과 하위단어수준에서 나타나는지 알아보기 위해 단어명명과제, 각운판단과제, 음소제거과제를 진행하였다. 전체 단어수준(whole word level)에서의 규칙 양상을 살펴보기 위해, [1] 영어단어명명과제(English word naming task)를 사용하였고, 단어 단위보다 하위 단계에서의 규칙성 효과를 알아보기 위해 [2] 라임판단 과제(rhyme judgement task)와 음소수준(phoneme level)에서의 과제인 [3] 음소탈락과제(phoneme deletion task)를 사용하였다. 실험 참가자들은 세 종류의 과제를 모두 수행하였고, 총 43명의 후기 이중언어화자가 실험에 참가하였다. 실험결과, 세 과제 모두에서 규칙성 효과가 나타나 한국어-영어 이중언어화자가 영어(L2) 단어 처리 시 GPC 규칙을 적극적으로 활용하고 있다는 사실을 확인하였다. 사후분석으로써 세 과제 사이의 상관분석을 진행한 결과, 단어명명과제와 라임판단과제 간 상관이 가장 높게 나타났다. 비록 영어 모국어 화자의 이전 연구결과와는 달리 라임판단과제와 단어읽기과제 간 상관이 높게 나타났지만, 이는 실험 참가자의 L2 능숙도가 모국어화자만큼 높지 않았기 때문인 것으로 보인다. 본 연구는 후기 한국어-영어 이중언어화자가 영어 GPC 규칙을 사용하여 영어단어읽기 처리를 하고 있음을 확인하였다.

난청 고령자의 우울정도, 인지기능, 의사소통능력 및 정량뇌파 분석 연구 (A Study on Analysis of Depression, Cognition, Communication, and Quantitative Electroencephalogram in Hearing Impaired Elderly)

  • 김형재;원희욱
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.430-440
    • /
    • 2021
  • 본 연구는 난청 고령자의 우울정도, 인지기능, 의사소통능력 및 정량뇌파를 분석하고, 관련성을 규명할 목적으로 시도하였다. Y 시 소재의 S 청능재활 센터를 내원한 60세 이상의 난청 고령자 중 모집공고문을 통해 남성 37명, 여성 26명이 2020년 6월 20일부터 2020년 9월 3일까지 자발적으로 참여했다. 구조화된 설문지를 통해 대상자의 전반적인 특성, 우울정도, 인지기능을 평가하였다. 의사소통능력의 척도인 단어인지도는 한국표준 단음절어를 사용하여 진단용 청력검사기로 평가하였다. 정량뇌파는 전전두엽 Fp1과 Fp2에 건식 전극을 사용하여 2채널 뇌파 측정기로 측정하였다. 수집된 자료는 SPSS/WIN 25.0 프로그램으로 인구 사회학적 특성 파악을 위한 빈도분석, 변수간 Pearson's correlation분석, 3분할 집단 간 One-way ANOVA분석을 하였다. 결과를 요약하면 다음과 같다. 의사소통능력은 전전두엽 좌우 대칭성(**p<.01)과 정(+)적 상관관계를 보였고, 우뇌 정신적 산만 및 스트레스(*p<.05)와 부(-)적 상관관계를 보였다. 그러나 우울정도와 인지기능과는 유의한 상관관계는 없었다. 의사소통능력에 따른 3분할 집단별 차이 검정에서도 전전두엽 좌우 대칭성(**p<.01)이 우울정도와 인지능력보다 높은 수준의 상관관계를 보였다. 이상의 결과는 정량뇌파에서 측정된 전전두엽 좌우 대칭성이 난청 고령자의 의사소통능력의 강력한 생체적 지표 가능성을 시사 하였다.

문서 영상 내 테이블 영역에서의 단어 추출 (Word Extraction from Table Regions in Document Images)

  • 정창부;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.369-378
    • /
    • 2005
  • 문서 영상은 문서 구조 분석을 통하여 텍스트, 그림, 테이블 등의 세부 영역으로 분할 및 분류되는데, 테이블 영역에 있는 단어는 다른 영역의 단어보다 의미가 있기 때문에 주제어 검색과 같은 응용 분야에서 중요한 역할을 한다. 본 논문에서는 문서 영상의 테이블 영역에 존재하는 문자 성분을 단어단위로 추출하는 방법을 제안한다. 테이블 영역에서의 단어 추출은 실질적으로 테이블을 구성하는 셀 영역에서 단어를 추출하는 것이기 때문에 정확한 셀 추출 과정이 필요하다. 셀 추출은 연결 요소를 분석하여 테이블 프레임을 찾아내고, 교차점 검출은 전체가 아닌 테이블 프레임에 대해서만 수행한다. 잘못 검출된 교차점은 이웃하는 교차점과의 관계를 이용하여 수정하고, 최종 교차점 정보를 이용하여 셀을 추출한다. 추출된 셀 내부에 있는 텍스트 영역은 셀 추출 과정에서 분석한 문자성분의 연결 요소 정보를 재사용하여 결정하고, 결정된 텍스트 영역은 투영 프로파일을 분석하여 문자연로 분리된다. 마지막으로 분리된 문자열에 대하여 갭 군집화와 특수 기호 검출을 수행함으로써 단어 분리를 수행한다. 제안 방법의 성능 평가를 위하여 한글 논문 영상으로부터 추출한 총 In개의 테이블 영상에 대해 실험한 결과, $99.16\%$의 단어 추출 성공률을 얻을 수 있었다.

인터넷 쇼핑몰에서 패션제품 소비자의 위험지각과 위험감소행동에 관한 연구 (Risk Perception and Risk Reduction Behaviors of Fashion Product Consumers in Internet Shopping Malls)

  • 하종경
    • 한국생활과학회지
    • /
    • 제19권4호
    • /
    • pp.675-685
    • /
    • 2010
  • This study analyzed risk perception and risk reduction behaviors of male and female college students in their twenties who purchased fashion products in internet shopping malls. It also investigated the relationship between risk perception and risk reduction behavior as well as the ways in which groups, categorized by risk perception, differed in their risk reduction behaviors. The results of this study were as follows: first, seven factors of risk perception were identified. These were product quality, shipping, product image, payment, economic feasibility, fear of other people's reactions, and size. Six types of risk reduction behavior were also identified. These were product comparison, word-of-mouth information search, price search, preference for name-brand, service comparison, and referring to experiences. Next, a correlational analysis of the factors of risk perception and those of risk reduction behavior showed several patterns. The highest positive correlation was between economic risk perception and product comparison behavior. In addition, shipping risk perception was positively correlated with service comparison behavior and product quality and product image had a positive correlation with word-of-mouth information search behavior. Third, customers of internet shopping malls could be categorized into three groups: shipping risk perception group, high risk perception group, and product quality risk perception group. The groups were shown by factor analysis to be significantly different to each other. Finally, risk reduction behavior was investigated according to the different groups of risk perception of the internet shopping malls and the results showed significant differences among groups.

40, 50대 성인의 인지연령과 신체이미지 평가 (Cognitive Ages and Body Images of Korean Adults in their 40s and 50s)

  • 장은주;유화숙
    • 한국의류산업학회지
    • /
    • 제13권5호
    • /
    • pp.769-777
    • /
    • 2011
  • Anti-aging is one of the key words to have characterized Korean society, and Korean adults in their 40s and 50s are very interested in this word. In this study, their cognitive ages and body images which are expected to have been influenced by anti-ageing were determined and correlation between them was examined. A survey was conducted and 368 of 500 questionnaires were used in data analysis. Data were analyzed by descriptives, factor analysis, reliability analysis, correlation analysis, and multiple response analysis through SPSS 12.0. The results are as follows. First, the cognitive ages of Korean adults in their 40s and 50s showed to be 37.5 years old which are 9.1 years old younger than their average actual ages. Second, their attitudinal body images appeared to be composed of appearance orientation and appearance evaluation, and appearance orientation represented to be a little higher than appearance evaluation. In addition, it showed that the correlation between cognitive ages and the attitudinal body images was low and negative. Third, people in their 40s and 50s revealed to think good health and impression as ideal body images. It was found that they regarded a face as the most important body part for ideal body images and were sensitive of their weight. Forth, correlation between cognitive ages and variables of ideal body images was identified to be significant in 4 variables which are slender, shapely and slim figure and good body proportions. In conclusion, it was shown that Korean adults in their 40s and 50s recognized themselves to be 9.1 years old younger and, the younger they perceive themselves, the younger body images they want. Also, it could be confirmed that anti-ageing is a megatrend in Korean society.

Text Mining 기법을 활용한 항공안전관리 이슈 분석 (Analysis of Aviation Safety Management Issues using Text Mining)

  • 권문진;이장룡
    • 한국항공운항학회지
    • /
    • 제31권4호
    • /
    • pp.19-27
    • /
    • 2023
  • In this study, a total of 2,584 domestic research papers with the keywords "Aviation Safety" and "Aviation Accidents" were subjected to Text Mining analysis. Various text mining techniques, including keyword frequency analysis, word correlation analysis, network analysis, and topic modeling, were applied to examine the research trends in the field of aviation safety. The results revealed a significant increase in research using the keyword "Aviation Safety" since 2015, with over 300 papers published annually. Through keyword frequency analysis, it was observed that "Aircraft" was the most frequently mentioned term, followed by "Drones" and "Unmanned Aircraft." Phi coefficients were calculated for words closely related to "Aircraft," "Aviation," "Drones," and "Safety." Furthermore, topic modeling was employed to identify 12 distinct topics in the field of aviation safety and aviation accidents, allowing for an in-depth exploration of research trends.