• 제목/요약/키워드: vocabulary data

검색결과 285건 처리시간 0.027초

대학도서관 유튜브 콘텐츠 내용분석과 이용자 감성반응 분석에 관한 연구 (A Study on the YouTube Content Analysis and Users' Emotional Responses Analysis)

  • 송영;김지현
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.73-93
    • /
    • 2023
  • 이 연구는 국내 대학도서관에서 운영하는 유튜브 콘텐츠에 대한 내용분석과 이용자의 댓글에 대한 감성 반응분석을 통해 국내 대학도서관들의 유튜브를 활용한 도서관 서비스에 대해 종합적인 분석과 평가를 하였다. 연구분석대상은 61개 대학도서관의 2,169개 유튜브 콘텐츠와 이용자의 댓글 6,487개였다. 연구결과로 국내 대학도서관의 유튜브 콘텐츠는 대분류 중 '자료' 콘텐츠의 수량이 가장 많고 '소통' 콘텐츠와 '교육' 콘텐츠가 뒤를 이었으며, '홍보' 콘텐츠가 가장 적었다. 소분류 중 '정보서비스' 콘텐츠의 수량이 가장 많았으며 연구지원 서비스를 주된 내용으로 수록하였다. 국내 대학도서관의 유튜브 콘텐츠를 열람한 이용자의 감성 반응에 대한 분석에서 이용자 감성 반응이 가장 높게 나타난 대분류는 '자료' 콘텐츠와 '소통' 콘텐츠였다. 이용자 감성 반응은 모든 범주의 콘텐츠에서 긍정 반응이 대부분이었고 부정 반응은 긍정 반응에 비하여 적었으며, 빈번히 나타난 이용자 감성 표현은 '좋다'였다. 또한, 이용자 감성 반응에 사용된 어휘는 유튜브 콘텐츠의 내용에 대한 표현보다 영상에 등장하는 인물에 대한 표현이 많았다. 이용자의 평가는 콘텐츠의 기술적 품질에 관한 것 평가보다 콘텐츠의 내용에 관한 것이 많았다.

사용자 사전과 형태소 토큰을 사용한 트랜스포머 기반 형태소 분석기 (A Morpheme Analyzer based on Transformer using Morpheme Tokens and User Dictionary)

  • 김동현;김도국;김철희;신명선;서영덕
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.19-27
    • /
    • 2023
  • 형태소는 한국어에서 의미를 가진 최소단위이기 때문에, 한국어 언어모델의 성능을 높이기 위해서는 정확한 형태소 분석기의 개발이 필요하다. 기존의 형태소 분석기는 대부분 어절 단위 토큰을 입력 값으로 학습하여 형태소 분석 결과를 제시한다. 하지만 한국어의 어절은 어근에 조사나 접사가 부착된 형태이기 때문에 어근이 같은 어절이어도 조사나 접사로 인해 의미가 달라지는 성향이 있다. 따라서 어절 단위 토큰을 사용하여 형태소를 학습하면 조사나 접사에 대한 오분류가 발생할 수 있다. 본 논문에서는 형태소 단위의 토큰을 사용하여 한국어 문장에 내재된 의미를 과악하고, Transformer를 사용한 시퀀스 생성 방식의 형태소 분석기를 제안한다. 또한, 미등록 단어 문제를 해결하기 위해 학습 말뭉치 데이터를 기반으로 사용자 사전을 구축하였다. 실험 과정에서 각 형태소 분석기가 출력 한 형태소와 품사 태그를 함께 정답 데이터와 비교하여 성능을 측정하였으며, 실험 결과 본 논문에서 제시한 형태소 분석기가 기존 형태소 분석기에 비해 성능이 높음을 증명하였다.

한국어 학습 모델별 한국어 쓰기 답안지 점수 구간 예측 성능 비교 (Comparison of Korean Classification Models' Korean Essay Score Range Prediction Performance)

  • 조희련;임현열;이유미;차준우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.133-140
    • /
    • 2022
  • 우리는 유학생이 작성한 한국어 쓰기 답안지의 점수 구간을 예측하는 문제에서 세 개의 딥러닝 기반 한국어 언어모델의 예측 성능을 조사한다. 이를 위해 총 304편의 답안지로 구성된 실험 데이터 세트를 구축하였는데, 답안지의 주제는 직업 선택의 기준('직업'), 행복한 삶의 조건('행복'), 돈과 행복('경제'), 성공의 정의('성공')로 다양하다. 이들 답안지는 네 개의 점수 구간으로 구분되어 평어 레이블(A, B, C, D)이 매겨졌고, 총 11건의 점수 구간 예측 실험이 시행되었다. 구체적으로는 5개의 '직업' 답안지 점수 구간(평어) 예측 실험, 5개의 '행복' 답안지 점수 구간 예측 실험, 1개의 혼합 답안지 점수 구간 예측 실험이 시행되었다. 이들 실험에서 세 개의 딥러닝 기반 한국어 언어모델(KoBERT, KcBERT, KR-BERT)이 다양한 훈련 데이터로 미세조정되었다. 또 두 개의 전통적인 확률적 기계학습 분류기(나이브 베이즈와 로지스틱 회귀)도 그 성능이 분석되었다. 실험 결과 딥러닝 기반 한국어 언어모델이 전통적인 기계학습 분류기보다 우수한 성능을 보였으며, 특히 KR-BERT는 전반적인 평균 예측 정확도가 55.83%로 가장 우수한 성능을 보였다. 그 다음은 KcBERT(55.77%)였고 KoBERT(54.91%)가 뒤를 이었다. 나이브 베이즈와 로지스틱 회귀 분류기의 성능은 각각 52.52%와 50.28%였다. 학습된 분류기 모두 훈련 데이터의 부족과 데이터 분포의 불균형 때문에 예측 성능이 별로 높지 않았고, 분류기의 어휘가 글쓰기 답안지의 오류를 제대로 포착하지 못하는 한계가 있었다. 이 두 가지 한계를 극복하면 분류기의 성능이 향상될 것으로 보인다.

소셜 빅데이터를 활용한 한국관광 트렌드에 관한연구 -감성분석을 중심으로- (A study on Korean tourism trends using social big data -Focusing on sentiment analysis-)

  • 최연희;유경미
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.97-109
    • /
    • 2024
  • 국내관광 영역에서 관광 소비 주체인 외래관광객과 내국인에 대한 관광 트렌드 분석은 한국 관광시장 뿐 만 아니라 지역 및 정부의 관광정책을 수립하는 관계자에게도 필수적이라 할 수 있다. 이에 소셜미디어 상의 핵심키워드와 감성분석을 알아보고 향후 관광소비자의 커뮤니케이션과 정보를 통해 마케팅 전략 계획을 수립하고 국내 관광산업을 활성화시키고자 한다. 한국관광의 트렌드를 분석하기 위해 텍스톰(TEXTOM) 6.0을 활용하였다. 구글, 네이버, 다음이 제공하는 카페, 블로그, 뉴스 등을 대상으로 '한국관광', '국내관광'을 키워드로 하여 2022년 9월31일부터 2023년 8월31일까지 데이터를 수집하였다. 텍스트마이닝을 통하여 빈도순으로 핵심 키워드와 TF-IDF를 각각 100개씩 추출한 후, CONCOR 분석, 감성분석을 실시하였다. 한국관광 핵심 키워드는 관광지, 여행동반 및 행태, 관광동기 및 체험, 숙박형태, 관광정보, 감성 관련 등에 관한 단어들이 상위권에 노출되었다. CONCOR분석 결과는 관광지, 관광정보, 관광활동/체험, 관광동기/콘텐츠, 인바운드 관련 등과 관련된 5개의 클러스터로 구분되었다. 마지막으로 감성분석 결과 긍정에 대한 문서와 어휘가 높게 나타났다. 이 연구는 한국관광에 대한 텍스트 마이닝을 통하여 급변하는 한국관광 트렌드를 분석하여 내국인 뿐 만 아니라 방한 외국인에 대한 국내관광 활성화에 의미 있는 기초자료를 제공할 것으로 기대한다.

유아대상 한글학습용 애플리케이션 평가 및 내용 분석 -언어 교수방법에 따른 비교 분석 (Contents Analysis on Hangul-learning Applications for Preschoolers - Comparative Analysis by Teaching Methods)

  • 서주현
    • 한국보육지원학회지
    • /
    • 제11권2호
    • /
    • pp.21-37
    • /
    • 2015
  • 본 연구의 목적은 유아대상 한글학습용 애플리케이션의 내용을 전통적 언어교육에서 사용하는 언어 교수방법인 발음중심 교수방법과 총체적 교수방법으로 분류하여 비교분석함으로써 학습용 애플리케이션 내용 개선을 위한 시사점을 찾는 데에 있다. 이를 위해, 선행연구에서 사용된 유아용 애플리케이션 평가 척도에서 학습내용과 관련된 4개 하위영역을 선택하여 이를 수정, 보완하여 총 51개 애플리케이션을 대상으로 분석을 실시하였다. 그 결과, 총체적 교수방법의 애플리케이션이 발음중심 교수방법의 애플리케이션보다 인터랙션을 잘 활용하는 것으로 드러났다. 또한, 총체적 교수방법의 애플리케이션은 교육의도에 적합한 그래픽의 사용, 매력적인 캐릭터 및 피드백을 통한 능동적 학습활동 유도에서 발음중심 교수방법의 애플리케이션을 앞섰다. 이 연구결과는 효율적인 한글학습을 위한 양질의 애플리케이션 개발을 위한 기초자료로 활용될 수 있다.

Methodology for Identifying Key Factors in Sentiment Analysis by Customer Characteristics Using Attention Mechanism

  • Lee, Kwangho;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.207-218
    • /
    • 2020
  • 최근 온라인 리뷰의 증가와 분석 기술의 발달로 인해 온라인 리뷰 분석에 대한 관심과 수요가 지속적으로 증가하고 있다. 하지만 리뷰 분석을 다룬 기존의 연구는 동일한 어휘라도 각 어휘에 담긴 감정은 리뷰어에 따라 서로 다를 수 있다는 점을 반영하지 못했다는 한계를 갖는다. 따라서 본 연구에서는 고객의 등급에 따라 고객군을 분류하고, 각 고객군별로 리뷰 분석을 수행하여 그 차이를 분석한 결과를 제시하였다. 의류 전문 쇼핑몰인 'M'사의 리뷰에 대한 분석을 수행한 결과, 쇼핑몰 사용도가 높은 고객의 경우 가격적인 요소가, 쇼핑몰 사용도가 낮은 고객의 경우 쇼핑몰에 소개된 내용과 실제 제품의 일치 정도가 제품의 긍/부정 평가에 크게 영향을 미치는 것으로 파악되었다. 제안 방법론은 고객군별로 제품 평가에 중요하게 영향을 미치는 요소를 식별함으로써, 차별화된 마케팅 전략을 수립하는 데에 효과적으로 활용될 수 있을 것으로 기대한다.

대사증후군 교육 인쇄물의 이독성과 적합성 평가 (Evaluation of the Readability and Suitability of Printed Educational Materials on Metabolic Syndrome)

  • 김정은;양숙자
    • 한국보건간호학회지
    • /
    • 제30권1호
    • /
    • pp.149-163
    • /
    • 2016
  • Purpose: The aim of this study was to assess the readability and suitability of printed educational materials related to metabolic syndrome in South Korea. Methods: Data were collected on 15 educational materials on metabolic syndrome from public health centers in Seoul. The 9 Graded Korean Vocabulary Classification and Korean version of SAM (Suitability Assessment of Materials) were used for the readability evaluation and the suitability evaluation respectively. Results: Overall average of the readability was 3.0th grade level. The percentage of 1st to 4th grade words was 79.4%. The printed educational materials on metabolic syndrome were written according to recommended reading levels. In suitability assessment, 2 out of 15 materials(13.3%) were scored as superior, 12 materials(80.0%) were scored as adequate and only 1 (6.7%) was scored as inadequate. The total average score of suitability was adequate. However, there are limitations in "summary and review" and "context is given first" due to limited writing pages. Conclusion: Readability and suitability of educational materials for metabolic syndrome were evaluated as adequate level. However, future health educational materials should be evaluated for readability via different factors including length of sentences, numbers of sentences, and structure of sentences. In addition, for easier understanding and motivation of readers, materials should use summary & review, context and proper interaction.

하시모토 유키오의 식음공간에 나타난 디자인 표현특성 (Expressional Characteristics of Interior Design Presented in the Food and Beverage Spaces of Yukio Hashimoto)

  • 고명애;김문덕
    • 한국실내디자인학회논문집
    • /
    • 제26권2호
    • /
    • pp.101-109
    • /
    • 2017
  • The food and beverage spaces of modern industrial society have transformed from a simple space for meals into a space of culture, communication and experience as society becomes more complex and diverse along side economic growth. An interior designer who is rapidly rising on this flow of change is Yukio Hashimoto. While working for interior design firm Super Potato, which highlights food and beverage spaces, he was much affected by the expression methods of representative designer Takashi Sugimoto, who makes use of natural elements. By using these expression methods that make use of natural elements in his own creation of spatial ambience and elements of experience and by adding his own differentiated expression methods, he emphasizes an effective spatial expression for food and beverage spaces. The design characteristics of Yukio Hashimoto's food and beverage spaces are as follows. First natural elements like light and water are recreated as memories of nature after being established through a methodology that allows these elements to penetrate his own thoughts. Second, he pursues a hybrid design through the harmony between past tradition and current expressive techniques. Third, he expresses objets of light through a formative sense of shape expressed with light.. Fourth, he establishes an axis in the interior space by light and structure and endows a strong directionality that induces symmetric characteristics, gaze, and movement.. Fifth, he installs lights at the bottom of weighty materials and expresses a sense of floating by light. Sixth, he uses an illusion technique that makes use of the ambiguity and depth of space resulting from reflecting materials like mirrors. The study hopes that such design expression characteristics of food and beverage spaces can be used as data for interior designers to apply and develop a new design vocabulary.

KONG-DB: 웹 상의 어휘 사전을 활용한 한국 소설 지명 DB, 검색 및 시각화 시스템 (KONG-DB: Korean Novel Geo-name DB & Search and Visualization System Using Dictionary from the Web)

  • 박성희
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.321-343
    • /
    • 2016
  • 본 연구의 목적은 1) 소설 속 지명 데이터베이스(DB)를 구축하고, 2) 확장 가능한 지명 DB를 위해 자동으로 지명을 추출하여 데이터베이스를 갱신하며, 3) 데이터베이스 내의 소설지명과 용례를 검색하고 시각화하는 파일럿시스템을 구현하는 데 있다. 특히, 학습자료(training)에 해당하는 말뭉치(corpus)를 확보하기 어려운, 소설지명과 같이 현재 잘 쓰이지 않는 개체명을 자동으로 추출하는 것은 매우 어려운 문제이다. 효과적인 지명 정보 추출용 학습자료 말뭉치 확보 문제를 해결하기 위해 본 논문에서는 이미 수작업으로 구축된 웹 지식(어휘사전)을 활용하여 학습에 필요한 충분한 양의 학습말뭉치를 확보하는 방안을 적용하였다. 이렇게 확보된 학습용 코퍼스와 학습된 자동추출 모듈을 가지고, 새로운 지명 용례를 찾아 추가하는 지명 데이터베이스 확장 도구를 만들었으며, 소설지명을 지도 위에 시각화하는 시스템을 설계하였다. 또한, 시범시스템을 구현함으로써 실험적으로 그 타당성을 입증하였다. 끝으로, 현재 시스템의 보완점을 제시하였다.

역사성 보존을 위한 구 국악사양성소(별오름극장)의 리모델링에 관한 연구 (A Study on the Remodeling of The Training Center for Performers of Korean Traditional Music(Studio 'Byeol') for Historicity Conservation)

  • 이완건
    • 한국실내디자인학회논문집
    • /
    • 제19권5호
    • /
    • pp.165-172
    • /
    • 2010
  • Recently, the recognition is changing about cultural heritage, and the various types of buildings or facilities of modern or contemporary times have been designated as cultural properties after that Registered Cultural Properties System is enforced. The purpose of this study is to survey how the newly born the historic buildings of modern or contemporary times through the remodeling process of the Studio 'Byeol'(the Training Center for Performers of Korean Traditional Music) in the National Theater of Korea so-called a microcosm of performing arts history. In the process, it will examine the merits and demerits of various alternatives and the direction of the remodeling etc., and propose an utilization as a basic data of post evaluation for the remodeling of a historic building. The result are as followings. Firstly, the remodeling that gave a new physical properties to a building can be used a method of conservation and reuse on a historic building. The remodeling of a historic building must be eclectically progress between the owner and the citizen or the economic value and the historicity conservation. And, the remodeling of historic buildings such as the Training Center for Performers of Korean Traditional Music must consider the conservation of the exterior walls in whole or in part at least. Secondly, an architect Lee Hee Tae(李喜泰) who had been to develop his own architectural vocabulary and to test based on the korean traditional architecture and the Training Center for Performers of Korean Traditional Music must be newly evaluated today. Lastly, the remodeling alternatives of the Training Center for Performers of Korean Traditional Music have been analyzed with three types, which is 'repairing only the interior which maintains the size and an appearance of present', 'extending the outer wall to the external column line', 'extending the basement'. And, it was analyzed with the appropriate final decision that it remodels only the interior in the current situation because of a historicity, a budget, a relevant law etc.