• Title/Summary/Keyword: 텍스트 연구

Search Result 3,492, Processing Time 0.031 seconds

Toward Preventing Cold-start Problem: Basis Recommendation System (콜드스타트 문제 완화를 위한 기저속성 추출 기반 추천시스템 제안)

  • Jungseob Lee;Hyeonseok Moon;Chanjun Park;Myunghoon Kang;Seungjun Lee;Sungmin Ahn;Jeongbae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.427-430
    • /
    • 2022
  • 추천시스템에서 콜드스타트 문제를 해결하기 위해 다양한 연구들이 진행되고 있다. 하지만, 대부분의 연구는 아직도 사용자 기반의 히스토리 데이터셋을 반드시 필요로 하여, 콜드스타트 문제를 완벽히 해결하지 못하고 있다. 이에 본 논문은 콜드스타트 문제를 완화할 수 있는 기저속성 기반의 추천시스템을 제안한다. 제안하는 방법론을 검증하기 위해, 직접 수집한 한국어 영화 리뷰 데이터셋을 기반으로 성능을 검증하였으며, 평가 결과 제안한 방법론이 키워드와 사용자의 리뷰 점수를 효과적으로 반영한 추천시스템임을 확인할 수 있었고, 데이터 희소성 및 콜드스타트 문제를 완화하여 기존의 텍스트 기반 랭킹 시스템의 성능을 압도하는 것을 확인하였다. 더 나아가 제안된 기저속성 추천시스템은 추론 시에 GPU 컴퓨팅 자원을 요구하지 않기에 서비스 측면에서도 많은 이점이 있음을 확인하였다.

  • PDF

Sentence Unit De-noising Training Method for Korean Grammar Error Correction Model (한국어 문법 오류 교정 모델을 위한 문장 단위 디노이징 학습법)

  • Hoonrae Kim;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.507-511
    • /
    • 2022
  • 문법 교정 모델은 입력된 텍스트에 존재하는 문법 오류를 탐지하여 이를 문법적으로 옳게 고치는 작업을 수행하며, 학습자에게 더 나은 학습 경험을 제공하기 위해 높은 정확도와 재현율을 필요로 한다. 이를 위해 최근 연구에서는 문단 단위 사전 학습을 완료한 모델을 맞춤법 교정 데이터셋으로 미세 조정하여 사용한다. 하지만 본 연구에서는 기존 사전 학습 방법이 문법 교정에 적합하지 않다고 판단하여 문단 단위 데이터셋을 문장 단위로 나눈 뒤 각 문장에 G2P 노이즈와 편집거리 기반 노이즈를 추가한 데이터셋을 제작하였다. 그리고 문단 단위 사전 학습한 모델에 해당 데이터셋으로 문장 단위 디노이징 사전 학습을 추가했고, 그 결과 성능이 향상되었다. 노이즈 없이 문장 단위로 분할된 데이터셋을 사용하여 디노이징 사전 학습한 모델을 통해 문장 단위 분할의 효과를 검증하고자 했고, 디노이징 사전 학습하지 않은 기존 모델보다 성능이 향상되는 것을 확인하였다. 또한 둘 중 하나의 노이즈만을 사용하여 디노이징 사전 학습한 두 모델의 성능이 큰 차이를 보이지 않는 것을 통해 인공적인 무작위 편집거리 노이즈만을 사용한 모델이 언어학적 지식이 필요한 G2P 노이즈만을 사용한 모델에 필적하는 성능을 보일 수 있다는 것을 확인할 수 있었다.

  • PDF

Comparison of Sentiment Classification Performance of for RNN and Transformer-Based Models on Korean Reviews (RNN과 트랜스포머 기반 모델들의 한국어 리뷰 감성분류 비교)

  • Jae-Hong Lee
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.18 no.4
    • /
    • pp.693-700
    • /
    • 2023
  • Sentiment analysis, a branch of natural language processing that classifies and identifies subjective opinions and emotions in text documents as positive or negative, can be used for various promotions and services through customer preference analysis. To this end, recent research has been conducted utilizing various techniques in machine learning and deep learning. In this study, we propose an optimal language model by comparing the accuracy of sentiment analysis for movie, product, and game reviews using existing RNN-based models and recent Transformer-based language models. In our experiments, LMKorBERT and GPT3 showed relatively good accuracy among the models pre-trained on the Korean corpus.

Case Study of Media Literacy for Intercultural Education : Focused on <Crash Landing on You> (상호문화교육을 위한 미디어리터러시 사례 연구: 드라마 <사랑의 불시착>을 중심으로)

  • Jeong Hee Kim
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.1
    • /
    • pp.321-326
    • /
    • 2023
  • Interculturalism presents a philosophy for understanding cultural differences in the multicultural era and for resolving various conflicts that may arise from intercultural differences. While multiculturalism focuses on the coexistence of diverse cultures, interculturalism seeks active interaction between different cultures. We study the hit drama <Crash Landing on You> as an example of media literacy for intercultural education. We will discuss cultural differences and interculturalism in dramas, and analyze aspects of intercultural dialogue specifically. Through this, we would like to consider that this drama is an effective media text of intercultural education.

An Interactive Whiteboard on Smart Phones for Ubiquitous Collaboration (유비쿼터스 협업을 위한 스마트폰 환경에서의 인터랙티브 화이트보드)

  • Ha, Wonjeong;Kim, Kangseok;Yeh, Hongjin
    • Annual Conference of KIPS
    • /
    • 2011.11a
    • /
    • pp.151-154
    • /
    • 2011
  • 유비쿼터스 협업 (Ubiquitous Collaboration)은 유비쿼터스 환경에서 다양한 이기종 디바이스 (PC, Tablet PC, Smart Phone, etc)들이 유무선망을 통해 언제 어디서나 원하는 서비스를 주고 받을 수 있는 시스템으로 시간과 장소에 상관없이 다양한 데이터를 주고 받을 수 있다. 스마트폰의 보편화, 하드웨어 / 소프트웨어 그리고 무선망의 진화로 협업의 중요성은 점점 증가하고 있다. 본 연구에서는 스마트폰 환경에서 이미지, 도형, 텍스트 등의 도구를 사용 협업하는 인터랙티브 화이트보드 어플리케이션(Interactive Whiteboard Application on Smart Phone)을 사용하여 다양한 환경의 사용자들이 서로 다른 이기종 디바이스와 함께 통신하는 방법을 보인다. 또한 서로 다른 이기종 디바이스 간 그룹 통신에서 오는 동기화(Synchronization), 비동기화(Asynchronization), 또한 다른 화면 크기로 부터 발생되는 서로 다른 이미지 크기 표현문제를 극복하기 위한 사용성 평가실험(Usability Test)을 통하여 연구의 타당성 및 우수성을 증명해 보이고자 한다.

A Study on the Product Planning Model based on Word2Vec using On-offline Comment Analysis (온·오프라인 댓글 분석이 활용된 Word2Vec 기반 상품기획 모델연구)

  • Ahn, Yeong-Hwi;Jung, Jin-Young;Park, Koo-Rack
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.79-80
    • /
    • 2021
  • 인터넷은 우리 경제를 디지털 경제로 변화시키며 전자상거래도 증가하고 있다. 따라서 구매자가 전자상거래에서 남기는 긍정적인, 부정적인 상품평은 상품기획의 주요 정보가 될 수 있다. 본 논문에서는 버티컬 무소음 마우스 10,000개에 대한 정형화된 데이터셋을 Word2Vec을 이용하여 유사도 분석, 온라인 상품평 빈도분석 상위 50개 단어를 제시하여 실제 상품을 사용한 후 설문조사 시행을 하였다. 온라인 상품평 유사도 분석결과 클릭 키워드에 대한 장점으로 통증(.986), 디자인(.982)가 분석되었으며 단점은 적응(.866), 불편(.854)이었다. 오프라인 상품평에서는 장점으로 디자인(17명), 단점으로 불편(11명)이었다. 또한 온라인과 오프라인의 상품평을 비교함으로써 구매자의 긍정, 부정의 의미를 교차 확인하여 유의미한 정보를 제시 하였다고 볼수 있다. 따라서 본 연구에서 제시하는 상품기획 프로세스를 신상품 개발 및 기존 상품의 개선 전략으로 적용할 수 있겠다.

  • PDF

Technology Mining and Sentiment Analysis on Hydrogen Fuel Cell Using National R&D and Social Data (국가R&D와 소셜 데이터를 활용한 수소연료전지 기술마이닝과 감성분석)

  • Lee, Byeong-Hee;Choi, Jung-Woo;Kim, Tae-Hyun
    • Annual Conference of KIPS
    • /
    • 2022.11a
    • /
    • pp.341-343
    • /
    • 2022
  • 온실가스 배출 문제가 세계적인 현안으로 부각되면서 수소를 에너지원으로 사용하는 수소경제가 주목받고 있다. 수소연료전지는 수소경제의 구성요소 중 하나로, 수소를 활용해 열과 전기를 생산하며 에너지 변환 효율이 높이는데 장점이 있다. 본 연구는 세계적인 온라인 커뮤니티인 레딧(Reddit)에서 수집한 수소연료전지와 관련된 소셜 데이터를 텍스트마이닝과 감성분석 기법으로 분석하였다. 분석 결과 9,211건의 댓글을 LDA(Latent Dirichlet Allocation)을 이용해 4개의 토픽 그룹으로 분류할 수 있었다. 이 중 수소연료전지와 관련이 높은 그룹을 선정해 STM(Structural Topic Model) 분석으로 10개 토픽을 추출하였고, 기후 환경, 수소 산업, 수소 차와 관련 있는 토픽 3개를 발견할 수 있었다. 이 연구 결과를 통해 수소연료전지의 세계적으로 실제적인 내용을 빠르고 효과적으로 파악하여 수소연료전지에 대한 예측하고, 우리나라의 수소연료전지 관련 국가R&D의 정책적 방향을 제시하고자 한다.

A Case Study of Public Contents in Out-Of-Home Advertising: Focused on Visual Characteristics (옥외광고를 활용한 공공 콘텐츠 사례연구: 시각적 특성을 중심으로)

  • Kim, Woon-Han;Jeong, Hyeon-Ju
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.6
    • /
    • pp.453-459
    • /
    • 2023
  • This study analyzed the creative properties of public service advertisements and public content in outdoor advertising. The results of a case analysis focusing on outdoor advertisements for fundraising are as follows. First, government ministries were mainly found as advertisers. Second, most of the advertising messages were about policy promotion by the government and public institutions, with few public content or public interest messages. Third, in terms of expression, text took up more weight than visual elements, and illustrations were the main visual expression element. This proves that the public content of domestic outdoor advertisements mainly has a strong purpose of conveying direct information.

Exploring Dynamics of Information Systems Research Trend Using Text Mining Approach (텍스트 마이닝 기법을 이용한 정보시스템 분야 연구 동향 분석)

  • Jungkook An;Sodam Kim;Hee-Woong Kim
    • Information Systems Review
    • /
    • v.18 no.3
    • /
    • pp.73-96
    • /
    • 2016
  • Recent research on information and communication technology and Internet-of-Things indicates that convergence and integration facilitate the development of various technologies. Similarly, related academic theories and technologies have also gained attention. This paradigm shift facilitated the convergence and integration of academic disciplines. In particular, information systems have become initiators of change. However, only a limited number of studies have been conducted on information systems. To address this gap, this study explores the future direction of information systems based on the core concepts and results of the comparative analysis conducted on research trends. We considered 48,102 data obtained from international top journals from 1980 to 2015. We analyzed journal titles, authors, abstracts, and keywords. We conducted the network analysis on existing collaborative studies and performed comparative analysis to visualize the results. The results provide an in-depth understanding of information systems and provides directions for future research on this area.

Research Trends of School Space in the Field of Educational Facilities and Environment (교육시설환경 분야에서의 학교공간 연구동향 분석)

  • Lee, Jaejin;Choi, Ji-Hee
    • The Journal of Sustainable Design and Educational Environment Research
    • /
    • v.23 no.3
    • /
    • pp.36-51
    • /
    • 2024
  • School facilities play are crucial in improving educational outcomes not only by serving as physical infrastructure to achieve the goals of school education but also by positively influencing the satisfaction of school users (e.g., teachers and students) and students' academic achievement and emotional development. Consequently, the importance of school facilities has been consistently emphasized. This study aims to explore the research trends of school spaces within the field of educational facilities to identify the future role and research directions of school spaces. Therefore, content and network text analyses were conducted on 531 studies published from 2001 to 2022 that are related to school spaces in the Korean Educational Facilities Society and Korean Educational Green Environment Research Institute. Further, quantitative changes, target contributions, research methods, and shifts in key words and themes were analyzed. The results suggest the need for expanding research subjects, improving the educational environment by reflecting characteristics and needs of each educational stage, broadening the use of research methodologies, and expanding research on school safety to further contribute to the development of research on school spaces.